システムアーキテクチャ
Microsoft Presidioを基盤に、分析・匿名化・処理を専用サービスに分離し、最大限の信頼性を実現。
主要コンポーネント
アナライザーサービス
IDや税番号などの構造化データ向けに317種類のカスタム正規表現認識器(regexパターン)でPIIを検出。氏名・所在地はspaCy/Stanza/XLM-RoBERTa NLPで対応。すべてのモデルは自社サーバー上で実行され、第三者AIプロバイダーへのデータ送信はありません。エンティティの位置、種類、信頼度スコアを返却。
アノニマイザーサービス
ご指定の変換方式を適用。置換、編集、ハッシュ化、暗号化、マスキングに対応。
Webアプリケーション
Next.jsフロントエンドによるリアルタイム処理。全デバイス対応のレスポンシブ設計。
REST API
プログラム連携用のRESTfulエンドポイント。JWT認証、レート制限対応。
データフロー
ドキュメントは安全かつ監査可能なパイプラインで各サービスを通過します。
- 1
クライアントがHTTPS経由でドキュメント送信
- 2
アナライザーサービスがPIIエンティティを検出
- 3
検出結果(位置・スコア)を返却
- 4
クライアントが匿名化方式を選択
- 5
アノニマイザーが変換を適用
- 6
匿名化済みドキュメントをクライアントへ返却