検出の仕組み
パターンマッチング
各エンティティタイプに対して慎重に作成された正規表現パターンを使用し、すべての文書で一貫した予測可能な結果を保証します。
NLP Named Entity Recognition (Names & Locations)
spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.
信頼度スコアリング
各検出には、パターンの強度とコンテキストに基づいた信頼度スコア(0-1)が含まれ、結果をフィルタリングするのに役立ちます。
コンテキスト認識
周囲のテキストコンテキストが検出精度を向上させ、誤検出を減らし、エッジケースを捉えます。
サポートされているエンティティタイプ
カテゴリ全体にわたる個人情報タイプの包括的なカバレッジ
個人識別子
- 人名
- メールアドレス
- 電話番号
- 生年月日
- 年齢
- 性別
- 国籍
財務情報
- クレジットカード番号
- IBAN
- BIC/SWIFT
- 銀行口座番号
- 税番号
- VAT番号
政府発行ID
- 社会保障番号(SSN)
- 国民ID番号
- パスポート番号
- 運転免許証
- 健康保険ID
位置データ
- 住所
- 都市
- 郵便番号
- 国
- GPS座標
デジタル識別子
- IPアドレス(v4/v6)
- MACアドレス
- URL
- ドメイン名
- ユーザーID
組織データ
- 会社名
- 組織ID
- 登録番号
- 部門名
時間データ
- 日付
- 時間
- 日付範囲
- タイムスタンプ
国際フォーマット
- ドイツのID(Personalausweis)
- 英国の国民保険
- スペインのDNI/NIE
- イタリアのCodice Fiscale
- および20以上の国別フォーマット
カスタムエンティティサポート
カスタムパターンを検出する必要がありますか?正規表現パターンで独自のエンティティタイプを作成するか、AI支援のパターンジェネレーターを使用してください。
手動パターン作成
内部従業員ID、プロジェクトコード、またはカスタム参照番号などの独自の識別子のために正規表現パターンを定義します。
AIパターンジェネレーター
検出したい内容を平易な言葉で説明すると、当社のAIが最適化された正規表現パターンを生成します。