PII検出: 50以上のエンティティタイプ

当社の正規表現ベースの検出エンジンは、パターンに基づいた精度で50種類以上の個人情報を特定します。同じ入力、同じ出力 - 毎回。

検出の仕組み

パターンマッチング

各エンティティタイプに対して慎重に作成された正規表現パターンを使用し、すべての文書で一貫した予測可能な結果を保証します。

NLP Named Entity Recognition (Names & Locations)

spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.

信頼度スコアリング

各検出には、パターンの強度とコンテキストに基づいた信頼度スコア(0-1)が含まれ、結果をフィルタリングするのに役立ちます。

コンテキスト認識

周囲のテキストコンテキストが検出精度を向上させ、誤検出を減らし、エッジケースを捉えます。

サポートされているエンティティタイプ

カテゴリ全体にわたる個人情報タイプの包括的なカバレッジ

個人識別子

  • 人名
  • メールアドレス
  • 電話番号
  • 生年月日
  • 年齢
  • 性別
  • 国籍

財務情報

  • クレジットカード番号
  • IBAN
  • BIC/SWIFT
  • 銀行口座番号
  • 税番号
  • VAT番号

政府発行ID

  • 社会保障番号(SSN)
  • 国民ID番号
  • パスポート番号
  • 運転免許証
  • 健康保険ID

位置データ

  • 住所
  • 都市
  • 郵便番号
  • GPS座標

デジタル識別子

  • IPアドレス(v4/v6)
  • MACアドレス
  • URL
  • ドメイン名
  • ユーザーID

組織データ

  • 会社名
  • 組織ID
  • 登録番号
  • 部門名

時間データ

  • 日付
  • 時間
  • 日付範囲
  • タイムスタンプ

国際フォーマット

  • ドイツのID(Personalausweis)
  • 英国の国民保険
  • スペインのDNI/NIE
  • イタリアのCodice Fiscale
  • および20以上の国別フォーマット

カスタムエンティティサポート

カスタムパターンを検出する必要がありますか?正規表現パターンで独自のエンティティタイプを作成するか、AI支援のパターンジェネレーターを使用してください。

手動パターン作成

内部従業員ID、プロジェクトコード、またはカスタム参照番号などの独自の識別子のために正規表現パターンを定義します。

AIパターンジェネレーター

検出したい内容を平易な言葉で説明すると、当社のAIが最適化された正規表現パターンを生成します。

今日からPIIを検出し始めましょう

200トークンで無料で当社の検出エンジンを試してください。クレジットカードは不要です。