PII Tuvastamine: 320+ Entiteeditüüpi

Meie tuvastusmootor ühendab 317 kohandatud regulaaravaldiste tuvastajat NLP mudelitega, et tuvastada üle 320 isikuandmete tüübi 70+ riigis. Sama sisend, sama väljund - iga kord.

Kuidas Tuvastamine Töötab

Regulaaravaldiste Mustrite Sobitamine (Struktureeritud PII)

317 kohandatud PatternRecognizers regulaaravaldiste mustritega tuvastavad struktureeritud andmeid nagu riiklikud ID-d, maksunumbrid, passid ja juhiload. Iga muster kasutab piiritõestusi, et vältida valesid vasteid koodis või struktureeritud andmetes.

NLP Nimede ja Asukohtade Tuvastamine

spaCy (25 keelt), Stanza NER (7 keelt) ja XLM-RoBERTa transformerid (16 keelt) tuvastavad struktureerimata PII nagu isikunimed, asukohad ja organisatsioonid, mida ei saa ainult regulaaravaldistega hõlmata. Kõik mudelid töötavad meie enda serverites Saksamaal — andmeid ei saadeta kunagi Metale, Google'ile, Stanfordile ega kolmandatele osapooltele.

Usaldusväärsuse Hindamine

Iga tuvastus sisaldab usaldusväärsuse hinnangut (0,0–1,0) inimese-sekkumise otsuste jaoks. Väga spetsiifilised vormingud (nt Saksa IBAN DE89 3704 0044 0532 0130 00) saavad 0,85+ skoori, samas kui üldised numbrimustrid saavad 0,3–0,5 ja tuginevad kinnitamiseks kontekstisõnadele. Vastavusmeeskonnad saavad üle vaadata ja tuvastusi enne anonüümseks muutmist muuta.

Konteksti Sõnade Analüüs

Igal tuvastajal on kontekstisõnad vastavas keeles (nt 'Personalausweis' Saksa ID-de jaoks, 'kitambulisho' Keenia ID-de jaoks). Kui kontekstisõnad ilmuvad vaste lähedal, tõstetakse usaldusväärsuse hinnangut.

Toetatud Entiteeditüübid

Isikuandmete tüüpide ulatuslik katvus kategooriate kaupa

Isiklikud Identifikaatorid

  • Isikunimed
  • E-posti Aadressid
  • Telefoninumbrid
  • Sünnikuupäev
  • Vanus
  • Sugu
  • Rahvus

Finantsandmed

  • Krediitkaardi Numbrid
  • IBAN
  • BIC/SWIFT
  • Pangakonto Numbrid
  • Maksukoodid
  • Käibemaksu Numbrid

Valitsuse ID-d

  • Sotsiaalkindlustuse Numbrid (SSN)
  • Riiklikud ID Numbrid
  • Passi Numbrid
  • Juhiload
  • Tervisekindlustuse ID-d

Asukohaandmed

  • Tänavaaadressid
  • Linnad
  • Posti/Sihtnumbrid
  • Riigid
  • GPS Koordinaadid

Digitaalsed Identifikaatorid

  • IP Aadressid (v4/v6)
  • MAC Aadressid
  • URL-id
  • Domeeninimed
  • Kasutaja ID-d

Organisatsiooni Andmed

  • Ettevõtte Nimed
  • Organisatsiooni ID-d
  • Registrinumbrid
  • Osakonna Nimed

Ajalised Andmed

  • Kuupäevad
  • Kellajad
  • Kuupäevavahemikud
  • Ajatemplid

Rahvusvahelised Vormingud

  • Saksa ID (Personalausweis)
  • Suurbritannia Riiklik Kindlustus
  • Hispaania DNI/NIE
  • Itaalia Codice Fiscale
  • Ja veel 70+ riigispetsiifilist vormingut

Kohandatud Entiteetide Tugi

Kas vajate kohandatud mustrite tuvastamist? Looge oma entiteeditüübid regulaaravaldiste mustritega või kasutage meie AI-abiga mustrite generaatorit.

Käsitsi Mustri Loomine

Määratlege regulaaravaldiste mustrid omandatud identifikaatorite jaoks nagu sisemised töötaja ID-d, projekti koodid või kohandatud viitenumbrid.

AI Mustrite Generaator

Kirjeldage, mida soovite tuvastada lihtsas keeles, ja meie AI genereerib teile optimeeritud regulaaravaldiste mustrid.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Alusta PII Tuvastamist Täna

Proovige meie tuvastusmootorit tasuta 200 tokeniga tsükli kohta. Krediitkaarti pole vaja.