Kuidas Tuvastamine Töötab
Regulaaravaldiste Mustrite Sobitamine (Struktureeritud PII)
317 kohandatud PatternRecognizers regulaaravaldiste mustritega tuvastavad struktureeritud andmeid nagu riiklikud ID-d, maksunumbrid, passid ja juhiload. Iga muster kasutab piiritõestusi, et vältida valesid vasteid koodis või struktureeritud andmetes.
NLP Nimede ja Asukohtade Tuvastamine
spaCy (25 keelt), Stanza NER (7 keelt) ja XLM-RoBERTa transformerid (16 keelt) tuvastavad struktureerimata PII nagu isikunimed, asukohad ja organisatsioonid, mida ei saa ainult regulaaravaldistega hõlmata. Kõik mudelid töötavad meie enda serverites Saksamaal — andmeid ei saadeta kunagi Metale, Google'ile, Stanfordile ega kolmandatele osapooltele.
Usaldusväärsuse Hindamine
Iga tuvastus sisaldab usaldusväärsuse hinnangut (0,0–1,0) inimese-sekkumise otsuste jaoks. Väga spetsiifilised vormingud (nt Saksa IBAN DE89 3704 0044 0532 0130 00) saavad 0,85+ skoori, samas kui üldised numbrimustrid saavad 0,3–0,5 ja tuginevad kinnitamiseks kontekstisõnadele. Vastavusmeeskonnad saavad üle vaadata ja tuvastusi enne anonüümseks muutmist muuta.
Konteksti Sõnade Analüüs
Igal tuvastajal on kontekstisõnad vastavas keeles (nt 'Personalausweis' Saksa ID-de jaoks, 'kitambulisho' Keenia ID-de jaoks). Kui kontekstisõnad ilmuvad vaste lähedal, tõstetakse usaldusväärsuse hinnangut.
Toetatud Entiteeditüübid
Isikuandmete tüüpide ulatuslik katvus kategooriate kaupa
Isiklikud Identifikaatorid
- Isikunimed
- E-posti Aadressid
- Telefoninumbrid
- Sünnikuupäev
- Vanus
- Sugu
- Rahvus
Finantsandmed
- Krediitkaardi Numbrid
- IBAN
- BIC/SWIFT
- Pangakonto Numbrid
- Maksukoodid
- Käibemaksu Numbrid
Valitsuse ID-d
- Sotsiaalkindlustuse Numbrid (SSN)
- Riiklikud ID Numbrid
- Passi Numbrid
- Juhiload
- Tervisekindlustuse ID-d
Asukohaandmed
- Tänavaaadressid
- Linnad
- Posti/Sihtnumbrid
- Riigid
- GPS Koordinaadid
Digitaalsed Identifikaatorid
- IP Aadressid (v4/v6)
- MAC Aadressid
- URL-id
- Domeeninimed
- Kasutaja ID-d
Organisatsiooni Andmed
- Ettevõtte Nimed
- Organisatsiooni ID-d
- Registrinumbrid
- Osakonna Nimed
Ajalised Andmed
- Kuupäevad
- Kellajad
- Kuupäevavahemikud
- Ajatemplid
Rahvusvahelised Vormingud
- Saksa ID (Personalausweis)
- Suurbritannia Riiklik Kindlustus
- Hispaania DNI/NIE
- Itaalia Codice Fiscale
- Ja veel 70+ riigispetsiifilist vormingut
Kohandatud Entiteetide Tugi
Kas vajate kohandatud mustrite tuvastamist? Looge oma entiteeditüübid regulaaravaldiste mustritega või kasutage meie AI-abiga mustrite generaatorit.
Käsitsi Mustri Loomine
Määratlege regulaaravaldiste mustrid omandatud identifikaatorite jaoks nagu sisemised töötaja ID-d, projekti koodid või kohandatud viitenumbrid.
AI Mustrite Generaator
Kirjeldage, mida soovite tuvastada lihtsas keeles, ja meie AI genereerib teile optimeeritud regulaaravaldiste mustrid.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient