Kuidas tuvastamine töötab
Mustriga sobitamine
Kasutab hoolikalt koostatud regex-mustreid iga üksuse tüübi jaoks, tagades järjepidevad ja ennustatavad tulemused kõikides dokumentides.
NLP Named Entity Recognition (Names & Locations)
spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.
Usaldusväärsuse skoorimine
Iga tuvastamine sisaldab usaldusväärsuse skoori (0-1), mis põhineb mustri tugevusel ja kontekstil, aidates teil tulemusi filtreerida.
Kontekstitunne
Ümbritseva teksti kontekst parandab tuvastamise täpsust, vähendades valepositiivide arvu ja tuvastades äärmuslikke juhtumeid.
Toetatud üksuse tüübid
Kohustuslik katvus isikliku teabe tüüpide üle kategooriate lõikes
Isiklikud tuvastajad
- Isiku nimed
- E-posti aadressid
- Telefoninumbrid
- Sünnikuupäev
- Vanus
- Sugu
- Rahvus
Finantsinformatsioon
- Krediitkaardi numbrid
- IBAN
- BIC/SWIFT
- Panga konto numbrid
- Maksu ID-d
- KM numbrid
Valitsuse ID-d
- Sotsiaalkindlustuse numbrid (SSN)
- Riiklikud ID numbrid
- Passi numbrid
- Juhi luba
- Tervisekindlustuse ID-d
Asukohaandmed
- Tänava aadressid
- Linnad
- ZIP/postiindeksid
- Riigid
- GPS koordinaadid
Digitaalsed tuvastajad
- IP aadressid (v4/v6)
- MAC aadressid
- URL-id
- Domeeninimed
- Kasutaja ID-d
Organisatsiooni andmed
- Ettevõtte nimed
- Organisatsiooni ID-d
- Registri numbrid
- Osakonna nimed
Ajaliselt seotud andmed
- Kuupäevad
- Kellajad
- Kuupäevavahemikud
- Ajatempli numbrid
Rahvusvahelised formaadid
- Saksa ID (Personalausweis)
- UK riiklik kindlustus
- Hispaania DNI/NIE
- Itaalia Codice Fiscale
- Ja 20+ muud riigispetsiifilist formaati
Kohandatud üksuse tugi
Kas vajate kohandatud mustrite tuvastamist? Looge oma üksuse tüübid regex-mustritega või kasutage meie AI-abistatud mustrigeneraatorit.
Käsitsi mustri loomine
Määratlege regex-mustrid omanike tuvastamiseks, nagu sisemised töötaja ID-d, projektikoodid või kohandatud viitenumbrid.
AI mustrigeneraator
Kirjeldage, mida soovite tuvastada, selges keeles, ja meie AI genereerib teile optimeeritud regex-mustrid.