Kako deluje odkrivanje
Ujemanje vzorcev
Uporablja skrbno oblikovane regex vzorce za vsako vrsto entitete, kar zagotavlja dosledne in predvidljive rezultate v vseh dokumentih.
NLP Named Entity Recognition (Names & Locations)
spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.
Ocena zanesljivosti
Vsako odkrivanje vključuje oceno zanesljivosti (0-1) na podlagi moči vzorca in konteksta, kar vam pomaga filtrirati rezultate.
Zavedanje konteksta
Okoljski kontekst besedila izboljša natančnost odkrivanja, zmanjšuje lažne pozitivne rezultate in zajema robne primere.
Podprte vrste entitet
Obsežno pokritje vrst osebnih informacij po kategorijah
Osebni identifikatorji
- Imena oseb
- E-poštni naslovi
- Telefonske številke
- Datum rojstva
- Starost
- Spol
- Državljanstvo
Finančne informacije
- Številke kreditnih kartic
- IBAN
- BIC/SWIFT
- Številke bančnih računov
- Davčne številke
- DDV številke
Vladni identifikatorji
- Številke socialne varnosti (SSN)
- Številke nacionalnih identitet
- Številke potnih listov
- Vožniška dovoljenja
- Identifikacijske številke zdravstvenega zavarovanja
Podatki o lokaciji
- Ulične naslove
- Mesta
- ZIP/Poštne številke
- Države
- GPS koordinate
Digitalni identifikatorji
- IP naslovi (v4/v6)
- MAC naslovi
- URL-ji
- Domena
- Uporabniški ID-ji
Podatki o organizaciji
- Imena podjetij
- ID-ji organizacij
- Registracijske številke
- Imena oddelkov
Temporalni podatki
- Datumi
- Časi
- Obdobja datumov
- Časovni žigi
Mednarodni formati
- Nemška osebna izkaznica (Personalausweis)
- Britanska nacionalna zavarovalna številka
- Španska DNI/NIE
- Italijanski Codice Fiscale
- In 20+ drugih formatov specifičnih za države
Podpora za prilagojene entitete
Potrebujete odkriti prilagojene vzorce? Ustvarite svoje vrste entitet z regex vzorci ali uporabite naš generator vzorcev, podprt z AI.
Ustvarjanje ročnih vzorcev
Določite regex vzorce za lastne identifikatorje, kot so notranje ID številke zaposlenih, projektne kode ali prilagojene referenčne številke.
Generator vzorcev AI
Opredelite, kaj želite odkriti v preprostem jeziku, in naš AI generira optimizirane regex vzorce za vas.