Hvordan Deteksjon Fungerer
Regex Mønster Matching (Strukturert PII)
317 tilpassede PatternRecognizers med regex-mønstre oppdager strukturerte data som nasjonale ID-er, skattenumre, pass og førerkort. Hvert mønster bruker grensepåstander for å forhindre falske treff i kode eller strukturerte data.
NLP Navngitt Enhetsgjenkjenning (Navn & Steder)
spaCy (25 språk), Stanza NER (7 språk) og XLM-RoBERTa-transformatorer (16 språk) oppdager ustrukturerte PII som personnavn, steder og organisasjoner som ikke kan fanges opp av kun regex. Alle modeller kjører på våre egne servere i Tyskland — ingen data sendes noen gang til Meta, Google, Stanford eller noen tredjepart.
Tillitsvurdering
Hver deteksjon inkluderer en tillitsscore (0,0–1,0) for menneskelig-in-the-loop beslutninger. Svært spesifikke formater (f.eks. tysk IBAN DE89 3704 0044 0532 0130 00) scorer 0,85+, mens generiske siffermønstre scorer 0,3–0,5 og er avhengige av kontekstord for bekreftelse. Samsvarsteam kan gjennomgå og overstyre deteksjoner før anonymisering.
Kontekstord Analyse
Hver gjenkjenner har kontekstord på det relevante språket (f.eks. 'Personalausweis' for tyske ID-er, 'kitambulisho' for kenyanske ID-er). Når kontekstord vises nær et treff, økes tillitsscoren.
Støttede Enhetstyper
Omfattende dekning av typer personlig informasjon på tvers av kategorier
Personlige Identifikatorer
- Personnavn
- E-postadresser
- Telefonnumre
- Fødselsdato
- Alder
- Kjønn
- Nasjonalitet
Finansiell Informasjon
- Kredittkortnumre
- IBAN
- BIC/SWIFT
- Bankkontonumre
- Skatte-ID-er
- MVA-numre
Offentlige ID-er
- Personnummer (SSN)
- Nasjonale ID-numre
- Passnumre
- Førerkort
- Helseforsikrings-ID-er
Plasseringsdata
- Gateadresser
- Byer
- Postnummer
- Land
- GPS-koordinater
Digitale Identifikatorer
- IP-adresser (v4/v6)
- MAC-adresser
- URL-er
- Domenenavn
- Bruker-ID-er
Organisasjonsdata
- Firmanavn
- Organisasjons-ID-er
- Registreringsnumre
- Avdelingsnavn
Tidsdata
- Datoer
- Tider
- Datointervaller
- Tidsstempler
Internasjonale Formater
- Tysk ID (Personalausweis)
- Britisk National Insurance
- Spansk DNI/NIE
- Italiensk Codice Fiscale
- Og 70+ flere landsspesifikke formater
Tilpasset Enhetsstøtte
Trenger du å oppdage tilpassede mønstre? Opprett dine egne enhetstyper med regex-mønstre eller bruk vår AI-assisterte mønstergenerator.
Manuell Mønsteropprettelse
Definer regex-mønstre for proprietære identifikatorer som interne ansatt-ID-er, prosjektkoder eller tilpassede referansenummer.
AI Mønstergenerator
Beskriv hva du vil oppdage i vanlig språk, og vår AI genererer optimaliserte regex-mønstre for deg.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient