Sådan Fungerer Detektion
Regex Mønster Matching (Struktureret PII)
317 brugerdefinerede PatternRecognizers med regex-mønstre registrerer strukturerede data som nationale ID'er, skattenumre, pas og kørekort. Hvert mønster bruger grænseudsagn for at forhindre falske matches i kode eller strukturerede data.
NLP Navngiven Enhedsgenkendelse (Navne & Lokationer)
spaCy (25 sprog), Stanza NER (7 sprog) og XLM-RoBERTa transformere (16 sprog) registrerer ustruktureret PII som personnavne, lokationer og organisationer, der ikke kan fanges af kun regex. Alle modeller kører på vores egne servere i Tyskland — ingen data sendes nogensinde til Meta, Google, Stanford eller nogen tredjepart.
Tillidsscore
Hver detektion inkluderer en tillidsscore (0,0–1,0) til menneske-i-løkken beslutninger. Meget specifikke formater (f.eks. tysk IBAN DE89 3704 0044 0532 0130 00) scorer 0,85+, mens generiske cifermønstre scorer 0,3–0,5 og er afhængige af kontekstord for bekræftelse. Compliance teams kan gennemgå og tilsidesætte detektioner før anonymisering.
Kontekstord Analyse
Hver genkender har kontekstord på det relevante sprog (f.eks. 'Personalausweis' for tyske ID'er, 'kitambulisho' for kenyanske ID'er). Når kontekstord vises nær et match, øges tillidsscoren.
Understøttede Enhedstyper
Omfattende dækning af typer af personlige oplysninger på tværs af kategorier
Personlige Identifikatorer
- Personnavne
- E-mailadresser
- Telefonnumre
- Fødselsdato
- Alder
- Køn
- Nationalitet
Finansiel Information
- Kreditkortnumre
- IBAN
- BIC/SWIFT
- Bankkontonumre
- Skatte-ID'er
- Momsnumre
Offentlige ID'er
- Social Security Numbers (SSN)
- Nationale ID-numre
- Pasnumre
- Kørekort
- Sundhedsforsikrings-ID'er
Lokationsdata
- Gadeadresser
- Byer
- Postnumre
- Lande
- GPS-koordinater
Digitale Identifikatorer
- IP-adresser (v4/v6)
- MAC-adresser
- URL'er
- Domænenavne
- Bruger-ID'er
Organisationsdata
- Firmanavne
- Organisations-ID'er
- Registreringsnumre
- Afdelingsnavne
Tidsdata
- Datoer
- Tidspunkter
- Datointervaller
- Tidsstempler
Internationale Formater
- Tysk ID (Personalausweis)
- UK National Insurance
- Spansk DNI/NIE
- Italiensk Codice Fiscale
- Og 70+ flere landespecifikke formater
Brugerdefineret Enhedsstøtte
Har du brug for at registrere brugerdefinerede mønstre? Opret dine egne enhedstyper med regex-mønstre eller brug vores AI-assisterede mønstergenerator.
Manuel Mønsteroprettelse
Definer regex-mønstre for proprietære identifikatorer som interne medarbejder-ID'er, projektkoder eller brugerdefinerede referencenumre.
AI Mønstergenerator
Beskriv, hvad du vil registrere på almindeligt sprog, og vores AI genererer optimerede regex-mønstre for dig.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient