Hur detektering fungerar
Regex-mönsterigenkänning (Strukturerad PII)
317 anpassade PatternRecognizers med regex-mönster upptäcker strukturerad data som nationella ID, skattenummer, pass och körkort. Varje mönster använder gränsassertioner för att förhindra falska träffar i kod eller strukturerad data.
NLP Namngiven Enhetsigenkänning (Namn & Platser)
spaCy (25 språk), Stanza NER (7 språk) och XLM-RoBERTa-transformatorer (16 språk) upptäcker ostrukturerad PII som personnamn, platser och organisationer som inte kan fångas av endast regex. Alla modeller körs på våra egna servrar i Tyskland — ingen data skickas någonsin till Meta, Google, Stanford eller någon tredje part.
Konfidenspoäng
Varje detektering inkluderar en konfidenspoäng (0,0–1,0) för mänskliga beslut i loopen. Mycket specifika format (t.ex. tysk IBAN DE89 3704 0044 0532 0130 00) får poäng på 0,85+, medan generiska siffermönster får poäng på 0,3–0,5 och förlitar sig på kontextord för bekräftelse. Efterlevnadsteam kan granska och åsidosätta detektioner innan anonymisering.
Kontextordsanalys
Varje igenkännare har kontextord på det relevanta språket (t.ex. 'Personalausweis' för tyska ID, 'kitambulisho' för kenyanska ID). När kontextord dyker upp nära en träff, förstärks konfidenspoängen.
Stödda enhetstyper
Omfattande täckning av typer av personlig information över kategorier
Personliga identifierare
- Personnamn
- E-postadresser
- Telefonnummer
- Födelsedatum
- Ålder
- Kön
- Nationalitet
Finansiell information
- Kreditkortsnummer
- IBAN
- BIC/SWIFT
- Bankkontonummer
- Skatte-ID
- Momsnummer
Statliga ID
- Socialförsäkringsnummer (SSN)
- Nationella ID-nummer
- Passnummer
- Körkort
- Sjukförsäkrings-ID
Platsdata
- Gatuadresser
- Städer
- Postnummer
- Länder
- GPS-koordinater
Digitala identifierare
- IP-adresser (v4/v6)
- MAC-adresser
- URL:er
- Domännamn
- Användar-ID
Organisationsdata
- Företagsnamn
- Organisations-ID
- Registreringsnummer
- Avdelningsnamn
Tidsdata
- Datum
- Tider
- Datumintervall
- Tidsstämplar
Internationella format
- Tyskt ID (Personalausweis)
- Brittiskt National Insurance
- Spanskt DNI/NIE
- Italienskt Codice Fiscale
- Och 70+ fler landspecifika format
Stöd för anpassade enheter
Behöver du upptäcka anpassade mönster? Skapa dina egna enhetstyper med regex-mönster eller använd vår AI-assisterade mönstergenerator.
Manuell mönsterskapande
Definiera regex-mönster för proprietära identifierare som interna anställd-ID, projektkoder eller anpassade referensnummer.
AI-mönstergenerator
Beskriv vad du vill upptäcka på vanlig språk, och vår AI genererar optimerade regex-mönster åt dig.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient