PII-detektering: 317 enhetstyper

Vår detekteringsmotor kombinerar 317 anpassade regex-igenkännare med NLP-modeller för att identifiera 317 typer av personlig information i över 70 länder. Samma indata, samma utdata - varje gång.

Prova gratis Fullständig enhetsreferens

Hur detektering fungerar

Regex-mönsterigenkänning (Strukturerad PII)

317 anpassade PatternRecognizers med regex-mönster upptäcker strukturerad data som nationella ID, skattenummer, pass och körkort. Varje mönster använder gränsassertioner för att förhindra falska träffar i kod eller strukturerad data.

NLP Namngiven Enhetsigenkänning (Namn & Platser)

spaCy (25 språk), Stanza NER (7 språk) och XLM-RoBERTa-transformatorer (16 språk) upptäcker ostrukturerad PII som personnamn, platser och organisationer som inte kan fångas av endast regex. Alla modeller körs på våra egna servrar i Tyskland — ingen data skickas någonsin till Meta, Google, Stanford eller någon tredje part.

Konfidenspoäng

Varje detektering inkluderar en konfidenspoäng (0,0–1,0) för mänskliga beslut i loopen. Mycket specifika format (t.ex. tysk IBAN DE89 3704 0044 0532 0130 00) får poäng på 0,85+, medan generiska siffermönster får poäng på 0,3–0,5 och förlitar sig på kontextord för bekräftelse. Efterlevnadsteam kan granska och åsidosätta detektioner innan anonymisering.

Kontextordsanalys

Varje igenkännare har kontextord på det relevanta språket (t.ex. 'Personalausweis' för tyska ID, 'kitambulisho' för kenyanska ID). När kontextord dyker upp nära en träff, förstärks konfidenspoängen.

Stödda enhetstyper

Omfattande täckning av typer av personlig information över kategorier

Personliga identifierare

Personnamn
E-postadresser
Telefonnummer
Födelsedatum
Ålder
Kön
Nationalitet

Finansiell information

Kreditkortsnummer
IBAN
BIC/SWIFT
Bankkontonummer
Skatte-ID
Momsnummer

Statliga ID

Socialförsäkringsnummer (SSN)
Nationella ID-nummer
Passnummer
Körkort
Sjukförsäkrings-ID

Platsdata

Gatuadresser
Städer
Postnummer
Länder
GPS-koordinater

Digitala identifierare

IP-adresser (v4/v6)
MAC-adresser
URL:er
Domännamn
Användar-ID

Organisationsdata

Företagsnamn
Organisations-ID
Registreringsnummer
Avdelningsnamn

Tidsdata

Datum
Tider
Datumintervall
Tidsstämplar

Internationella format

Tyskt ID (Personalausweis)
Brittiskt National Insurance
Spanskt DNI/NIE
Italienskt Codice Fiscale
Och 70+ fler landspecifika format

Stöd för anpassade enheter

Behöver du upptäcka anpassade mönster? Skapa dina egna enhetstyper med regex-mönster eller använd vår AI-assisterade mönstergenerator.

Manuell mönsterskapande

Definiera regex-mönster för proprietära identifierare som interna anställd-ID, projektkoder eller anpassade referensnummer.

AI-mönstergenerator

Beskriv vad du vill upptäcka på vanlig språk, och vår AI genererar optimerade regex-mönster åt dig.

Is This Right For You?

Best For

✦Teams needing 317 entity types across personal, financial, government, and organizational data
✦Multilingual PII detection (48 languages) for global compliance and audit requirements
✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
✦Simple English-only use cases where basic regex or keyword matching is sufficient

Börja upptäcka PII idag

Prova vår detekteringsmotor gratis med 200 tokens per cykel. Inget kreditkort krävs.