PII-detektering: 320+ enhetstyper

Vår detekteringsmotor kombinerar 317 anpassade regex-igenkännare med NLP-modeller för att identifiera 320+ typer av personlig information i över 70 länder. Samma indata, samma utdata - varje gång.

Hur detektering fungerar

Regex-mönsterigenkänning (Strukturerad PII)

317 anpassade PatternRecognizers med regex-mönster upptäcker strukturerad data som nationella ID, skattenummer, pass och körkort. Varje mönster använder gränsassertioner för att förhindra falska träffar i kod eller strukturerad data.

NLP Namngiven Enhetsigenkänning (Namn & Platser)

spaCy (25 språk), Stanza NER (7 språk) och XLM-RoBERTa-transformatorer (16 språk) upptäcker ostrukturerad PII som personnamn, platser och organisationer som inte kan fångas av endast regex. Alla modeller körs på våra egna servrar i Tyskland — ingen data skickas någonsin till Meta, Google, Stanford eller någon tredje part.

Konfidenspoäng

Varje detektering inkluderar en konfidenspoäng (0,0–1,0) för mänskliga beslut i loopen. Mycket specifika format (t.ex. tysk IBAN DE89 3704 0044 0532 0130 00) får poäng på 0,85+, medan generiska siffermönster får poäng på 0,3–0,5 och förlitar sig på kontextord för bekräftelse. Efterlevnadsteam kan granska och åsidosätta detektioner innan anonymisering.

Kontextordsanalys

Varje igenkännare har kontextord på det relevanta språket (t.ex. 'Personalausweis' för tyska ID, 'kitambulisho' för kenyanska ID). När kontextord dyker upp nära en träff, förstärks konfidenspoängen.

Stödda enhetstyper

Omfattande täckning av typer av personlig information över kategorier

Personliga identifierare

  • Personnamn
  • E-postadresser
  • Telefonnummer
  • Födelsedatum
  • Ålder
  • Kön
  • Nationalitet

Finansiell information

  • Kreditkortsnummer
  • IBAN
  • BIC/SWIFT
  • Bankkontonummer
  • Skatte-ID
  • Momsnummer

Statliga ID

  • Socialförsäkringsnummer (SSN)
  • Nationella ID-nummer
  • Passnummer
  • Körkort
  • Sjukförsäkrings-ID

Platsdata

  • Gatuadresser
  • Städer
  • Postnummer
  • Länder
  • GPS-koordinater

Digitala identifierare

  • IP-adresser (v4/v6)
  • MAC-adresser
  • URL:er
  • Domännamn
  • Användar-ID

Organisationsdata

  • Företagsnamn
  • Organisations-ID
  • Registreringsnummer
  • Avdelningsnamn

Tidsdata

  • Datum
  • Tider
  • Datumintervall
  • Tidsstämplar

Internationella format

  • Tyskt ID (Personalausweis)
  • Brittiskt National Insurance
  • Spanskt DNI/NIE
  • Italienskt Codice Fiscale
  • Och 70+ fler landspecifika format

Stöd för anpassade enheter

Behöver du upptäcka anpassade mönster? Skapa dina egna enhetstyper med regex-mönster eller använd vår AI-assisterade mönstergenerator.

Manuell mönsterskapande

Definiera regex-mönster för proprietära identifierare som interna anställd-ID, projektkoder eller anpassade referensnummer.

AI-mönstergenerator

Beskriv vad du vill upptäcka på vanlig språk, och vår AI genererar optimerade regex-mönster åt dig.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Börja upptäcka PII idag

Prova vår detekteringsmotor gratis med 200 tokens per cykel. Inget kreditkort krävs.