PII-Deteksjon: 320+ Enhetstyper

Vår deteksjonsmotor kombinerer 317 tilpassede regex-gjenkjennere med NLP-modeller for å identifisere 320+ typer personlig informasjon i over 70 land. Samme input, samme output - hver gang.

Hvordan Deteksjon Fungerer

Regex Mønster Matching (Strukturert PII)

317 tilpassede PatternRecognizers med regex-mønstre oppdager strukturerte data som nasjonale ID-er, skattenumre, pass og førerkort. Hvert mønster bruker grensepåstander for å forhindre falske treff i kode eller strukturerte data.

NLP Navngitt Enhetsgjenkjenning (Navn & Steder)

spaCy (25 språk), Stanza NER (7 språk) og XLM-RoBERTa-transformatorer (16 språk) oppdager ustrukturerte PII som personnavn, steder og organisasjoner som ikke kan fanges opp av kun regex. Alle modeller kjører på våre egne servere i Tyskland — ingen data sendes noen gang til Meta, Google, Stanford eller noen tredjepart.

Tillitsvurdering

Hver deteksjon inkluderer en tillitsscore (0,0–1,0) for menneskelig-in-the-loop beslutninger. Svært spesifikke formater (f.eks. tysk IBAN DE89 3704 0044 0532 0130 00) scorer 0,85+, mens generiske siffermønstre scorer 0,3–0,5 og er avhengige av kontekstord for bekreftelse. Samsvarsteam kan gjennomgå og overstyre deteksjoner før anonymisering.

Kontekstord Analyse

Hver gjenkjenner har kontekstord på det relevante språket (f.eks. 'Personalausweis' for tyske ID-er, 'kitambulisho' for kenyanske ID-er). Når kontekstord vises nær et treff, økes tillitsscoren.

Støttede Enhetstyper

Omfattende dekning av typer personlig informasjon på tvers av kategorier

Personlige Identifikatorer

  • Personnavn
  • E-postadresser
  • Telefonnumre
  • Fødselsdato
  • Alder
  • Kjønn
  • Nasjonalitet

Finansiell Informasjon

  • Kredittkortnumre
  • IBAN
  • BIC/SWIFT
  • Bankkontonumre
  • Skatte-ID-er
  • MVA-numre

Offentlige ID-er

  • Personnummer (SSN)
  • Nasjonale ID-numre
  • Passnumre
  • Førerkort
  • Helseforsikrings-ID-er

Plasseringsdata

  • Gateadresser
  • Byer
  • Postnummer
  • Land
  • GPS-koordinater

Digitale Identifikatorer

  • IP-adresser (v4/v6)
  • MAC-adresser
  • URL-er
  • Domenenavn
  • Bruker-ID-er

Organisasjonsdata

  • Firmanavn
  • Organisasjons-ID-er
  • Registreringsnumre
  • Avdelingsnavn

Tidsdata

  • Datoer
  • Tider
  • Datointervaller
  • Tidsstempler

Internasjonale Formater

  • Tysk ID (Personalausweis)
  • Britisk National Insurance
  • Spansk DNI/NIE
  • Italiensk Codice Fiscale
  • Og 70+ flere landsspesifikke formater

Tilpasset Enhetsstøtte

Trenger du å oppdage tilpassede mønstre? Opprett dine egne enhetstyper med regex-mønstre eller bruk vår AI-assisterte mønstergenerator.

Manuell Mønsteropprettelse

Definer regex-mønstre for proprietære identifikatorer som interne ansatt-ID-er, prosjektkoder eller tilpassede referansenummer.

AI Mønstergenerator

Beskriv hva du vil oppdage i vanlig språk, og vår AI genererer optimaliserte regex-mønstre for deg.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Begynn å Oppdage PII i Dag

Prøv vår deteksjonsmotor gratis med 200 tokens per syklus. Ingen kredittkort kreves.