cloak.business

PII Detektion: 320+ Enhedstyper

Vores detektionsmotor kombinerer 317 brugerdefinerede regex-genkendere med NLP-modeller for at identificere 320+ typer af personlige oplysninger på tværs af 70+ lande. Samme input, samme output - hver gang.

Sådan Fungerer Detektion

Regex Mønster Matching (Struktureret PII)

317 brugerdefinerede PatternRecognizers med regex-mønstre registrerer strukturerede data som nationale ID'er, skattenumre, pas og kørekort. Hvert mønster bruger grænseudsagn for at forhindre falske matches i kode eller strukturerede data.

NLP Navngiven Enhedsgenkendelse (Navne & Lokationer)

spaCy (25 sprog), Stanza NER (7 sprog) og XLM-RoBERTa transformere (16 sprog) registrerer ustruktureret PII som personnavne, lokationer og organisationer, der ikke kan fanges af kun regex. Alle modeller kører på vores egne servere i Tyskland — ingen data sendes nogensinde til Meta, Google, Stanford eller nogen tredjepart.

Tillidsscore

Hver detektion inkluderer en tillidsscore (0,0–1,0) til menneske-i-løkken beslutninger. Meget specifikke formater (f.eks. tysk IBAN DE89 3704 0044 0532 0130 00) scorer 0,85+, mens generiske cifermønstre scorer 0,3–0,5 og er afhængige af kontekstord for bekræftelse. Compliance teams kan gennemgå og tilsidesætte detektioner før anonymisering.

Kontekstord Analyse

Hver genkender har kontekstord på det relevante sprog (f.eks. 'Personalausweis' for tyske ID'er, 'kitambulisho' for kenyanske ID'er). Når kontekstord vises nær et match, øges tillidsscoren.

Understøttede Enhedstyper

Omfattende dækning af typer af personlige oplysninger på tværs af kategorier

Personlige Identifikatorer

  • Personnavne
  • E-mailadresser
  • Telefonnumre
  • Fødselsdato
  • Alder
  • Køn
  • Nationalitet

Finansiel Information

  • Kreditkortnumre
  • IBAN
  • BIC/SWIFT
  • Bankkontonumre
  • Skatte-ID'er
  • Momsnumre

Offentlige ID'er

  • Social Security Numbers (SSN)
  • Nationale ID-numre
  • Pasnumre
  • Kørekort
  • Sundhedsforsikrings-ID'er

Lokationsdata

  • Gadeadresser
  • Byer
  • Postnumre
  • Lande
  • GPS-koordinater

Digitale Identifikatorer

  • IP-adresser (v4/v6)
  • MAC-adresser
  • URL'er
  • Domænenavne
  • Bruger-ID'er

Organisationsdata

  • Firmanavne
  • Organisations-ID'er
  • Registreringsnumre
  • Afdelingsnavne

Tidsdata

  • Datoer
  • Tidspunkter
  • Datointervaller
  • Tidsstempler

Internationale Formater

  • Tysk ID (Personalausweis)
  • UK National Insurance
  • Spansk DNI/NIE
  • Italiensk Codice Fiscale
  • Og 70+ flere landespecifikke formater

Brugerdefineret Enhedsstøtte

Har du brug for at registrere brugerdefinerede mønstre? Opret dine egne enhedstyper med regex-mønstre eller brug vores AI-assisterede mønstergenerator.

Manuel Mønsteroprettelse

Definer regex-mønstre for proprietære identifikatorer som interne medarbejder-ID'er, projektkoder eller brugerdefinerede referencenumre.

AI Mønstergenerator

Beskriv, hvad du vil registrere på almindeligt sprog, og vores AI genererer optimerede regex-mønstre for dig.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Start med at Detektere PII i Dag

Prøv vores detektionsmotor gratis med 200 tokens pr. cyklus. Intet kreditkort kræves.