cloak.business

PII Detectie: 320+ Entiteitstypen

Onze detectiemotor combineert 317 aangepaste regex-herkenners met NLP-modellen om 320+ typen persoonlijke informatie in meer dan 70 landen te identificeren. Zelfde input, zelfde output - elke keer.

Hoe Detectie Werkt

Regex Patroonherkenning (Gestructureerde PII)

317 aangepaste PatternRecognizers met regex-patronen detecteren gestructureerde data zoals nationale ID's, belastingnummers, paspoorten en rijbewijzen. Elk patroon gebruikt grensasserties om valse overeenkomsten in code of gestructureerde data te voorkomen.

NLP Named Entity Recognition (Namen & Locaties)

spaCy (25 talen), Stanza NER (7 talen), en XLM-RoBERTa transformers (16 talen) detecteren ongestructureerde PII zoals persoonsnamen, locaties en organisaties die niet door alleen regex kunnen worden vastgelegd. Alle modellen draaien op onze eigen servers in Duitsland — er worden nooit gegevens verzonden naar Meta, Google, Stanford of een derde partij.

Vertrouwensscore

Elke detectie bevat een vertrouwensscore (0.0–1.0) voor menselijke beslissingen. Zeer specifieke formaten (bijv. Duitse IBAN DE89 3704 0044 0532 0130 00) scoren 0.85+, terwijl generieke cijferpatronen 0.3–0.5 scoren en vertrouwen op contextwoorden voor bevestiging. Compliance-teams kunnen detecties beoordelen en overschrijven vóór anonimisering.

Context Woordanalyse

Elke herkenner heeft contextwoorden in de relevante taal (bijv. 'Personalausweis' voor Duitse ID's, 'kitambulisho' voor Keniaanse ID's). Wanneer contextwoorden in de buurt van een overeenkomst verschijnen, wordt de vertrouwensscore verhoogd.

Ondersteunde Entiteitstypen

Uitgebreide dekking van typen persoonlijke informatie in verschillende categorieën

Persoonlijke Identificatoren

  • Persoonsnamen
  • E-mailadressen
  • Telefoonnummers
  • Geboortedatum
  • Leeftijd
  • Geslacht
  • Nationaliteit

Financiële Informatie

  • Creditcardnummers
  • IBAN
  • BIC/SWIFT
  • Bankrekeningnummers
  • Belasting-ID's
  • BTW-nummers

Overheids-ID's

  • Social Security Numbers (SSN)
  • Nationale ID-nummers
  • Paspoortnummers
  • Rijbewijzen
  • Zorgverzekerings-ID's

Locatiegegevens

  • Straatadressen
  • Steden
  • Postcodes
  • Landen
  • GPS-coördinaten

Digitale Identificatoren

  • IP-adressen (v4/v6)
  • MAC-adressen
  • URL's
  • Domeinnamen
  • Gebruikers-ID's

Organisatiegegevens

  • Bedrijfsnamen
  • Organisatie-ID's
  • Registratienummers
  • Afdelingsnamen

Tijdgegevens

  • Datums
  • Tijden
  • Datumbereiken
  • Tijdstempels

Internationale Formaten

  • Duitse ID (Personalausweis)
  • Britse National Insurance
  • Spaanse DNI/NIE
  • Italiaanse Codice Fiscale
  • En 70+ meer land-specifieke formaten

Ondersteuning voor Aangepaste Entiteiten

Moet u aangepaste patronen detecteren? Maak uw eigen entiteitstypen met regex-patronen of gebruik onze AI-ondersteunde patroongenerator.

Handmatige Patrooncreatie

Definieer regex-patronen voor eigen identificatoren zoals interne werknemers-ID's, projectcodes of aangepaste referentienummers.

AI Patroongenerator

Beschrijf wat u wilt detecteren in gewone taal, en onze AI genereert geoptimaliseerde regex-patronen voor u.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Begin Vandaag met PII Detectie

Probeer onze detectiemotor gratis met 200 tokens per cyclus. Geen creditcard vereist.