Hoe Detectie Werkt
Regex Patroonherkenning (Gestructureerde PII)
317 aangepaste PatternRecognizers met regex-patronen detecteren gestructureerde data zoals nationale ID's, belastingnummers, paspoorten en rijbewijzen. Elk patroon gebruikt grensasserties om valse overeenkomsten in code of gestructureerde data te voorkomen.
NLP Named Entity Recognition (Namen & Locaties)
spaCy (25 talen), Stanza NER (7 talen), en XLM-RoBERTa transformers (16 talen) detecteren ongestructureerde PII zoals persoonsnamen, locaties en organisaties die niet door alleen regex kunnen worden vastgelegd. Alle modellen draaien op onze eigen servers in Duitsland — er worden nooit gegevens verzonden naar Meta, Google, Stanford of een derde partij.
Vertrouwensscore
Elke detectie bevat een vertrouwensscore (0.0–1.0) voor menselijke beslissingen. Zeer specifieke formaten (bijv. Duitse IBAN DE89 3704 0044 0532 0130 00) scoren 0.85+, terwijl generieke cijferpatronen 0.3–0.5 scoren en vertrouwen op contextwoorden voor bevestiging. Compliance-teams kunnen detecties beoordelen en overschrijven vóór anonimisering.
Context Woordanalyse
Elke herkenner heeft contextwoorden in de relevante taal (bijv. 'Personalausweis' voor Duitse ID's, 'kitambulisho' voor Keniaanse ID's). Wanneer contextwoorden in de buurt van een overeenkomst verschijnen, wordt de vertrouwensscore verhoogd.
Ondersteunde Entiteitstypen
Uitgebreide dekking van typen persoonlijke informatie in verschillende categorieën
Persoonlijke Identificatoren
- Persoonsnamen
- E-mailadressen
- Telefoonnummers
- Geboortedatum
- Leeftijd
- Geslacht
- Nationaliteit
Financiële Informatie
- Creditcardnummers
- IBAN
- BIC/SWIFT
- Bankrekeningnummers
- Belasting-ID's
- BTW-nummers
Overheids-ID's
- Social Security Numbers (SSN)
- Nationale ID-nummers
- Paspoortnummers
- Rijbewijzen
- Zorgverzekerings-ID's
Locatiegegevens
- Straatadressen
- Steden
- Postcodes
- Landen
- GPS-coördinaten
Digitale Identificatoren
- IP-adressen (v4/v6)
- MAC-adressen
- URL's
- Domeinnamen
- Gebruikers-ID's
Organisatiegegevens
- Bedrijfsnamen
- Organisatie-ID's
- Registratienummers
- Afdelingsnamen
Tijdgegevens
- Datums
- Tijden
- Datumbereiken
- Tijdstempels
Internationale Formaten
- Duitse ID (Personalausweis)
- Britse National Insurance
- Spaanse DNI/NIE
- Italiaanse Codice Fiscale
- En 70+ meer land-specifieke formaten
Ondersteuning voor Aangepaste Entiteiten
Moet u aangepaste patronen detecteren? Maak uw eigen entiteitstypen met regex-patronen of gebruik onze AI-ondersteunde patroongenerator.
Handmatige Patrooncreatie
Definieer regex-patronen voor eigen identificatoren zoals interne werknemers-ID's, projectcodes of aangepaste referentienummers.
AI Patroongenerator
Beschrijf wat u wilt detecteren in gewone taal, en onze AI genereert geoptimaliseerde regex-patronen voor u.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient