Com Funciona la Detecció
Coincidència de Patrons Regex (PII Estructurat)
317 PatternRecognizers personalitzats amb patrons regex detecten dades estructurades com ID nacionals, números fiscals, passaports i permisos de conduir. Cada patró utilitza afirmacions de límit per evitar coincidències falses en codi o dades estructurades.
Reconeixement d'Entitats Nominals NLP (Noms i Localitzacions)
spaCy (25 idiomes), NER Stanza (7 idiomes) i transformadors XLM-RoBERTa (16 idiomes) detecten PII no estructurat com noms de persones, localitzacions i organitzacions que no poden ser capturats només per regex. Tots els models s'executen als nostres propis servidors a Alemanya — mai s'envien dades a Meta, Google, Stanford o cap tercer.
Puntuació de Confiança
Cada detecció inclou una puntuació de confiança (0.0–1.0) per a decisions humanes en el bucle. Els formats altament específics (per exemple, IBAN alemany DE89 3704 0044 0532 0130 00) puntuen 0.85+, mentre que els patrons de dígits genèrics puntuen 0.3–0.5 i depenen de paraules de context per a la confirmació. Els equips de compliment poden revisar i anul·lar deteccions abans de l'anonimització.
Anàlisi de Paraules de Context
Cada reconeixedor té paraules de context en l'idioma rellevant (per exemple, 'Personalausweis' per a ID alemanys, 'kitambulisho' per a ID kenyans). Quan les paraules de context apareixen prop d'una coincidència, la puntuació de confiança es veu augmentada.
Tipus d'Entitats Suportades
Cobertura completa dels tipus d'informació personal a través de categories
Identificadors Personals
- Noms de Persona
- Adreces de Correu Electrònic
- Números de Telèfon
- Data de Naixement
- Edat
- Gènere
- Nacionalitat
Informació Financera
- Números de Targeta de Crèdit
- IBAN
- BIC/SWIFT
- Números de Compte Bancari
- ID Fiscals
- Números de IVA
ID Governamentals
- Números de Seguretat Social (SSN)
- Números d'ID Nacionals
- Números de Passaport
- Permisos de Conduir
- ID d'Assegurança de Salut
Dades de Localització
- Adreces
- Ciutats
- Codis Postals
- Països
- Coordenades GPS
Identificadors Digitals
- Adreces IP (v4/v6)
- Adreces MAC
- URLs
- Noms de Domini
- ID d'Usuari
Dades d'Organització
- Noms d'Empresa
- ID d'Organització
- Números de Registre
- Noms de Departament
Dades Temporals
- Dates
- Hores
- Intervals de Dates
- Marques de Temps
Formats Internacionals
- ID Alemany (Personalausweis)
- Assegurança Nacional del Regne Unit
- DNI/NIE Espanyol
- Codice Fiscale Italià
- I més de 70 formats específics per país
Suport d'Entitats Personalitzades
Necessiteu detectar patrons personalitzats? Creeu els vostres propis tipus d'entitats amb patrons regex o utilitzeu el nostre generador de patrons assistit per IA.
Creació Manual de Patrons
Definiu patrons regex per a identificadors propietaris com ID d'empleats interns, codis de projectes o números de referència personalitzats.
Generador de Patrons IA
Descriviu el que voleu detectar en llenguatge senzill, i la nostra IA generarà patrons regex optimitzats per a vostè.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient