Cómo Funciona la Detección
Coincidencia de Patrones Regex (PII Estructurado)
317 PatternRecognizers personalizados con patrones regex detectan datos estructurados como IDs nacionales, números fiscales, pasaportes y licencias de conducir. Cada patrón utiliza afirmaciones de límites para prevenir coincidencias falsas en código o datos estructurados.
Reconocimiento de Entidades Nombradas NLP (Nombres y Ubicaciones)
spaCy (25 idiomas), NER de Stanza (7 idiomas) y transformadores XLM-RoBERTa (16 idiomas) detectan PII no estructurado como nombres de personas, ubicaciones y organizaciones que no pueden ser capturados solo por regex. Todos los modelos se ejecutan en nuestros propios servidores en Alemania — nunca se envían datos a Meta, Google, Stanford, o cualquier tercero.
Puntuación de Confianza
Cada detección incluye una puntuación de confianza (0.0–1.0) para decisiones con intervención humana. Los formatos altamente específicos (por ejemplo, IBAN alemán DE89 3704 0044 0532 0130 00) puntúan 0.85+, mientras que los patrones genéricos de dígitos puntúan 0.3–0.5 y dependen de palabras de contexto para confirmación. Los equipos de cumplimiento pueden revisar y anular detecciones antes de la anonimización.
Análisis de Palabras de Contexto
Cada reconocedor tiene palabras de contexto en el idioma relevante (por ejemplo, 'Personalausweis' para IDs alemanes, 'kitambulisho' para IDs kenianos). Cuando las palabras de contexto aparecen cerca de una coincidencia, la puntuación de confianza se incrementa.
Tipos de Entidades Soportadas
Cobertura completa de tipos de información personal a través de categorías
Identificadores Personales
- Nombres de Personas
- Direcciones de Correo Electrónico
- Números de Teléfono
- Fecha de Nacimiento
- Edad
- Género
- Nacionalidad
Información Financiera
- Números de Tarjetas de Crédito
- IBAN
- BIC/SWIFT
- Números de Cuenta Bancaria
- IDs Fiscales
- Números de IVA
IDs Gubernamentales
- Números de Seguridad Social (SSN)
- Números de ID Nacional
- Números de Pasaporte
- Licencias de Conducir
- IDs de Seguro de Salud
Datos de Ubicación
- Direcciones
- Ciudades
- Códigos Postales
- Países
- Coordenadas GPS
Identificadores Digitales
- Direcciones IP (v4/v6)
- Direcciones MAC
- URLs
- Nombres de Dominio
- IDs de Usuario
Datos de Organización
- Nombres de Empresas
- IDs de Organización
- Números de Registro
- Nombres de Departamentos
Datos Temporales
- Fechas
- Tiempos
- Rangos de Fechas
- Timestamps
Formatos Internacionales
- ID Alemán (Personalausweis)
- Seguro Nacional del Reino Unido
- DNI/NIE Español
- Codice Fiscale Italiano
- Y más de 70 formatos específicos de países
Soporte para Entidades Personalizadas
¿Necesita detectar patrones personalizados? Cree sus propios tipos de entidades con patrones regex o use nuestro generador de patrones asistido por IA.
Creación Manual de Patrones
Defina patrones regex para identificadores propietarios como IDs internos de empleados, códigos de proyectos o números de referencia personalizados.
Generador de Patrones de IA
Describa lo que desea detectar en lenguaje sencillo, y nuestra IA generará patrones regex optimizados para usted.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient