Detección de PII: Más de 320 Tipos de Entidades

Nuestro motor de detección combina 317 reconocedores de regex personalizados con modelos NLP para identificar más de 320 tipos de información personal en más de 70 países. Mismo input, mismo output - cada vez.

Cómo Funciona la Detección

Coincidencia de Patrones Regex (PII Estructurado)

317 PatternRecognizers personalizados con patrones regex detectan datos estructurados como IDs nacionales, números fiscales, pasaportes y licencias de conducir. Cada patrón utiliza afirmaciones de límites para prevenir coincidencias falsas en código o datos estructurados.

Reconocimiento de Entidades Nombradas NLP (Nombres y Ubicaciones)

spaCy (25 idiomas), NER de Stanza (7 idiomas) y transformadores XLM-RoBERTa (16 idiomas) detectan PII no estructurado como nombres de personas, ubicaciones y organizaciones que no pueden ser capturados solo por regex. Todos los modelos se ejecutan en nuestros propios servidores en Alemania — nunca se envían datos a Meta, Google, Stanford, o cualquier tercero.

Puntuación de Confianza

Cada detección incluye una puntuación de confianza (0.0–1.0) para decisiones con intervención humana. Los formatos altamente específicos (por ejemplo, IBAN alemán DE89 3704 0044 0532 0130 00) puntúan 0.85+, mientras que los patrones genéricos de dígitos puntúan 0.3–0.5 y dependen de palabras de contexto para confirmación. Los equipos de cumplimiento pueden revisar y anular detecciones antes de la anonimización.

Análisis de Palabras de Contexto

Cada reconocedor tiene palabras de contexto en el idioma relevante (por ejemplo, 'Personalausweis' para IDs alemanes, 'kitambulisho' para IDs kenianos). Cuando las palabras de contexto aparecen cerca de una coincidencia, la puntuación de confianza se incrementa.

Tipos de Entidades Soportadas

Cobertura completa de tipos de información personal a través de categorías

Identificadores Personales

  • Nombres de Personas
  • Direcciones de Correo Electrónico
  • Números de Teléfono
  • Fecha de Nacimiento
  • Edad
  • Género
  • Nacionalidad

Información Financiera

  • Números de Tarjetas de Crédito
  • IBAN
  • BIC/SWIFT
  • Números de Cuenta Bancaria
  • IDs Fiscales
  • Números de IVA

IDs Gubernamentales

  • Números de Seguridad Social (SSN)
  • Números de ID Nacional
  • Números de Pasaporte
  • Licencias de Conducir
  • IDs de Seguro de Salud

Datos de Ubicación

  • Direcciones
  • Ciudades
  • Códigos Postales
  • Países
  • Coordenadas GPS

Identificadores Digitales

  • Direcciones IP (v4/v6)
  • Direcciones MAC
  • URLs
  • Nombres de Dominio
  • IDs de Usuario

Datos de Organización

  • Nombres de Empresas
  • IDs de Organización
  • Números de Registro
  • Nombres de Departamentos

Datos Temporales

  • Fechas
  • Tiempos
  • Rangos de Fechas
  • Timestamps

Formatos Internacionales

  • ID Alemán (Personalausweis)
  • Seguro Nacional del Reino Unido
  • DNI/NIE Español
  • Codice Fiscale Italiano
  • Y más de 70 formatos específicos de países

Soporte para Entidades Personalizadas

¿Necesita detectar patrones personalizados? Cree sus propios tipos de entidades con patrones regex o use nuestro generador de patrones asistido por IA.

Creación Manual de Patrones

Defina patrones regex para identificadores propietarios como IDs internos de empleados, códigos de proyectos o números de referencia personalizados.

Generador de Patrones de IA

Describa lo que desea detectar en lenguaje sencillo, y nuestra IA generará patrones regex optimizados para usted.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Comience a Detectar PII Hoy

Pruebe nuestro motor de detección gratis con 200 tokens por ciclo. No se requiere tarjeta de crédito.