Regex primero: Por qué es importante
Nuestro enfoque: Regex + NLP
- 317 reconocedores regex: 100% reproducibles para datos estructurados
- NLP para nombres y ubicaciones con puntuaciones de confianza
- Totalmente auditable: cada detección es trazable a un patrón o modelo
- Transparente: siempre sabe qué coincidió y por qué
- Rendimiento rápido y predecible
- 48 idiomas en 3 motores NLP
Enfoques solo IA
- Todas las detecciones son probabilísticas
- No puede explicar por qué se marcó algo
- Requiere grandes conjuntos de datos de entrenamiento
- Difícil de auditar para cumplimiento
- Costos de computación más altos (se necesita GPU)
- El drift del modelo reduce la precisión con el tiempo
El proceso en 10 pasos
Desde la entrada hasta la salida, esto es exactamente lo que sucede con su documento
Texto de entrada
Envíe su documento a través de la interfaz web, API o complemento de Office
Detección de idioma
El sistema identifica el idioma del documento para un procesamiento óptimo
Tokenización
El texto se divide en tokens para la búsqueda de patrones
Coincidencia de patrones
317 reconocedores regex y modelos NLP buscan más de 320 tipos de entidades en más de 70 países
Análisis de contexto
El texto circundante mejora la precisión de la detección
Puntuación de confianza
Cada detección recibe una puntuación de confianza (0.0–1.0) que permite decisiones de revisión humana
Clasificación de entidades
Los elementos detectados se categorizan por tipo
Revisión humana
Revise todas las detecciones, corrija falsos positivos y apruebe antes de anonimizar
Aplicar anonimización
Elija su método: Reemplazar, Ocultar, Hash, Encriptar o Enmascarar
Documento de salida
Descargue su documento anonimizado
Servidor MCP: Integración de IA con privacidad primero
Cómo fluyen sus datos a través del servidor MCP para mantener seguras las herramientas de IA
El servidor MCP actúa como un escudo de privacidad, interceptando solicitudes de herramientas de IA, anonimizando PII, procesando datos seguros a través de la IA y, opcionalmente, restaurando los valores originales.
Solicitud de herramienta de IA
Su herramienta de IA (Cursor, Claude) envía una solicitud que contiene PII
Intercepción por el servidor MCP
El servidor analiza y detecta todas las entidades PII
Anonimización
La PII se reemplaza por tokens o se oculta
Procesamiento IA
La IA recibe y procesa solo datos anonimizados
Devolución de respuesta
La respuesta de la IA regresa a través del servidor MCP
Des-tokenización
Opcional: los valores originales se restauran para el usuario
Preguntas frecuentes
¿cloak.business utiliza IA para la detección?
No. La detección utiliza patrones regex deterministas y modelos NLP (spaCy, Stanza). Esto garantiza resultados 100% reproducibles: la misma entrada siempre produce la misma salida, a diferencia de los enfoques probabilísticos de IA.
¿Por qué patrones regex en lugar de IA?
Los patrones regex son auditables, reproducibles y cumplen con la normativa. Puede inspeccionar exactamente qué coincide cada patrón. La detección basada en IA es no determinista: los resultados pueden variar entre ejecuciones, lo que dificulta la documentación de cumplimiento.
¿Qué precisión tiene la detección?
Con 317 reconocedores de patrones personalizados, incluyendo validación de checksum (Luhn, IBAN, SSN), cloak.business logra una precisión significativamente mayor que los modelos NER genéricos, especialmente para identificadores estructurados como tarjetas de crédito, IDs fiscales y números de identificación nacional.
¿Qué idiomas son compatibles?
Se admiten 48 idiomas con modelos NLP dedicados para reconocimiento de entidades nombradas. La detección basada en patrones (regex) funciona en todos los idiomas ya que coincide con patrones de caracteres independientemente del idioma.
¿Puedo agregar patrones de entidades personalizados?
Sí. La API admite definiciones de reconocedores personalizados para que pueda agregar patrones para identificadores propios, números de referencia internos o formatos de datos específicos de su sector.