Cómo funciona cloak.business

Detección de PII basada en regex: 317 reconocedores de patrones deterministas para datos estructurados (IDs, números fiscales, tarjetas de crédito), además de spaCy, Stanza y XLM-RoBERTa NLP para nombres y ubicaciones en 48 idiomas.

Regex primero: Por qué es importante

Nuestro enfoque: Regex + NLP

  • 317 reconocedores regex: 100% reproducibles para datos estructurados
  • NLP para nombres y ubicaciones con puntuaciones de confianza
  • Totalmente auditable: cada detección es trazable a un patrón o modelo
  • Transparente: siempre sabe qué coincidió y por qué
  • Rendimiento rápido y predecible
  • 48 idiomas en 3 motores NLP

Enfoques solo IA

  • Todas las detecciones son probabilísticas
  • No puede explicar por qué se marcó algo
  • Requiere grandes conjuntos de datos de entrenamiento
  • Difícil de auditar para cumplimiento
  • Costos de computación más altos (se necesita GPU)
  • El drift del modelo reduce la precisión con el tiempo

El proceso en 10 pasos

Desde la entrada hasta la salida, esto es exactamente lo que sucede con su documento

1

Texto de entrada

Envíe su documento a través de la interfaz web, API o complemento de Office

2

Detección de idioma

El sistema identifica el idioma del documento para un procesamiento óptimo

3

Tokenización

El texto se divide en tokens para la búsqueda de patrones

4

Coincidencia de patrones

317 reconocedores regex y modelos NLP buscan más de 320 tipos de entidades en más de 70 países

5

Análisis de contexto

El texto circundante mejora la precisión de la detección

6

Puntuación de confianza

Cada detección recibe una puntuación de confianza (0.0–1.0) que permite decisiones de revisión humana

7

Clasificación de entidades

Los elementos detectados se categorizan por tipo

8

Revisión humana

Revise todas las detecciones, corrija falsos positivos y apruebe antes de anonimizar

9

Aplicar anonimización

Elija su método: Reemplazar, Ocultar, Hash, Encriptar o Enmascarar

10

Documento de salida

Descargue su documento anonimizado

Servidor MCP: Integración de IA con privacidad primero

Cómo fluyen sus datos a través del servidor MCP para mantener seguras las herramientas de IA

El servidor MCP actúa como un escudo de privacidad, interceptando solicitudes de herramientas de IA, anonimizando PII, procesando datos seguros a través de la IA y, opcionalmente, restaurando los valores originales.

Solicitud de herramienta de IA

Su herramienta de IA (Cursor, Claude) envía una solicitud que contiene PII

Intercepción por el servidor MCP

El servidor analiza y detecta todas las entidades PII

Anonimización

La PII se reemplaza por tokens o se oculta

Procesamiento IA

La IA recibe y procesa solo datos anonimizados

Devolución de respuesta

La respuesta de la IA regresa a través del servidor MCP

Des-tokenización

Opcional: los valores originales se restauran para el usuario

Preguntas frecuentes

¿cloak.business utiliza IA para la detección?

No. La detección utiliza patrones regex deterministas y modelos NLP (spaCy, Stanza). Esto garantiza resultados 100% reproducibles: la misma entrada siempre produce la misma salida, a diferencia de los enfoques probabilísticos de IA.

¿Por qué patrones regex en lugar de IA?

Los patrones regex son auditables, reproducibles y cumplen con la normativa. Puede inspeccionar exactamente qué coincide cada patrón. La detección basada en IA es no determinista: los resultados pueden variar entre ejecuciones, lo que dificulta la documentación de cumplimiento.

¿Qué precisión tiene la detección?

Con 317 reconocedores de patrones personalizados, incluyendo validación de checksum (Luhn, IBAN, SSN), cloak.business logra una precisión significativamente mayor que los modelos NER genéricos, especialmente para identificadores estructurados como tarjetas de crédito, IDs fiscales y números de identificación nacional.

¿Qué idiomas son compatibles?

Se admiten 48 idiomas con modelos NLP dedicados para reconocimiento de entidades nombradas. La detección basada en patrones (regex) funciona en todos los idiomas ya que coincide con patrones de caracteres independientemente del idioma.

¿Puedo agregar patrones de entidades personalizados?

Sí. La API admite definiciones de reconocedores personalizados para que pueda agregar patrones para identificadores propios, números de referencia internos o formatos de datos específicos de su sector.

Véalo en acción

Pruebe gratis nuestra detección y anonimización de PII con 200 tokens por ciclo.