Detección de PII en 48 Idiomas

Detecte y anonimice PII en 48 idiomas con soporte nativo de patrones. Soporte completo RTL para árabe, hebreo, persa y urdu.

48 Idiomas Soportados

Detección y anonimización completa de PII en toda la plataforma

spaCy NLP - Funciona Localmente (25 idiomas)

InglésAlemánEspañolFrancésItalianoPortuguésHolandésPolacoRusoJaponésChinoCoreanoRumanoGriegoCroataEslovenoMacedonioSuecoDanésNoruegoFinlandésUcranianoLituanoCatalánTurco

Stanza NER - Funciona Localmente (7 idiomas)

BúlgaroHúngaroHebreo (RTL)VietnamitaAfrikáansArmenioVasco

XLM-RoBERTa Transformer - Funciona Localmente (16 idiomas)

Árabe (RTL)HindiChecoEslovacoIndonesioTailandésPersa (RTL)SerbioLetónEstonioMalayoBengalíUrdu (RTL)SuajiliTagaloIslandés

Soporte RTL

ÁrabeHebreoPersaUrdu

Impulsado por NLP Avanzado

Tres motores NLP trabajando juntos para máxima cobertura de idiomas

  • Modelos cargados de forma perezosa (máximo 5 en caché) para eficiencia de memoria
  • Detección automática de idiomas
  • Procesamiento de documentos en varios idiomas
  • Patrones de entidades específicos de idioma

Formatos Específicos por País

Detectamos PII en formatos específicos de cada país y región.

Formatos Europeos

  • Alemán: Personalausweis, Steuer-ID, Reisepass
  • Francés: NIR, Carte Nationale, Permis
  • Italiano: Codice Fiscale, Carta d'Identità
  • Español: DNI, NIE, NIF
  • Holandés: BSN, Rijbewijs
  • Polaco: PESEL, NIP, REGON

Formatos de Asia-Pacífico

  • Japón: My Number, Pasaporte
  • India: Aadhaar, PAN, GSTIN, Registro de Vehículos
  • Tailandia: ID Nacional, ID Fiscal, Pasaporte
  • Indonesia: NIK, NPWP, Pasaporte
  • Vietnam: CCCD, Código Fiscal, Pasaporte
  • Malasia: MyKad, ID Fiscal, Pasaporte

Américas, África y Medio Oriente

  • EE.UU.: SSN, Licencia de Conducir, Pasaporte
  • Reino Unido: Seguro Nacional, Número NHS
  • Canadá: SIN, Licencia de Conducir
  • Australia: TFN, Medicare, ABN
  • Kenia: ID Nacional, KRA PIN, Pasaporte
  • Sudáfrica: Número de ID, Número Fiscal, Pasaporte

Preguntas Frecuentes

¿Qué 48 idiomas soporta cloak.business?

cloak.business soporta Afrikáans, Árabe, Armenio, Vasco, Bengalí, Búlgaro, Catalán, Chino, Croata, Checo, Danés, Holandés, Inglés, Estonio, Finés, Francés, Alemán, Griego, Hebreo, Hindi, Húngaro, Islandés, Indonesio, Italiano, Japonés, Coreano, Letón, Lituano, Macedonio, Malayo, Noruego, Persa, Polaco, Portugués, Rumano, Ruso, Serbio, Eslovaco, Esloveno, Español, Suajili, Sueco, Tagalo, Tailandés, Turco, Ucraniano, Urdu y Vietnamita, con soporte completo RTL para Árabe, Hebreo, Persa y Urdu.

¿Funciona la detección de PII igual en todos los idiomas?

La detección utiliza dos enfoques: coincidencia de patrones basada en regex para datos estructurados (IDs, números de teléfono, números fiscales) y modelos NLP para entidades no estructuradas (nombres, ubicaciones). La detección basada en patrones cubre los 48 idiomas. La detección basada en NLP está disponible en idiomas con modelos entrenados.

¿Cómo se manejan los formatos de identificación específicos de cada país?

cloak.business incluye 317 reconocedores de patrones que cubren más de 70 países. Cada reconocedor valida el formato específico, el checksum y la estructura de las identificaciones nacionales, números fiscales, identificadores de salud y datos financieros para ese país.

¿Puedo detectar PII en varios idiomas dentro del mismo documento?

Sí. cloak.business puede procesar documentos multilingües y detectar PII en diferentes idiomas en una sola solicitud. El sistema identifica automáticamente qué patrones de idioma aplicar.

¿Cómo puedo agregar soporte para un nuevo idioma o tipo de entidad?

Puede crear reconocedores de entidades personalizados utilizando patrones regex o listas de denegación. Esto le permite agregar identificadores específicos de dominio o extender la cobertura a formatos adicionales que aún no están incluidos en la biblioteca de reconocedores incorporada.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizar en Cualquier Idioma

Comience con 200 tokens gratis. Funciona con los 48 idiomas.