48 Idiomas Soportados
Detección y anonimización completa de PII en toda la plataforma
spaCy NLP - Funciona Localmente (25 idiomas)
Stanza NER - Funciona Localmente (7 idiomas)
XLM-RoBERTa Transformer - Funciona Localmente (16 idiomas)
Soporte RTL
Impulsado por NLP Avanzado
Tres motores NLP trabajando juntos para máxima cobertura de idiomas
- Modelos cargados de forma perezosa (máximo 5 en caché) para eficiencia de memoria
- Detección automática de idiomas
- Procesamiento de documentos en varios idiomas
- Patrones de entidades específicos de idioma
Formatos Específicos por País
Detectamos PII en formatos específicos de cada país y región.
Formatos Europeos
- Alemán: Personalausweis, Steuer-ID, Reisepass
- Francés: NIR, Carte Nationale, Permis
- Italiano: Codice Fiscale, Carta d'Identità
- Español: DNI, NIE, NIF
- Holandés: BSN, Rijbewijs
- Polaco: PESEL, NIP, REGON
Formatos de Asia-Pacífico
- Japón: My Number, Pasaporte
- India: Aadhaar, PAN, GSTIN, Registro de Vehículos
- Tailandia: ID Nacional, ID Fiscal, Pasaporte
- Indonesia: NIK, NPWP, Pasaporte
- Vietnam: CCCD, Código Fiscal, Pasaporte
- Malasia: MyKad, ID Fiscal, Pasaporte
Américas, África y Medio Oriente
- EE.UU.: SSN, Licencia de Conducir, Pasaporte
- Reino Unido: Seguro Nacional, Número NHS
- Canadá: SIN, Licencia de Conducir
- Australia: TFN, Medicare, ABN
- Kenia: ID Nacional, KRA PIN, Pasaporte
- Sudáfrica: Número de ID, Número Fiscal, Pasaporte
Preguntas Frecuentes
¿Qué 48 idiomas soporta cloak.business?
cloak.business soporta Afrikáans, Árabe, Armenio, Vasco, Bengalí, Búlgaro, Catalán, Chino, Croata, Checo, Danés, Holandés, Inglés, Estonio, Finés, Francés, Alemán, Griego, Hebreo, Hindi, Húngaro, Islandés, Indonesio, Italiano, Japonés, Coreano, Letón, Lituano, Macedonio, Malayo, Noruego, Persa, Polaco, Portugués, Rumano, Ruso, Serbio, Eslovaco, Esloveno, Español, Suajili, Sueco, Tagalo, Tailandés, Turco, Ucraniano, Urdu y Vietnamita, con soporte completo RTL para Árabe, Hebreo, Persa y Urdu.
¿Funciona la detección de PII igual en todos los idiomas?
La detección utiliza dos enfoques: coincidencia de patrones basada en regex para datos estructurados (IDs, números de teléfono, números fiscales) y modelos NLP para entidades no estructuradas (nombres, ubicaciones). La detección basada en patrones cubre los 48 idiomas. La detección basada en NLP está disponible en idiomas con modelos entrenados.
¿Cómo se manejan los formatos de identificación específicos de cada país?
cloak.business incluye 317 reconocedores de patrones que cubren más de 70 países. Cada reconocedor valida el formato específico, el checksum y la estructura de las identificaciones nacionales, números fiscales, identificadores de salud y datos financieros para ese país.
¿Puedo detectar PII en varios idiomas dentro del mismo documento?
Sí. cloak.business puede procesar documentos multilingües y detectar PII en diferentes idiomas en una sola solicitud. El sistema identifica automáticamente qué patrones de idioma aplicar.
¿Cómo puedo agregar soporte para un nuevo idioma o tipo de entidad?
Puede crear reconocedores de entidades personalizados utilizando patrones regex o listas de denegación. Esto le permite agregar identificadores específicos de dominio o extender la cobertura a formatos adicionales que aún no están incluidos en la biblioteca de reconocedores incorporada.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only