Detección de PII en 48 Idiomas

Detecte y anonimice PII en 48 idiomas con soporte nativo de patrones. Soporte completo RTL para árabe, hebreo, persa y urdu.

Pruebe Gratis Documentación de Idiomas

48 Idiomas Soportados

Detección y anonimización completa de PII en toda la plataforma

spaCy NLP - Funciona Localmente (25 idiomas)

InglésAlemánEspañolFrancésItalianoPortuguésHolandésPolacoRusoJaponésChinoCoreanoRumanoGriegoCroataEslovenoMacedonioSuecoDanésNoruegoFinlandésUcranianoLituanoCatalánTurco

Stanza NER - Funciona Localmente (7 idiomas)

BúlgaroHúngaroHebreo (RTL)VietnamitaAfrikáansArmenioVasco

XLM-RoBERTa Transformer - Funciona Localmente (16 idiomas)

Árabe (RTL)HindiChecoEslovacoIndonesioTailandésPersa (RTL)SerbioLetónEstonioMalayoBengalíUrdu (RTL)SuajiliTagaloIslandés

Soporte RTL

ÁrabeHebreoPersaUrdu

Impulsado por NLP Avanzado

Tres motores NLP trabajando juntos para máxima cobertura de idiomas

Modelos cargados de forma perezosa (máximo 5 en caché) para eficiencia de memoria
Detección automática de idiomas
Procesamiento de documentos en varios idiomas
Patrones de entidades específicos de idioma

Formatos Específicos por País

Detectamos PII en formatos específicos de cada país y región.

Formatos Europeos

Alemán: Personalausweis, Steuer-ID, Reisepass
Francés: NIR, Carte Nationale, Permis
Italiano: Codice Fiscale, Carta d'Identità
Español: DNI, NIE, NIF
Holandés: BSN, Rijbewijs
Polaco: PESEL, NIP, REGON

Formatos de Asia-Pacífico

Japón: My Number, Pasaporte
India: Aadhaar, PAN, GSTIN, Registro de Vehículos
Tailandia: ID Nacional, ID Fiscal, Pasaporte
Indonesia: NIK, NPWP, Pasaporte
Vietnam: CCCD, Código Fiscal, Pasaporte
Malasia: MyKad, ID Fiscal, Pasaporte

Américas, África y Medio Oriente

EE.UU.: SSN, Licencia de Conducir, Pasaporte
Reino Unido: Seguro Nacional, Número NHS
Canadá: SIN, Licencia de Conducir
Australia: TFN, Medicare, ABN
Kenia: ID Nacional, KRA PIN, Pasaporte
Sudáfrica: Número de ID, Número Fiscal, Pasaporte

Preguntas Frecuentes

¿Qué 48 idiomas soporta cloak.business?

cloak.business soporta Afrikáans, Árabe, Armenio, Vasco, Bengalí, Búlgaro, Catalán, Chino, Croata, Checo, Danés, Holandés, Inglés, Estonio, Finés, Francés, Alemán, Griego, Hebreo, Hindi, Húngaro, Islandés, Indonesio, Italiano, Japonés, Coreano, Letón, Lituano, Macedonio, Malayo, Noruego, Persa, Polaco, Portugués, Rumano, Ruso, Serbio, Eslovaco, Esloveno, Español, Suajili, Sueco, Tagalo, Tailandés, Turco, Ucraniano, Urdu y Vietnamita, con soporte completo RTL para Árabe, Hebreo, Persa y Urdu.

¿Funciona la detección de PII igual en todos los idiomas?

La detección utiliza dos enfoques: coincidencia de patrones basada en regex para datos estructurados (IDs, números de teléfono, números fiscales) y modelos NLP para entidades no estructuradas (nombres, ubicaciones). La detección basada en patrones cubre los 48 idiomas. La detección basada en NLP está disponible en idiomas con modelos entrenados.

¿Cómo se manejan los formatos de identificación específicos de cada país?

cloak.business incluye 317 reconocedores de patrones que cubren más de 70 países. Cada reconocedor valida el formato específico, el checksum y la estructura de las identificaciones nacionales, números fiscales, identificadores de salud y datos financieros para ese país.

¿Puedo detectar PII en varios idiomas dentro del mismo documento?

Sí. cloak.business puede procesar documentos multilingües y detectar PII en diferentes idiomas en una sola solicitud. El sistema identifica automáticamente qué patrones de idioma aplicar.

¿Cómo puedo agregar soporte para un nuevo idioma o tipo de entidad?

Puede crear reconocedores de entidades personalizados utilizando patrones regex o listas de denegación. Esto le permite agregar identificadores específicos de dominio o extender la cobertura a formatos adicionales que aún no están incluidos en la biblioteca de reconocedores incorporada.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizar en Cualquier Idioma

Comience con 200 tokens gratis. Funciona con los 48 idiomas.