48 Idiomes Suportats
Detecció i anonimització completa de PII a tota la plataforma
spaCy NLP - S'executa Localment (25 idiomes)
Stanza NER - S'executa Localment (7 idiomes)
XLM-RoBERTa Transformer - S'executa Localment (16 idiomes)
Suport RTL
Impulsat per NLP Avançat
Tres motors NLP treballant junts per a una cobertura màxima d'idiomes
- Models carregats de manera mandrosa (màxim 5 emmagatzemats) per a eficiència de memòria
- Detecció automàtica d'idioma
- Processament de documents multilingües
- Patrons d'entitats específics per idioma
Formats Específics per País
Detectem PII en formats específics per a cada país i regió.
Formats Europeus
- Alemany: Personalausweis, Steuer-ID, Reisepass
- Francès: NIR, Carte Nationale, Permis
- Italià: Codice Fiscale, Carta d'Identità
- Espanyol: DNI, NIE, NIF
- Neerlandès: BSN, Rijbewijs
- Polonès: PESEL, NIP, REGON
Formats Àsia-Pacífic
- Japó: My Number, Passaport
- Índia: Aadhaar, PAN, GSTIN, Registre de Vehicles
- Tailàndia: ID Nacional, ID Fiscal, Passaport
- Indonèsia: NIK, NPWP, Passaport
- Vietnam: CCCD, Codi Fiscal, Passaport
- Malàisia: MyKad, ID Fiscal, Passaport
Amèriques, Àfrica i Orient Mitjà
- EUA: SSN, Llicència de Conduir, Passaport
- Regne Unit: Assegurança Nacional, Número NHS
- Canadà: SIN, Llicència de Conduir
- Austràlia: TFN, Medicare, ABN
- Kenya: ID Nacional, KRA PIN, Passaport
- Sud-àfrica: Número d'ID, Número Fiscal, Passaport
Preguntes Freqüents
Quins 48 idiomes suporta cloak.business?
cloak.business suporta Afrikaans, Àrab, Armeni, Basc, Bengalí, Búlgar, Català, Xinès, Croat, Txec, Danès, Neerlandès, Anglès, Estonià, Finès, Francès, Alemany, Grec, Hebreu, Hindi, Hongarès, Islandès, Indonesi, Italià, Japonès, Coreà, Letó, Lituà, Macedoni, Malai, Noruec, Persa, Polonès, Portuguès, Romanès, Rus, Serbi, Eslovac, Eslovè, Espanyol, Swahili, Suec, Tagalog, Tailandès, Turc, Ucraïnès, Urdú i Vietnamita — amb suport complet RTL per a àrab, hebreu, persa i urdú.
La detecció de PII funciona igual en tots els idiomes?
La detecció utilitza dos enfocaments: coincidència de patrons basada en regex per a dades estructurades (IDs, números de telèfon, números fiscals) i models NLP per a entitats no estructurades (noms, ubicacions). La detecció basada en patrons cobreix tots els 48 idiomes. La detecció basada en NLP està disponible en idiomes amb models entrenats.
Com es gestionen els formats d'ID específics per país?
cloak.business inclou 317 reconeixedors de patrons que cobreixen més de 70 països. Cada reconeixedor valida el format específic, el checksum i l'estructura dels IDs nacionals, números fiscals, identificadors de salut i dades financeres per a aquell país.
Puc detectar PII en múltiples idiomes dins del mateix document?
Sí. cloak.business pot processar documents multilingües i detectar PII en diferents idiomes en una sola sol·licitud. El sistema identifica automàticament quins patrons d'idioma aplicar.
Com puc afegir suport per a un nou idioma o tipus d'entitat?
Podeu crear reconeixedors d'entitats personalitzats utilitzant patrons regex o llistes de denegació. Això us permet afegir identificadors específics de domini o ampliar la cobertura a formats addicionals que encara no estan inclosos a la biblioteca de reconeixedors integrada.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only