48 Lingue Supportate
Rilevamento e anonimizzazione completi di PII su tutta la piattaforma
spaCy NLP - Esegue Localmente (25 lingue)
Stanza NER - Esegue Localmente (7 lingue)
XLM-RoBERTa Transformer - Esegue Localmente (16 lingue)
Supporto RTL
Alimentato da NLP Avanzato
Tre motori NLP che lavorano insieme per la massima copertura linguistica
- Modelli caricati pigramente (massimo 5 in cache) per efficienza di memoria
- Rilevamento automatico della lingua
- Elaborazione di documenti in lingue miste
- Modelli di entità specifici per lingua
Formati Specifici per Paese
Rileviamo PII in formati specifici per ogni paese e regione.
Formati Europei
- Tedesco: Personalausweis, Steuer-ID, Reisepass
- Francese: NIR, Carte Nationale, Permis
- Italiano: Codice Fiscale, Carta d'Identità
- Spagnolo: DNI, NIE, NIF
- Olandese: BSN, Rijbewijs
- Polacco: PESEL, NIP, REGON
Formati Asia-Pacifico
- Giappone: My Number, Passaporto
- India: Aadhaar, PAN, GSTIN, Registrazione Veicoli
- Thailandia: ID Nazionale, Codice Fiscale, Passaporto
- Indonesia: NIK, NPWP, Passaporto
- Vietnam: CCCD, Codice Fiscale, Passaporto
- Malesia: MyKad, Codice Fiscale, Passaporto
Americhe, Africa e Medio Oriente
- USA: SSN, Patente di Guida, Passaporto
- Regno Unito: Assicurazione Nazionale, Numero NHS
- Canada: SIN, Patente di Guida
- Australia: TFN, Medicare, ABN
- Kenya: ID Nazionale, KRA PIN, Passaporto
- Sud Africa: Numero ID, Numero Fiscale, Passaporto
Domande Frequenti
Quali 48 lingue supporta cloak.business?
cloak.business supporta Afrikaans, Arabo, Armeno, Basco, Bengalese, Bulgaro, Catalano, Cinese, Croato, Ceco, Danese, Olandese, Inglese, Estone, Finlandese, Francese, Tedesco, Greco, Ebraico, Hindi, Ungherese, Islandese, Indonesiano, Italiano, Giapponese, Coreano, Lettone, Lituano, Macedone, Malese, Norvegese, Persiano, Polacco, Portoghese, Rumeno, Russo, Serbo, Slovacco, Sloveno, Spagnolo, Swahili, Svedese, Tagalog, Tailandese, Turco, Ucraino, Urdu e Vietnamita — con supporto completo RTL per Arabo, Ebraico, Persiano e Urdu.
Il rilevamento di PII funziona allo stesso modo in tutte le lingue?
Il rilevamento utilizza due approcci: il pattern matching basato su regex per dati strutturati (ID, numeri di telefono, numeri fiscali) e modelli NLP per entità non strutturate (nomi, località). Il rilevamento basato su pattern copre tutte le 48 lingue. Il rilevamento basato su NLP è disponibile nelle lingue con modelli addestrati.
Come vengono gestiti i formati di ID specifici per paese?
cloak.business include 317 riconoscitori di pattern che coprono oltre 70 paesi. Ogni riconoscitore convalida il formato specifico, il checksum e la struttura degli ID nazionali, dei numeri fiscali, degli identificatori sanitari e dei dati finanziari per quel paese.
Posso rilevare PII in più lingue all'interno dello stesso documento?
Sì. cloak.business può elaborare documenti multilingue e rilevare PII in diverse lingue in una singola richiesta. Il sistema identifica automaticamente quali modelli linguistici applicare.
Come posso aggiungere supporto per una nuova lingua o tipo di entità?
È possibile creare riconoscitori di entità personalizzati utilizzando pattern regex o liste di negazione. Questo consente di aggiungere identificatori specifici del dominio o estendere la copertura a formati aggiuntivi non ancora inclusi nella libreria di riconoscitori integrata.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only