48 Wika na Sinusuportahan
Buong pagtukoy at pag-anonymize ng PII sa buong platform
spaCy NLP - Tumatakbo Lokal (25 wika)
Stanza NER - Tumatakbo Lokal (7 wika)
XLM-RoBERTa Transformer - Tumatakbo Lokal (16 wika)
Suporta sa RTL
Pinapatakbo ng Advanced na NLP
Tatlong NLP engine na nagtutulungan para sa pinakamataas na saklaw ng wika
- Mga lazy-loaded na modelo (max 5 naka-cache) para sa memory efficiency
- Awtomatikong pagtukoy ng wika
- Pagproseso ng dokumento na may halong wika
- Mga pattern ng entity na partikular sa wika
Mga Format na Partikular sa Bansa
Tinutukoy namin ang PII sa mga format na partikular sa bawat bansa at rehiyon.
Mga Format ng Europa
- Aleman: Personalausweis, Steuer-ID, Reisepass
- Pranses: NIR, Carte Nationale, Permis
- Italyano: Codice Fiscale, Carta d'Identità
- Espanyol: DNI, NIE, NIF
- Olandes: BSN, Rijbewijs
- Polish: PESEL, NIP, REGON
Mga Format ng Asia-Pacific
- Japan: My Number, Passport
- India: Aadhaar, PAN, GSTIN, Rehistro ng Sasakyan
- Thailand: National ID, Tax ID, Passport
- Indonesia: NIK, NPWP, Passport
- Vietnam: CCCD, Tax Code, Passport
- Malaysia: MyKad, Tax ID, Passport
Americas, Africa & Middle East
- US: SSN, Driver's License, Passport
- UK: National Insurance, NHS Number
- Canada: SIN, Driver's License
- Australia: TFN, Medicare, ABN
- Kenya: National ID, KRA PIN, Passport
- South Africa: ID Number, Tax Number, Passport
Madalas na Itanong
Aling 48 wika ang sinusuportahan ng cloak.business?
Sinusuportahan ng cloak.business ang Afrikaans, Arabic, Armenian, Basque, Bengali, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Italian, Japanese, Korean, Latvian, Lithuanian, Macedonian, Malay, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tagalog, Thai, Turkish, Ukrainian, Urdu, at Vietnamese — na may buong suporta sa RTL para sa Arabic, Hebrew, Persian, at Urdu.
Gumagana ba ang pagtukoy ng PII sa parehong paraan sa lahat ng wika?
Gumagamit ang pagtukoy ng dalawang pamamaraan: regex-based na pattern matching para sa structured data (IDs, mga numero ng telepono, mga numero ng buwis) at mga NLP model para sa unstructured na mga entity (mga pangalan, lokasyon). Ang pattern-based na pagtukoy ay sumasaklaw sa lahat ng 48 wika. Ang NLP-based na pagtukoy ay magagamit sa mga wikang may sinanay na mga modelo.
Paano hinahawakan ang mga format ng ID na partikular sa bansa?
Kasama sa cloak.business ang 317 pattern recognizers na sumasaklaw sa 70+ bansa. Ang bawat recognizer ay nagva-validate ng partikular na format, checksum, at istruktura ng mga pambansang ID, mga numero ng buwis, mga tagapagpakilala ng kalusugan, at mga pinansyal na data para sa bansang iyon.
Maaari ko bang tukuyin ang PII sa maraming wika sa loob ng parehong dokumento?
Oo. Ang cloak.business ay maaaring magproseso ng mga multilingual na dokumento at tukuyin ang PII sa iba't ibang wika sa isang solong kahilingan. Awtomatikong kinikilala ng sistema kung aling mga pattern ng wika ang ilalapat.
Paano ko idaragdag ang suporta para sa isang bagong wika o uri ng entity?
Maaari kang lumikha ng mga custom na entity recognizers gamit ang regex patterns o deny lists. Pinapayagan ka nitong magdagdag ng mga domain-specific na tagapagpakilala o palawakin ang saklaw sa karagdagang mga format na hindi pa kasama sa built-in na recognizer library.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only