48 Bahasa Disokong
Pengesanan dan anonimisasi PII penuh di seluruh platform
spaCy NLP - Berjalan Secara Lokal (25 bahasa)
Stanza NER - Berjalan Secara Lokal (7 bahasa)
XLM-RoBERTa Transformer - Berjalan Secara Lokal (16 bahasa)
Sokongan RTL
Dikuasakan oleh NLP Lanjutan
Tiga enjin NLP bekerja bersama untuk liputan bahasa maksimum
- Model dimuat secara malas (maksimum 5 disimpan) untuk kecekapan memori
- Pengesanan bahasa automatik
- Pemprosesan dokumen pelbagai bahasa
- Corak entiti khusus bahasa
Format Khusus Negara
Kami mengesan PII dalam format khusus untuk setiap negara dan wilayah.
Format Eropah
- Jerman: Personalausweis, Steuer-ID, Reisepass
- Perancis: NIR, Carte Nationale, Permis
- Itali: Codice Fiscale, Carta d'Identità
- Sepanyol: DNI, NIE, NIF
- Belanda: BSN, Rijbewijs
- Poland: PESEL, NIP, REGON
Format Asia-Pasifik
- Jepun: My Number, Passport
- India: Aadhaar, PAN, GSTIN, Pendaftaran Kenderaan
- Thailand: ID Nasional, ID Cukai, Passport
- Indonesia: NIK, NPWP, Passport
- Vietnam: CCCD, Kod Cukai, Passport
- Malaysia: MyKad, ID Cukai, Passport
Amerika, Afrika & Timur Tengah
- AS: SSN, Lesen Memandu, Passport
- UK: Insurans Nasional, Nombor NHS
- Kanada: SIN, Lesen Memandu
- Australia: TFN, Medicare, ABN
- Kenya: ID Nasional, KRA PIN, Passport
- Afrika Selatan: Nombor ID, Nombor Cukai, Passport
Soalan Lazim
Apakah 48 bahasa yang disokong oleh cloak.business?
cloak.business menyokong Afrikaans, Arab, Armenia, Basque, Bengali, Bulgaria, Catalan, Cina, Croatia, Czech, Denmark, Belanda, Inggeris, Estonia, Finland, Perancis, Jerman, Yunani, Ibrani, Hindi, Hungary, Iceland, Indonesia, Itali, Jepun, Korea, Latvia, Lithuania, Makedonia, Melayu, Norway, Parsi, Poland, Portugis, Romania, Rusia, Serbia, Slovak, Slovenia, Sepanyol, Swahili, Sweden, Tagalog, Thai, Turki, Ukraine, Urdu, dan Vietnam — dengan sokongan RTL penuh untuk Arab, Ibrani, Parsi, dan Urdu.
Adakah pengesanan PII berfungsi sama dalam semua bahasa?
Pengesanan menggunakan dua pendekatan: pencocokan corak berasaskan regex untuk data berstruktur (ID, nombor telefon, nombor cukai) dan model NLP untuk entiti tidak berstruktur (nama, lokasi). Pengesanan berasaskan corak merangkumi semua 48 bahasa. Pengesanan berasaskan NLP tersedia dalam bahasa dengan model yang dilatih.
Bagaimana format ID khusus negara ditangani?
cloak.business merangkumi 317 pengecam corak yang meliputi lebih 70 negara. Setiap pengecam mengesahkan format khusus, checksum, dan struktur ID nasional, nombor cukai, pengecam kesihatan, dan data kewangan untuk negara tersebut.
Bolehkah saya mengesan PII dalam pelbagai bahasa dalam dokumen yang sama?
Ya. cloak.business boleh memproses dokumen pelbagai bahasa dan mengesan PII merentasi bahasa yang berbeza dalam satu permintaan. Sistem secara automatik mengenal pasti corak bahasa mana yang perlu digunakan.
Bagaimana saya menambah sokongan untuk bahasa atau jenis entiti baru?
Anda boleh membuat pengecam entiti khusus menggunakan corak regex atau senarai penafian. Ini membolehkan anda menambah pengecam khusus domain atau memperluaskan liputan kepada format tambahan yang belum termasuk dalam perpustakaan pengecam terbina dalam.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only