48 Bahasa Didukung
Deteksi dan anonimisasi PII penuh di seluruh platform
spaCy NLP - Berjalan Secara Lokal (25 bahasa)
Stanza NER - Berjalan Secara Lokal (7 bahasa)
XLM-RoBERTa Transformer - Berjalan Secara Lokal (16 bahasa)
Dukungan RTL
Didukung oleh NLP Canggih
Tiga mesin NLP bekerja sama untuk cakupan bahasa maksimum
- Model yang dimuat secara malas (maksimal 5 yang di-cache) untuk efisiensi memori
- Deteksi bahasa otomatis
- Pemrosesan dokumen campuran bahasa
- Pola entitas spesifik bahasa
Format Khusus Negara
Kami mendeteksi PII dalam format khusus untuk setiap negara dan wilayah.
Format Eropa
- Jerman: Personalausweis, Steuer-ID, Reisepass
- Prancis: NIR, Carte Nationale, Permis
- Italia: Codice Fiscale, Carta d'Identità
- Spanyol: DNI, NIE, NIF
- Belanda: BSN, Rijbewijs
- Polandia: PESEL, NIP, REGON
Format Asia-Pasifik
- Jepang: My Number, Passport
- India: Aadhaar, PAN, GSTIN, Registrasi Kendaraan
- Thailand: ID Nasional, ID Pajak, Passport
- Indonesia: NIK, NPWP, Passport
- Vietnam: CCCD, Kode Pajak, Passport
- Malaysia: MyKad, ID Pajak, Passport
Amerika, Afrika & Timur Tengah
- AS: SSN, Surat Izin Mengemudi, Passport
- Inggris: Asuransi Nasional, Nomor NHS
- Kanada: SIN, Surat Izin Mengemudi
- Australia: TFN, Medicare, ABN
- Kenya: ID Nasional, KRA PIN, Passport
- Afrika Selatan: Nomor ID, Nomor Pajak, Passport
Pertanyaan yang Sering Diajukan
Bahasa apa saja yang didukung oleh cloak.business?
cloak.business mendukung Afrikaans, Arab, Armenia, Basque, Bengali, Bulgaria, Katalan, Cina, Kroasia, Ceko, Denmark, Belanda, Inggris, Estonia, Finlandia, Prancis, Jerman, Yunani, Ibrani, Hindi, Hungaria, Islandia, Indonesia, Italia, Jepang, Korea, Latvia, Lituania, Makedonia, Melayu, Norwegia, Persia, Polandia, Portugis, Rumania, Rusia, Serbia, Slovakia, Slovenia, Spanyol, Swahili, Swedia, Tagalog, Thai, Turki, Ukraina, Urdu, dan Vietnam — dengan dukungan RTL penuh untuk Arab, Ibrani, Persia, dan Urdu.
Apakah deteksi PII bekerja sama di semua bahasa?
Deteksi menggunakan dua pendekatan: pencocokan pola berbasis regex untuk data terstruktur (ID, nomor telepon, nomor pajak) dan model NLP untuk entitas tidak terstruktur (nama, lokasi). Deteksi berbasis pola mencakup semua 48 bahasa. Deteksi berbasis NLP tersedia dalam bahasa dengan model terlatih.
Bagaimana format ID khusus negara ditangani?
cloak.business mencakup 317 pengenal pola yang mencakup lebih dari 70 negara. Setiap pengenal memvalidasi format spesifik, checksum, dan struktur ID nasional, nomor pajak, pengenal kesehatan, dan data keuangan untuk negara tersebut.
Bisakah saya mendeteksi PII dalam beberapa bahasa dalam dokumen yang sama?
Ya. cloak.business dapat memproses dokumen multibahasa dan mendeteksi PII di berbagai bahasa dalam satu permintaan. Sistem secara otomatis mengidentifikasi pola bahasa mana yang akan diterapkan.
Bagaimana cara menambahkan dukungan untuk bahasa atau jenis entitas baru?
Anda dapat membuat pengenal entitas kustom menggunakan pola regex atau daftar penolakan. Ini memungkinkan Anda menambahkan pengenal spesifik domain atau memperluas cakupan ke format tambahan yang belum termasuk dalam perpustakaan pengenal bawaan.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only