cloak.business

Deteksi PII dalam 48 Bahasa

Deteksi dan anonimisasi PII dalam 48 bahasa dengan dukungan pola asli. Dukungan RTL penuh untuk bahasa Arab, Ibrani, Persia, dan Urdu.

48 Bahasa Didukung

Deteksi dan anonimisasi PII penuh di seluruh platform

spaCy NLP - Berjalan Secara Lokal (25 bahasa)

InggrisJermanSpanyolPrancisItaliaPortugisBelandaPolandiaRusiaJepangCinaKoreaRumaniaYunaniKroasiaSloveniaMakedoniaSwediaDenmarkNorwegiaFinlandiaUkrainaLituaniaKatalanTurki

Stanza NER - Berjalan Secara Lokal (7 bahasa)

BulgariaHungariaIbrani (RTL)VietnamAfrikaansArmeniaBasque

XLM-RoBERTa Transformer - Berjalan Secara Lokal (16 bahasa)

Arab (RTL)HindiCekoSlovakiaIndonesiaThaiPersia (RTL)SerbiaLatviaEstoniaMelayuBengaliUrdu (RTL)SwahiliTagalogIslandia

Dukungan RTL

ArabIbraniPersiaUrdu

Didukung oleh NLP Canggih

Tiga mesin NLP bekerja sama untuk cakupan bahasa maksimum

  • Model yang dimuat secara malas (maksimal 5 yang di-cache) untuk efisiensi memori
  • Deteksi bahasa otomatis
  • Pemrosesan dokumen campuran bahasa
  • Pola entitas spesifik bahasa

Format Khusus Negara

Kami mendeteksi PII dalam format khusus untuk setiap negara dan wilayah.

Format Eropa

  • Jerman: Personalausweis, Steuer-ID, Reisepass
  • Prancis: NIR, Carte Nationale, Permis
  • Italia: Codice Fiscale, Carta d'Identità
  • Spanyol: DNI, NIE, NIF
  • Belanda: BSN, Rijbewijs
  • Polandia: PESEL, NIP, REGON

Format Asia-Pasifik

  • Jepang: My Number, Passport
  • India: Aadhaar, PAN, GSTIN, Registrasi Kendaraan
  • Thailand: ID Nasional, ID Pajak, Passport
  • Indonesia: NIK, NPWP, Passport
  • Vietnam: CCCD, Kode Pajak, Passport
  • Malaysia: MyKad, ID Pajak, Passport

Amerika, Afrika & Timur Tengah

  • AS: SSN, Surat Izin Mengemudi, Passport
  • Inggris: Asuransi Nasional, Nomor NHS
  • Kanada: SIN, Surat Izin Mengemudi
  • Australia: TFN, Medicare, ABN
  • Kenya: ID Nasional, KRA PIN, Passport
  • Afrika Selatan: Nomor ID, Nomor Pajak, Passport

Pertanyaan yang Sering Diajukan

Bahasa apa saja yang didukung oleh cloak.business?

cloak.business mendukung Afrikaans, Arab, Armenia, Basque, Bengali, Bulgaria, Katalan, Cina, Kroasia, Ceko, Denmark, Belanda, Inggris, Estonia, Finlandia, Prancis, Jerman, Yunani, Ibrani, Hindi, Hungaria, Islandia, Indonesia, Italia, Jepang, Korea, Latvia, Lituania, Makedonia, Melayu, Norwegia, Persia, Polandia, Portugis, Rumania, Rusia, Serbia, Slovakia, Slovenia, Spanyol, Swahili, Swedia, Tagalog, Thai, Turki, Ukraina, Urdu, dan Vietnam — dengan dukungan RTL penuh untuk Arab, Ibrani, Persia, dan Urdu.

Apakah deteksi PII bekerja sama di semua bahasa?

Deteksi menggunakan dua pendekatan: pencocokan pola berbasis regex untuk data terstruktur (ID, nomor telepon, nomor pajak) dan model NLP untuk entitas tidak terstruktur (nama, lokasi). Deteksi berbasis pola mencakup semua 48 bahasa. Deteksi berbasis NLP tersedia dalam bahasa dengan model terlatih.

Bagaimana format ID khusus negara ditangani?

cloak.business mencakup 317 pengenal pola yang mencakup lebih dari 70 negara. Setiap pengenal memvalidasi format spesifik, checksum, dan struktur ID nasional, nomor pajak, pengenal kesehatan, dan data keuangan untuk negara tersebut.

Bisakah saya mendeteksi PII dalam beberapa bahasa dalam dokumen yang sama?

Ya. cloak.business dapat memproses dokumen multibahasa dan mendeteksi PII di berbagai bahasa dalam satu permintaan. Sistem secara otomatis mengidentifikasi pola bahasa mana yang akan diterapkan.

Bagaimana cara menambahkan dukungan untuk bahasa atau jenis entitas baru?

Anda dapat membuat pengenal entitas kustom menggunakan pola regex atau daftar penolakan. Ini memungkinkan Anda menambahkan pengenal spesifik domain atau memperluas cakupan ke format tambahan yang belum termasuk dalam perpustakaan pengenal bawaan.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimkan dalam Bahasa Apa Saja

Mulai dengan 200 token gratis. Bekerja dengan semua 48 bahasa.