Atbalstītas 48 Valodas
Pilna PII noteikšana un anonimizācija visā platformā
spaCy NLP - Darbojas Lokāli (25 valodas)
Stanza NER - Darbojas Lokāli (7 valodas)
XLM-RoBERTa Transformer - Darbojas Lokāli (16 valodas)
RTL Atbalsts
Darbināts ar Uzlabotu NLP
Trīs NLP dzinēji strādā kopā maksimālai valodu pārklājumam
- Lazy-loaded modeļi (maks. 5 kešatmiņā) atmiņas efektivitātei
- Automātiska valodas noteikšana
- Jauktas valodas dokumentu apstrāde
- Valodai specifiski entitāšu modeļi
Valstij Specifiski Formāti
Mēs atpazīstam PII formātus, kas ir specifiski katrai valstij un reģionam.
Eiropas Formāti
- Vācu: Personalausweis, Steuer-ID, Reisepass
- Franču: NIR, Carte Nationale, Permis
- Itāļu: Codice Fiscale, Carta d'Identità
- Spāņu: DNI, NIE, NIF
- Holandiešu: BSN, Rijbewijs
- Poļu: PESEL, NIP, REGON
Āzijas-Pacifika Formāti
- Japāna: My Number, Pase
- Indija: Aadhaar, PAN, GSTIN, Transportlīdzekļa Reģistrācija
- Taizeme: Nacionālais ID, Nodokļu ID, Pase
- Indonēzija: NIK, NPWP, Pase
- Vjetnama: CCCD, Nodokļu Kods, Pase
- Malaizija: MyKad, Nodokļu ID, Pase
Amerikas, Āfrika un Tuvie Austrumi
- ASV: SSN, Vadītāja Apliecība, Pase
- Lielbritānija: Nacionālās Apdrošināšanas Numurs, NHS Numurs
- Kanāda: SIN, Vadītāja Apliecība
- Austrālija: TFN, Medicare, ABN
- Kenija: Nacionālais ID, KRA PIN, Pase
- Dienvidāfrika: ID Numurs, Nodokļu Numurs, Pase
Bieži Uzdotie Jautājumi
Kuras 48 valodas atbalsta cloak.business?
cloak.business atbalsta afrikāņu, arābu, armēņu, basku, bengāļu, bulgāru, katalāņu, ķīniešu, horvātu, čehu, dāņu, holandiešu, angļu, igauņu, somu, franču, vācu, grieķu, ebreju, hindī, ungāru, islandiešu, indonēziešu, itāļu, japāņu, korejiešu, latviešu, lietuviešu, maķedoniešu, malajiešu, norvēģu, persiešu, poļu, portugāļu, rumāņu, krievu, serbu, slovāku, slovēņu, spāņu, svahili, zviedru, tagalogu, taju, turku, ukraiņu, urdu un vjetnamiešu — ar pilnu RTL atbalstu arābu, ebreju, persiešu un urdu valodām.
Vai PII noteikšana darbojas vienādi visās valodās?
Noteikšana izmanto divas pieejas: regex bāzētu modeļu atbilstību strukturētiem datiem (ID, tālruņa numuri, nodokļu numuri) un NLP modeļus nestrukturētām entitātēm (vārdi, vietas). Modeļu bāzētā noteikšana aptver visas 48 valodas. NLP bāzētā noteikšana ir pieejama valodās ar apmācītiem modeļiem.
Kā tiek apstrādāti valstij specifiski ID formāti?
cloak.business ietver 317 modeļu atpazinējus, kas aptver vairāk nekā 70 valstis. Katrs atpazinējs pārbauda konkrēto formātu, kontrolsummu un nacionālo ID, nodokļu numuru, veselības identifikatoru un finanšu datu struktūru.
Vai es varu noteikt PII vairākās valodās vienā dokumentā?
Jā. cloak.business var apstrādāt daudzvalodu dokumentus un noteikt PII dažādās valodās vienā pieprasījumā. Sistēma automātiski identificē, kurus valodu modeļus piemērot.
Kā es varu pievienot atbalstu jaunai valodai vai entitātes tipam?
Jūs varat izveidot pielāgotus entitāšu atpazinējus, izmantojot regex modeļus vai noliegumu sarakstus. Tas ļauj pievienot nozares specifiskus identifikatorus vai paplašināt pārklājumu uz papildu formātiem, kas vēl nav iekļauti iebūvētajā atpazinēju bibliotēkā.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only