Podprti 48 jeziki
Popolno zaznavanje in anonimizacija PII po celotni platformi
spaCy NLP - deluje lokalno (25 jezikov)
Stanza NER - deluje lokalno (7 jezikov)
XLM-RoBERTa Transformer - deluje lokalno (16 jezikov)
Podpora za RTL
Poganja ga napredni NLP
Tri NLP pogone, ki delujejo skupaj za največjo jezikovno pokritost
- Lenobno nalaganje modelov (maksimalno 5 v predpomnilniku) za učinkovitost pomnilnika
- Samodejno zaznavanje jezika
- Obdelava dokumentov v mešanih jezikih
- Jezikovno specifični vzorci entitet
Formati specifični za države
Zaznavamo PII v formatih specifičnih za vsako državo in regijo.
Evropski formati
- Nemčija: Osebna izkaznica, Steuer-ID, potni list
- Francija: NIR, Carte Nationale, vozniško dovoljenje
- Italija: Codice Fiscale, osebna izkaznica
- Španija: DNI, NIE, NIF
- Nizozemska: BSN, vozniško dovoljenje
- Poljska: PESEL, NIP, REGON
Azijsko-pacifiški formati
- Japonska: Moja številka, potni list
- Indija: Aadhaar, PAN, GSTIN, registracija vozila
- Tajska: Nacionalna ID, davčna ID, potni list
- Indonezija: NIK, NPWP, potni list
- Vietnam: CCCD, davčna koda, potni list
- Malezija: MyKad, davčna ID, potni list
Amerike, Afrika in Bližnji vzhod
- ZDA: SSN, vozniško dovoljenje, potni list
- Združeno kraljestvo: Nacionalno zavarovanje, NHS številka
- Kanada: SIN, vozniško dovoljenje
- Avstralija: TFN, Medicare, ABN
- Kenija: Nacionalna ID, KRA PIN, potni list
- Južna Afrika: ID številka, davčna številka, potni list
Pogosto zastavljena vprašanja
Katere 48 jezikov podpira cloak.business?
cloak.business podpira afrikans, arabščino, armenščino, baskovščino, bengalščino, bolgarščino, katalonščino, kitajščino, hrvaščino, češčino, danščino, nizozemščino, angleščino, estonščino, finščino, francoščino, nemščino, grščino, hebrejščino, hindijščino, madžarščino, islandščino, indonezijščino, italijanščino, japonščino, korejščino, latvijščino, litovščino, makedonščino, malajščino, norveščino, perzijščino, poljščino, portugalščino, romunščino, ruščino, srbščino, slovaščino, slovenščino, španščino, svahili, švedščino, tagalog, tajščino, turščino, ukrajinščino, urdu in vietnamščino — s popolno podporo za RTL za arabščino, hebrejščino, perzijščino in urdu.
Ali zaznavanje PII deluje enako v vseh jezikih?
Zaznavanje uporablja dva pristopa: ujemanje vzorcev na osnovi regex za strukturirane podatke (ID-ji, telefonske številke, davčne številke) in NLP modele za nestrukturirane entitete (imena, lokacije). Zaznavanje na osnovi vzorcev pokriva vseh 48 jezikov. Zaznavanje na osnovi NLP je na voljo v jezikih z usposobljenimi modeli.
Kako se obravnavajo formati ID specifični za države?
cloak.business vključuje 317 prepoznavalnikov vzorcev, ki pokrivajo več kot 70 držav. Vsak prepoznavalnik preverja specifičen format, kontrolno vsoto in strukturo nacionalnih ID-jev, davčnih številk, zdravstvenih identifikatorjev in finančnih podatkov za to državo.
Ali lahko zaznam PII v več jezikih znotraj istega dokumenta?
Da. cloak.business lahko obdeluje večjezične dokumente in zaznava PII v različnih jezikih v eni zahtevi. Sistem samodejno prepozna, katere jezikovne vzorce uporabiti.
Kako dodam podporo za nov jezik ali tip entitete?
Lahko ustvarite prilagojene prepoznavalnike entitet z uporabo regex vzorcev ali seznamov zavrnitev. To vam omogoča dodajanje identifikatorjev specifičnih za domeno ali razširitev pokritosti na dodatne formate, ki še niso vključeni v vgrajeno knjižnico prepoznavalnikov.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only