48 Keele Tugi
Täielik PII tuvastamine ja anonüümimine kogu platvormil
spaCy NLP - Kohalik Käitamine (25 keelt)
Stanza NER - Kohalik Käitamine (7 keelt)
XLM-RoBERTa Transformer - Kohalik Käitamine (16 keelt)
RTL Tugi
Toetatud Täiustatud NLP-ga
Kolm NLP mootorit töötavad koos maksimaalse keelekatvuse saavutamiseks
- Laisalt laaditud mudelid (maksimaalselt 5 vahemälus) mälu efektiivsuse tagamiseks
- Automaatne keele tuvastamine
- Segakeelsete dokumentide töötlemine
- Keelepõhised entiteedimustrid
Riigispetsiifilised Formaadid
Tuvastame PII riigi- ja piirkonnapõhistes formaatides.
Euroopa Formaadid
- Saksa: Isikutunnistus, Maksu-ID, Pass
- Prantsuse: NIR, Rahvuskaart, Luba
- Itaalia: Fiskaalkood, Isikutunnistus
- Hispaania: DNI, NIE, NIF
- Hollandi: BSN, Juhiluba
- Poola: PESEL, NIP, REGON
Aasia-Vaikse Ookeani Formaadid
- Jaapan: Minu Number, Pass
- India: Aadhaar, PAN, GSTIN, Sõidukiregistreerimine
- Tai: Riiklik ID, Maksu-ID, Pass
- Indoneesia: NIK, NPWP, Pass
- Vietnam: CCCD, Maksukood, Pass
- Malaisia: MyKad, Maksu-ID, Pass
Ameerikad, Aafrika & Lähis-Ida
- USA: SSN, Juhiluba, Pass
- Suurbritannia: Riiklik Kindlustus, NHS Number
- Kanada: SIN, Juhiluba
- Austraalia: TFN, Medicare, ABN
- Keenia: Riiklik ID, KRA PIN, Pass
- Lõuna-Aafrika: ID Number, Maksunumber, Pass
Korduma Kippuvad Küsimused
Milliseid 48 keelt cloak.business toetab?
cloak.business toetab afrikaani, araabia, armeenia, baski, bengali, bulgaaria, katalaani, hiina, horvaadi, tšehhi, taani, hollandi, inglise, eesti, soome, prantsuse, saksa, kreeka, heebrea, hindi, ungari, islandi, indoneesia, itaalia, jaapani, korea, läti, leedu, makedoonia, malai, norra, pärsia, poola, portugali, rumeenia, vene, serbia, slovaki, sloveeni, hispaania, suahiili, rootsi, tagalogi, tai, türgi, ukraina, urdu ja vietnami keelt — täielik RTL tugi araabia, heebrea, pärsia ja urdu keelele.
Kas PII tuvastamine töötab kõigis keeltes ühtemoodi?
Tuvastamine kasutab kahte lähenemist: regex-põhine mustrituvastus struktureeritud andmete jaoks (ID-d, telefoninumbrid, maksunumbrid) ja NLP mudelid struktureerimata entiteetide jaoks (nimed, asukohad). Mustrituvastus katab kõik 48 keelt. NLP-põhine tuvastamine on saadaval keeltes, millel on treenitud mudelid.
Kuidas käsitletakse riigispetsiifilisi ID formaate?
cloak.business sisaldab 317 mustrituvastajat, mis katavad üle 70 riigi. Iga tuvastaja valideerib konkreetse riigi ID-de, maksunumbrite, terviseidentifikaatorite ja finantsandmete formaadi, kontrollsumma ja struktuuri.
Kas ma saan tuvastada PII-d mitmes keeles ühes dokumendis?
Jah. cloak.business saab töödelda mitmekeelseid dokumente ja tuvastada PII-d erinevates keeltes ühe päringu raames. Süsteem tuvastab automaatselt, milliseid keelemustreid rakendada.
Kuidas lisada tuge uuele keelele või entiteeditüübile?
Saate luua kohandatud entiteedituvastajaid, kasutades regex-mustreid või keelatud nimekirju. See võimaldab lisada valdkonnaspetsiifilisi identifikaatoreid või laiendada katvust lisavormaatidele, mis pole veel sisseehitatud tuvastajate raamatukogus.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only