48 Tungumál Studd
Full greining og nafnleynd PII yfir alla vettvanginn
spaCy NLP - Keyrir Staðbundið (25 tungumál)
Stanza NER - Keyrir Staðbundið (7 tungumál)
XLM-RoBERTa Transformer - Keyrir Staðbundið (16 tungumál)
RTL Stuðningur
Knúið af Háþróaðri NLP
Þrjár NLP vélar vinna saman fyrir hámarks tungumálaumfjöllun
- Lazy-loaded módel (hámark 5 í skyndiminni) fyrir minni skilvirkni
- Sjálfvirk tungumálagreining
- Blandað tungumálaskjalavinnsla
- Tungumálasértæk mynstur fyrir einingar
Landssértæk Snið
Við greinum PII í sniðum sem eru sértæk fyrir hvert land og svæði.
Evrópsk Snið
- Þýskaland: Personalausweis, Steuer-ID, Reisepass
- Frakkland: NIR, Carte Nationale, Permis
- Ítalía: Codice Fiscale, Carta d'Identità
- Spánn: DNI, NIE, NIF
- Holland: BSN, Rijbewijs
- Pólland: PESEL, NIP, REGON
Asía-Kyrrahafssvæðið
- Japan: My Number, Passport
- Indland: Aadhaar, PAN, GSTIN, Vehicle Registration
- Taíland: National ID, Tax ID, Passport
- Indónesía: NIK, NPWP, Passport
- Víetnam: CCCD, Tax Code, Passport
- Malasía: MyKad, Tax ID, Passport
Ameríka, Afríka & Miðausturlönd
- Bandaríkin: SSN, Driver's License, Passport
- Bretland: National Insurance, NHS Number
- Kanada: SIN, Driver's License
- Ástralía: TFN, Medicare, ABN
- Kenía: National ID, KRA PIN, Passport
- Suður-Afríka: ID Number, Tax Number, Passport
Algengar Spurningar
Hvaða 48 tungumál styður cloak.business?
cloak.business styður Afríkanska, Arabísku, Armensku, Basknesku, Bengalsku, Búlgarsku, Katalónsku, Kínversku, Króatísku, Tékknesku, Dansku, Hollensku, Ensku, Eistnesku, Finnsku, Frönsku, Þýsku, Grísku, Hebresku, Hindí, Ungversku, Íslensku, Indónesísku, Ítölsku, Japönsku, Kóresku, Lettnesku, Litháísku, Makedónsku, Malay, Norsku, Persnesku, Pólska, Portúgalska, Rúmensku, Rússnesku, Serbnesku, Slóvakísku, Slóvensku, Spænsku, Svahílí, Sænsku, Tagalog, Taílensku, Tyrknesku, Úkraínska, Urdú og Víetnamska — með fullum RTL stuðningi fyrir Arabísku, Hebresku, Persnesku og Urdú.
Virkjar PII greining á sama hátt í öllum tungumálum?
Greining notar tvær aðferðir: regex-mynsturgreiningu fyrir uppbyggð gögn (auðkenni, símanúmer, skattnúmer) og NLP módel fyrir óuppbyggðar einingar (nöfn, staðsetningar). Mynsturgreining nær yfir öll 48 tungumál. NLP-greining er í boði í tungumálum með þjálfuðum módelum.
Hvernig er meðhöndlun landssértækra auðkennisforma?
cloak.business inniheldur 317 mynsturgreina sem ná yfir 70+ lönd. Hver greinir staðfestir sérstakt snið, ávísun og uppbyggingu þjóðarauðkenna, skattnúmera, heilsuauðkenna og fjármálagagna fyrir það land.
Get ég greint PII á mörgum tungumálum innan sama skjals?
Já. cloak.business getur unnið með fjöltyngd skjöl og greint PII á mismunandi tungumálum í einni beiðni. Kerfið greinir sjálfkrafa hvaða tungumálamynstur á að beita.
Hvernig bæti ég við stuðningi fyrir nýtt tungumál eða einingartegund?
Þú getur búið til sérsniðna einingargreina með því að nota regex-mynstur eða neitunarlista. Þetta gerir þér kleift að bæta við sértækum auðkennum eða auka umfjöllun til viðbótarforma sem ekki eru enn í innbyggðu greinalibraríinu.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only