48 Լեզուների Աջակցություն
Լրիվ PII հայտնաբերում և անանունացում ամբողջ հարթակում
spaCy NLP - Աշխատում է Տեղական (25 լեզուներ)
Stanza NER - Աշխատում է Տեղական (7 լեզուներ)
XLM-RoBERTa Transformer - Աշխատում է Տեղական (16 լեզուներ)
RTL Աջակցություն
Շարժիչված է Առաջադեմ NLP-ով
Երեք NLP շարժիչներ աշխատում են միասին՝ առավելագույն լեզվական ծածկույթի համար
- Ծուլորեն բեռնվող մոդելներ (առավելագույնը 5 պահվող) հիշողության արդյունավետության համար
- Լեզվի ավտոմատ հայտնաբերում
- Խառը լեզուների փաստաթղթերի մշակում
- Լեզվային հատուկ էակների ձևեր
Երկրի Հատուկ Ձևաչափեր
Մենք հայտնաբերում ենք PII ձևաչափեր, որոնք հատուկ են յուրաքանչյուր երկրի և տարածաշրջանի:
Եվրոպական Ձևաչափեր
- Գերմանիա: Անձնագիր, Հարկային ID, Անձնագիր
- Ֆրանսիա: NIR, Ազգային Քարտ, Վարորդական Վկայական
- Իտալիա: Ֆիսկալ Կոդ, Անձնագիր
- Իսպանիա: DNI, NIE, NIF
- Հոլանդիա: BSN, Վարորդական Վկայական
- Լեհաստան: PESEL, NIP, REGON
Ասիա-Խաղաղօվկիանոսյան Ձևաչափեր
- Ճապոնիա: Իմ Համար, Անձնագիր
- Հնդկաստան: Aadhaar, PAN, GSTIN, Տրանսպորտային Միջոցների Գրանցում
- Թայլանդ: Ազգային ID, Հարկային ID, Անձնագիր
- Ինդոնեզիա: NIK, NPWP, Անձնագիր
- Վիետնամ: CCCD, Հարկային Կոդ, Անձնագիր
- Մալայզիա: MyKad, Հարկային ID, Անձնագիր
Ամերիկաներ, Աֆրիկա և Մերձավոր Արևելք
- ԱՄՆ: SSN, Վարորդական Վկայական, Անձնագիր
- Մեծ Բրիտանիա: Ազգային Ապահովագրություն, NHS Համար
- Կանադա: SIN, Վարորդական Վկայական
- Ավստրալիա: TFN, Medicare, ABN
- Քենիա: Ազգային ID, KRA PIN, Անձնագիր
- Հարավային Աֆրիկա: ID Համար, Հարկային Համար, Անձնագիր
Հաճախակի Տրվող Հարցեր
Որ 48 լեզուներն են cloak.business-ը աջակցում?
cloak.business-ը աջակցում է աֆրիկաանս, արաբերեն, հայերեն, բասկերեն, բենգալերեն, բուլղարերեն, կատալոներեն, չինարեն, խորվաթերեն, չեխերեն, դանիերեն, հոլանդերեն, անգլերեն, էստոներեն, ֆիններեն, ֆրանսերեն, գերմաներեն, հունարեն, եբրայերեն, հինդի, հունգարերեն, իսլանդերեն, ինդոնեզերեն, իտալերեն, ճապոներեն, կորեերեն, լատվիերեն, լիտվերեն, մակեդոներեն, մալայերեն, նորվեգերեն, պարսկերեն, լեհերեն, պորտուգալերեն, ռումիներեն, ռուսերեն, սերբերեն, սլովակերեն, սլովեներեն, իսպաներեն, սուահիլի, շվեդերեն, տագալոներեն, թայերեն, թուրքերեն, ուկրաիներեն, ուրդու և վիետնամերեն՝ լրիվ RTL աջակցությամբ արաբերեն, եբրայերեն, պարսկերեն և ուրդու լեզուների համար:
PII հայտնաբերումը նույն կերպ է աշխատում բոլոր լեզուներում?
Հայտնաբերումը օգտագործում է երկու մոտեցում՝ regex-ի վրա հիմնված ձևաչափերի համընկնումը կառուցվածքային տվյալների համար (ID-ներ, հեռախոսահամարներ, հարկային համարներ) և NLP մոդելներ չկառուցված էակների համար (անուններ, վայրեր): Ձևաչափերի վրա հիմնված հայտնաբերումը ընդգրկում է բոլոր 48 լեզուները: NLP-ի վրա հիմնված հայտնաբերումը հասանելի է լեզուներում, որոնք ունեն վերապատրաստված մոդելներ:
Ինչպե՞ս են երկրին հատուկ ID ձևաչափերը մշակվում?
cloak.business-ը ներառում է 317 ձևաչափերի ճանաչողներ, որոնք ընդգրկում են 70+ երկրներ: Յուրաքանչյուր ճանաչող ստուգում է տվյալ երկրի ազգային ID-ների, հարկային համարների, առողջապահական նույնացուցիչների և ֆինանսական տվյալների հատուկ ձևաչափը, ստուգման գումարը և կառուցվածքը:
Կարո՞ղ եմ նույն փաստաթղթում հայտնաբերել PII տարբեր լեզուներով:
Այո: cloak.business-ը կարող է մշակել բազմալեզու փաստաթղթեր և հայտնաբերել PII տարբեր լեզուներով մեկ հարցման մեջ: Համակարգը ավտոմատ կերպով հայտնաբերում է, թե որ լեզվական ձևաչափերը կիրառել:
Ինչպե՞ս կարող եմ ավելացնել նոր լեզվի կամ էակի տեսակի աջակցություն?
Դուք կարող եք ստեղծել հարմարեցված էակների ճանաչողներ՝ օգտագործելով regex ձևաչափեր կամ մերժման ցուցակներ: Սա թույլ է տալիս ավելացնել ոլորտային հատուկ նույնացուցիչներ կամ ընդլայնել ծածկույթը լրացուցիչ ձևաչափերի համար, որոնք դեռ ներառված չեն ներկառուցված ճանաչող գրադարանում:
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only