Поддржани 48 јазици
Целосна детекција и анонимизација на PII низ целата платформа
spaCy NLP - Работи локално (25 јазици)
Stanza NER - Работи локално (7 јазици)
XLM-RoBERTa Transformer - Работи локално (16 јазици)
Поддршка за RTL
Поддржано од напредна NLP
Три NLP мотори кои работат заедно за максимално покривање на јазиците
- Модели кои се вчитуваат на побарувачка (максимум 5 зачувани) за ефикасност на меморијата
- Автоматско откривање на јазикот
- Обработка на документи со мешани јазици
- Ентитетски обрасци специфични за јазикот
Формати специфични за земја
Ние детектираме PII во формати специфични за секоја земја и регион.
Европски формати
- Германски: Лична карта, Даночен ИД, Пасош
- Француски: NIR, Национална карта, Возачка дозвола
- Италијански: Даночен код, Лична карта
- Шпански: DNI, NIE, NIF
- Холандски: BSN, Возачка дозвола
- Полски: PESEL, NIP, REGON
Азија-Пацифик формати
- Јапонија: Мој број, Пасош
- Индија: Aadhaar, PAN, GSTIN, Регистрација на возило
- Тајланд: Национален ИД, Даночен ИД, Пасош
- Индонезија: NIK, NPWP, Пасош
- Виетнам: CCCD, Даночен код, Пасош
- Малезија: MyKad, Даночен ИД, Пасош
Америка, Африка и Среден Исток
- САД: SSN, Возачка дозвола, Пасош
- Велика Британија: Национално осигурување, NHS број
- Канада: SIN, Возачка дозвола
- Австралија: TFN, Medicare, ABN
- Кенија: Национален ИД, KRA PIN, Пасош
- Јужна Африка: ИД број, Даночен број, Пасош
Често поставувани прашања
Кои 48 јазици ги поддржува cloak.business?
cloak.business поддржува Африканс, Арапски, Ерменски, Баскиски, Бенгалски, Бугарски, Каталонски, Кинески, Хрватски, Чешки, Дански, Холандски, Англиски, Естонски, Фински, Француски, Германски, Грчки, Хебрејски, Хинди, Унгарски, Исландски, Индонезиски, Италијански, Јапонски, Корејски, Латвиски, Литвански, Македонски, Малајски, Норвешки, Персиски, Полски, Португалски, Романски, Руски, Српски, Словачки, Словенечки, Шпански, Свахили, Шведски, Тагалог, Тајландски, Турски, Украински, Урду и Виетнамски — со целосна поддршка за RTL за арапски, хебрејски, персиски и урду.
Дали детекцијата на PII работи исто на сите јазици?
Детекцијата користи два пристапи: regex-базирано препознавање на обрасци за структуирани податоци (ИД, телефонски броеви, даночни броеви) и NLP модели за неструктуирани ентитети (имиња, локации). Детекцијата базирана на обрасци покрива сите 48 јазици. NLP-базираната детекција е достапна на јазици со обучени модели.
Како се ракуваат формати на ИД специфични за земја?
cloak.business вклучува 317 препознавачи на обрасци кои покриваат 70+ земји. Секој препознавач го валидира специфичниот формат, чексума и структура на национални ИД, даночни броеви, здравствени идентификатори и финансиски податоци за таа земја.
Можам ли да детектирам PII на повеќе јазици во ист документ?
Да. cloak.business може да обработува документи на повеќе јазици и да детектира PII на различни јазици во една барање. Системот автоматски идентификува кои јазични обрасци да ги примени.
Како да додадам поддршка за нов јазик или тип на ентитет?
Можете да креирате сопствени препознавачи на ентитети користејќи regex обрасци или листи за одбивање. Ова ви овозможува да додадете идентификатори специфични за домен или да го проширите покривањето на дополнителни формати кои сè уште не се вклучени во вградената библиотека на препознавачи.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only