48 Nyelv Támogatott
Teljes PII felismerés és anonimizálás az egész platformon
spaCy NLP - Helyben fut (25 nyelv)
Stanza NER - Helyben fut (7 nyelv)
XLM-RoBERTa Transformer - Helyben fut (16 nyelv)
RTL Támogatás
Fejlett NLP által Támogatva
Három NLP motor együttműködése a maximális nyelvi lefedettségért
- Lusta betöltésű modellek (max 5 gyorsítótárazott) a memóriahatékonyság érdekében
- Automatikus nyelvfelismerés
- Vegyes nyelvű dokumentumfeldolgozás
- Nyelvspecifikus entitásminták
Országspecifikus Formátumok
PII-t észlelünk az egyes országokra és régiókra jellemző formátumokban.
Európai Formátumok
- Német: Személyi igazolvány, Adóazonosító, Útlevél
- Francia: NIR, Nemzeti Igazolvány, Jogosítvány
- Olasz: Adókód, Személyi Igazolvány
- Spanyol: DNI, NIE, NIF
- Holland: BSN, Jogosítvány
- Lengyel: PESEL, NIP, REGON
Ázsia-Csendes-óceáni Formátumok
- Japán: My Number, Útlevél
- India: Aadhaar, PAN, GSTIN, Jármű Regisztráció
- Thaiföld: Nemzeti ID, Adóazonosító, Útlevél
- Indonézia: NIK, NPWP, Útlevél
- Vietnám: CCCD, Adókód, Útlevél
- Malajzia: MyKad, Adóazonosító, Útlevél
Amerikák, Afrika és Közel-Kelet
- USA: SSN, Jogosítvány, Útlevél
- UK: Nemzeti Biztosítás, NHS Szám
- Kanada: SIN, Jogosítvány
- Ausztrália: TFN, Medicare, ABN
- Kenya: Nemzeti ID, KRA PIN, Útlevél
- Dél-Afrika: ID Szám, Adószám, Útlevél
Gyakran Ismételt Kérdések
Melyik 48 nyelvet támogatja a cloak.business?
A cloak.business támogatja az afrikaans, arab, örmény, baszk, bengáli, bolgár, katalán, kínai, horvát, cseh, dán, holland, angol, észt, finn, francia, német, görög, héber, hindi, magyar, izlandi, indonéz, olasz, japán, koreai, lett, litván, macedón, maláj, norvég, perzsa, lengyel, portugál, román, orosz, szerb, szlovák, szlovén, spanyol, szuahéli, svéd, tagalog, thai, török, ukrán, urdu és vietnámi nyelveket — teljes RTL támogatással az arab, héber, perzsa és urdu nyelvekhez.
Ugyanúgy működik a PII felismerés minden nyelven?
A felismerés két megközelítést alkalmaz: regex-alapú mintázat felismerés strukturált adatokhoz (ID-k, telefonszámok, adószámok) és NLP modellek strukturálatlan entitásokhoz (nevek, helyszínek). A mintázat-alapú felismerés mind a 48 nyelvet lefedi. Az NLP-alapú felismerés elérhető a betanított modellekkel rendelkező nyelveken.
Hogyan kezelik az országspecifikus ID formátumokat?
A cloak.business 317 mintázat felismerőt tartalmaz, amelyek több mint 70 országot fednek le. Minden felismerő ellenőrzi az adott ország nemzeti ID-k, adószámok, egészségügyi azonosítók és pénzügyi adatok specifikus formátumát, ellenőrző összegét és szerkezetét.
Képes vagyok több nyelven is PII-t felismerni ugyanabban a dokumentumban?
Igen. A cloak.business képes többnyelvű dokumentumokat feldolgozni és PII-t felismerni különböző nyelveken egyetlen kérésben. A rendszer automatikusan azonosítja, mely nyelvi mintákat kell alkalmazni.
Hogyan adhatok hozzá támogatást új nyelvhez vagy entitás típushoz?
Egyedi entitás felismerőket hozhat létre regex minták vagy tiltó listák használatával. Ez lehetővé teszi, hogy hozzáadjon domain-specifikus azonosítókat vagy kiterjessze a lefedettséget további formátumokra, amelyek még nem szerepelnek a beépített felismerő könyvtárban.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only