PII Felismerés 48 Nyelven

PII felismerése és anonimizálása 48 nyelven natív mintázat támogatással. Teljes RTL támogatás arab, héber, perzsa és urdu nyelveken.

Próbálja ki Ingyen Nyelvi Dokumentáció

48 Nyelv Támogatott

Teljes PII felismerés és anonimizálás az egész platformon

spaCy NLP - Helyben fut (25 nyelv)

AngolNémetSpanyolFranciaOlaszPortugálHollandLengyelOroszJapánKínaiKoreaiRománGörögHorvátSzlovénMacedónSvédDánNorvégFinnUkránLitvánKatalánTörök

Stanza NER - Helyben fut (7 nyelv)

BolgárMagyarHéber (RTL)VietnámiAfrikaansÖrményBaszk

XLM-RoBERTa Transformer - Helyben fut (16 nyelv)

Arab (RTL)HindiCsehSzlovákIndonézThaiPerzsa (RTL)SzerbLettÉsztMalájBengáliUrdu (RTL)SzuahéliTagalogIzlandi

RTL Támogatás

ArabHéberPerzsaUrdu

Fejlett NLP által Támogatva

Három NLP motor együttműködése a maximális nyelvi lefedettségért

Lusta betöltésű modellek (max 5 gyorsítótárazott) a memóriahatékonyság érdekében
Automatikus nyelvfelismerés
Vegyes nyelvű dokumentumfeldolgozás
Nyelvspecifikus entitásminták

Országspecifikus Formátumok

PII-t észlelünk az egyes országokra és régiókra jellemző formátumokban.

Európai Formátumok

Német: Személyi igazolvány, Adóazonosító, Útlevél
Francia: NIR, Nemzeti Igazolvány, Jogosítvány
Olasz: Adókód, Személyi Igazolvány
Spanyol: DNI, NIE, NIF
Holland: BSN, Jogosítvány
Lengyel: PESEL, NIP, REGON

Ázsia-Csendes-óceáni Formátumok

Japán: My Number, Útlevél
India: Aadhaar, PAN, GSTIN, Jármű Regisztráció
Thaiföld: Nemzeti ID, Adóazonosító, Útlevél
Indonézia: NIK, NPWP, Útlevél
Vietnám: CCCD, Adókód, Útlevél
Malajzia: MyKad, Adóazonosító, Útlevél

Amerikák, Afrika és Közel-Kelet

USA: SSN, Jogosítvány, Útlevél
UK: Nemzeti Biztosítás, NHS Szám
Kanada: SIN, Jogosítvány
Ausztrália: TFN, Medicare, ABN
Kenya: Nemzeti ID, KRA PIN, Útlevél
Dél-Afrika: ID Szám, Adószám, Útlevél

Gyakran Ismételt Kérdések

Melyik 48 nyelvet támogatja a cloak.business?

A cloak.business támogatja az afrikaans, arab, örmény, baszk, bengáli, bolgár, katalán, kínai, horvát, cseh, dán, holland, angol, észt, finn, francia, német, görög, héber, hindi, magyar, izlandi, indonéz, olasz, japán, koreai, lett, litván, macedón, maláj, norvég, perzsa, lengyel, portugál, román, orosz, szerb, szlovák, szlovén, spanyol, szuahéli, svéd, tagalog, thai, török, ukrán, urdu és vietnámi nyelveket — teljes RTL támogatással az arab, héber, perzsa és urdu nyelvekhez.

Ugyanúgy működik a PII felismerés minden nyelven?

A felismerés két megközelítést alkalmaz: regex-alapú mintázat felismerés strukturált adatokhoz (ID-k, telefonszámok, adószámok) és NLP modellek strukturálatlan entitásokhoz (nevek, helyszínek). A mintázat-alapú felismerés mind a 48 nyelvet lefedi. Az NLP-alapú felismerés elérhető a betanított modellekkel rendelkező nyelveken.

Hogyan kezelik az országspecifikus ID formátumokat?

A cloak.business 317 mintázat felismerőt tartalmaz, amelyek több mint 70 országot fednek le. Minden felismerő ellenőrzi az adott ország nemzeti ID-k, adószámok, egészségügyi azonosítók és pénzügyi adatok specifikus formátumát, ellenőrző összegét és szerkezetét.

Képes vagyok több nyelven is PII-t felismerni ugyanabban a dokumentumban?

Igen. A cloak.business képes többnyelvű dokumentumokat feldolgozni és PII-t felismerni különböző nyelveken egyetlen kérésben. A rendszer automatikusan azonosítja, mely nyelvi mintákat kell alkalmazni.

Hogyan adhatok hozzá támogatást új nyelvhez vagy entitás típushoz?

Egyedi entitás felismerőket hozhat létre regex minták vagy tiltó listák használatával. Ez lehetővé teszi, hogy hozzáadjon domain-specifikus azonosítókat vagy kiterjessze a lefedettséget további formátumokra, amelyek még nem szerepelnek a beépített felismerő könyvtárban.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizálás Bármilyen Nyelven

Kezdje 200 ingyenes tokennel. Működik mind a 48 nyelvvel.