cloak.business

PII Felismerés 48 Nyelven

PII felismerése és anonimizálása 48 nyelven natív mintázat támogatással. Teljes RTL támogatás arab, héber, perzsa és urdu nyelveken.

48 Nyelv Támogatott

Teljes PII felismerés és anonimizálás az egész platformon

spaCy NLP - Helyben fut (25 nyelv)

AngolNémetSpanyolFranciaOlaszPortugálHollandLengyelOroszJapánKínaiKoreaiRománGörögHorvátSzlovénMacedónSvédDánNorvégFinnUkránLitvánKatalánTörök

Stanza NER - Helyben fut (7 nyelv)

BolgárMagyarHéber (RTL)VietnámiAfrikaansÖrményBaszk

XLM-RoBERTa Transformer - Helyben fut (16 nyelv)

Arab (RTL)HindiCsehSzlovákIndonézThaiPerzsa (RTL)SzerbLettÉsztMalájBengáliUrdu (RTL)SzuahéliTagalogIzlandi

RTL Támogatás

ArabHéberPerzsaUrdu

Fejlett NLP által Támogatva

Három NLP motor együttműködése a maximális nyelvi lefedettségért

  • Lusta betöltésű modellek (max 5 gyorsítótárazott) a memóriahatékonyság érdekében
  • Automatikus nyelvfelismerés
  • Vegyes nyelvű dokumentumfeldolgozás
  • Nyelvspecifikus entitásminták

Országspecifikus Formátumok

PII-t észlelünk az egyes országokra és régiókra jellemző formátumokban.

Európai Formátumok

  • Német: Személyi igazolvány, Adóazonosító, Útlevél
  • Francia: NIR, Nemzeti Igazolvány, Jogosítvány
  • Olasz: Adókód, Személyi Igazolvány
  • Spanyol: DNI, NIE, NIF
  • Holland: BSN, Jogosítvány
  • Lengyel: PESEL, NIP, REGON

Ázsia-Csendes-óceáni Formátumok

  • Japán: My Number, Útlevél
  • India: Aadhaar, PAN, GSTIN, Jármű Regisztráció
  • Thaiföld: Nemzeti ID, Adóazonosító, Útlevél
  • Indonézia: NIK, NPWP, Útlevél
  • Vietnám: CCCD, Adókód, Útlevél
  • Malajzia: MyKad, Adóazonosító, Útlevél

Amerikák, Afrika és Közel-Kelet

  • USA: SSN, Jogosítvány, Útlevél
  • UK: Nemzeti Biztosítás, NHS Szám
  • Kanada: SIN, Jogosítvány
  • Ausztrália: TFN, Medicare, ABN
  • Kenya: Nemzeti ID, KRA PIN, Útlevél
  • Dél-Afrika: ID Szám, Adószám, Útlevél

Gyakran Ismételt Kérdések

Melyik 48 nyelvet támogatja a cloak.business?

A cloak.business támogatja az afrikaans, arab, örmény, baszk, bengáli, bolgár, katalán, kínai, horvát, cseh, dán, holland, angol, észt, finn, francia, német, görög, héber, hindi, magyar, izlandi, indonéz, olasz, japán, koreai, lett, litván, macedón, maláj, norvég, perzsa, lengyel, portugál, román, orosz, szerb, szlovák, szlovén, spanyol, szuahéli, svéd, tagalog, thai, török, ukrán, urdu és vietnámi nyelveket — teljes RTL támogatással az arab, héber, perzsa és urdu nyelvekhez.

Ugyanúgy működik a PII felismerés minden nyelven?

A felismerés két megközelítést alkalmaz: regex-alapú mintázat felismerés strukturált adatokhoz (ID-k, telefonszámok, adószámok) és NLP modellek strukturálatlan entitásokhoz (nevek, helyszínek). A mintázat-alapú felismerés mind a 48 nyelvet lefedi. Az NLP-alapú felismerés elérhető a betanított modellekkel rendelkező nyelveken.

Hogyan kezelik az országspecifikus ID formátumokat?

A cloak.business 317 mintázat felismerőt tartalmaz, amelyek több mint 70 országot fednek le. Minden felismerő ellenőrzi az adott ország nemzeti ID-k, adószámok, egészségügyi azonosítók és pénzügyi adatok specifikus formátumát, ellenőrző összegét és szerkezetét.

Képes vagyok több nyelven is PII-t felismerni ugyanabban a dokumentumban?

Igen. A cloak.business képes többnyelvű dokumentumokat feldolgozni és PII-t felismerni különböző nyelveken egyetlen kérésben. A rendszer automatikusan azonosítja, mely nyelvi mintákat kell alkalmazni.

Hogyan adhatok hozzá támogatást új nyelvhez vagy entitás típushoz?

Egyedi entitás felismerőket hozhat létre regex minták vagy tiltó listák használatával. Ez lehetővé teszi, hogy hozzáadjon domain-specifikus azonosítókat vagy kiterjessze a lefedettséget további formátumokra, amelyek még nem szerepelnek a beépített felismerő könyvtárban.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizálás Bármilyen Nyelven

Kezdje 200 ingyenes tokennel. Működik mind a 48 nyelvvel.