PII aptikimas 48 kalbomis

Aptikite ir anonimizuokite PII 48 kalbomis su vietiniais šablonais. Visapusiškas RTL palaikymas arabų, hebrajų, persų ir urdų kalboms.

Palaikomos 48 kalbos

Visapusiškas PII aptikimas ir anonimizavimas visoje platformoje

spaCy NLP - Veikia lokaliai (25 kalbos)

AnglųVokiečiųIspanųPrancūzųItalųPortugalųOlandųLenkųRusųJaponųKinųKorėjiečiųRumunųGraikųKroatųSlovėnųMakedonųŠvedųDanųNorvegųSuomiųUkrainiečiųLietuviųKatalonųTurkų

Stanza NER - Veikia lokaliai (7 kalbos)

BulgarųVengrųHebrajų (RTL)VietnamiečiųAfrikansoArmėnųBaskų

XLM-RoBERTa Transformer - Veikia lokaliai (16 kalbų)

Arabų (RTL)HindiČekųSlovakųIndoneziečiųTajųPersų (RTL)SerbųLatviųEstųMalajųBengalųUrdų (RTL)SvahiliTagalogIslandų

RTL palaikymas

ArabųHebrajųPersųUrdų

Veikia su pažangia NLP

Trys NLP varikliai dirba kartu, kad užtikrintų maksimalų kalbų aprėpimą

  • Lėtai įkeliami modeliai (maks. 5 talpinami) atminties efektyvumui
  • Automatinis kalbos aptikimas
  • Mišrios kalbos dokumentų apdorojimas
  • Kalbai specifiniai objektų šablonai

Šalims specifiniai formatai

Mes aptinkame PII formatus, specifinius kiekvienai šaliai ir regionui.

Europos formatai

  • Vokietija: Personalausweis, Steuer-ID, Reisepass
  • Prancūzija: NIR, Carte Nationale, Permis
  • Italija: Codice Fiscale, Carta d'Identità
  • Ispanija: DNI, NIE, NIF
  • Nyderlandai: BSN, Rijbewijs
  • Lenkija: PESEL, NIP, REGON

Azijos ir Ramiojo vandenyno formatai

  • Japonija: My Number, Passport
  • Indija: Aadhaar, PAN, GSTIN, Transporto priemonės registracija
  • Tailandas: National ID, Tax ID, Passport
  • Indonezija: NIK, NPWP, Passport
  • Vietnamas: CCCD, Tax Code, Passport
  • Malaizija: MyKad, Tax ID, Passport

Amerikos, Afrika ir Vidurio Rytai

  • JAV: SSN, Driver's License, Passport
  • JK: National Insurance, NHS Number
  • Kanada: SIN, Driver's License
  • Australija: TFN, Medicare, ABN
  • Kenija: National ID, KRA PIN, Passport
  • Pietų Afrika: ID Number, Tax Number, Passport

Dažnai užduodami klausimai

Kokias 48 kalbas palaiko cloak.business?

cloak.business palaiko afrikanso, arabų, armėnų, baskų, bengalų, bulgarų, katalonų, kinų, kroatų, čekų, danų, olandų, anglų, estų, suomių, prancūzų, vokiečių, graikų, hebrajų, hindi, vengrų, islandų, indoneziečių, italų, japonų, korėjiečių, latvių, lietuvių, makedonų, malajų, norvegų, persų, lenkų, portugalų, rumunų, rusų, serbų, slovakų, slovėnų, ispanų, svahili, švedų, tagalog, tajų, turkų, ukrainiečių, urdų ir vietnamiečių kalbas — su visapusišku RTL palaikymu arabų, hebrajų, persų ir urdų kalboms.

Ar PII aptikimas veikia vienodai visose kalbose?

Aptikimas naudoja du metodus: regex pagrįstą šablonų atpažinimą struktūrizuotiems duomenims (ID, telefono numeriai, mokesčių numeriai) ir NLP modelius nestruktūrizuotiems objektams (vardai, vietos). Šablonų pagrindu veikiantis aptikimas apima visas 48 kalbas. NLP pagrindu veikiantis aptikimas yra prieinamas kalbose su išmokytais modeliais.

Kaip tvarkomi šalims specifiniai ID formatai?

cloak.business apima 317 šablonų atpažinimo įrankių, apimančių daugiau nei 70 šalių. Kiekvienas atpažinimo įrankis patikrina specifinį formatą, kontrolinę sumą ir nacionalinių ID, mokesčių numerių, sveikatos identifikatorių ir finansinių duomenų struktūrą tai šaliai.

Ar galiu aptikti PII keliomis kalbomis tame pačiame dokumente?

Taip. cloak.business gali apdoroti daugiakalbius dokumentus ir aptikti PII skirtingomis kalbomis viename užklausoje. Sistema automatiškai nustato, kuriuos kalbos šablonus taikyti.

Kaip pridėti palaikymą naujai kalbai ar objektų tipui?

Galite sukurti pasirinktinius objektų atpažinimo įrankius naudodami regex šablonus arba draudimų sąrašus. Tai leidžia pridėti specifinius domeno identifikatorius arba išplėsti aprėptį papildomiems formatams, kurie dar nėra įtraukti į įmontuotą atpažinimo biblioteką.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizuokite bet kuria kalba

Pradėkite su 200 nemokamų žetonų. Veikia su visomis 48 kalbomis.