PII Noteikšana 48 Valodās

Noteikt un anonimizēt PII 48 valodās ar vietējo modeļu atbalstu. Pilns RTL atbalsts arābu, ebreju, persiešu un urdu valodām.

Atbalstītas 48 Valodas

Pilna PII noteikšana un anonimizācija visā platformā

spaCy NLP - Darbojas Lokāli (25 valodas)

AngļuVācuSpāņuFrančuItāļuPortugāļuHolandiešuPoļuKrievuJapāņuĶīniešuKorejiešuRumāņuGrieķuHorvātuSlovēņuMaķedoniešuZviedruDāņuNorvēģuSomuUkraiņuLietuviešuKatalāņuTurku

Stanza NER - Darbojas Lokāli (7 valodas)

BulgāruUngāruEbreju (RTL)VjetnamiešuAfrikāņuArmēņuBasku

XLM-RoBERTa Transformer - Darbojas Lokāli (16 valodas)

Arābu (RTL)HindīČehuSlovākuIndonēziešuTajuPersiešu (RTL)SerbuLatviešuIgauņuMalajiešuBengāļuUrdu (RTL)SvahiliTagaloguIslandiešu

RTL Atbalsts

ArābuEbrejuPersiešuUrdu

Darbināts ar Uzlabotu NLP

Trīs NLP dzinēji strādā kopā maksimālai valodu pārklājumam

  • Lazy-loaded modeļi (maks. 5 kešatmiņā) atmiņas efektivitātei
  • Automātiska valodas noteikšana
  • Jauktas valodas dokumentu apstrāde
  • Valodai specifiski entitāšu modeļi

Valstij Specifiski Formāti

Mēs atpazīstam PII formātus, kas ir specifiski katrai valstij un reģionam.

Eiropas Formāti

  • Vācu: Personalausweis, Steuer-ID, Reisepass
  • Franču: NIR, Carte Nationale, Permis
  • Itāļu: Codice Fiscale, Carta d'Identità
  • Spāņu: DNI, NIE, NIF
  • Holandiešu: BSN, Rijbewijs
  • Poļu: PESEL, NIP, REGON

Āzijas-Pacifika Formāti

  • Japāna: My Number, Pase
  • Indija: Aadhaar, PAN, GSTIN, Transportlīdzekļa Reģistrācija
  • Taizeme: Nacionālais ID, Nodokļu ID, Pase
  • Indonēzija: NIK, NPWP, Pase
  • Vjetnama: CCCD, Nodokļu Kods, Pase
  • Malaizija: MyKad, Nodokļu ID, Pase

Amerikas, Āfrika un Tuvie Austrumi

  • ASV: SSN, Vadītāja Apliecība, Pase
  • Lielbritānija: Nacionālās Apdrošināšanas Numurs, NHS Numurs
  • Kanāda: SIN, Vadītāja Apliecība
  • Austrālija: TFN, Medicare, ABN
  • Kenija: Nacionālais ID, KRA PIN, Pase
  • Dienvidāfrika: ID Numurs, Nodokļu Numurs, Pase

Bieži Uzdotie Jautājumi

Kuras 48 valodas atbalsta cloak.business?

cloak.business atbalsta afrikāņu, arābu, armēņu, basku, bengāļu, bulgāru, katalāņu, ķīniešu, horvātu, čehu, dāņu, holandiešu, angļu, igauņu, somu, franču, vācu, grieķu, ebreju, hindī, ungāru, islandiešu, indonēziešu, itāļu, japāņu, korejiešu, latviešu, lietuviešu, maķedoniešu, malajiešu, norvēģu, persiešu, poļu, portugāļu, rumāņu, krievu, serbu, slovāku, slovēņu, spāņu, svahili, zviedru, tagalogu, taju, turku, ukraiņu, urdu un vjetnamiešu — ar pilnu RTL atbalstu arābu, ebreju, persiešu un urdu valodām.

Vai PII noteikšana darbojas vienādi visās valodās?

Noteikšana izmanto divas pieejas: regex bāzētu modeļu atbilstību strukturētiem datiem (ID, tālruņa numuri, nodokļu numuri) un NLP modeļus nestrukturētām entitātēm (vārdi, vietas). Modeļu bāzētā noteikšana aptver visas 48 valodas. NLP bāzētā noteikšana ir pieejama valodās ar apmācītiem modeļiem.

Kā tiek apstrādāti valstij specifiski ID formāti?

cloak.business ietver 317 modeļu atpazinējus, kas aptver vairāk nekā 70 valstis. Katrs atpazinējs pārbauda konkrēto formātu, kontrolsummu un nacionālo ID, nodokļu numuru, veselības identifikatoru un finanšu datu struktūru.

Vai es varu noteikt PII vairākās valodās vienā dokumentā?

Jā. cloak.business var apstrādāt daudzvalodu dokumentus un noteikt PII dažādās valodās vienā pieprasījumā. Sistēma automātiski identificē, kurus valodu modeļus piemērot.

Kā es varu pievienot atbalstu jaunai valodai vai entitātes tipam?

Jūs varat izveidot pielāgotus entitāšu atpazinējus, izmantojot regex modeļus vai noliegumu sarakstus. Tas ļauj pievienot nozares specifiskus identifikatorus vai paplašināt pārklājumu uz papildu formātiem, kas vēl nav iekļauti iebūvētajā atpazinēju bibliotēkā.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizēt Jebkurā Valodā

Sāciet ar 200 bezmaksas žetoniem. Darbojas ar visām 48 valodām.