PII Noteikšana 48 Valodās

Noteikt un anonimizēt PII 48 valodās ar vietējo modeļu atbalstu. Pilns RTL atbalsts arābu, ebreju, persiešu un urdu valodām.

Izmēģināt bez maksas Valodu dokumentācija

Atbalstītas 48 Valodas

Pilna PII noteikšana un anonimizācija visā platformā

spaCy NLP - Darbojas Lokāli (25 valodas)

AngļuVācuSpāņuFrančuItāļuPortugāļuHolandiešuPoļuKrievuJapāņuĶīniešuKorejiešuRumāņuGrieķuHorvātuSlovēņuMaķedoniešuZviedruDāņuNorvēģuSomuUkraiņuLietuviešuKatalāņuTurku

Stanza NER - Darbojas Lokāli (7 valodas)

BulgāruUngāruEbreju (RTL)VjetnamiešuAfrikāņuArmēņuBasku

XLM-RoBERTa Transformer - Darbojas Lokāli (16 valodas)

Arābu (RTL)HindīČehuSlovākuIndonēziešuTajuPersiešu (RTL)SerbuLatviešuIgauņuMalajiešuBengāļuUrdu (RTL)SvahiliTagaloguIslandiešu

RTL Atbalsts

ArābuEbrejuPersiešuUrdu

Darbināts ar Uzlabotu NLP

Trīs NLP dzinēji strādā kopā maksimālai valodu pārklājumam

Lazy-loaded modeļi (maks. 5 kešatmiņā) atmiņas efektivitātei
Automātiska valodas noteikšana
Jauktas valodas dokumentu apstrāde
Valodai specifiski entitāšu modeļi

Valstij Specifiski Formāti

Mēs atpazīstam PII formātus, kas ir specifiski katrai valstij un reģionam.

Eiropas Formāti

Vācu: Personalausweis, Steuer-ID, Reisepass
Franču: NIR, Carte Nationale, Permis
Itāļu: Codice Fiscale, Carta d'Identità
Spāņu: DNI, NIE, NIF
Holandiešu: BSN, Rijbewijs
Poļu: PESEL, NIP, REGON

Āzijas-Pacifika Formāti

Japāna: My Number, Pase
Indija: Aadhaar, PAN, GSTIN, Transportlīdzekļa Reģistrācija
Taizeme: Nacionālais ID, Nodokļu ID, Pase
Indonēzija: NIK, NPWP, Pase
Vjetnama: CCCD, Nodokļu Kods, Pase
Malaizija: MyKad, Nodokļu ID, Pase

Amerikas, Āfrika un Tuvie Austrumi

ASV: SSN, Vadītāja Apliecība, Pase
Lielbritānija: Nacionālās Apdrošināšanas Numurs, NHS Numurs
Kanāda: SIN, Vadītāja Apliecība
Austrālija: TFN, Medicare, ABN
Kenija: Nacionālais ID, KRA PIN, Pase
Dienvidāfrika: ID Numurs, Nodokļu Numurs, Pase

Bieži Uzdotie Jautājumi

Kuras 48 valodas atbalsta cloak.business?

cloak.business atbalsta afrikāņu, arābu, armēņu, basku, bengāļu, bulgāru, katalāņu, ķīniešu, horvātu, čehu, dāņu, holandiešu, angļu, igauņu, somu, franču, vācu, grieķu, ebreju, hindī, ungāru, islandiešu, indonēziešu, itāļu, japāņu, korejiešu, latviešu, lietuviešu, maķedoniešu, malajiešu, norvēģu, persiešu, poļu, portugāļu, rumāņu, krievu, serbu, slovāku, slovēņu, spāņu, svahili, zviedru, tagalogu, taju, turku, ukraiņu, urdu un vjetnamiešu — ar pilnu RTL atbalstu arābu, ebreju, persiešu un urdu valodām.

Vai PII noteikšana darbojas vienādi visās valodās?

Noteikšana izmanto divas pieejas: regex bāzētu modeļu atbilstību strukturētiem datiem (ID, tālruņa numuri, nodokļu numuri) un NLP modeļus nestrukturētām entitātēm (vārdi, vietas). Modeļu bāzētā noteikšana aptver visas 48 valodas. NLP bāzētā noteikšana ir pieejama valodās ar apmācītiem modeļiem.

Kā tiek apstrādāti valstij specifiski ID formāti?

cloak.business ietver 317 modeļu atpazinējus, kas aptver vairāk nekā 70 valstis. Katrs atpazinējs pārbauda konkrēto formātu, kontrolsummu un nacionālo ID, nodokļu numuru, veselības identifikatoru un finanšu datu struktūru.

Vai es varu noteikt PII vairākās valodās vienā dokumentā?

Jā. cloak.business var apstrādāt daudzvalodu dokumentus un noteikt PII dažādās valodās vienā pieprasījumā. Sistēma automātiski identificē, kurus valodu modeļus piemērot.

Kā es varu pievienot atbalstu jaunai valodai vai entitātes tipam?

Jūs varat izveidot pielāgotus entitāšu atpazinējus, izmantojot regex modeļus vai noliegumu sarakstus. Tas ļauj pievienot nozares specifiskus identifikatorus vai paplašināt pārklājumu uz papildu formātiem, kas vēl nav iekļauti iebūvētajā atpazinēju bibliotēkā.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizēt Jebkurā Valodā

Sāciet ar 200 bezmaksas žetoniem. Darbojas ar visām 48 valodām.