Otkrivanje PII na 48 jezika

Otkrivanje i anonimizacija PII na 48 jezika s podrškom za izvorne obrasce. Potpuna RTL podrška za arapski, hebrejski, perzijski i urdu.

Isprobajte besplatno Dokumentacija o jezicima

Podržano 48 jezika

Potpuno otkrivanje i anonimizacija PII na cijeloj platformi

spaCy NLP - Radi lokalno (25 jezika)

EngleskiNjemačkiŠpanjolskiFrancuskiTalijanskiPortugalskiNizozemskiPoljskiRuskiJapanskiKineskiKorejskiRumunjskiGrčkiHrvatskiSlovenskiMakedonskiŠvedskiDanskiNorveškiFinskiUkrajinskiLitvanskiKatalonskiTurski

Stanza NER - Radi lokalno (7 jezika)

BugarskiMađarskiHebrejski (RTL)VijetnamskiAfrikaansArmenskiBaskijski

XLM-RoBERTa Transformer - Radi lokalno (16 jezika)

Arapski (RTL)HindskiČeškiSlovačkiIndonezijskiTajlandskiPerzijski (RTL)SrpskiLatvijskiEstonskiMalajskiBengalskiUrdu (RTL)SvahiliTagalogIslandski

Podrška za RTL

ArapskiHebrejskiPerzijskiUrdu

Pokreće napredni NLP

Tri NLP motora rade zajedno za maksimalnu pokrivenost jezika

Modeli s lijenim učitavanjem (maksimalno 5 u predmemoriji) za učinkovitost memorije
Automatsko prepoznavanje jezika
Obrada dokumenata s miješanim jezicima
Obrasci entiteta specifični za jezik

Formati specifični za zemlju

Otkrivamo PII u formatima specifičnim za svaku zemlju i regiju.

Europski formati

Njemački: Osobna iskaznica, Porezni ID, Putovnica
Francuski: NIR, Nacionalna karta, Dozvola
Talijanski: Fiskalni kod, Osobna iskaznica
Španjolski: DNI, NIE, NIF
Nizozemski: BSN, Vozačka dozvola
Poljski: PESEL, NIP, REGON

Azijsko-pacifički formati

Japan: Moj broj, Putovnica
Indija: Aadhaar, PAN, GSTIN, Registracija vozila
Tajland: Nacionalni ID, Porezni ID, Putovnica
Indonezija: NIK, NPWP, Putovnica
Vijetnam: CCCD, Porezni kod, Putovnica
Malezija: MyKad, Porezni ID, Putovnica

Amerike, Afrika i Bliski istok

SAD: SSN, Vozačka dozvola, Putovnica
UK: Nacionalno osiguranje, NHS broj
Kanada: SIN, Vozačka dozvola
Australija: TFN, Medicare, ABN
Kenija: Nacionalni ID, KRA PIN, Putovnica
Južna Afrika: ID broj, Porezni broj, Putovnica

Često postavljana pitanja

Koja 48 jezika podržava cloak.business?

cloak.business podržava afrikaans, arapski, armenski, baskijski, bengalski, bugarski, katalonski, kineski, hrvatski, češki, danski, nizozemski, engleski, estonski, finski, francuski, njemački, grčki, hebrejski, hindski, mađarski, islandski, indonezijski, talijanski, japanski, korejski, latvijski, litvanski, makedonski, malajski, norveški, perzijski, poljski, portugalski, rumunjski, ruski, srpski, slovački, slovenski, španjolski, svahili, švedski, tagalog, tajlandski, turski, ukrajinski, urdu i vijetnamski — s punom RTL podrškom za arapski, hebrejski, perzijski i urdu.

Radi li otkrivanje PII isto na svim jezicima?

Otkrivanje koristi dva pristupa: prepoznavanje uzoraka temeljenih na regexu za strukturirane podatke (ID-ovi, brojevi telefona, porezni brojevi) i NLP modele za nestrukturirane entitete (imena, lokacije). Otkrivanje temeljem uzoraka pokriva svih 48 jezika. Otkrivanje temeljem NLP-a dostupno je na jezicima s treniranim modelima.

Kako se obrađuju formati ID-ova specifični za zemlju?

cloak.business uključuje 317 prepoznavača uzoraka koji pokrivaju više od 70 zemalja. Svaki prepoznavač provjerava specifičan format, kontrolni zbroj i strukturu nacionalnih ID-ova, poreznih brojeva, zdravstvenih identifikatora i financijskih podataka za tu zemlju.

Mogu li otkriti PII na više jezika unutar istog dokumenta?

Da. cloak.business može obraditi višejezične dokumente i otkriti PII na različitim jezicima u jednom zahtjevu. Sustav automatski prepoznaje koje jezične obrasce primijeniti.

Kako mogu dodati podršku za novi jezik ili tip entiteta?

Možete stvoriti prilagođene prepoznavače entiteta koristeći regex uzorke ili liste zabrana. To vam omogućuje dodavanje identifikatora specifičnih za domenu ili proširenje pokrivenosti na dodatne formate koji još nisu uključeni u ugrađenu biblioteku prepoznavača.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizirajte na bilo kojem jeziku

Započnite s 200 besplatnih tokena. Radi sa svih 48 jezika.