Detekcija PII na 48 Jezika

Detektujte i anonimizujte PII na 48 jezika sa podrškom za izvorne obrasce. Potpuna RTL podrška za arapski, hebrejski, persijski i urdu.

Isprobajte Besplatno Dokumentacija o Jezicima

Podržano 48 Jezika

Potpuna detekcija i anonimizacija PII na celoj platformi

spaCy NLP - Radi Lokalno (25 jezika)

EngleskiNemačkiŠpanskiFrancuskiItalijanskiPortugalskiHolandskiPoljskiRuskiJapanskiKineskiKorejskiRumunskiGrčkiHrvatskiSlovenačkiMakedonskiŠvedskiDanskiNorveškiFinskiUkrajinskiLitvanskiKatalonskiTurski

Stanza NER - Radi Lokalno (7 jezika)

BugarskiMađarskiHebrejski (RTL)VijetnamskiAfrikansArmenskiBaskijski

XLM-RoBERTa Transformer - Radi Lokalno (16 jezika)

Arapski (RTL)HindskiČeškiSlovačkiIndonežanskiTajlandskiPersijski (RTL)SrpskiLetonskiEstonskiMalajskiBengalskiUrdu (RTL)SvahiliTagalogIslandski

Podrška za RTL

ArapskiHebrejskiPersijskiUrdu

Pokretano Naprednim NLP-om

Tri NLP motora rade zajedno za maksimalnu pokrivenost jezika

Modeli koji se učitavaju po potrebi (maksimalno 5 u kešu) za efikasnost memorije
Automatsko prepoznavanje jezika
Obrada dokumenata sa mešovitim jezicima
Obrasci entiteta specifični za jezik

Formati Specifični za Zemlje

Detektujemo PII u formatima specifičnim za svaku zemlju i region.

Evropski Formati

Nemački: Lična karta, Poreski ID, Pasoš
Francuski: NIR, Nacionalna karta, Dozvola
Italijanski: Fiskalni kod, Lična karta
Španski: DNI, NIE, NIF
Holandski: BSN, Vozačka dozvola
Poljski: PESEL, NIP, REGON

Azijsko-Pacifički Formati

Japan: Moj Broj, Pasoš
Indija: Aadhaar, PAN, GSTIN, Registracija vozila
Tajland: Nacionalni ID, Poreski ID, Pasoš
Indonezija: NIK, NPWP, Pasoš
Vijetnam: CCCD, Poreski kod, Pasoš
Malezija: MyKad, Poreski ID, Pasoš

Amerike, Afrika i Bliski Istok

SAD: SSN, Vozačka dozvola, Pasoš
UK: Nacionalno osiguranje, NHS broj
Kanada: SIN, Vozačka dozvola
Australija: TFN, Medicare, ABN
Kenija: Nacionalni ID, KRA PIN, Pasoš
Južna Afrika: ID broj, Poreski broj, Pasoš

Često Postavljana Pitanja

Koje jezike podržava cloak.business?

cloak.business podržava afrikans, arapski, armenski, baskijski, bengalski, bugarski, katalonski, kineski, hrvatski, češki, danski, holandski, engleski, estonski, finski, francuski, nemački, grčki, hebrejski, hindski, mađarski, islandski, indonežanski, italijanski, japanski, korejski, letonski, litvanski, makedonski, malajski, norveški, persijski, poljski, portugalski, rumunski, ruski, srpski, slovački, slovenački, španski, svahili, švedski, tagalog, tajlandski, turski, ukrajinski, urdu i vijetnamski — sa punom RTL podrškom za arapski, hebrejski, persijski i urdu.

Da li detekcija PII funkcioniše isto na svim jezicima?

Detekcija koristi dva pristupa: prepoznavanje obrazaca zasnovano na regularnim izrazima za strukturirane podatke (ID-ovi, brojevi telefona, poreski brojevi) i NLP modele za nestrukturirane entitete (imena, lokacije). Detekcija zasnovana na obrascima pokriva svih 48 jezika. NLP detekcija je dostupna na jezicima sa obučenim modelima.

Kako se obrađuju formati ID-ova specifični za zemlju?

cloak.business uključuje 317 prepoznavača obrazaca koji pokrivaju više od 70 zemalja. Svaki prepoznavač validira specifičan format, kontrolni zbir i strukturu nacionalnih ID-ova, poreskih brojeva, zdravstvenih identifikatora i finansijskih podataka za tu zemlju.

Mogu li detektovati PII na više jezika unutar istog dokumenta?

Da. cloak.business može obraditi višejezične dokumente i detektovati PII na različitim jezicima u jednom zahtevu. Sistem automatski prepoznaje koje obrasce jezika treba primeniti.

Kako mogu dodati podršku za novi jezik ili tip entiteta?

Možete kreirati prilagođene prepoznavače entiteta koristeći obrasce regularnih izraza ili liste zabrana. Ovo vam omogućava da dodate identifikatore specifične za domen ili proširite pokrivenost na dodatne formate koji još nisu uključeni u biblioteku ugrađenih prepoznavača.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizujte na Bilo Kom Jeziku

Počnite sa 200 besplatnih tokena. Radi sa svih 48 jezika.