Zaznavanje PII v 48 jezikih

Zaznajte in anonimizirajte PII v 48 jezikih s podporo za domače vzorce. Popolna podpora za RTL za arabščino, hebrejščino, perzijščino in urdu.

Preizkusite brezplačno Dokumentacija o jezikih

Podprti 48 jeziki

Popolno zaznavanje in anonimizacija PII po celotni platformi

spaCy NLP - deluje lokalno (25 jezikov)

AngleščinaNemščinaŠpanščinaFrancoščinaItalijanščinaPortugalščinaNizozemščinaPoljščinaRuščinaJaponščinaKitajščinaKorejščinaRomunščinaGrščinaHrvaščinaSlovenščinaMakedonščinaŠvedščinaDanščinaNorveščinaFinščinaUkrajinščinaLitovščinaKatalonščinaTurščina

Stanza NER - deluje lokalno (7 jezikov)

BolgarščinaMadžarščinaHebrejščina (RTL)VietnamščinaAfrikanščinaArmenščinaBaskovščina

XLM-RoBERTa Transformer - deluje lokalno (16 jezikov)

Arabščina (RTL)HindijščinaČeščinaSlovaščinaIndonezijščinaTajščinaPerzijščina (RTL)SrbščinaLatvijščinaEstonščinaMalajščinaBengalščinaUrdu (RTL)SvahiliTagalogIslandščina

Podpora za RTL

ArabščinaHebrejščinaPerzijščinaUrdu

Poganja ga napredni NLP

Tri NLP pogone, ki delujejo skupaj za največjo jezikovno pokritost

Lenobno nalaganje modelov (maksimalno 5 v predpomnilniku) za učinkovitost pomnilnika
Samodejno zaznavanje jezika
Obdelava dokumentov v mešanih jezikih
Jezikovno specifični vzorci entitet

Formati specifični za države

Zaznavamo PII v formatih specifičnih za vsako državo in regijo.

Evropski formati

Nemčija: Osebna izkaznica, Steuer-ID, potni list
Francija: NIR, Carte Nationale, vozniško dovoljenje
Italija: Codice Fiscale, osebna izkaznica
Španija: DNI, NIE, NIF
Nizozemska: BSN, vozniško dovoljenje
Poljska: PESEL, NIP, REGON

Azijsko-pacifiški formati

Japonska: Moja številka, potni list
Indija: Aadhaar, PAN, GSTIN, registracija vozila
Tajska: Nacionalna ID, davčna ID, potni list
Indonezija: NIK, NPWP, potni list
Vietnam: CCCD, davčna koda, potni list
Malezija: MyKad, davčna ID, potni list

Amerike, Afrika in Bližnji vzhod

ZDA: SSN, vozniško dovoljenje, potni list
Združeno kraljestvo: Nacionalno zavarovanje, NHS številka
Kanada: SIN, vozniško dovoljenje
Avstralija: TFN, Medicare, ABN
Kenija: Nacionalna ID, KRA PIN, potni list
Južna Afrika: ID številka, davčna številka, potni list

Pogosto zastavljena vprašanja

Katere 48 jezikov podpira cloak.business?

cloak.business podpira afrikans, arabščino, armenščino, baskovščino, bengalščino, bolgarščino, katalonščino, kitajščino, hrvaščino, češčino, danščino, nizozemščino, angleščino, estonščino, finščino, francoščino, nemščino, grščino, hebrejščino, hindijščino, madžarščino, islandščino, indonezijščino, italijanščino, japonščino, korejščino, latvijščino, litovščino, makedonščino, malajščino, norveščino, perzijščino, poljščino, portugalščino, romunščino, ruščino, srbščino, slovaščino, slovenščino, španščino, svahili, švedščino, tagalog, tajščino, turščino, ukrajinščino, urdu in vietnamščino — s popolno podporo za RTL za arabščino, hebrejščino, perzijščino in urdu.

Ali zaznavanje PII deluje enako v vseh jezikih?

Zaznavanje uporablja dva pristopa: ujemanje vzorcev na osnovi regex za strukturirane podatke (ID-ji, telefonske številke, davčne številke) in NLP modele za nestrukturirane entitete (imena, lokacije). Zaznavanje na osnovi vzorcev pokriva vseh 48 jezikov. Zaznavanje na osnovi NLP je na voljo v jezikih z usposobljenimi modeli.

Kako se obravnavajo formati ID specifični za države?

cloak.business vključuje 317 prepoznavalnikov vzorcev, ki pokrivajo več kot 70 držav. Vsak prepoznavalnik preverja specifičen format, kontrolno vsoto in strukturo nacionalnih ID-jev, davčnih številk, zdravstvenih identifikatorjev in finančnih podatkov za to državo.

Ali lahko zaznam PII v več jezikih znotraj istega dokumenta?

Da. cloak.business lahko obdeluje večjezične dokumente in zaznava PII v različnih jezikih v eni zahtevi. Sistem samodejno prepozna, katere jezikovne vzorce uporabiti.

Kako dodam podporo za nov jezik ali tip entitete?

Lahko ustvarite prilagojene prepoznavalnike entitet z uporabo regex vzorcev ali seznamov zavrnitev. To vam omogoča dodajanje identifikatorjev specifičnih za domeno ali razširitev pokritosti na dodatne formate, ki še niso vključeni v vgrajeno knjižnico prepoznavalnikov.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizirajte v katerem koli jeziku

Začnite z 200 brezplačnimi žetoni. Deluje z vsemi 48 jeziki.