PII Tuvastamine 48 Keeles

Tuvasta ja anonüümi PII 48 keeles koos natiivsete mustrite toega. Täielik RTL tugi araabia, heebrea, pärsia ja urdu keelele.

Proovi Tasuta Keeledokumentatsioon

48 Keele Tugi

Täielik PII tuvastamine ja anonüümimine kogu platvormil

spaCy NLP - Kohalik Käitamine (25 keelt)

IngliseSaksaHispaaniaPrantsuseItaaliaPortugaliHollandiPoolaVeneJaapaniHiinaKoreaRumeeniaKreekaHorvaatiaSloveeniaMakedooniaRootsiTaaniNorraSoomeUkrainaLeeduKatalaaniTürgi

Stanza NER - Kohalik Käitamine (7 keelt)

BulgaariaUngariHeebrea (RTL)VietnamiAfrikaaniArmeeniaBaski

XLM-RoBERTa Transformer - Kohalik Käitamine (16 keelt)

Araabia (RTL)HindiTšehhiSlovakiIndoneesiaTaiPärsia (RTL)SerbiaLätiEestiMalaiBengaliUrdu (RTL)SuahiiliTagalogiIslandi

RTL Tugi

AraabiaHeebreaPärsiaUrdu

Toetatud Täiustatud NLP-ga

Kolm NLP mootorit töötavad koos maksimaalse keelekatvuse saavutamiseks

Laisalt laaditud mudelid (maksimaalselt 5 vahemälus) mälu efektiivsuse tagamiseks
Automaatne keele tuvastamine
Segakeelsete dokumentide töötlemine
Keelepõhised entiteedimustrid

Riigispetsiifilised Formaadid

Tuvastame PII riigi- ja piirkonnapõhistes formaatides.

Euroopa Formaadid

Saksa: Isikutunnistus, Maksu-ID, Pass
Prantsuse: NIR, Rahvuskaart, Luba
Itaalia: Fiskaalkood, Isikutunnistus
Hispaania: DNI, NIE, NIF
Hollandi: BSN, Juhiluba
Poola: PESEL, NIP, REGON

Aasia-Vaikse Ookeani Formaadid

Jaapan: Minu Number, Pass
India: Aadhaar, PAN, GSTIN, Sõidukiregistreerimine
Tai: Riiklik ID, Maksu-ID, Pass
Indoneesia: NIK, NPWP, Pass
Vietnam: CCCD, Maksukood, Pass
Malaisia: MyKad, Maksu-ID, Pass

Ameerikad, Aafrika & Lähis-Ida

USA: SSN, Juhiluba, Pass
Suurbritannia: Riiklik Kindlustus, NHS Number
Kanada: SIN, Juhiluba
Austraalia: TFN, Medicare, ABN
Keenia: Riiklik ID, KRA PIN, Pass
Lõuna-Aafrika: ID Number, Maksunumber, Pass

Korduma Kippuvad Küsimused

Milliseid 48 keelt cloak.business toetab?

cloak.business toetab afrikaani, araabia, armeenia, baski, bengali, bulgaaria, katalaani, hiina, horvaadi, tšehhi, taani, hollandi, inglise, eesti, soome, prantsuse, saksa, kreeka, heebrea, hindi, ungari, islandi, indoneesia, itaalia, jaapani, korea, läti, leedu, makedoonia, malai, norra, pärsia, poola, portugali, rumeenia, vene, serbia, slovaki, sloveeni, hispaania, suahiili, rootsi, tagalogi, tai, türgi, ukraina, urdu ja vietnami keelt — täielik RTL tugi araabia, heebrea, pärsia ja urdu keelele.

Kas PII tuvastamine töötab kõigis keeltes ühtemoodi?

Tuvastamine kasutab kahte lähenemist: regex-põhine mustrituvastus struktureeritud andmete jaoks (ID-d, telefoninumbrid, maksunumbrid) ja NLP mudelid struktureerimata entiteetide jaoks (nimed, asukohad). Mustrituvastus katab kõik 48 keelt. NLP-põhine tuvastamine on saadaval keeltes, millel on treenitud mudelid.

Kuidas käsitletakse riigispetsiifilisi ID formaate?

cloak.business sisaldab 317 mustrituvastajat, mis katavad üle 70 riigi. Iga tuvastaja valideerib konkreetse riigi ID-de, maksunumbrite, terviseidentifikaatorite ja finantsandmete formaadi, kontrollsumma ja struktuuri.

Kas ma saan tuvastada PII-d mitmes keeles ühes dokumendis?

Jah. cloak.business saab töödelda mitmekeelseid dokumente ja tuvastada PII-d erinevates keeltes ühe päringu raames. Süsteem tuvastab automaatselt, milliseid keelemustreid rakendada.

Kuidas lisada tuge uuele keelele või entiteeditüübile?

Saate luua kohandatud entiteedituvastajaid, kasutades regex-mustreid või keelatud nimekirju. See võimaldab lisada valdkonnaspetsiifilisi identifikaatoreid või laiendada katvust lisavormaatidele, mis pole veel sisseehitatud tuvastajate raamatukogus.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonüümi Igas Keeles

Alusta 200 tasuta märgiga. Töötab kõigi 48 keelega.