PII Tuvastamine 48 Keeles

Tuvasta ja anonüümi PII 48 keeles koos natiivsete mustrite toega. Täielik RTL tugi araabia, heebrea, pärsia ja urdu keelele.

48 Keele Tugi

Täielik PII tuvastamine ja anonüümimine kogu platvormil

spaCy NLP - Kohalik Käitamine (25 keelt)

IngliseSaksaHispaaniaPrantsuseItaaliaPortugaliHollandiPoolaVeneJaapaniHiinaKoreaRumeeniaKreekaHorvaatiaSloveeniaMakedooniaRootsiTaaniNorraSoomeUkrainaLeeduKatalaaniTürgi

Stanza NER - Kohalik Käitamine (7 keelt)

BulgaariaUngariHeebrea (RTL)VietnamiAfrikaaniArmeeniaBaski

XLM-RoBERTa Transformer - Kohalik Käitamine (16 keelt)

Araabia (RTL)HindiTšehhiSlovakiIndoneesiaTaiPärsia (RTL)SerbiaLätiEestiMalaiBengaliUrdu (RTL)SuahiiliTagalogiIslandi

RTL Tugi

AraabiaHeebreaPärsiaUrdu

Toetatud Täiustatud NLP-ga

Kolm NLP mootorit töötavad koos maksimaalse keelekatvuse saavutamiseks

  • Laisalt laaditud mudelid (maksimaalselt 5 vahemälus) mälu efektiivsuse tagamiseks
  • Automaatne keele tuvastamine
  • Segakeelsete dokumentide töötlemine
  • Keelepõhised entiteedimustrid

Riigispetsiifilised Formaadid

Tuvastame PII riigi- ja piirkonnapõhistes formaatides.

Euroopa Formaadid

  • Saksa: Isikutunnistus, Maksu-ID, Pass
  • Prantsuse: NIR, Rahvuskaart, Luba
  • Itaalia: Fiskaalkood, Isikutunnistus
  • Hispaania: DNI, NIE, NIF
  • Hollandi: BSN, Juhiluba
  • Poola: PESEL, NIP, REGON

Aasia-Vaikse Ookeani Formaadid

  • Jaapan: Minu Number, Pass
  • India: Aadhaar, PAN, GSTIN, Sõidukiregistreerimine
  • Tai: Riiklik ID, Maksu-ID, Pass
  • Indoneesia: NIK, NPWP, Pass
  • Vietnam: CCCD, Maksukood, Pass
  • Malaisia: MyKad, Maksu-ID, Pass

Ameerikad, Aafrika & Lähis-Ida

  • USA: SSN, Juhiluba, Pass
  • Suurbritannia: Riiklik Kindlustus, NHS Number
  • Kanada: SIN, Juhiluba
  • Austraalia: TFN, Medicare, ABN
  • Keenia: Riiklik ID, KRA PIN, Pass
  • Lõuna-Aafrika: ID Number, Maksunumber, Pass

Korduma Kippuvad Küsimused

Milliseid 48 keelt cloak.business toetab?

cloak.business toetab afrikaani, araabia, armeenia, baski, bengali, bulgaaria, katalaani, hiina, horvaadi, tšehhi, taani, hollandi, inglise, eesti, soome, prantsuse, saksa, kreeka, heebrea, hindi, ungari, islandi, indoneesia, itaalia, jaapani, korea, läti, leedu, makedoonia, malai, norra, pärsia, poola, portugali, rumeenia, vene, serbia, slovaki, sloveeni, hispaania, suahiili, rootsi, tagalogi, tai, türgi, ukraina, urdu ja vietnami keelt — täielik RTL tugi araabia, heebrea, pärsia ja urdu keelele.

Kas PII tuvastamine töötab kõigis keeltes ühtemoodi?

Tuvastamine kasutab kahte lähenemist: regex-põhine mustrituvastus struktureeritud andmete jaoks (ID-d, telefoninumbrid, maksunumbrid) ja NLP mudelid struktureerimata entiteetide jaoks (nimed, asukohad). Mustrituvastus katab kõik 48 keelt. NLP-põhine tuvastamine on saadaval keeltes, millel on treenitud mudelid.

Kuidas käsitletakse riigispetsiifilisi ID formaate?

cloak.business sisaldab 317 mustrituvastajat, mis katavad üle 70 riigi. Iga tuvastaja valideerib konkreetse riigi ID-de, maksunumbrite, terviseidentifikaatorite ja finantsandmete formaadi, kontrollsumma ja struktuuri.

Kas ma saan tuvastada PII-d mitmes keeles ühes dokumendis?

Jah. cloak.business saab töödelda mitmekeelseid dokumente ja tuvastada PII-d erinevates keeltes ühe päringu raames. Süsteem tuvastab automaatselt, milliseid keelemustreid rakendada.

Kuidas lisada tuge uuele keelele või entiteeditüübile?

Saate luua kohandatud entiteedituvastajaid, kasutades regex-mustreid või keelatud nimekirju. See võimaldab lisada valdkonnaspetsiifilisi identifikaatoreid või laiendada katvust lisavormaatidele, mis pole veel sisseehitatud tuvastajate raamatukogus.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonüümi Igas Keeles

Alusta 200 tasuta märgiga. Töötab kõigi 48 keelega.