PII Greining á 48 Tungumálum

Greindu og nafnleyndu PII á 48 tungumálum með innfæddum mynstrastuðningi. Fullur RTL stuðningur fyrir arabísku, hebresku, persnesku og urdú.

48 Tungumál Studd

Full greining og nafnleynd PII yfir alla vettvanginn

spaCy NLP - Keyrir Staðbundið (25 tungumál)

EnskaÞýskaSpænskaFranskaÍtalskaPortúgalskaHollenskaPólskaRússneskaJapanskaKínverskaKóreskaRúmenskaGrískaKróatískaSlóvenskaMakedónskaSænskaDanskaNorskaFinnskaÚkraínskaLitháískaKatalónskaTyrkneska

Stanza NER - Keyrir Staðbundið (7 tungumál)

BúlgarskaUngverskaHebreska (RTL)VíetnamskaAfríkanskaArmenskaBaskneska

XLM-RoBERTa Transformer - Keyrir Staðbundið (16 tungumál)

Arabíska (RTL)HindíTékkneskaSlóvakískaIndónesískaTaílenskaPersneska (RTL)SerbneskaLettneskaEistneskaMalayBengalskaUrdú (RTL)SvahílíTagalogÍslenska

RTL Stuðningur

ArabískaHebreskaPersneskaUrdú

Knúið af Háþróaðri NLP

Þrjár NLP vélar vinna saman fyrir hámarks tungumálaumfjöllun

  • Lazy-loaded módel (hámark 5 í skyndiminni) fyrir minni skilvirkni
  • Sjálfvirk tungumálagreining
  • Blandað tungumálaskjalavinnsla
  • Tungumálasértæk mynstur fyrir einingar

Landssértæk Snið

Við greinum PII í sniðum sem eru sértæk fyrir hvert land og svæði.

Evrópsk Snið

  • Þýskaland: Personalausweis, Steuer-ID, Reisepass
  • Frakkland: NIR, Carte Nationale, Permis
  • Ítalía: Codice Fiscale, Carta d'Identità
  • Spánn: DNI, NIE, NIF
  • Holland: BSN, Rijbewijs
  • Pólland: PESEL, NIP, REGON

Asía-Kyrrahafssvæðið

  • Japan: My Number, Passport
  • Indland: Aadhaar, PAN, GSTIN, Vehicle Registration
  • Taíland: National ID, Tax ID, Passport
  • Indónesía: NIK, NPWP, Passport
  • Víetnam: CCCD, Tax Code, Passport
  • Malasía: MyKad, Tax ID, Passport

Ameríka, Afríka & Miðausturlönd

  • Bandaríkin: SSN, Driver's License, Passport
  • Bretland: National Insurance, NHS Number
  • Kanada: SIN, Driver's License
  • Ástralía: TFN, Medicare, ABN
  • Kenía: National ID, KRA PIN, Passport
  • Suður-Afríka: ID Number, Tax Number, Passport

Algengar Spurningar

Hvaða 48 tungumál styður cloak.business?

cloak.business styður Afríkanska, Arabísku, Armensku, Basknesku, Bengalsku, Búlgarsku, Katalónsku, Kínversku, Króatísku, Tékknesku, Dansku, Hollensku, Ensku, Eistnesku, Finnsku, Frönsku, Þýsku, Grísku, Hebresku, Hindí, Ungversku, Íslensku, Indónesísku, Ítölsku, Japönsku, Kóresku, Lettnesku, Litháísku, Makedónsku, Malay, Norsku, Persnesku, Pólska, Portúgalska, Rúmensku, Rússnesku, Serbnesku, Slóvakísku, Slóvensku, Spænsku, Svahílí, Sænsku, Tagalog, Taílensku, Tyrknesku, Úkraínska, Urdú og Víetnamska — með fullum RTL stuðningi fyrir Arabísku, Hebresku, Persnesku og Urdú.

Virkjar PII greining á sama hátt í öllum tungumálum?

Greining notar tvær aðferðir: regex-mynsturgreiningu fyrir uppbyggð gögn (auðkenni, símanúmer, skattnúmer) og NLP módel fyrir óuppbyggðar einingar (nöfn, staðsetningar). Mynsturgreining nær yfir öll 48 tungumál. NLP-greining er í boði í tungumálum með þjálfuðum módelum.

Hvernig er meðhöndlun landssértækra auðkennisforma?

cloak.business inniheldur 317 mynsturgreina sem ná yfir 70+ lönd. Hver greinir staðfestir sérstakt snið, ávísun og uppbyggingu þjóðarauðkenna, skattnúmera, heilsuauðkenna og fjármálagagna fyrir það land.

Get ég greint PII á mörgum tungumálum innan sama skjals?

Já. cloak.business getur unnið með fjöltyngd skjöl og greint PII á mismunandi tungumálum í einni beiðni. Kerfið greinir sjálfkrafa hvaða tungumálamynstur á að beita.

Hvernig bæti ég við stuðningi fyrir nýtt tungumál eða einingartegund?

Þú getur búið til sérsniðna einingargreina með því að nota regex-mynstur eða neitunarlista. Þetta gerir þér kleift að bæta við sértækum auðkennum eða auka umfjöllun til viðbótarforma sem ekki eru enn í innbyggðu greinalibraríinu.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Nafnleynd í Öllum Tungumálum

Byrjaðu með 200 ókeypis tákn. Virkar með öllum 48 tungumálum.