Ugunduzi wa PII katika Lugha 48

Gundua na ficha PII katika lugha 48 na msaada wa mifumo ya asili. Msaada kamili wa RTL kwa Kiarabu, Kiebrania, Kiajemi, na Kiurdu.

Lugha 48 Zinazoungwa Mkono

Ugunduzi kamili wa PII na ufichaji katika jukwaa zima

spaCy NLP - Inaendeshwa Kwenye Kompyuta (lugha 25)

KiingerezaKijerumaniKihispaniaKifaransaKiitalianoKirenoKiholanziKipolandiKirusiKijapaniKichinaKikoreaKiromaniaKigirikiKikroeshiaKisloveniaKimasedoniaKiswidiKidenmakiKinorweKifiniKiukreniKilitwaniaKikatalaniKituruki

Stanza NER - Inaendeshwa Kwenye Kompyuta (lugha 7)

KibulgariaKihungariKiebrania (RTL)KivietinamuKiafrikanaKiarmeniaKibasque

XLM-RoBERTa Transformer - Inaendeshwa Kwenye Kompyuta (lugha 16)

Kiarabu (RTL)KihindiKichekiKislovakiaKiindonesiaKithaiKiajemi (RTL)KiserbiaKilatviaKiestoniaKimaleiKibengaliKiurdu (RTL)KiswahiliKitagalogiKiisilandi

Msaada wa RTL

KiarabuKiebraniaKiajemiKiurdu

Inaendeshwa na NLP ya Kisasa

Injini tatu za NLP zikifanya kazi pamoja kwa usambazaji wa lugha wa juu zaidi

  • Mifano inayopakiwa kwa uvivu (max 5 iliyohifadhiwa) kwa ufanisi wa kumbukumbu
  • Ugunduzi wa lugha kiotomatiki
  • Usindikaji wa nyaraka za lugha mchanganyiko
  • Mifumo ya entiti maalum ya lugha

Miundo Maalum ya Nchi

Tunagundua PII katika miundo maalum kwa kila nchi na kanda.

Miundo ya Ulaya

  • Kijerumani: Personalausweis, Steuer-ID, Reisepass
  • Kifaransa: NIR, Carte Nationale, Permis
  • Kiitaliano: Codice Fiscale, Carta d'Identità
  • Kihispania: DNI, NIE, NIF
  • Kiholanzi: BSN, Rijbewijs
  • Kipolandi: PESEL, NIP, REGON

Miundo ya Asia-Pacific

  • Japani: My Number, Passport
  • India: Aadhaar, PAN, GSTIN, Usajili wa Gari
  • Thailand: Kitambulisho cha Taifa, Kitambulisho cha Kodi, Passport
  • Indonesia: NIK, NPWP, Passport
  • Vietnam: CCCD, Msimbo wa Kodi, Passport
  • Malaysia: MyKad, Kitambulisho cha Kodi, Passport

Amerika, Afrika & Mashariki ya Kati

  • Marekani: SSN, Leseni ya Dereva, Passport
  • Uingereza: Bima ya Taifa, Nambari ya NHS
  • Kanada: SIN, Leseni ya Dereva
  • Australia: TFN, Medicare, ABN
  • Kenya: Kitambulisho cha Taifa, KRA PIN, Passport
  • Afrika Kusini: Nambari ya Kitambulisho, Nambari ya Kodi, Passport

Maswali Yanayoulizwa Mara kwa Mara

Ni lugha zipi 48 zinazoungwa mkono na cloak.business?

cloak.business inasaidia Kiafrikana, Kiarabu, Kiarmenia, Kibasque, Kibengali, Kibulgaria, Kikatalani, Kichina, Kikroeshia, Kicheki, Kidenmaki, Kiholanzi, Kiingereza, Kiestonia, Kifini, Kifaransa, Kijerumani, Kigiriki, Kiebrania, Kihindi, Kihungari, Kiisilandi, Kiindonesia, Kiitaliano, Kijapani, Kikorea, Kilatvia, Kilitwania, Kimasedonia, Kimalei, Kinorwe, Kiajemi, Kipolandi, Kireno, Kiromania, Kirusi, Kiserbia, Kislovakia, Kislovenia, Kihispania, Kiswahili, Kiswidi, Kitagalogi, Kithai, Kituruki, Kiukreni, Kiurdu, na Kivietinamu — na msaada kamili wa RTL kwa Kiarabu, Kiebrania, Kiajemi, na Kiurdu.

Je, ugunduzi wa PII unafanya kazi sawa katika lugha zote?

Ugunduzi hutumia mbinu mbili: kulinganisha mifumo ya regex kwa data iliyopangiliwa (ID, nambari za simu, nambari za kodi) na mifano ya NLP kwa entiti zisizopangiliwa (majina, maeneo). Ugunduzi wa msingi wa mifumo unashughulikia lugha zote 48. Ugunduzi wa msingi wa NLP unapatikana katika lugha zilizo na mifano iliyofundishwa.

Miundo ya kitambulisho maalum ya nchi inashughulikiwa vipi?

cloak.business inajumuisha watambuzi wa mifumo 317 wanaoshughulikia nchi 70+. Kila mtambuzi huthibitisha muundo maalum, hesabu ya hundi, na muundo wa vitambulisho vya kitaifa, nambari za kodi, vitambulisho vya afya, na data ya kifedha kwa nchi hiyo.

Je, naweza kugundua PII katika lugha nyingi ndani ya hati moja?

Ndio. cloak.business inaweza kusindika nyaraka za lugha nyingi na kugundua PII katika lugha tofauti katika ombi moja. Mfumo unatambua kiotomatiki ni mifumo gani ya lugha itumike.

Ninawezaje kuongeza msaada kwa lugha mpya au aina ya entiti?

Unaweza kuunda watambuzi wa entiti maalum kwa kutumia mifumo ya regex au orodha za kukataa. Hii inakuruhusu kuongeza vitambulisho maalum vya kikoa au kupanua usambazaji kwa miundo ya ziada ambayo bado haijajumuishwa katika maktaba ya mtambuzi iliyojengwa ndani.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Ficha katika Lugha Yoyote

Anza na tokeni 200 za bure. Inafanya kazi na lugha zote 48.