Lugha 48 Zinazoungwa Mkono
Ugunduzi kamili wa PII na ufichaji katika jukwaa zima
spaCy NLP - Inaendeshwa Kwenye Kompyuta (lugha 25)
Stanza NER - Inaendeshwa Kwenye Kompyuta (lugha 7)
XLM-RoBERTa Transformer - Inaendeshwa Kwenye Kompyuta (lugha 16)
Msaada wa RTL
Inaendeshwa na NLP ya Kisasa
Injini tatu za NLP zikifanya kazi pamoja kwa usambazaji wa lugha wa juu zaidi
- Mifano inayopakiwa kwa uvivu (max 5 iliyohifadhiwa) kwa ufanisi wa kumbukumbu
- Ugunduzi wa lugha kiotomatiki
- Usindikaji wa nyaraka za lugha mchanganyiko
- Mifumo ya entiti maalum ya lugha
Miundo Maalum ya Nchi
Tunagundua PII katika miundo maalum kwa kila nchi na kanda.
Miundo ya Ulaya
- Kijerumani: Personalausweis, Steuer-ID, Reisepass
- Kifaransa: NIR, Carte Nationale, Permis
- Kiitaliano: Codice Fiscale, Carta d'Identità
- Kihispania: DNI, NIE, NIF
- Kiholanzi: BSN, Rijbewijs
- Kipolandi: PESEL, NIP, REGON
Miundo ya Asia-Pacific
- Japani: My Number, Passport
- India: Aadhaar, PAN, GSTIN, Usajili wa Gari
- Thailand: Kitambulisho cha Taifa, Kitambulisho cha Kodi, Passport
- Indonesia: NIK, NPWP, Passport
- Vietnam: CCCD, Msimbo wa Kodi, Passport
- Malaysia: MyKad, Kitambulisho cha Kodi, Passport
Amerika, Afrika & Mashariki ya Kati
- Marekani: SSN, Leseni ya Dereva, Passport
- Uingereza: Bima ya Taifa, Nambari ya NHS
- Kanada: SIN, Leseni ya Dereva
- Australia: TFN, Medicare, ABN
- Kenya: Kitambulisho cha Taifa, KRA PIN, Passport
- Afrika Kusini: Nambari ya Kitambulisho, Nambari ya Kodi, Passport
Maswali Yanayoulizwa Mara kwa Mara
Ni lugha zipi 48 zinazoungwa mkono na cloak.business?
cloak.business inasaidia Kiafrikana, Kiarabu, Kiarmenia, Kibasque, Kibengali, Kibulgaria, Kikatalani, Kichina, Kikroeshia, Kicheki, Kidenmaki, Kiholanzi, Kiingereza, Kiestonia, Kifini, Kifaransa, Kijerumani, Kigiriki, Kiebrania, Kihindi, Kihungari, Kiisilandi, Kiindonesia, Kiitaliano, Kijapani, Kikorea, Kilatvia, Kilitwania, Kimasedonia, Kimalei, Kinorwe, Kiajemi, Kipolandi, Kireno, Kiromania, Kirusi, Kiserbia, Kislovakia, Kislovenia, Kihispania, Kiswahili, Kiswidi, Kitagalogi, Kithai, Kituruki, Kiukreni, Kiurdu, na Kivietinamu — na msaada kamili wa RTL kwa Kiarabu, Kiebrania, Kiajemi, na Kiurdu.
Je, ugunduzi wa PII unafanya kazi sawa katika lugha zote?
Ugunduzi hutumia mbinu mbili: kulinganisha mifumo ya regex kwa data iliyopangiliwa (ID, nambari za simu, nambari za kodi) na mifano ya NLP kwa entiti zisizopangiliwa (majina, maeneo). Ugunduzi wa msingi wa mifumo unashughulikia lugha zote 48. Ugunduzi wa msingi wa NLP unapatikana katika lugha zilizo na mifano iliyofundishwa.
Miundo ya kitambulisho maalum ya nchi inashughulikiwa vipi?
cloak.business inajumuisha watambuzi wa mifumo 317 wanaoshughulikia nchi 70+. Kila mtambuzi huthibitisha muundo maalum, hesabu ya hundi, na muundo wa vitambulisho vya kitaifa, nambari za kodi, vitambulisho vya afya, na data ya kifedha kwa nchi hiyo.
Je, naweza kugundua PII katika lugha nyingi ndani ya hati moja?
Ndio. cloak.business inaweza kusindika nyaraka za lugha nyingi na kugundua PII katika lugha tofauti katika ombi moja. Mfumo unatambua kiotomatiki ni mifumo gani ya lugha itumike.
Ninawezaje kuongeza msaada kwa lugha mpya au aina ya entiti?
Unaweza kuunda watambuzi wa entiti maalum kwa kutumia mifumo ya regex au orodha za kukataa. Hii inakuruhusu kuongeza vitambulisho maalum vya kikoa au kupanua usambazaji kwa miundo ya ziada ambayo bado haijajumuishwa katika maktaba ya mtambuzi iliyojengwa ndani.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only