48 kieltä tuettuna
Täysi PII-tunnistus ja anonymisointi koko alustalla
spaCy NLP - Toimii paikallisesti (25 kieltä)
Stanza NER - Toimii paikallisesti (7 kieltä)
XLM-RoBERTa Transformer - Toimii paikallisesti (16 kieltä)
RTL-tuki
Kehittyneen NLP:n voimalla
Kolme NLP-moottoria työskentelee yhdessä maksimaalisen kielikattavuuden saavuttamiseksi
- Laiskasti ladatut mallit (enintään 5 välimuistissa) muistin tehokkuuden parantamiseksi
- Automaattinen kielen tunnistus
- Sekakielisten asiakirjojen käsittely
- Kielikohtaiset entiteettikuviot
Maakohtaiset muodot
Tunnistamme PII:n kullekin maalle ja alueelle ominaisissa muodoissa.
Eurooppalaiset muodot
- Saksa: Henkilökortti, Verotunnus, Passi
- Ranska: NIR, Kansallinen kortti, Ajokortti
- Italia: Verokoodi, Henkilökortti
- Espanja: DNI, NIE, NIF
- Hollanti: BSN, Ajokortti
- Puola: PESEL, NIP, REGON
Aasia-Tyynenmeren muodot
- Japani: Oma numero, Passi
- Intia: Aadhaar, PAN, GSTIN, Ajoneuvorekisteri
- Thaimaa: Kansallinen ID, Verotunnus, Passi
- Indonesia: NIK, NPWP, Passi
- Vietnam: CCCD, Verokoodi, Passi
- Malesia: MyKad, Verotunnus, Passi
Amerikat, Afrikka & Lähi-itä
- Yhdysvallat: SSN, Ajokortti, Passi
- Iso-Britannia: Kansallinen vakuutus, NHS-numero
- Kanada: SIN, Ajokortti
- Australia: TFN, Medicare, ABN
- Kenia: Kansallinen ID, KRA PIN, Passi
- Etelä-Afrikka: ID-numero, Veronumero, Passi
Usein kysytyt kysymykset
Mitä 48 kieltä cloak.business tukee?
cloak.business tukee afrikaansia, arabiaa, armeniaa, baskia, bengalia, bulgariaa, katalaania, kiinaa, kroatiaa, tšekkiä, tanskaa, hollantia, englantia, viroa, suomea, ranskaa, saksaa, kreikkaa, hepreaa, hindiä, unkaria, islantia, indonesiaa, italiaa, japania, koreaa, latviaa, liettuaa, makedoniaa, malaijia, norjaa, farsia, puolaa, portugalia, romaniaa, venäjää, serbiaa, slovakkia, sloveniaa, espanjaa, swahilia, ruotsia, tagalogia, thaita, turkkia, ukrainaa, urdua ja vietnamia — täysi RTL-tuki arabiaksi, hepreaksi, farsiksi ja urduksi.
Toimiiko PII-tunnistus samalla tavalla kaikilla kielillä?
Tunnistus käyttää kahta lähestymistapaa: regex-pohjaista kuvioiden tunnistusta rakenteelliselle datalle (tunnukset, puhelinnumerot, veronumerot) ja NLP-malleja rakenteettomille entiteeteille (nimet, sijainnit). Kuvioihin perustuva tunnistus kattaa kaikki 48 kieltä. NLP-pohjainen tunnistus on saatavilla kielillä, joilla on koulutetut mallit.
Miten maakohtaiset tunnusmuodot käsitellään?
cloak.business sisältää 317 kuviotunnistajaa, jotka kattavat yli 70 maata. Jokainen tunnistaja validoi kyseisen maan kansallisten tunnusten, veronumeroiden, terveysidentifikaattoreiden ja taloudellisten tietojen erityisen muodon, tarkistussumman ja rakenteen.
Voinko tunnistaa PII:tä useilla kielillä samassa asiakirjassa?
Kyllä. cloak.business voi käsitellä monikielisiä asiakirjoja ja tunnistaa PII:tä eri kielillä yhdellä pyynnöllä. Järjestelmä tunnistaa automaattisesti, mitä kielikuvioita sovelletaan.
Miten voin lisätä tuen uudelle kielelle tai entiteettityypille?
Voit luoda mukautettuja entiteettitunnistajia käyttämällä regex-kuvioita tai kieltolistoja. Tämä mahdollistaa alakohtaisten tunnisteiden lisäämisen tai kattavuuden laajentamisen lisämuotoihin, joita ei vielä ole sisäänrakennetussa tunnistajakirjastossa.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only