48 Språk Støttet
Full PII-deteksjon og anonymisering over hele plattformen
spaCy NLP - Kjører Lokalt (25 språk)
Stanza NER - Kjører Lokalt (7 språk)
XLM-RoBERTa Transformer - Kjører Lokalt (16 språk)
RTL Støtte
Drevet av Avansert NLP
Tre NLP-motorer som jobber sammen for maksimal språkdekning
- Lazy-loaded modeller (maks 5 i cache) for minneeffektivitet
- Automatisk språkgjenkjenning
- Behandling av dokumenter med blandede språk
- Språkspesifikke enhetsmønstre
Lands-spesifikke Formater
Vi oppdager PII i formater spesifikke for hvert land og region.
Europeiske Formater
- Tysk: Personalausweis, Steuer-ID, Reisepass
- Fransk: NIR, Carte Nationale, Permis
- Italiensk: Codice Fiscale, Carta d'Identità
- Spansk: DNI, NIE, NIF
- Nederlandsk: BSN, Rijbewijs
- Polsk: PESEL, NIP, REGON
Asia-Stillehavsformater
- Japan: My Number, Pass
- India: Aadhaar, PAN, GSTIN, Kjøretøyregistrering
- Thailand: Nasjonalt ID, Skatte-ID, Pass
- Indonesia: NIK, NPWP, Pass
- Vietnam: CCCD, Skattekode, Pass
- Malaysia: MyKad, Skatte-ID, Pass
Amerika, Afrika & Midtøsten
- USA: SSN, Førerkort, Pass
- Storbritannia: National Insurance, NHS-nummer
- Canada: SIN, Førerkort
- Australia: TFN, Medicare, ABN
- Kenya: Nasjonalt ID, KRA PIN, Pass
- Sør-Afrika: ID-nummer, Skattenummer, Pass
Ofte Stilte Spørsmål
Hvilke 48 språk støtter cloak.business?
cloak.business støtter Afrikaans, Arabisk, Armensk, Baskisk, Bengali, Bulgarsk, Katalansk, Kinesisk, Kroatisk, Tsjekkisk, Dansk, Nederlandsk, Engelsk, Estisk, Finsk, Fransk, Tysk, Gresk, Hebraisk, Hindi, Ungarsk, Islandsk, Indonesisk, Italiensk, Japansk, Koreansk, Latvisk, Litauisk, Makedonsk, Malay, Norsk, Persisk, Polsk, Portugisisk, Rumensk, Russisk, Serbisk, Slovakisk, Slovensk, Spansk, Swahili, Svensk, Tagalog, Thai, Tyrkisk, Ukrainsk, Urdu og Vietnamesisk — med full RTL-støtte for Arabisk, Hebraisk, Persisk og Urdu.
Fungerer PII-deteksjon likt på alle språk?
Deteksjon bruker to tilnærminger: regex-basert mønstergjenkjenning for strukturerte data (ID-er, telefonnumre, skattenumre) og NLP-modeller for ustrukturerte enheter (navn, steder). Mønsterbasert deteksjon dekker alle 48 språk. NLP-basert deteksjon er tilgjengelig på språk med trente modeller.
Hvordan håndteres lands-spesifikke ID-formater?
cloak.business inkluderer 317 mønstergjenkjennere som dekker 70+ land. Hver gjenkjenner validerer det spesifikke formatet, sjekksummen og strukturen til nasjonale ID-er, skattenumre, helseidentifikatorer og finansielle data for det landet.
Kan jeg oppdage PII på flere språk i samme dokument?
Ja. cloak.business kan behandle flerspråklige dokumenter og oppdage PII på forskjellige språk i en enkelt forespørsel. Systemet identifiserer automatisk hvilke språk mønstre som skal brukes.
Hvordan legger jeg til støtte for et nytt språk eller enhetstype?
Du kan lage tilpassede enhetsgjenkjennere ved å bruke regex-mønstre eller nektelister. Dette lar deg legge til domene-spesifikke identifikatorer eller utvide dekningen til flere formater som ennå ikke er inkludert i det innebygde gjenkjennerbiblioteket.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only