48 Sprog Understøttet
Fuld PII-detektion og anonymisering på hele platformen
spaCy NLP - Kører Lokalt (25 sprog)
Stanza NER - Kører Lokalt (7 sprog)
XLM-RoBERTa Transformer - Kører Lokalt (16 sprog)
RTL Support
Drevet af Avanceret NLP
Tre NLP-motorer arbejder sammen for maksimal sprogunderstøttelse
- Lazy-loaded modeller (max 5 cachede) for hukommelseseffektivitet
- Automatisk sprogdetektion
- Blandet-sprog dokumentbehandling
- Sprog-specifikke enhedsmønstre
Landspecifikke Formater
Vi detekterer PII i formater, der er specifikke for hvert land og region.
Europæiske Formater
- Tysk: Personalausweis, Steuer-ID, Reisepass
- Fransk: NIR, Carte Nationale, Permis
- Italiensk: Codice Fiscale, Carta d'Identità
- Spansk: DNI, NIE, NIF
- Hollandsk: BSN, Rijbewijs
- Polsk: PESEL, NIP, REGON
Asien-Stillehavs Formater
- Japan: My Number, Pas
- Indien: Aadhaar, PAN, GSTIN, Køretøjsregistrering
- Thailand: Nationalt ID, Skatte-ID, Pas
- Indonesien: NIK, NPWP, Pas
- Vietnam: CCCD, Skattekode, Pas
- Malaysia: MyKad, Skatte-ID, Pas
Amerika, Afrika & Mellemøsten
- USA: SSN, Kørekort, Pas
- UK: National Insurance, NHS-nummer
- Canada: SIN, Kørekort
- Australien: TFN, Medicare, ABN
- Kenya: Nationalt ID, KRA PIN, Pas
- Sydafrika: ID-nummer, Skattenummer, Pas
Ofte Stillede Spørgsmål
Hvilke 48 sprog understøtter cloak.business?
cloak.business understøtter Afrikaans, Arabisk, Armensk, Baskisk, Bengali, Bulgarsk, Catalansk, Kinesisk, Kroatisk, Tjekkisk, Dansk, Hollandsk, Engelsk, Estisk, Finsk, Fransk, Tysk, Græsk, Hebraisk, Hindi, Ungarsk, Islandsk, Indonesisk, Italiensk, Japansk, Koreansk, Lettisk, Litauisk, Makedonsk, Malajisk, Norsk, Persisk, Polsk, Portugisisk, Rumænsk, Russisk, Serbisk, Slovakisk, Slovensk, Spansk, Swahili, Svensk, Tagalog, Thai, Tyrkisk, Ukrainsk, Urdu og Vietnamesisk — med fuld RTL support for Arabisk, Hebraisk, Persisk og Urdu.
Fungerer PII-detektion på samme måde på alle sprog?
Detektion bruger to tilgange: regex-baseret mønstermatching for strukturerede data (ID'er, telefonnumre, skattenumre) og NLP-modeller for ustrukturerede enheder (navne, lokationer). Mønsterbaseret detektion dækker alle 48 sprog. NLP-baseret detektion er tilgængelig på sprog med trænede modeller.
Hvordan håndteres landspecifikke ID-formater?
cloak.business inkluderer 317 mønstergenkendere, der dækker 70+ lande. Hver genkender validerer det specifikke format, kontrolsum og struktur for nationale ID'er, skattenumre, sundhedsidentifikatorer og finansielle data for det pågældende land.
Kan jeg detektere PII på flere sprog inden for samme dokument?
Ja. cloak.business kan behandle flersprogede dokumenter og detektere PII på tværs af forskellige sprog i en enkelt forespørgsel. Systemet identificerer automatisk, hvilke sprog mønstre der skal anvendes.
Hvordan tilføjer jeg support til et nyt sprog eller enhedstype?
Du kan oprette brugerdefinerede enhedsgenkendere ved hjælp af regex-mønstre eller afvisningslister. Dette giver dig mulighed for at tilføje domænespecifikke identifikatorer eller udvide dækningen til yderligere formater, der endnu ikke er inkluderet i det indbyggede genkenderbibliotek.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only