PII Detektion på 48 Sprog

Detekter og anonymiser PII på 48 sprog med native mønsterunderstøttelse. Fuld RTL support for arabisk, hebraisk, persisk og urdu.

Prøv Gratis Sprogdokumentation

48 Sprog Understøttet

Fuld PII-detektion og anonymisering på hele platformen

spaCy NLP - Kører Lokalt (25 sprog)

EngelskTyskSpanskFranskItalienskPortugisiskHollandskPolskRussiskJapanskKinesiskKoreanskRumænskGræskKroatiskSlovenskMakedonskSvenskDanskNorskFinskUkrainskLitauiskCatalanskTyrkisk

Stanza NER - Kører Lokalt (7 sprog)

BulgarskUngarskHebraisk (RTL)VietnamesiskAfrikaansArmenskBaskisk

XLM-RoBERTa Transformer - Kører Lokalt (16 sprog)

Arabisk (RTL)HindiTjekkiskSlovakiskIndonesiskThaiPersisk (RTL)SerbiskLettiskEstiskMalajiskBengaliUrdu (RTL)SwahiliTagalogIslandsk

RTL Support

ArabiskHebraiskPersiskUrdu

Drevet af Avanceret NLP

Tre NLP-motorer arbejder sammen for maksimal sprogunderstøttelse

Lazy-loaded modeller (max 5 cachede) for hukommelseseffektivitet
Automatisk sprogdetektion
Blandet-sprog dokumentbehandling
Sprog-specifikke enhedsmønstre

Landspecifikke Formater

Vi detekterer PII i formater, der er specifikke for hvert land og region.

Europæiske Formater

Tysk: Personalausweis, Steuer-ID, Reisepass
Fransk: NIR, Carte Nationale, Permis
Italiensk: Codice Fiscale, Carta d'Identità
Spansk: DNI, NIE, NIF
Hollandsk: BSN, Rijbewijs
Polsk: PESEL, NIP, REGON

Asien-Stillehavs Formater

Japan: My Number, Pas
Indien: Aadhaar, PAN, GSTIN, Køretøjsregistrering
Thailand: Nationalt ID, Skatte-ID, Pas
Indonesien: NIK, NPWP, Pas
Vietnam: CCCD, Skattekode, Pas
Malaysia: MyKad, Skatte-ID, Pas

Amerika, Afrika & Mellemøsten

USA: SSN, Kørekort, Pas
UK: National Insurance, NHS-nummer
Canada: SIN, Kørekort
Australien: TFN, Medicare, ABN
Kenya: Nationalt ID, KRA PIN, Pas
Sydafrika: ID-nummer, Skattenummer, Pas

Ofte Stillede Spørgsmål

Hvilke 48 sprog understøtter cloak.business?

cloak.business understøtter Afrikaans, Arabisk, Armensk, Baskisk, Bengali, Bulgarsk, Catalansk, Kinesisk, Kroatisk, Tjekkisk, Dansk, Hollandsk, Engelsk, Estisk, Finsk, Fransk, Tysk, Græsk, Hebraisk, Hindi, Ungarsk, Islandsk, Indonesisk, Italiensk, Japansk, Koreansk, Lettisk, Litauisk, Makedonsk, Malajisk, Norsk, Persisk, Polsk, Portugisisk, Rumænsk, Russisk, Serbisk, Slovakisk, Slovensk, Spansk, Swahili, Svensk, Tagalog, Thai, Tyrkisk, Ukrainsk, Urdu og Vietnamesisk — med fuld RTL support for Arabisk, Hebraisk, Persisk og Urdu.

Fungerer PII-detektion på samme måde på alle sprog?

Detektion bruger to tilgange: regex-baseret mønstermatching for strukturerede data (ID'er, telefonnumre, skattenumre) og NLP-modeller for ustrukturerede enheder (navne, lokationer). Mønsterbaseret detektion dækker alle 48 sprog. NLP-baseret detektion er tilgængelig på sprog med trænede modeller.

Hvordan håndteres landspecifikke ID-formater?

cloak.business inkluderer 317 mønstergenkendere, der dækker 70+ lande. Hver genkender validerer det specifikke format, kontrolsum og struktur for nationale ID'er, skattenumre, sundhedsidentifikatorer og finansielle data for det pågældende land.

Kan jeg detektere PII på flere sprog inden for samme dokument?

Ja. cloak.business kan behandle flersprogede dokumenter og detektere PII på tværs af forskellige sprog i en enkelt forespørgsel. Systemet identificerer automatisk, hvilke sprog mønstre der skal anvendes.

Hvordan tilføjer jeg support til et nyt sprog eller enhedstype?

Du kan oprette brugerdefinerede enhedsgenkendere ved hjælp af regex-mønstre eller afvisningslister. Dette giver dig mulighed for at tilføje domænespecifikke identifikatorer eller udvide dækningen til yderligere formater, der endnu ikke er inkluderet i det indbyggede genkenderbibliotek.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymiser på Ethvert Sprog

Start med 200 gratis tokens. Fungerer med alle 48 sprog.