PII-deteksjon på 48 språk

Oppdag og anonymiser PII på 48 språk med støtte for lokale mønstre. Full RTL-støtte for arabisk, hebraisk, persisk og urdu.

Prøv Gratis Språkdokumentasjon

48 Språk Støttet

Full PII-deteksjon og anonymisering over hele plattformen

spaCy NLP - Kjører Lokalt (25 språk)

EngelskTyskSpanskFranskItalienskPortugisiskNederlandskPolskRussiskJapanskKinesiskKoreanskRumenskGreskKroatiskSlovenskMakedonskSvenskDanskNorskFinskUkrainskLitauiskKatalanskTyrkisk

Stanza NER - Kjører Lokalt (7 språk)

BulgarskUngarskHebraisk (RTL)VietnamesiskAfrikaansArmenskBaskisk

XLM-RoBERTa Transformer - Kjører Lokalt (16 språk)

Arabisk (RTL)HindiTsjekkiskSlovakiskIndonesiskThaiPersisk (RTL)SerbiskLatviskEstiskMalayBengaliUrdu (RTL)SwahiliTagalogIslandsk

RTL Støtte

ArabiskHebraiskPersiskUrdu

Drevet av Avansert NLP

Tre NLP-motorer som jobber sammen for maksimal språkdekning

Lazy-loaded modeller (maks 5 i cache) for minneeffektivitet
Automatisk språkgjenkjenning
Behandling av dokumenter med blandede språk
Språkspesifikke enhetsmønstre

Lands-spesifikke Formater

Vi oppdager PII i formater spesifikke for hvert land og region.

Europeiske Formater

Tysk: Personalausweis, Steuer-ID, Reisepass
Fransk: NIR, Carte Nationale, Permis
Italiensk: Codice Fiscale, Carta d'Identità
Spansk: DNI, NIE, NIF
Nederlandsk: BSN, Rijbewijs
Polsk: PESEL, NIP, REGON

Asia-Stillehavsformater

Japan: My Number, Pass
India: Aadhaar, PAN, GSTIN, Kjøretøyregistrering
Thailand: Nasjonalt ID, Skatte-ID, Pass
Indonesia: NIK, NPWP, Pass
Vietnam: CCCD, Skattekode, Pass
Malaysia: MyKad, Skatte-ID, Pass

Amerika, Afrika & Midtøsten

USA: SSN, Førerkort, Pass
Storbritannia: National Insurance, NHS-nummer
Canada: SIN, Førerkort
Australia: TFN, Medicare, ABN
Kenya: Nasjonalt ID, KRA PIN, Pass
Sør-Afrika: ID-nummer, Skattenummer, Pass

Ofte Stilte Spørsmål

Hvilke 48 språk støtter cloak.business?

cloak.business støtter Afrikaans, Arabisk, Armensk, Baskisk, Bengali, Bulgarsk, Katalansk, Kinesisk, Kroatisk, Tsjekkisk, Dansk, Nederlandsk, Engelsk, Estisk, Finsk, Fransk, Tysk, Gresk, Hebraisk, Hindi, Ungarsk, Islandsk, Indonesisk, Italiensk, Japansk, Koreansk, Latvisk, Litauisk, Makedonsk, Malay, Norsk, Persisk, Polsk, Portugisisk, Rumensk, Russisk, Serbisk, Slovakisk, Slovensk, Spansk, Swahili, Svensk, Tagalog, Thai, Tyrkisk, Ukrainsk, Urdu og Vietnamesisk — med full RTL-støtte for Arabisk, Hebraisk, Persisk og Urdu.

Fungerer PII-deteksjon likt på alle språk?

Deteksjon bruker to tilnærminger: regex-basert mønstergjenkjenning for strukturerte data (ID-er, telefonnumre, skattenumre) og NLP-modeller for ustrukturerte enheter (navn, steder). Mønsterbasert deteksjon dekker alle 48 språk. NLP-basert deteksjon er tilgjengelig på språk med trente modeller.

Hvordan håndteres lands-spesifikke ID-formater?

cloak.business inkluderer 317 mønstergjenkjennere som dekker 70+ land. Hver gjenkjenner validerer det spesifikke formatet, sjekksummen og strukturen til nasjonale ID-er, skattenumre, helseidentifikatorer og finansielle data for det landet.

Kan jeg oppdage PII på flere språk i samme dokument?

Ja. cloak.business kan behandle flerspråklige dokumenter og oppdage PII på forskjellige språk i en enkelt forespørsel. Systemet identifiserer automatisk hvilke språk mønstre som skal brukes.

Hvordan legger jeg til støtte for et nytt språk eller enhetstype?

Du kan lage tilpassede enhetsgjenkjennere ved å bruke regex-mønstre eller nektelister. Dette lar deg legge til domene-spesifikke identifikatorer eller utvide dekningen til flere formater som ennå ikke er inkludert i det innebygde gjenkjennerbiblioteket.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymiser på Ethvert Språk

Start med 200 gratis tokens. Fungerer med alle 48 språk.