PII-deteksjon på 48 språk

Oppdag og anonymiser PII på 48 språk med støtte for lokale mønstre. Full RTL-støtte for arabisk, hebraisk, persisk og urdu.

48 Språk Støttet

Full PII-deteksjon og anonymisering over hele plattformen

spaCy NLP - Kjører Lokalt (25 språk)

EngelskTyskSpanskFranskItalienskPortugisiskNederlandskPolskRussiskJapanskKinesiskKoreanskRumenskGreskKroatiskSlovenskMakedonskSvenskDanskNorskFinskUkrainskLitauiskKatalanskTyrkisk

Stanza NER - Kjører Lokalt (7 språk)

BulgarskUngarskHebraisk (RTL)VietnamesiskAfrikaansArmenskBaskisk

XLM-RoBERTa Transformer - Kjører Lokalt (16 språk)

Arabisk (RTL)HindiTsjekkiskSlovakiskIndonesiskThaiPersisk (RTL)SerbiskLatviskEstiskMalayBengaliUrdu (RTL)SwahiliTagalogIslandsk

RTL Støtte

ArabiskHebraiskPersiskUrdu

Drevet av Avansert NLP

Tre NLP-motorer som jobber sammen for maksimal språkdekning

  • Lazy-loaded modeller (maks 5 i cache) for minneeffektivitet
  • Automatisk språkgjenkjenning
  • Behandling av dokumenter med blandede språk
  • Språkspesifikke enhetsmønstre

Lands-spesifikke Formater

Vi oppdager PII i formater spesifikke for hvert land og region.

Europeiske Formater

  • Tysk: Personalausweis, Steuer-ID, Reisepass
  • Fransk: NIR, Carte Nationale, Permis
  • Italiensk: Codice Fiscale, Carta d'Identità
  • Spansk: DNI, NIE, NIF
  • Nederlandsk: BSN, Rijbewijs
  • Polsk: PESEL, NIP, REGON

Asia-Stillehavsformater

  • Japan: My Number, Pass
  • India: Aadhaar, PAN, GSTIN, Kjøretøyregistrering
  • Thailand: Nasjonalt ID, Skatte-ID, Pass
  • Indonesia: NIK, NPWP, Pass
  • Vietnam: CCCD, Skattekode, Pass
  • Malaysia: MyKad, Skatte-ID, Pass

Amerika, Afrika & Midtøsten

  • USA: SSN, Førerkort, Pass
  • Storbritannia: National Insurance, NHS-nummer
  • Canada: SIN, Førerkort
  • Australia: TFN, Medicare, ABN
  • Kenya: Nasjonalt ID, KRA PIN, Pass
  • Sør-Afrika: ID-nummer, Skattenummer, Pass

Ofte Stilte Spørsmål

Hvilke 48 språk støtter cloak.business?

cloak.business støtter Afrikaans, Arabisk, Armensk, Baskisk, Bengali, Bulgarsk, Katalansk, Kinesisk, Kroatisk, Tsjekkisk, Dansk, Nederlandsk, Engelsk, Estisk, Finsk, Fransk, Tysk, Gresk, Hebraisk, Hindi, Ungarsk, Islandsk, Indonesisk, Italiensk, Japansk, Koreansk, Latvisk, Litauisk, Makedonsk, Malay, Norsk, Persisk, Polsk, Portugisisk, Rumensk, Russisk, Serbisk, Slovakisk, Slovensk, Spansk, Swahili, Svensk, Tagalog, Thai, Tyrkisk, Ukrainsk, Urdu og Vietnamesisk — med full RTL-støtte for Arabisk, Hebraisk, Persisk og Urdu.

Fungerer PII-deteksjon likt på alle språk?

Deteksjon bruker to tilnærminger: regex-basert mønstergjenkjenning for strukturerte data (ID-er, telefonnumre, skattenumre) og NLP-modeller for ustrukturerte enheter (navn, steder). Mønsterbasert deteksjon dekker alle 48 språk. NLP-basert deteksjon er tilgjengelig på språk med trente modeller.

Hvordan håndteres lands-spesifikke ID-formater?

cloak.business inkluderer 317 mønstergjenkjennere som dekker 70+ land. Hver gjenkjenner validerer det spesifikke formatet, sjekksummen og strukturen til nasjonale ID-er, skattenumre, helseidentifikatorer og finansielle data for det landet.

Kan jeg oppdage PII på flere språk i samme dokument?

Ja. cloak.business kan behandle flerspråklige dokumenter og oppdage PII på forskjellige språk i en enkelt forespørsel. Systemet identifiserer automatisk hvilke språk mønstre som skal brukes.

Hvordan legger jeg til støtte for et nytt språk eller enhetstype?

Du kan lage tilpassede enhetsgjenkjennere ved å bruke regex-mønstre eller nektelister. Dette lar deg legge til domene-spesifikke identifikatorer eller utvide dekningen til flere formater som ennå ikke er inkludert i det innebygde gjenkjennerbiblioteket.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymiser på Ethvert Språk

Start med 200 gratis tokens. Fungerer med alle 48 språk.