cloak.business

PII Detektion på 48 Sprog

Detekter og anonymiser PII på 48 sprog med native mønsterunderstøttelse. Fuld RTL support for arabisk, hebraisk, persisk og urdu.

48 Sprog Understøttet

Fuld PII-detektion og anonymisering på hele platformen

spaCy NLP - Kører Lokalt (25 sprog)

EngelskTyskSpanskFranskItalienskPortugisiskHollandskPolskRussiskJapanskKinesiskKoreanskRumænskGræskKroatiskSlovenskMakedonskSvenskDanskNorskFinskUkrainskLitauiskCatalanskTyrkisk

Stanza NER - Kører Lokalt (7 sprog)

BulgarskUngarskHebraisk (RTL)VietnamesiskAfrikaansArmenskBaskisk

XLM-RoBERTa Transformer - Kører Lokalt (16 sprog)

Arabisk (RTL)HindiTjekkiskSlovakiskIndonesiskThaiPersisk (RTL)SerbiskLettiskEstiskMalajiskBengaliUrdu (RTL)SwahiliTagalogIslandsk

RTL Support

ArabiskHebraiskPersiskUrdu

Drevet af Avanceret NLP

Tre NLP-motorer arbejder sammen for maksimal sprogunderstøttelse

  • Lazy-loaded modeller (max 5 cachede) for hukommelseseffektivitet
  • Automatisk sprogdetektion
  • Blandet-sprog dokumentbehandling
  • Sprog-specifikke enhedsmønstre

Landspecifikke Formater

Vi detekterer PII i formater, der er specifikke for hvert land og region.

Europæiske Formater

  • Tysk: Personalausweis, Steuer-ID, Reisepass
  • Fransk: NIR, Carte Nationale, Permis
  • Italiensk: Codice Fiscale, Carta d'Identità
  • Spansk: DNI, NIE, NIF
  • Hollandsk: BSN, Rijbewijs
  • Polsk: PESEL, NIP, REGON

Asien-Stillehavs Formater

  • Japan: My Number, Pas
  • Indien: Aadhaar, PAN, GSTIN, Køretøjsregistrering
  • Thailand: Nationalt ID, Skatte-ID, Pas
  • Indonesien: NIK, NPWP, Pas
  • Vietnam: CCCD, Skattekode, Pas
  • Malaysia: MyKad, Skatte-ID, Pas

Amerika, Afrika & Mellemøsten

  • USA: SSN, Kørekort, Pas
  • UK: National Insurance, NHS-nummer
  • Canada: SIN, Kørekort
  • Australien: TFN, Medicare, ABN
  • Kenya: Nationalt ID, KRA PIN, Pas
  • Sydafrika: ID-nummer, Skattenummer, Pas

Ofte Stillede Spørgsmål

Hvilke 48 sprog understøtter cloak.business?

cloak.business understøtter Afrikaans, Arabisk, Armensk, Baskisk, Bengali, Bulgarsk, Catalansk, Kinesisk, Kroatisk, Tjekkisk, Dansk, Hollandsk, Engelsk, Estisk, Finsk, Fransk, Tysk, Græsk, Hebraisk, Hindi, Ungarsk, Islandsk, Indonesisk, Italiensk, Japansk, Koreansk, Lettisk, Litauisk, Makedonsk, Malajisk, Norsk, Persisk, Polsk, Portugisisk, Rumænsk, Russisk, Serbisk, Slovakisk, Slovensk, Spansk, Swahili, Svensk, Tagalog, Thai, Tyrkisk, Ukrainsk, Urdu og Vietnamesisk — med fuld RTL support for Arabisk, Hebraisk, Persisk og Urdu.

Fungerer PII-detektion på samme måde på alle sprog?

Detektion bruger to tilgange: regex-baseret mønstermatching for strukturerede data (ID'er, telefonnumre, skattenumre) og NLP-modeller for ustrukturerede enheder (navne, lokationer). Mønsterbaseret detektion dækker alle 48 sprog. NLP-baseret detektion er tilgængelig på sprog med trænede modeller.

Hvordan håndteres landspecifikke ID-formater?

cloak.business inkluderer 317 mønstergenkendere, der dækker 70+ lande. Hver genkender validerer det specifikke format, kontrolsum og struktur for nationale ID'er, skattenumre, sundhedsidentifikatorer og finansielle data for det pågældende land.

Kan jeg detektere PII på flere sprog inden for samme dokument?

Ja. cloak.business kan behandle flersprogede dokumenter og detektere PII på tværs af forskellige sprog i en enkelt forespørgsel. Systemet identificerer automatisk, hvilke sprog mønstre der skal anvendes.

Hvordan tilføjer jeg support til et nyt sprog eller enhedstype?

Du kan oprette brugerdefinerede enhedsgenkendere ved hjælp af regex-mønstre eller afvisningslister. Dette giver dig mulighed for at tilføje domænespecifikke identifikatorer eller udvide dækningen til yderligere formater, der endnu ikke er inkluderet i det indbyggede genkenderbibliotek.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymiser på Ethvert Sprog

Start med 200 gratis tokens. Fungerer med alle 48 sprog.