cloak.business

PII-detectie in 48 Talen

Detecteer en anonimiseer PII in 48 talen met ondersteuning voor native patronen. Volledige RTL-ondersteuning voor Arabisch, Hebreeuws, Perzisch en Urdu.

48 Talen Ondersteund

Volledige PII-detectie en anonimisering over het hele platform

spaCy NLP - Lokaal Uitgevoerd (25 talen)

EngelsDuitsSpaansFransItaliaansPortugeesNederlandsPoolsRussischJapansChineesKoreaansRoemeensGrieksKroatischSloveensMacedonischZweedsDeensNoorsFinsOekraïensLitouwsCatalaansTurks

Stanza NER - Lokaal Uitgevoerd (7 talen)

BulgaarsHongaarsHebreeuws (RTL)VietnameesAfrikaansArmeensBaskisch

XLM-RoBERTa Transformer - Lokaal Uitgevoerd (16 talen)

Arabisch (RTL)HindiTsjechischSlowaaksIndonesischThaisPerzisch (RTL)ServischLetsEstsMaleisBengaalsUrdu (RTL)SwahiliTagalogIJslands

RTL Ondersteuning

ArabischHebreeuwsPerzischUrdu

Aangedreven door Geavanceerde NLP

Drie NLP-engines werken samen voor maximale taaldekking

  • Lazy-loaded modellen (maximaal 5 in cache) voor geheugenefficiëntie
  • Automatische taalherkenning
  • Verwerking van documenten in meerdere talen
  • Taalspecifieke entiteitspatronen

Landspecifieke Formaten

We detecteren PII in formaten die specifiek zijn voor elk land en elke regio.

Europese Formaten

  • Duits: Personalausweis, Steuer-ID, Reisepass
  • Frans: NIR, Carte Nationale, Permis
  • Italiaans: Codice Fiscale, Carta d'Identità
  • Spaans: DNI, NIE, NIF
  • Nederlands: BSN, Rijbewijs
  • Pools: PESEL, NIP, REGON

Azië-Pacific Formaten

  • Japan: Mijn Nummer, Paspoort
  • India: Aadhaar, PAN, GSTIN, Voertuigregistratie
  • Thailand: Nationaal ID, Belasting-ID, Paspoort
  • Indonesië: NIK, NPWP, Paspoort
  • Vietnam: CCCD, Belastingcode, Paspoort
  • Maleisië: MyKad, Belasting-ID, Paspoort

Amerika, Afrika & Midden-Oosten

  • VS: SSN, Rijbewijs, Paspoort
  • VK: National Insurance, NHS-nummer
  • Canada: SIN, Rijbewijs
  • Australië: TFN, Medicare, ABN
  • Kenia: Nationaal ID, KRA PIN, Paspoort
  • Zuid-Afrika: ID-nummer, Belastingnummer, Paspoort

Veelgestelde Vragen

Welke 48 talen ondersteunt cloak.business?

cloak.business ondersteunt Afrikaans, Arabisch, Armeens, Baskisch, Bengaals, Bulgaars, Catalaans, Chinees, Kroatisch, Tsjechisch, Deens, Nederlands, Engels, Ests, Fins, Frans, Duits, Grieks, Hebreeuws, Hindi, Hongaars, IJslands, Indonesisch, Italiaans, Japans, Koreaans, Lets, Litouws, Macedonisch, Maleis, Noors, Perzisch, Pools, Portugees, Roemeens, Russisch, Servisch, Slowaaks, Sloveens, Spaans, Swahili, Zweeds, Tagalog, Thais, Turks, Oekraïens, Urdu en Vietnamees — met volledige RTL-ondersteuning voor Arabisch, Hebreeuws, Perzisch en Urdu.

Werkt PII-detectie hetzelfde in alle talen?

Detectie maakt gebruik van twee benaderingen: regex-gebaseerde patroonherkenning voor gestructureerde data (ID's, telefoonnummers, belastingnummers) en NLP-modellen voor ongestructureerde entiteiten (namen, locaties). Patroon-gebaseerde detectie dekt alle 48 talen. NLP-gebaseerde detectie is beschikbaar in talen met getrainde modellen.

Hoe worden landspecifieke ID-formaten behandeld?

cloak.business bevat 317 patroonherkenners die meer dan 70 landen dekken. Elke herkenner valideert het specifieke formaat, de checksum en de structuur van nationale ID's, belastingnummers, gezondheidsidentificatoren en financiële gegevens voor dat land.

Kan ik PII in meerdere talen binnen hetzelfde document detecteren?

Ja. cloak.business kan meertalige documenten verwerken en PII in verschillende talen in één verzoek detecteren. Het systeem identificeert automatisch welke taalpatronen moeten worden toegepast.

Hoe voeg ik ondersteuning toe voor een nieuwe taal of entiteitstype?

U kunt aangepaste entiteitsherkenners maken met behulp van regex-patronen of uitsluitlijsten. Dit stelt u in staat om domeinspecifieke identificatoren toe te voegen of de dekking uit te breiden naar extra formaten die nog niet zijn opgenomen in de ingebouwde herkenningsbibliotheek.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimiseer in Elke Taal

Begin met 200 gratis tokens. Werkt met alle 48 talen.