cloak.business

PII Opsporing in 48 Tale

Spoor op en anonimiseer PII in 48 tale met inheemse patroonondersteuning. Volledige RTL ondersteuning vir Arabies, Hebreeus, Persies, en Urdu.

48 Tale Ondersteun

Volledige PII-opsporing en anonimisering oor die hele platform

spaCy NLP - Loop Plaaslik (25 tale)

EngelsDuitsSpaansFransItaliaansPortugeesNederlandsPoolsRussiesJapanneseChineseKoreaansRoemeensGrieksKroatiesSloweensMasedoniesSweedsDeensNoorsFinsOekraïensLitausKatalaansTurks

Stanza NER - Loop Plaaslik (7 tale)

BulgaarseHongaarsHebreeus (RTL)ViëtnameesAfrikaansArmeensBaskies

XLM-RoBERTa Transformer - Loop Plaaslik (16 tale)

Arabies (RTL)HindiTsjeggiesSlowaaksIndonesiesThaiPersies (RTL)SerwiesLetsEstniesMaleisBengaalsUrdu (RTL)SwahiliTagalogYslands

RTL Ondersteuning

ArabiesHebreeusPersiesUrdu

Aangedryf deur Gevorderde NLP

Drie NLP-enjins werk saam vir maksimum taaldekking

  • Lazy-loaded modelle (maksimum 5 gekas) vir geheue-effektiwiteit
  • Outomatiese taalopsporing
  • Gemengde-taal dokumentverwerking
  • Taalspesifieke entiteitspatrone

Landspesifieke Formate

Ons spoor PII op in formate spesifiek aan elke land en streek.

Europese Formate

  • Duits: Personalausweis, Steuer-ID, Reisepass
  • Frans: NIR, Carte Nationale, Permis
  • Italiaans: Codice Fiscale, Carta d'Identità
  • Spaans: DNI, NIE, NIF
  • Nederlands: BSN, Rijbewijs
  • Pools: PESEL, NIP, REGON

Asië-Stille Oseaan Formate

  • Japan: My Number, Paspoort
  • Indië: Aadhaar, PAN, GSTIN, Voertuigregistrasie
  • Thailand: Nasionale ID, Belasting-ID, Paspoort
  • Indonesië: NIK, NPWP, Paspoort
  • Viëtnam: CCCD, Belastingkode, Paspoort
  • Maleisië: MyKad, Belasting-ID, Paspoort

Amerikas, Afrika & Midde-Ooste

  • VSA: SSN, Bestuurslisensie, Paspoort
  • VK: Nasionale Versekering, NHS Nommer
  • Kanada: SIN, Bestuurslisensie
  • Australië: TFN, Medicare, ABN
  • Kenia: Nasionale ID, KRA PIN, Paspoort
  • Suid-Afrika: ID Nommer, Belastingnommer, Paspoort

Gereelde Vrae

Watter 48 tale ondersteun cloak.business?

cloak.business ondersteun Afrikaans, Arabies, Armeens, Baskies, Bengaals, Bulgaars, Katalaans, Chinese, Kroaties, Tsjeggies, Deens, Nederlands, Engels, Estnies, Fins, Frans, Duits, Grieks, Hebreeus, Hindi, Hongaars, Yslands, Indonesies, Italiaans, Japannese, Koreaans, Lets, Litaus, Masedonies, Maleis, Noors, Persies, Pools, Portugees, Roemeens, Russies, Serwies, Slowaaks, Sloweens, Spaans, Swahili, Sweeds, Tagalog, Thai, Turks, Oekraïens, Urdu, en Viëtnamees — met volledige RTL ondersteuning vir Arabies, Hebreeus, Persies, en Urdu.

Werk PII-opsporing dieselfde in alle tale?

Opsporing gebruik twee benaderings: regex-gebaseerde patroonpassing vir gestruktureerde data (ID's, telefoonnommers, belastingnommers) en NLP-modelle vir ongestruktureerde entiteite (name, plekke). Patroon-gebaseerde opsporing dek al 48 tale. NLP-gebaseerde opsporing is beskikbaar in tale met opgeleide modelle.

Hoe word landspesifieke ID-formate hanteer?

cloak.business sluit 317 patroonherkenners in wat 70+ lande dek. Elke herkenner valideer die spesifieke formaat, kontrolesom, en struktuur van nasionale ID's, belastingnommers, gesondheidsidentifiseerders, en finansiële data vir daardie land.

Kan ek PII in verskeie tale binne dieselfde dokument opspoor?

Ja. cloak.business kan meertalige dokumente verwerk en PII oor verskillende tale in 'n enkele versoek opspoor. Die stelsel identifiseer outomaties watter taalpatrone toegepas moet word.

Hoe voeg ek ondersteuning vir 'n nuwe taal of entiteitstipe by?

U kan pasgemaakte entiteitherkenners skep met behulp van regex-patrone of ontkenningslyste. Dit stel u in staat om domeinspesifieke identifiseerders by te voeg of dekking uit te brei na bykomende formate wat nog nie in die ingeboude herkennerbiblioteek ingesluit is nie.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimiseer in Enige Taal

Begin met 200 gratis tokens. Werk met al 48 tale.