Detecció de PII en 48 Idiomes

Detecta i anonimitza PII en 48 idiomes amb suport de patrons natius. Suport complet RTL per a àrab, hebreu, persa i urdú.

48 Idiomes Suportats

Detecció i anonimització completa de PII a tota la plataforma

spaCy NLP - S'executa Localment (25 idiomes)

AnglèsAlemanyEspanyolFrancèsItaliàPortuguèsNeerlandèsPolonèsRusJaponèsXinèsCoreàRomanèsGrecCroatEslovèMacedoniSuecDanèsNoruecFinèsUcraïnèsLituàCatalàTurc

Stanza NER - S'executa Localment (7 idiomes)

BúlgarHongarèsHebreu (RTL)VietnamitaAfrikaansArmeniBasc

XLM-RoBERTa Transformer - S'executa Localment (16 idiomes)

Àrab (RTL)HindiTxecEslovacIndonesiTailandèsPersa (RTL)SerbiLetóEstoniàMalaiBengalíUrdú (RTL)SwahiliTagalogIslandès

Suport RTL

ÀrabHebreuPersaUrdú

Impulsat per NLP Avançat

Tres motors NLP treballant junts per a una cobertura màxima d'idiomes

  • Models carregats de manera mandrosa (màxim 5 emmagatzemats) per a eficiència de memòria
  • Detecció automàtica d'idioma
  • Processament de documents multilingües
  • Patrons d'entitats específics per idioma

Formats Específics per País

Detectem PII en formats específics per a cada país i regió.

Formats Europeus

  • Alemany: Personalausweis, Steuer-ID, Reisepass
  • Francès: NIR, Carte Nationale, Permis
  • Italià: Codice Fiscale, Carta d'Identità
  • Espanyol: DNI, NIE, NIF
  • Neerlandès: BSN, Rijbewijs
  • Polonès: PESEL, NIP, REGON

Formats Àsia-Pacífic

  • Japó: My Number, Passaport
  • Índia: Aadhaar, PAN, GSTIN, Registre de Vehicles
  • Tailàndia: ID Nacional, ID Fiscal, Passaport
  • Indonèsia: NIK, NPWP, Passaport
  • Vietnam: CCCD, Codi Fiscal, Passaport
  • Malàisia: MyKad, ID Fiscal, Passaport

Amèriques, Àfrica i Orient Mitjà

  • EUA: SSN, Llicència de Conduir, Passaport
  • Regne Unit: Assegurança Nacional, Número NHS
  • Canadà: SIN, Llicència de Conduir
  • Austràlia: TFN, Medicare, ABN
  • Kenya: ID Nacional, KRA PIN, Passaport
  • Sud-àfrica: Número d'ID, Número Fiscal, Passaport

Preguntes Freqüents

Quins 48 idiomes suporta cloak.business?

cloak.business suporta Afrikaans, Àrab, Armeni, Basc, Bengalí, Búlgar, Català, Xinès, Croat, Txec, Danès, Neerlandès, Anglès, Estonià, Finès, Francès, Alemany, Grec, Hebreu, Hindi, Hongarès, Islandès, Indonesi, Italià, Japonès, Coreà, Letó, Lituà, Macedoni, Malai, Noruec, Persa, Polonès, Portuguès, Romanès, Rus, Serbi, Eslovac, Eslovè, Espanyol, Swahili, Suec, Tagalog, Tailandès, Turc, Ucraïnès, Urdú i Vietnamita — amb suport complet RTL per a àrab, hebreu, persa i urdú.

La detecció de PII funciona igual en tots els idiomes?

La detecció utilitza dos enfocaments: coincidència de patrons basada en regex per a dades estructurades (IDs, números de telèfon, números fiscals) i models NLP per a entitats no estructurades (noms, ubicacions). La detecció basada en patrons cobreix tots els 48 idiomes. La detecció basada en NLP està disponible en idiomes amb models entrenats.

Com es gestionen els formats d'ID específics per país?

cloak.business inclou 317 reconeixedors de patrons que cobreixen més de 70 països. Cada reconeixedor valida el format específic, el checksum i l'estructura dels IDs nacionals, números fiscals, identificadors de salut i dades financeres per a aquell país.

Puc detectar PII en múltiples idiomes dins del mateix document?

Sí. cloak.business pot processar documents multilingües i detectar PII en diferents idiomes en una sola sol·licitud. El sistema identifica automàticament quins patrons d'idioma aplicar.

Com puc afegir suport per a un nou idioma o tipus d'entitat?

Podeu crear reconeixedors d'entitats personalitzats utilitzant patrons regex o llistes de denegació. Això us permet afegir identificadors específics de domini o ampliar la cobertura a formats addicionals que encara no estan inclosos a la biblioteca de reconeixedors integrada.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimitza en Qualsevol Idioma

Comença amb 200 tokens gratuïts. Funciona amb tots els 48 idiomes.