Rilevamento di PII in 48 Lingue

Rileva e anonimizza PII in 48 lingue con supporto per modelli nativi. Supporto completo RTL per arabo, ebraico, persiano e urdu.

48 Lingue Supportate

Rilevamento e anonimizzazione completi di PII su tutta la piattaforma

spaCy NLP - Esegue Localmente (25 lingue)

IngleseTedescoSpagnoloFranceseItalianoPortogheseOlandesePolaccoRussoGiapponeseCineseCoreanoRumenoGrecoCroatoSlovenoMacedoneSvedeseDaneseNorvegeseFinlandeseUcrainoLituanoCatalanoTurco

Stanza NER - Esegue Localmente (7 lingue)

BulgaroUnghereseEbraico (RTL)VietnamitaAfrikaansArmenoBasco

XLM-RoBERTa Transformer - Esegue Localmente (16 lingue)

Arabo (RTL)HindiCecoSlovaccoIndonesianoTailandesePersiano (RTL)SerboLettoneEstoneMaleseBengaleseUrdu (RTL)SwahiliTagalogIslandese

Supporto RTL

AraboEbraicoPersianoUrdu

Alimentato da NLP Avanzato

Tre motori NLP che lavorano insieme per la massima copertura linguistica

  • Modelli caricati pigramente (massimo 5 in cache) per efficienza di memoria
  • Rilevamento automatico della lingua
  • Elaborazione di documenti in lingue miste
  • Modelli di entità specifici per lingua

Formati Specifici per Paese

Rileviamo PII in formati specifici per ogni paese e regione.

Formati Europei

  • Tedesco: Personalausweis, Steuer-ID, Reisepass
  • Francese: NIR, Carte Nationale, Permis
  • Italiano: Codice Fiscale, Carta d'Identità
  • Spagnolo: DNI, NIE, NIF
  • Olandese: BSN, Rijbewijs
  • Polacco: PESEL, NIP, REGON

Formati Asia-Pacifico

  • Giappone: My Number, Passaporto
  • India: Aadhaar, PAN, GSTIN, Registrazione Veicoli
  • Thailandia: ID Nazionale, Codice Fiscale, Passaporto
  • Indonesia: NIK, NPWP, Passaporto
  • Vietnam: CCCD, Codice Fiscale, Passaporto
  • Malesia: MyKad, Codice Fiscale, Passaporto

Americhe, Africa e Medio Oriente

  • USA: SSN, Patente di Guida, Passaporto
  • Regno Unito: Assicurazione Nazionale, Numero NHS
  • Canada: SIN, Patente di Guida
  • Australia: TFN, Medicare, ABN
  • Kenya: ID Nazionale, KRA PIN, Passaporto
  • Sud Africa: Numero ID, Numero Fiscale, Passaporto

Domande Frequenti

Quali 48 lingue supporta cloak.business?

cloak.business supporta Afrikaans, Arabo, Armeno, Basco, Bengalese, Bulgaro, Catalano, Cinese, Croato, Ceco, Danese, Olandese, Inglese, Estone, Finlandese, Francese, Tedesco, Greco, Ebraico, Hindi, Ungherese, Islandese, Indonesiano, Italiano, Giapponese, Coreano, Lettone, Lituano, Macedone, Malese, Norvegese, Persiano, Polacco, Portoghese, Rumeno, Russo, Serbo, Slovacco, Sloveno, Spagnolo, Swahili, Svedese, Tagalog, Tailandese, Turco, Ucraino, Urdu e Vietnamita — con supporto completo RTL per Arabo, Ebraico, Persiano e Urdu.

Il rilevamento di PII funziona allo stesso modo in tutte le lingue?

Il rilevamento utilizza due approcci: il pattern matching basato su regex per dati strutturati (ID, numeri di telefono, numeri fiscali) e modelli NLP per entità non strutturate (nomi, località). Il rilevamento basato su pattern copre tutte le 48 lingue. Il rilevamento basato su NLP è disponibile nelle lingue con modelli addestrati.

Come vengono gestiti i formati di ID specifici per paese?

cloak.business include 317 riconoscitori di pattern che coprono oltre 70 paesi. Ogni riconoscitore convalida il formato specifico, il checksum e la struttura degli ID nazionali, dei numeri fiscali, degli identificatori sanitari e dei dati finanziari per quel paese.

Posso rilevare PII in più lingue all'interno dello stesso documento?

Sì. cloak.business può elaborare documenti multilingue e rilevare PII in diverse lingue in una singola richiesta. Il sistema identifica automaticamente quali modelli linguistici applicare.

Come posso aggiungere supporto per una nuova lingua o tipo di entità?

È possibile creare riconoscitori di entità personalizzati utilizzando pattern regex o liste di negazione. Questo consente di aggiungere identificatori specifici del dominio o estendere la copertura a formati aggiuntivi non ancora inclusi nella libreria di riconoscitori integrata.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizza in Qualsiasi Lingua

Inizia con 200 token gratuiti. Funziona con tutte le 48 lingue.