Détection de PII en 48 Langues

Détectez et anonymisez les PII en 48 langues avec un support de modèles natifs. Support RTL complet pour l'arabe, l'hébreu, le persan et l'ourdou.

48 Langues Supportées

Détection et anonymisation complètes de PII sur toute la plateforme

spaCy NLP - Fonctionne Localement (25 langues)

AnglaisAllemandEspagnolFrançaisItalienPortugaisNéerlandaisPolonaisRusseJaponaisChinoisCoréenRoumainGrecCroateSlovèneMacédonienSuédoisDanoisNorvégienFinnoisUkrainienLituanienCatalanTurc

Stanza NER - Fonctionne Localement (7 langues)

BulgareHongroisHébreu (RTL)VietnamienAfrikaansArménienBasque

XLM-RoBERTa Transformer - Fonctionne Localement (16 langues)

Arabe (RTL)HindiTchèqueSlovaqueIndonésienThaïPersan (RTL)SerbeLettonEstonienMalaisBengaliOurdou (RTL)SwahiliTagalogIslandais

Support RTL

ArabeHébreuPersanOurdou

Propulsé par un NLP Avancé

Trois moteurs NLP travaillant ensemble pour une couverture linguistique maximale

  • Modèles chargés paresseusement (max 5 en cache) pour l'efficacité mémoire
  • Détection automatique de la langue
  • Traitement de documents multilingues
  • Modèles d'entités spécifiques aux langues

Formats Spécifiques aux Pays

Nous détectons les PII dans des formats spécifiques à chaque pays et région.

Formats Européens

  • Allemand : Personalausweis, Steuer-ID, Reisepass
  • Français : NIR, Carte Nationale, Permis
  • Italien : Codice Fiscale, Carta d'Identità
  • Espagnol : DNI, NIE, NIF
  • Néerlandais : BSN, Rijbewijs
  • Polonais : PESEL, NIP, REGON

Formats Asie-Pacifique

  • Japon : My Number, Passeport
  • Inde : Aadhaar, PAN, GSTIN, Immatriculation de Véhicule
  • Thaïlande : ID National, ID Fiscal, Passeport
  • Indonésie : NIK, NPWP, Passeport
  • Vietnam : CCCD, Code Fiscal, Passeport
  • Malaisie : MyKad, ID Fiscal, Passeport

Amériques, Afrique & Moyen-Orient

  • États-Unis : SSN, Permis de Conduire, Passeport
  • Royaume-Uni : Assurance Nationale, Numéro NHS
  • Canada : SIN, Permis de Conduire
  • Australie : TFN, Medicare, ABN
  • Kenya : ID National, PIN KRA, Passeport
  • Afrique du Sud : Numéro d'ID, Numéro Fiscal, Passeport

Questions Fréquemment Posées

Quelles sont les 48 langues supportées par cloak.business ?

cloak.business supporte l'afrikaans, l'arabe, l'arménien, le basque, le bengali, le bulgare, le catalan, le chinois, le croate, le tchèque, le danois, le néerlandais, l'anglais, l'estonien, le finnois, le français, l'allemand, le grec, l'hébreu, l'hindi, le hongrois, l'islandais, l'indonésien, l'italien, le japonais, le coréen, le letton, le lituanien, le macédonien, le malais, le norvégien, le persan, le polonais, le portugais, le roumain, le russe, le serbe, le slovaque, le slovène, l'espagnol, le swahili, le suédois, le tagalog, le thaï, le turc, l'ukrainien, l'ourdou et le vietnamien — avec un support RTL complet pour l'arabe, l'hébreu, le persan et l'ourdou.

La détection de PII fonctionne-t-elle de la même manière dans toutes les langues ?

La détection utilise deux approches : la correspondance de modèles regex pour les données structurées (ID, numéros de téléphone, numéros fiscaux) et les modèles NLP pour les entités non structurées (noms, lieux). La détection basée sur les modèles couvre les 48 langues. La détection basée sur le NLP est disponible dans les langues avec des modèles entraînés.

Comment les formats d'identification spécifiques aux pays sont-ils gérés ?

cloak.business inclut 317 reconnaisseurs de modèles couvrant plus de 70 pays. Chaque reconnaisseur valide le format spécifique, le checksum et la structure des ID nationaux, des numéros fiscaux, des identifiants de santé et des données financières pour ce pays.

Puis-je détecter des PII dans plusieurs langues au sein d'un même document ?

Oui. cloak.business peut traiter des documents multilingues et détecter des PII dans différentes langues en une seule requête. Le système identifie automatiquement les modèles de langue à appliquer.

Comment puis-je ajouter le support pour une nouvelle langue ou un nouveau type d'entité ?

Vous pouvez créer des reconnaisseurs d'entités personnalisés en utilisant des modèles regex ou des listes de refus. Cela vous permet d'ajouter des identifiants spécifiques au domaine ou d'étendre la couverture à des formats supplémentaires non encore inclus dans la bibliothèque de reconnaisseurs intégrée.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymisez dans N'importe Quelle Langue

Commencez avec 200 jetons gratuits. Fonctionne avec les 48 langues.