48 Langues Supportées
Détection et anonymisation complètes de PII sur toute la plateforme
spaCy NLP - Fonctionne Localement (25 langues)
Stanza NER - Fonctionne Localement (7 langues)
XLM-RoBERTa Transformer - Fonctionne Localement (16 langues)
Support RTL
Propulsé par un NLP Avancé
Trois moteurs NLP travaillant ensemble pour une couverture linguistique maximale
- Modèles chargés paresseusement (max 5 en cache) pour l'efficacité mémoire
- Détection automatique de la langue
- Traitement de documents multilingues
- Modèles d'entités spécifiques aux langues
Formats Spécifiques aux Pays
Nous détectons les PII dans des formats spécifiques à chaque pays et région.
Formats Européens
- Allemand : Personalausweis, Steuer-ID, Reisepass
- Français : NIR, Carte Nationale, Permis
- Italien : Codice Fiscale, Carta d'Identità
- Espagnol : DNI, NIE, NIF
- Néerlandais : BSN, Rijbewijs
- Polonais : PESEL, NIP, REGON
Formats Asie-Pacifique
- Japon : My Number, Passeport
- Inde : Aadhaar, PAN, GSTIN, Immatriculation de Véhicule
- Thaïlande : ID National, ID Fiscal, Passeport
- Indonésie : NIK, NPWP, Passeport
- Vietnam : CCCD, Code Fiscal, Passeport
- Malaisie : MyKad, ID Fiscal, Passeport
Amériques, Afrique & Moyen-Orient
- États-Unis : SSN, Permis de Conduire, Passeport
- Royaume-Uni : Assurance Nationale, Numéro NHS
- Canada : SIN, Permis de Conduire
- Australie : TFN, Medicare, ABN
- Kenya : ID National, PIN KRA, Passeport
- Afrique du Sud : Numéro d'ID, Numéro Fiscal, Passeport
Questions Fréquemment Posées
Quelles sont les 48 langues supportées par cloak.business ?
cloak.business supporte l'afrikaans, l'arabe, l'arménien, le basque, le bengali, le bulgare, le catalan, le chinois, le croate, le tchèque, le danois, le néerlandais, l'anglais, l'estonien, le finnois, le français, l'allemand, le grec, l'hébreu, l'hindi, le hongrois, l'islandais, l'indonésien, l'italien, le japonais, le coréen, le letton, le lituanien, le macédonien, le malais, le norvégien, le persan, le polonais, le portugais, le roumain, le russe, le serbe, le slovaque, le slovène, l'espagnol, le swahili, le suédois, le tagalog, le thaï, le turc, l'ukrainien, l'ourdou et le vietnamien — avec un support RTL complet pour l'arabe, l'hébreu, le persan et l'ourdou.
La détection de PII fonctionne-t-elle de la même manière dans toutes les langues ?
La détection utilise deux approches : la correspondance de modèles regex pour les données structurées (ID, numéros de téléphone, numéros fiscaux) et les modèles NLP pour les entités non structurées (noms, lieux). La détection basée sur les modèles couvre les 48 langues. La détection basée sur le NLP est disponible dans les langues avec des modèles entraînés.
Comment les formats d'identification spécifiques aux pays sont-ils gérés ?
cloak.business inclut 317 reconnaisseurs de modèles couvrant plus de 70 pays. Chaque reconnaisseur valide le format spécifique, le checksum et la structure des ID nationaux, des numéros fiscaux, des identifiants de santé et des données financières pour ce pays.
Puis-je détecter des PII dans plusieurs langues au sein d'un même document ?
Oui. cloak.business peut traiter des documents multilingues et détecter des PII dans différentes langues en une seule requête. Le système identifie automatiquement les modèles de langue à appliquer.
Comment puis-je ajouter le support pour une nouvelle langue ou un nouveau type d'entité ?
Vous pouvez créer des reconnaisseurs d'entités personnalisés en utilisant des modèles regex ou des listes de refus. Cela vous permet d'ajouter des identifiants spécifiques au domaine ou d'étendre la couverture à des formats supplémentaires non encore inclus dans la bibliothèque de reconnaisseurs intégrée.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only