Comment Fonctionne la Détection
Correspondance de Modèles Regex (PII Structuré)
317 PatternRecognizers personnalisés avec des modèles regex détectent les données structurées comme les identifiants nationaux, les numéros fiscaux, les passeports et les permis de conduire. Chaque modèle utilise des assertions de limites pour éviter les correspondances fausses dans le code ou les données structurées.
Reconnaissance d'Entités Nommées NLP (Noms & Lieux)
spaCy (25 langues), Stanza NER (7 langues) et les transformateurs XLM-RoBERTa (16 langues) détectent les PII non structurés comme les noms de personnes, les lieux et les organisations qui ne peuvent pas être capturés uniquement par regex. Tous les modèles fonctionnent sur nos propres serveurs en Allemagne — aucune donnée n'est jamais envoyée à Meta, Google, Stanford ou tout tiers.
Évaluation de Confiance
Chaque détection inclut un score de confiance (0,0–1,0) pour les décisions humaines dans la boucle. Les formats très spécifiques (par exemple, IBAN allemand DE89 3704 0044 0532 0130 00) obtiennent un score de 0,85+, tandis que les schémas numériques génériques obtiennent un score de 0,3–0,5 et reposent sur des mots de contexte pour confirmation. Les équipes de conformité peuvent réviser et annuler les détections avant l'anonymisation.
Analyse des Mots de Contexte
Chaque reconnaisseur dispose de mots de contexte dans la langue pertinente (par exemple, 'Personalausweis' pour les identifiants allemands, 'kitambulisho' pour les identifiants kényans). Lorsque des mots de contexte apparaissent près d'une correspondance, le score de confiance est augmenté.
Types d'Entités Pris en Charge
Couverture complète des types d'informations personnelles par catégories
Identifiants Personnels
- Noms de Personnes
- Adresses Email
- Numéros de Téléphone
- Date de Naissance
- Âge
- Genre
- Nationalité
Informations Financières
- Numéros de Carte de Crédit
- IBAN
- BIC/SWIFT
- Numéros de Compte Bancaire
- Identifiants Fiscaux
- Numéros de TVA
Identifiants Gouvernementaux
- Numéros de Sécurité Sociale (SSN)
- Numéros d'Identité Nationale
- Numéros de Passeport
- Permis de Conduire
- Identifiants d'Assurance Maladie
Données de Localisation
- Adresses
- Villes
- Codes Postaux
- Pays
- Coordonnées GPS
Identifiants Numériques
- Adresses IP (v4/v6)
- Adresses MAC
- URLs
- Noms de Domaine
- Identifiants Utilisateur
Données Organisationnelles
- Noms d'Entreprises
- Identifiants d'Organisation
- Numéros d'Enregistrement
- Noms de Départements
Données Temporelles
- Dates
- Heures
- Plages de Dates
- Horodatages
Formats Internationaux
- ID Allemand (Personalausweis)
- Assurance Nationale du Royaume-Uni
- DNI/NIE Espagnol
- Codice Fiscale Italien
- Et plus de 70 formats spécifiques à d'autres pays
Support des Entités Personnalisées
Besoin de détecter des modèles personnalisés ? Créez vos propres types d'entités avec des modèles regex ou utilisez notre générateur de modèles assisté par IA.
Création de Modèles Manuels
Définissez des modèles regex pour les identifiants propriétaires comme les identifiants d'employés internes, les codes de projet ou les numéros de référence personnalisés.
Générateur de Modèles IA
Décrivez ce que vous souhaitez détecter en langage clair, et notre IA génère pour vous des modèles regex optimisés.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient