Come Funziona il Rilevamento
Corrispondenza di Pattern Regex (PII Strutturato)
317 PatternRecognizers personalizzati con pattern regex rilevano dati strutturati come ID nazionali, numeri fiscali, passaporti e patenti di guida. Ogni pattern utilizza asserzioni di confine per prevenire corrispondenze errate in codice o dati strutturati.
Riconoscimento di Entità Nominate NLP (Nomi e Luoghi)
spaCy (25 lingue), Stanza NER (7 lingue) e trasformatori XLM-RoBERTa (16 lingue) rilevano PII non strutturati come nomi di persone, luoghi e organizzazioni che non possono essere catturati solo da regex. Tutti i modelli funzionano sui nostri server in Germania — nessun dato viene mai inviato a Meta, Google, Stanford o terze parti.
Valutazione della Fiducia
Ogni rilevamento include un punteggio di fiducia (0.0–1.0) per decisioni umane nel loop. Formati altamente specifici (ad esempio, IBAN tedesco DE89 3704 0044 0532 0130 00) ottengono un punteggio di 0.85+, mentre i pattern di cifre generici ottengono un punteggio di 0.3–0.5 e si basano su parole di contesto per la conferma. I team di conformità possono rivedere e sovrascrivere i rilevamenti prima dell'anonimizzazione.
Analisi delle Parole di Contesto
Ogni riconoscitore ha parole di contesto nella lingua pertinente (ad esempio, 'Personalausweis' per gli ID tedeschi, 'kitambulisho' per gli ID kenioti). Quando le parole di contesto appaiono vicino a una corrispondenza, il punteggio di fiducia viene aumentato.
Tipi di Entità Supportati
Copertura completa dei tipi di informazioni personali attraverso le categorie
Identificatori Personali
- Nomi di Persona
- Indirizzi Email
- Numeri di Telefono
- Data di Nascita
- Età
- Genere
- Nazionalità
Informazioni Finanziarie
- Numeri di Carte di Credito
- IBAN
- BIC/SWIFT
- Numeri di Conto Bancario
- ID Fiscali
- Numeri di Partita IVA
ID Governativi
- Numeri di Sicurezza Sociale (SSN)
- Numeri di ID Nazionale
- Numeri di Passaporto
- Patenti di Guida
- ID Assicurazione Sanitaria
Dati di Localizzazione
- Indirizzi Stradali
- Città
- Codici Postali
- Paesi
- Coordinate GPS
Identificatori Digitali
- Indirizzi IP (v4/v6)
- Indirizzi MAC
- URL
- Nomi di Dominio
- ID Utente
Dati dell'Organizzazione
- Nomi di Aziende
- ID Organizzazione
- Numeri di Registrazione
- Nomi di Dipartimenti
Dati Temporali
- Date
- Orari
- Intervalli di Date
- Timestamp
Formati Internazionali
- ID Tedesco (Personalausweis)
- Assicurazione Nazionale del Regno Unito
- DNI/NIE Spagnolo
- Codice Fiscale Italiano
- E oltre 70 formati specifici per paese
Supporto per Entità Personalizzate
Hai bisogno di rilevare pattern personalizzati? Crea i tuoi tipi di entità con pattern regex o utilizza il nostro generatore di pattern assistito dall'AI.
Creazione Manuale di Pattern
Definisci pattern regex per identificatori proprietari come ID dipendenti interni, codici progetto o numeri di riferimento personalizzati.
Generatore di Pattern AI
Descrivi cosa vuoi rilevare in linguaggio semplice, e la nostra AI genera per te pattern regex ottimizzati.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient