Perché Regex-First?
Per la conformità normativa, servono risultati spiegabili e riproducibili. Il nostro approccio regex-first mantiene il rilevamento dei dati strutturati completamente deterministico, mentre la NLP gestisce nomi e località con punteggi di affidabilità trasparenti.
Confronto Dettagliato
| Regex-First (Noi) | Basato su AI/ML | |
|---|---|---|
| Riproducibilità | Dati strutturati: 100% identici. Nomi: con punteggio di affidabilità | Tutti i risultati variano tra le esecuzioni |
| Verificabilità | Ogni rilevamento è tracciabile a un pattern o modello NLP | Black box — decisioni non spiegabili |
| Dati di Addestramento | Regex: nessuno. NLP: modelli pre-addestrati inclusi | Richiede dataset di addestramento personalizzati |
| Drift del Modello | Regex: nessuno. NLP: modelli versionati e stabili | Si degrada in modo imprevedibile nel tempo |
| Prestazioni | Veloce, solo CPU | Variabile, dipendente da GPU |
| Costo Computazionale | Basso (solo CPU) | Alto (spesso necessaria GPU) |
| Conformità Normativa | Facile — pattern + punteggi di affidabilità sono verificabili con supervisione umana | Difficile da dimostrare alle autorità |
Come Funziona il Pattern Matching
Ogni tipo di entità ha pattern regex accuratamente progettati per riconoscere formati specifici.
Indirizzi Email
Riconosce il formato email standard: local-part@domain.tld
Numeri di Carte di Credito
Riconosce Visa, Mastercard, Amex e altri formati con validazione Luhn
IBAN Tedesco
Riconosce il formato IBAN tedesco con spazi opzionali
Progettato per la Conformità
Quando gli auditor chiedono "perché è stato rilevato questo?" serve una risposta chiara. I rilevamenti regex sono tracciabili a uno specifico pattern. I rilevamenti NLP includono nome modello e punteggio di affidabilità. La revisione umana garantisce che i team di conformità possano modificare i rilevamenti prima dell’anonimizzazione.
- GDPR Articolo 25: Privacy by design con elaborazione spiegabile
- ISO 27001: Processi documentati e ripetibili
- Audit Trail: Ogni rilevamento è tracciabile a uno specifico pattern
Esempio di Risposta a Audit
D: Perché "john.smith@company.com" è stato segnalato?
R: Pattern email rilevato tra le posizioni 45-68 con affidabilità 0,95. Pattern: validazione formato email standard.