Regex-First: Perché è Importante
Il Nostro Approccio: Regex + NLP
- 317 riconoscitori regex: 100% riproducibili per dati strutturati
- NLP per nomi e località con punteggi di affidabilità
- Completamente verificabile — ogni rilevamento è tracciabile a un pattern o modello
- Trasparente: sapete sempre cosa è stato rilevato e perché
- Prestazioni rapide e prevedibili
- 48 lingue su 3 motori NLP
Approcci Solo AI
- Tutti i rilevamenti sono probabilistici
- Impossibile spiegare perché qualcosa è stato segnalato
- Richiede grandi dataset di addestramento
- Difficile da verificare per la conformità
- Costi computazionali più elevati (necessaria GPU)
- Il drift del modello riduce l’accuratezza nel tempo
Il Processo in 10 Passi
Dall’input all’output, ecco cosa succede esattamente al Suo documento
Testo in Input
Invii il Suo documento tramite interfaccia web, API o componente aggiuntivo Office
Rilevamento Lingua
Il sistema identifica la lingua del documento per un’elaborazione ottimale
Tokenizzazione
Il testo viene suddiviso in token per il confronto con i pattern
Confronto con Pattern
317 riconoscitori regex e modelli NLP analizzano oltre 320 tipi di entità in più di 70 paesi
Analisi del Contesto
Il testo circostante migliora l’accuratezza del rilevamento
Punteggio di Affidabilità
Ogni rilevamento riceve un punteggio di affidabilità (0,0–1,0) che consente decisioni di revisione umana
Classificazione delle Entità
Gli elementi rilevati vengono categorizzati per tipo
Revisione Umana
Revisioni tutti i rilevamenti, corregga i falsi positivi e approvi prima dell’anonimizzazione
Applicazione Anonimizzazione
Scelga il metodo: Sostituisci, Oscura, Hash, Cifra o Maschera
Documento in Output
Scarichi il Suo documento anonimizzato
MCP Server: Integrazione AI Privacy-First
Come i Suoi dati passano attraverso MCP Server per mantenere sicuri gli strumenti AI
Il MCP Server agisce come uno scudo per la privacy, intercettando le richieste degli strumenti AI, anonimizzando i PII, elaborando i dati sicuri tramite AI e, opzionalmente, ripristinando i valori originali.
Richiesta Strumento AI
Il Suo strumento AI (Cursor, Claude) invia una richiesta contenente PII
Intercettazione MCP Server
Il server analizza e rileva tutte le entità PII
Anonimizzazione
I PII vengono sostituiti con token o oscurati
Elaborazione AI
L’AI riceve ed elabora solo dati anonimizzati
Restituzione Risposta
La risposta AI ritorna tramite MCP Server
De-tokenizzazione
Opzionale: i valori originali vengono ripristinati per l’utente
Domande Frequenti
cloak.business utilizza AI per il rilevamento?
No. Il rilevamento utilizza pattern regex deterministici e modelli NLP (spaCy, Stanza). Questo garantisce risultati 100% riproducibili — lo stesso input produce sempre lo stesso output, a differenza degli approcci AI probabilistici.
Perché pattern regex invece dell’AI?
I pattern regex sono verificabili, riproducibili e conformi. Può ispezionare esattamente cosa rileva ogni pattern. Il rilevamento basato su AI è non deterministico — i risultati possono variare tra le esecuzioni, rendendo difficile la documentazione per la conformità.
Quanto è accurato il rilevamento?
Con 317 riconoscitori personalizzati, inclusa la validazione dei checksum (Luhn, IBAN, SSN), cloak.business raggiunge un’accuratezza significativamente superiore rispetto ai modelli NER generici, soprattutto per identificativi strutturati come carte di credito, codici fiscali e numeri di identità nazionali.
Quali lingue sono supportate?
Sono supportate 48 lingue con modelli NLP dedicati per il riconoscimento di entità denominate. Il rilevamento basato su pattern (regex) funziona su tutte le lingue poiché confronta pattern di caratteri indipendentemente dalla lingua.
Posso aggiungere pattern di entità personalizzati?
Sì. L’API supporta la definizione di riconoscitori personalizzati, così può aggiungere pattern per identificativi proprietari, numeri di riferimento interni o formati dati specifici del Suo settore.