Come funziona cloak.business

Rilevamento PII regex-first: 317 riconoscitori di pattern deterministici per dati strutturati (ID, codici fiscali, carte di credito), oltre a spaCy, Stanza e XLM-RoBERTa NLP per nomi e località in 48 lingue.

Regex-First: Perché è Importante

Il Nostro Approccio: Regex + NLP

  • 317 riconoscitori regex: 100% riproducibili per dati strutturati
  • NLP per nomi e località con punteggi di affidabilità
  • Completamente verificabile — ogni rilevamento è tracciabile a un pattern o modello
  • Trasparente: sapete sempre cosa è stato rilevato e perché
  • Prestazioni rapide e prevedibili
  • 48 lingue su 3 motori NLP

Approcci Solo AI

  • Tutti i rilevamenti sono probabilistici
  • Impossibile spiegare perché qualcosa è stato segnalato
  • Richiede grandi dataset di addestramento
  • Difficile da verificare per la conformità
  • Costi computazionali più elevati (necessaria GPU)
  • Il drift del modello riduce l’accuratezza nel tempo

Il Processo in 10 Passi

Dall’input all’output, ecco cosa succede esattamente al Suo documento

1

Testo in Input

Invii il Suo documento tramite interfaccia web, API o componente aggiuntivo Office

2

Rilevamento Lingua

Il sistema identifica la lingua del documento per un’elaborazione ottimale

3

Tokenizzazione

Il testo viene suddiviso in token per il confronto con i pattern

4

Confronto con Pattern

317 riconoscitori regex e modelli NLP analizzano oltre 320 tipi di entità in più di 70 paesi

5

Analisi del Contesto

Il testo circostante migliora l’accuratezza del rilevamento

6

Punteggio di Affidabilità

Ogni rilevamento riceve un punteggio di affidabilità (0,0–1,0) che consente decisioni di revisione umana

7

Classificazione delle Entità

Gli elementi rilevati vengono categorizzati per tipo

8

Revisione Umana

Revisioni tutti i rilevamenti, corregga i falsi positivi e approvi prima dell’anonimizzazione

9

Applicazione Anonimizzazione

Scelga il metodo: Sostituisci, Oscura, Hash, Cifra o Maschera

10

Documento in Output

Scarichi il Suo documento anonimizzato

MCP Server: Integrazione AI Privacy-First

Come i Suoi dati passano attraverso MCP Server per mantenere sicuri gli strumenti AI

Il MCP Server agisce come uno scudo per la privacy, intercettando le richieste degli strumenti AI, anonimizzando i PII, elaborando i dati sicuri tramite AI e, opzionalmente, ripristinando i valori originali.

Richiesta Strumento AI

Il Suo strumento AI (Cursor, Claude) invia una richiesta contenente PII

Intercettazione MCP Server

Il server analizza e rileva tutte le entità PII

Anonimizzazione

I PII vengono sostituiti con token o oscurati

Elaborazione AI

L’AI riceve ed elabora solo dati anonimizzati

Restituzione Risposta

La risposta AI ritorna tramite MCP Server

De-tokenizzazione

Opzionale: i valori originali vengono ripristinati per l’utente

Domande Frequenti

cloak.business utilizza AI per il rilevamento?

No. Il rilevamento utilizza pattern regex deterministici e modelli NLP (spaCy, Stanza). Questo garantisce risultati 100% riproducibili — lo stesso input produce sempre lo stesso output, a differenza degli approcci AI probabilistici.

Perché pattern regex invece dell’AI?

I pattern regex sono verificabili, riproducibili e conformi. Può ispezionare esattamente cosa rileva ogni pattern. Il rilevamento basato su AI è non deterministico — i risultati possono variare tra le esecuzioni, rendendo difficile la documentazione per la conformità.

Quanto è accurato il rilevamento?

Con 317 riconoscitori personalizzati, inclusa la validazione dei checksum (Luhn, IBAN, SSN), cloak.business raggiunge un’accuratezza significativamente superiore rispetto ai modelli NER generici, soprattutto per identificativi strutturati come carte di credito, codici fiscali e numeri di identità nazionali.

Quali lingue sono supportate?

Sono supportate 48 lingue con modelli NLP dedicati per il riconoscimento di entità denominate. Il rilevamento basato su pattern (regex) funziona su tutte le lingue poiché confronta pattern di caratteri indipendentemente dalla lingua.

Posso aggiungere pattern di entità personalizzati?

Sì. L’API supporta la definizione di riconoscitori personalizzati, così può aggiungere pattern per identificativi proprietari, numeri di riferimento interni o formati dati specifici del Suo settore.

Veda il Funzionamento

Provi gratuitamente il nostro rilevamento e anonimizzazione PII con 200 token per ciclo.