cloak.business

Cum funcționează cloak.business

Detectare PII bazată pe regex: 317 recunoașteri deterministe pentru date structurate (ID-uri, numere fiscale, carduri de credit), plus spaCy, Stanza și XLM-RoBERTa NLP pentru nume și locații în 48 de limbi.

Regex-First: De ce contează

Abordarea noastră: Regex + NLP

  • 317 recunoașteri regex: 100% reproductibile pentru date structurate
  • NLP pentru nume și locații cu scoruri de încredere
  • Complet auditabil — fiecare detecție poate fi urmărită la un tipar sau model
  • Transparent: știți mereu ce a fost identificat și de ce
  • Performanță rapidă și predictibilă
  • 48 de limbi prin 3 motoare NLP

Abordări doar AI

  • Toate detecțiile sunt probabilistice
  • Nu se poate explica de ce a fost semnalat ceva
  • Necesită seturi mari de date pentru antrenare
  • Auditarea pentru conformitate este dificilă
  • Costuri de calcul mai mari (necesar GPU)
  • Model drift scade acuratețea în timp

Procesul în 10 pași

De la input la output, iată exact ce se întâmplă cu documentul dvs.

1

Text de intrare

Trimiteți documentul prin interfața web, API sau Office Add-in

2

Detectarea limbii

Sistemul identifică limba documentului pentru procesare optimă

3

Tokenizare

Textul este împărțit în tokeni pentru potrivirea tiparelor

4

Potrivire tipare

317 recunoașteri regex și modele NLP scanează peste 320 de tipuri de entități în peste 70 de țări

5

Analiza contextului

Textul din jur îmbunătățește acuratețea detecției

6

Scor de încredere

Fiecare detecție primește un scor de încredere (0.0–1.0), permițând decizii de revizuire umană

7

Clasificarea entităților

Elementele detectate sunt categorisite după tip

8

Revizuire umană

Revizuiți toate detecțiile, corectați pozitivele false și aprobați înainte de anonimizare

9

Aplicare anonimizare

Alegeți metoda: Înlocuire, Redactare, Hash, Criptare sau Mascare

10

Document de ieșire

Descărcați documentul anonimizat

MCP Server: Integrare AI cu prioritate pentru confidențialitate

Cum circulă datele dvs. prin MCP Server pentru a menține siguranța instrumentelor AI

MCP Server acționează ca un scut de confidențialitate, interceptând cererile de la instrumentele AI, anonimizând PII, procesând datele sigure prin AI și, opțional, restaurând valorile originale.

Cerere instrument AI

Instrumentul AI (Cursor, Claude) trimite o cerere ce conține PII

Interceptare MCP Server

Serverul analizează și detectează toate entitățile PII

Anonimizare

PII este înlocuit cu tokeni sau redactat

Procesare AI

AI primește și procesează doar date anonimizate

Răspuns AI

Răspunsul AI revine prin MCP Server

De-tokenizare

Opțional: Valorile originale sunt restaurate pentru utilizator

Întrebări frecvente

cloak.business folosește AI pentru detecție?

Nu. Detecția folosește tipare regex deterministe și modele NLP (spaCy, Stanza). Acest lucru asigură rezultate 100% reproductibile — același input produce întotdeauna același output, spre deosebire de abordările AI probabilistice.

De ce tipare regex în loc de AI?

Tiparele regex sunt auditabile, reproductibile și conforme. Puteți inspecta exact ce identifică fiecare tipar. Detecția bazată pe AI este nedeterministă — rezultatele pot varia la fiecare rulare, ceea ce îngreunează documentarea pentru conformitate.

Cât de precisă este detecția?

Cu 317 recunoașteri personalizate, inclusiv validare de control (Luhn, IBAN, SSN), cloak.business atinge o acuratețe semnificativ mai mare decât modelele NER generice, în special pentru identificatori structurați precum carduri de credit, ID-uri fiscale și numere naționale de identificare.

Ce limbi sunt suportate?

Sunt suportate 48 de limbi cu modele NLP dedicate pentru recunoașterea entităților numite. Detectarea bazată pe tipare (regex) funcționează în toate limbile, deoarece identifică tipare de caractere indiferent de limbă.

Pot adăuga tipare de entități personalizate?

Da. API-ul suportă definiții de recunoașteri personalizate, astfel încât puteți adăuga tipare pentru identificatori proprietari, numere de referință interne sau formate de date specifice domeniului.

Vedeți în acțiune

Încercați gratuit detectarea și anonimizarea PII cu 200 de tokeni per ciclu.