Regex-First: De ce contează
Abordarea noastră: Regex + NLP
- 317 recunoașteri regex: 100% reproductibile pentru date structurate
- NLP pentru nume și locații cu scoruri de încredere
- Complet auditabil — fiecare detecție poate fi urmărită la un tipar sau model
- Transparent: știți mereu ce a fost identificat și de ce
- Performanță rapidă și predictibilă
- 48 de limbi prin 3 motoare NLP
Abordări doar AI
- Toate detecțiile sunt probabilistice
- Nu se poate explica de ce a fost semnalat ceva
- Necesită seturi mari de date pentru antrenare
- Auditarea pentru conformitate este dificilă
- Costuri de calcul mai mari (necesar GPU)
- Model drift scade acuratețea în timp
Procesul în 10 pași
De la input la output, iată exact ce se întâmplă cu documentul dvs.
Text de intrare
Trimiteți documentul prin interfața web, API sau Office Add-in
Detectarea limbii
Sistemul identifică limba documentului pentru procesare optimă
Tokenizare
Textul este împărțit în tokeni pentru potrivirea tiparelor
Potrivire tipare
317 recunoașteri regex și modele NLP scanează peste 320 de tipuri de entități în peste 70 de țări
Analiza contextului
Textul din jur îmbunătățește acuratețea detecției
Scor de încredere
Fiecare detecție primește un scor de încredere (0.0–1.0), permițând decizii de revizuire umană
Clasificarea entităților
Elementele detectate sunt categorisite după tip
Revizuire umană
Revizuiți toate detecțiile, corectați pozitivele false și aprobați înainte de anonimizare
Aplicare anonimizare
Alegeți metoda: Înlocuire, Redactare, Hash, Criptare sau Mascare
Document de ieșire
Descărcați documentul anonimizat
MCP Server: Integrare AI cu prioritate pentru confidențialitate
Cum circulă datele dvs. prin MCP Server pentru a menține siguranța instrumentelor AI
MCP Server acționează ca un scut de confidențialitate, interceptând cererile de la instrumentele AI, anonimizând PII, procesând datele sigure prin AI și, opțional, restaurând valorile originale.
Cerere instrument AI
Instrumentul AI (Cursor, Claude) trimite o cerere ce conține PII
Interceptare MCP Server
Serverul analizează și detectează toate entitățile PII
Anonimizare
PII este înlocuit cu tokeni sau redactat
Procesare AI
AI primește și procesează doar date anonimizate
Răspuns AI
Răspunsul AI revine prin MCP Server
De-tokenizare
Opțional: Valorile originale sunt restaurate pentru utilizator
Întrebări frecvente
cloak.business folosește AI pentru detecție?
Nu. Detecția folosește tipare regex deterministe și modele NLP (spaCy, Stanza). Acest lucru asigură rezultate 100% reproductibile — același input produce întotdeauna același output, spre deosebire de abordările AI probabilistice.
De ce tipare regex în loc de AI?
Tiparele regex sunt auditabile, reproductibile și conforme. Puteți inspecta exact ce identifică fiecare tipar. Detecția bazată pe AI este nedeterministă — rezultatele pot varia la fiecare rulare, ceea ce îngreunează documentarea pentru conformitate.
Cât de precisă este detecția?
Cu 317 recunoașteri personalizate, inclusiv validare de control (Luhn, IBAN, SSN), cloak.business atinge o acuratețe semnificativ mai mare decât modelele NER generice, în special pentru identificatori structurați precum carduri de credit, ID-uri fiscale și numere naționale de identificare.
Ce limbi sunt suportate?
Sunt suportate 48 de limbi cu modele NLP dedicate pentru recunoașterea entităților numite. Detectarea bazată pe tipare (regex) funcționează în toate limbile, deoarece identifică tipare de caractere indiferent de limbă.
Pot adăuga tipare de entități personalizate?
Da. API-ul suportă definiții de recunoașteri personalizate, astfel încât puteți adăuga tipare pentru identificatori proprietari, numere de referință interne sau formate de date specifice domeniului.