Com funciona cloak.business

Detecció de PII basada en regex: 317 reconeixedors de patrons deterministes per a dades estructurades (ID, números fiscals, targetes de crèdit), més spaCy, Stanza i XLM-RoBERTa NLP per a noms i localitzacions en 48 idiomes.

Regex primer: Per què és important

El nostre enfocament: Regex + NLP

  • 317 reconeixedors regex: 100% reproduïbles per a dades estructurades
  • NLP per a noms i localitzacions amb puntuacions de confiança
  • Totalment auditable — cada detecció és traçable a un patró o model
  • Transparent: sempre sap què ha coincidit i per què
  • Rendiment ràpid i previsible
  • 48 idiomes en 3 motors NLP

Enfocaments només amb IA

  • Totes les deteccions són probabilístiques
  • No es pot explicar per què s'ha marcat alguna cosa
  • Requereix grans conjunts de dades d'entrenament
  • Difícil d'auditar per al compliment normatiu
  • Cost computacional més alt (cal GPU)
  • El model perd precisió amb el temps (model drift)

El procés en 10 passos

Des de l'entrada fins a la sortida, així és exactament què passa amb el seu document

1

Text d'entrada

Enviï el seu document a través de la interfície web, API o complement d'Office

2

Detecció de l'idioma

El sistema identifica l'idioma del document per a un processament òptim

3

Tokenització

El text es divideix en tokens per a la cerca de patrons

4

Cerca de patrons

317 reconeixedors regex i models NLP escanegen més de 320 tipus d'entitats en més de 70 països

5

Anàlisi de context

El text circumdant millora la precisió de la detecció

6

Puntuació de confiança

Cada detecció rep una puntuació de confiança (0.0–1.0) que permet decisions de revisió humana

7

Classificació d'entitats

Els elements detectats es classifiquen per tipus

8

Revisió humana

Revisi totes les deteccions, anul·li falsos positius i aprovi abans de l'anonimització

9

Aplicar anonimització

Triï el seu mètode: Substituir, Redactar, Hash, Xifrar o Emmascarar

10

Document de sortida

Descarregui el seu document anonimitzat

Servidor MCP: Integració d'IA amb privacitat per davant

Com flueixen les seves dades pel servidor MCP per mantenir les eines d'IA segures

El servidor MCP actua com a escut de privacitat, interceptant les sol·licituds de les eines d'IA, anonimitzant la PII, processant dades segures a través de la IA i, opcionalment, restaurant els valors originals.

Sol·licitud de l'eina d'IA

La seva eina d'IA (Cursor, Claude) envia una sol·licitud que conté PII

El servidor MCP intercepta

El servidor analitza i detecta totes les entitats PII

Anonimització

La PII es reemplaça per tokens o es redacta

Processament per IA

La IA només rep i processa dades anonimitzades

Retorn de la resposta

La resposta de la IA torna a través del servidor MCP

Des-tokenització

Opcional: Es restauren els valors originals per a l'usuari

Preguntes freqüents

cloak.business utilitza IA per a la detecció?

No. La detecció utilitza patrons regex deterministes i models NLP (spaCy, Stanza). Això garanteix resultats 100% reproduïbles — la mateixa entrada sempre produeix la mateixa sortida, a diferència dels enfocaments probabilístics amb IA.

Per què patrons regex en comptes d'IA?

Els patrons regex són auditables, reproduïbles i conformes. Pot inspeccionar exactament què coincideix cada patró. La detecció basada en IA és no determinista — els resultats poden variar entre execucions, fent difícil la documentació de compliment.

Quina precisió té la detecció?

Amb 317 reconeixedors de patrons personalitzats incloent validació de suma de control (Luhn, IBAN, SSN), cloak.business aconsegueix una precisió molt superior als models NER genèrics, especialment per a identificadors estructurats com targetes de crèdit, ID fiscals i números d'identitat nacional.

Quins idiomes es suporten?

Es suporten 48 idiomes amb models NLP dedicats per al reconeixement d'entitats anomenades. La detecció basada en patrons (regex) funciona en tots els idiomes ja que coincideix amb patrons de caràcters independentment de l'idioma.

Puc afegir patrons d'entitat personalitzats?

Sí. L'API permet definir reconeixedors personalitzats perquè pugui afegir patrons per a identificadors propietaris, números de referència interns o formats de dades específics del seu sector.

Vegui-ho en acció

Provi la nostra detecció i anonimització de PII gratuïtament amb 200 tokens per cicle.