Regex primer: Per què és important
El nostre enfocament: Regex + NLP
- 317 reconeixedors regex: 100% reproduïbles per a dades estructurades
- NLP per a noms i localitzacions amb puntuacions de confiança
- Totalment auditable — cada detecció és traçable a un patró o model
- Transparent: sempre sap què ha coincidit i per què
- Rendiment ràpid i previsible
- 48 idiomes en 3 motors NLP
Enfocaments només amb IA
- Totes les deteccions són probabilístiques
- No es pot explicar per què s'ha marcat alguna cosa
- Requereix grans conjunts de dades d'entrenament
- Difícil d'auditar per al compliment normatiu
- Cost computacional més alt (cal GPU)
- El model perd precisió amb el temps (model drift)
El procés en 10 passos
Des de l'entrada fins a la sortida, així és exactament què passa amb el seu document
Text d'entrada
Enviï el seu document a través de la interfície web, API o complement d'Office
Detecció de l'idioma
El sistema identifica l'idioma del document per a un processament òptim
Tokenització
El text es divideix en tokens per a la cerca de patrons
Cerca de patrons
317 reconeixedors regex i models NLP escanegen més de 320 tipus d'entitats en més de 70 països
Anàlisi de context
El text circumdant millora la precisió de la detecció
Puntuació de confiança
Cada detecció rep una puntuació de confiança (0.0–1.0) que permet decisions de revisió humana
Classificació d'entitats
Els elements detectats es classifiquen per tipus
Revisió humana
Revisi totes les deteccions, anul·li falsos positius i aprovi abans de l'anonimització
Aplicar anonimització
Triï el seu mètode: Substituir, Redactar, Hash, Xifrar o Emmascarar
Document de sortida
Descarregui el seu document anonimitzat
Servidor MCP: Integració d'IA amb privacitat per davant
Com flueixen les seves dades pel servidor MCP per mantenir les eines d'IA segures
El servidor MCP actua com a escut de privacitat, interceptant les sol·licituds de les eines d'IA, anonimitzant la PII, processant dades segures a través de la IA i, opcionalment, restaurant els valors originals.
Sol·licitud de l'eina d'IA
La seva eina d'IA (Cursor, Claude) envia una sol·licitud que conté PII
El servidor MCP intercepta
El servidor analitza i detecta totes les entitats PII
Anonimització
La PII es reemplaça per tokens o es redacta
Processament per IA
La IA només rep i processa dades anonimitzades
Retorn de la resposta
La resposta de la IA torna a través del servidor MCP
Des-tokenització
Opcional: Es restauren els valors originals per a l'usuari
Preguntes freqüents
cloak.business utilitza IA per a la detecció?
No. La detecció utilitza patrons regex deterministes i models NLP (spaCy, Stanza). Això garanteix resultats 100% reproduïbles — la mateixa entrada sempre produeix la mateixa sortida, a diferència dels enfocaments probabilístics amb IA.
Per què patrons regex en comptes d'IA?
Els patrons regex són auditables, reproduïbles i conformes. Pot inspeccionar exactament què coincideix cada patró. La detecció basada en IA és no determinista — els resultats poden variar entre execucions, fent difícil la documentació de compliment.
Quina precisió té la detecció?
Amb 317 reconeixedors de patrons personalitzats incloent validació de suma de control (Luhn, IBAN, SSN), cloak.business aconsegueix una precisió molt superior als models NER genèrics, especialment per a identificadors estructurats com targetes de crèdit, ID fiscals i números d'identitat nacional.
Quins idiomes es suporten?
Es suporten 48 idiomes amb models NLP dedicats per al reconeixement d'entitats anomenades. La detecció basada en patrons (regex) funciona en tots els idiomes ja que coincideix amb patrons de caràcters independentment de l'idioma.
Puc afegir patrons d'entitat personalitzats?
Sí. L'API permet definir reconeixedors personalitzats perquè pugui afegir patrons per a identificadors propietaris, números de referència interns o formats de dades específics del seu sector.