Glossari de PII i Privadesa de Dades

Definicions clares dels termes clau de privadesa, compliment i protecció de dades utilitzats a la indústria.

Termes de Privadesa i Compliment

Informació Personalment Identificable (PII)

Qualsevol dada que pugui identificar un individu específic, com noms, adreces de correu electrònic, números de seguretat social o números de telèfon.

Anonimització

El procés irreversible d'alterar dades perquè els individus no puguin ser identificats, directament o indirectament.

Pseudonimització

Substituir dades identificables per identificadors artificials (pseudònims) de manera que la re-identificació requereixi una clau mantinguda per separat.

Desidentificació

Eliminar o ocultar identificadors personals de les dades perquè ja no es pugui vincular a un individu específic sense informació addicional.

Subjecte de Dades

Una persona física identificada o identificable els dades personals de la qual són processades per un responsable o un processador.

Responsable de Dades

L'entitat que determina les finalitats i els mitjans del processament de dades personals.

Processador de Dades

Una entitat que processa dades personals en nom d'un responsable de dades, seguint les instruccions del responsable.

Consentiment

Una indicació lliurement donada, específica, informada i inequívoca de l'acord d'un subjecte de dades amb el processament de les seves dades personals.

Base Legal

Un fonament legal sota el qual es permet el processament de dades personals, com el consentiment, la necessitat contractual, l'obligació legal o l'interès legítim.

Minimització de Dades

El principi que les dades personals recollides han de ser adequades, rellevants i limitades a allò que és necessari per a la seva finalitat prevista.

Dret a l'Esborrament

El dret d'un subjecte de dades a fer que les seves dades personals siguin eliminades quan ja no siguin necessàries, també conegut com el 'dret a ser oblidat' sota el GDPR.

Portabilitat de Dades

El dret dels subjectes de dades a rebre les seves dades personals en un format estructurat, d'ús comú i a transferir-les a un altre responsable.

Delegat de Protecció de Dades (DPO)

Una persona designada responsable de supervisar l'estratègia de protecció de dades d'una organització i assegurar el compliment de les regulacions de privadesa.

Avaluació d'Impacte sobre la Protecció de Dades (DPIA)

Un procés per identificar i minimitzar els riscos de protecció de dades d'un projecte, requerit sota el GDPR per a activitats de processament d'alt risc.

Violació de Dades

Un incident de seguretat on les dades personals són accedides, divulgades, alterades o destruïdes sense autorització.

Marcs Regulatoris

GDPR (Reglament General de Protecció de Dades)

El reglament de la UE que governa el processament de dades personals d'individus dins de l'Espai Econòmic Europeu, vigent des de maig de 2018.

CCPA (Llei de Privadesa del Consumidor de Califòrnia)

Una llei estatal de Califòrnia que atorga als consumidors drets sobre la seva informació personal recollida per empreses, vigent des de gener de 2020.

HIPAA (Llei de Portabilitat i Responsabilitat d'Assegurança de Salut)

Una llei federal dels EUA que estableix estàndards per protegir la informació de salut sensible dels pacients contra la divulgació sense consentiment.

ISO 27001

Un estàndard internacional per a sistemes de gestió de seguretat de la informació (ISMS), que especifica requisits per establir, implementar i millorar contínuament els controls de seguretat.

SOC 2 (Controls de Sistema i Organització 2)

Un marc d'auditoria per a organitzacions de serveis que avalua controls relacionats amb la seguretat, disponibilitat, integritat del processament, confidencialitat i privadesa.

Termes Tècnics

Reconixement d'Entitats Nomenades (NER)

Una tècnica de NLP que identifica i classifica entitats nomenades en text en categories predefinides com noms de persones, ubicacions i organitzacions.

Processament del Llenguatge Natural (NLP)

Una branca de la intel·ligència artificial que permet als ordinadors entendre, interpretar i generar llenguatge humà.

Reconegut de Patrons

Un detector basat en regles que utilitza expressions regulars i pistes de context per identificar patrons de dades específics, com números de targetes de crèdit o números de seguretat social.

Puntuació de Confiança

Un valor numèric entre 0 i 1 que indica quina certesa té un motor de detecció que un fragment de text coincideix amb un tipus d'entitat específica.

Expressió Regular (Regex)

Una seqüència de caràcters que defineix un patró de cerca, comunament utilitzada per validar i detectar formats de dades estructurades com números de telèfon o adreces de correu electrònic.

AES-256-GCM

Un algoritme de xifratge autenticat que utilitza una clau de 256 bits amb Galois/Counter Mode, proporcionant tant confidencialitat com verificació d'integritat de les dades xifrades.

Xifratge Zero-Knowledge

Una arquitectura de xifratge on només l'usuari té la clau de desxifrat, cosa que significa que fins i tot el proveïdor de serveis no pot accedir a les dades en text pla.

Tokenització

Substituir dades sensibles per tokens de marcador no sensibles que poden ser mapejats de nou a les dades originals mitjançant una cerca segura.

Mascarament de Dades

Ocultar dades específiques dins d'un conjunt de dades de manera que la informació sensible estigui oculta mentre les dades segueixen sent utilitzables per a proves o anàlisis.

Redacció

L'eliminació permanent d'informació sensible d'un document o conjunt de dades, substituint-la per un marcador com [REDACTED].

Mètodes d'Anonimització

Substituir

Substitueix PII detectat per un marcador genèric del mateix tipus d'entitat, com substituir 'John Smith' per '<PERSON>'.

Mascarar

Oculta parcialment PII substituint caràcters per símbols de màscara, per exemple, convertint '123-45-6789' en '***-**-6789'.

Redactar

Elimina completament PII detectat del text, sense deixar rastre del valor original.

Hash

Converteix PII en un hash criptogràfic de longitud fixa, permetent una substitució consistent mentre fa que la reversió sigui computacionalment inviable.

Xifrar

Transforma PII mitjançant xifratge AES-256-GCM amb una clau mantinguda per l'usuari, permetent la reversió autoritzada (desanonimització) quan sigui necessari.

Preguntes Freqüents

Quina és la diferència entre anonimització i pseudonimització?

L'anonimització elimina irreversible tots els informació identificativa, de manera que la re-identificació és impossible. La pseudonimització substitueix identificadors per d'altres artificials mentre manté una clau separada que permet la re-identificació quan és autoritzada. Sota el GDPR, les dades pseudonimitzades es consideren encara dades personals.

Per què la detecció de PII utilitza tant NLP com reconeixedors de patrons?

Els models de NLP detecten entitats dependents del context com noms de persones i ubicacions que no tenen un format fix. Els reconeixedors de patrons utilitzen expressions regulars per capturar identificadors estructurats com números de seguretat social, números de targetes de crèdit i números de telèfon. Combinar ambdues aproximacions maximitza l'exactitud de detecció a través de tots els tipus d'entitats.

Què és el xifratge zero-knowledge i per què és important?

El xifratge zero-knowledge significa que només tu tens la clau de desxifrat — el proveïdor de serveis no pot llegir les teves dades. Això és important perquè fins i tot en cas de vulneració del servidor, les teves dades xifrades romanen il·legibles sense la teva clau, proporcionant la màxima protecció de dades possible.

Com es diferencia el xifratge reversible del hashing?

El hashing és una transformació unidireccional — un cop les dades són hashades, l'original no es pot recuperar. El xifratge reversible (utilitzant AES-256-GCM) permet als usuaris autoritzats amb la clau correcta desxifrar i recuperar les dades originals, habilitant fluxos de treball on es necessita la desanonimització.

Protegeix Dades Sensibles Avui

Comença a anonimitzar PII amb més de 320 tipus d'entitats, 48 idiomes i xifratge zero-knowledge.