PII & Duomenų Privatumo Terminų Žodynas

Aiškūs pagrindinių privatumo, atitikties ir duomenų apsaugos terminų apibrėžimai, naudojami visoje pramonėje.

Privatumo & Atitikties Terminai

Asmens Identifikuojama Informacija (PII)

Bet kokie duomenys, kurie gali identifikuoti konkretų asmenį, tokie kaip vardai, el. pašto adresai, socialinio draudimo numeriai ar telefono numeriai.

Anonimizacija

Negrįžtamas procesas, keičiantis duomenis taip, kad asmenys negalėtų būti identifikuojami, tiesiogiai ar netiesiogiai.

Pseudonimizacija

Identifikuojamų duomenų pakeitimas dirbtiniais identifikatoriais (pseudonimais), kad re-identifikavimui reikėtų atskirai laikomo rakto.

De-identifikacija

Asmeninių identifikatorių pašalinimas arba užtemdymas iš duomenų, kad jie nebegalėtų būti susiję su konkrečiu asmeniu be papildomos informacijos.

Duomenų Subjektas

Identifikuotas arba identifikuojamas fizinis asmuo, kurio asmeniniai duomenys yra tvarkomi valdytojo arba apdorotojo.

Duomenų Valdytojas

Subjektas, kuris nustato asmens duomenų tvarkymo tikslus ir priemones.

Duomenų Apdorotojas

Subjektas, kuris tvarko asmens duomenis duomenų valdytojo vardu, laikydamasis valdytojo nurodymų.

Sutikimas

Laisvai duotas, konkretus, informuotas ir nedviprasmiškas duomenų subjekto sutikimas dėl jų asmens duomenų tvarkymo.

Teisinis Pagrindas

Teisinis pagrindas, pagal kurį leidžiama tvarkyti asmens duomenis, pavyzdžiui, sutikimas, sutarties būtinybė, teisinė prievolė arba teisėtas interesas.

Duomenų Minimizavimas

Principas, kad surinkti asmens duomenys turi būti adekvatūs, aktualūs ir apriboti iki to, kas būtina numatytam tikslui.

Teisė į Ištrynimą

Duomenų subjekto teisė turėti savo asmens duomenis ištrintus, kai jie nebeaktualūs, dar žinoma kaip 'teisė būti pamirštam' pagal GDPR.

Duomenų Perkeliamumas

Duomenų subjektų teisė gauti savo asmens duomenis struktūrizuotu, plačiai naudojamu formatu ir perkelti juos kitam valdytojui.

Duomenų Apsaugos Pareigūnas (DPO)

Nustatytas asmuo, atsakingas už organizacijos duomenų apsaugos strategijos priežiūrą ir atitikties privatumo taisyklėms užtikrinimą.

Duomenų Apsaugos Poveikio Vertinimas (DPIA)

Procesas, skirtas nustatyti ir sumažinti projekto duomenų apsaugos rizikas, reikalaujamas pagal GDPR aukštos rizikos tvarkymo veikloms.

Duomenų Pažeidimas

Saugumo incidentas, kai asmens duomenys yra pasiekiami, atskleidžiami, keičiami ar naikinami be leidimo.

Šešėlis AI

Darbuotojų neteisėtas dirbtinio intelekto įrankių (ChatGPT, Copilot, Gemini) naudojimas be IT patvirtinimo. „Shadow AI“ yra pagrindinė AII duomenų nutekėjimo priežastis, nes vartotojai įklijuoja jautrius verslo duomenis – klientų įrašus, informaciją apie pacientus, finansinius duomenis – tiesiai į AI raginimus.

Duomenų minimizavimas

GDPR principas (Art. 5(1)(c)), reikalaujantis, kad organizacijos rinktų ir tvarkytų tik minimalius asmens duomenis, reikalingus konkrečiam tikslui. Dirbtinio intelekto sistemose duomenų sumažinimas reiškia AII anonimiškumą arba pašalinimą prieš duomenims patenkant į DI vamzdynus, taip sumažinant atitikties riziką ir pažeidimo paviršių.

Reguliavimo Rėmai

GDPR (Bendrasis Duomenų Apsaugos Reglamentas)

ES reglamentas, reguliuojantis asmens duomenų tvarkymą asmenims, esantiems Europos ekonominėje erdvėje, galiojantis nuo 2018 m. gegužės mėn.

CCPA (Kalifornijos Vartotojų Privatumo Aktas)

Kalifornijos valstijos įstatymas, suteikiantis vartotojams teises dėl jų asmeninės informacijos, kurią renka verslai, galiojantis nuo 2020 m. sausio mėn.

HIPAA (Sveikatos Draudimo Perkeliamumo ir Atsakomybės Aktas)

JAV federalinis įstatymas, nustatantis standartus, skirtus apsaugoti jautrią pacientų sveikatos informaciją nuo atskleidimo be sutikimo.

ISO 27001

Tarptautinis standartas informacijos saugumo valdymo sistemoms (ISMS), nustatantis reikalavimus saugumo kontrolės nustatymui, įgyvendinimui ir nuolatiniam tobulinimui.

SOC 2 (Sistemų ir Organizacijų Kontrolės 2)

Audito sistema, skirta paslaugų organizacijoms, vertinanti kontrolės priemones, susijusias su saugumu, prieinamumu, apdorojimo vientisumu, konfidencialumu ir privatumu.

EU AI Act

Europos Sąjungos reglamentas dėl dirbtinio intelekto (galioja nuo 2026 m. rugpjūčio mėn.). Didelės rizikos AI sistemos turi įgyvendinti duomenų valdymo priemones, įskaitant asmens duomenų mažinimą, dokumentavimą ir DPIA. Organizacijos, kurios naudoja dirbtinį intelektą priimdamos sprendimus dėl asmenų, turi užtikrinti, kad mokymo duomenys būtų anonimizuoti arba pseudonimizuoti.

ISO 42001

Tarptautinis AI valdymo sistemų standartas (AIMS), paskelbtas 2023 m. Suteikia atsakingo AI kūrimo ir diegimo sistemą, įskaitant duomenų kokybę, šališkumo kontrolę ir privatumo apsaugos priemones. Dažnai suporuojamas su ISO 27001, skirtas organizacijoms, naudojančioms dirbtinio intelekto sistemas su asmeniniais duomenimis.

Indija DPDP Act

Indijos skaitmeninių asmens duomenų apsaugos įstatymas (2023), taikomas nuo 2025 m. Reikia aiškaus sutikimo tvarkyti Indijos gyventojų asmens duomenis, lokalizuoti neskelbtinus duomenis ir pranešti apie pažeidimą per 72 valandas. Taikoma organizacijoms visame pasaulyje, kurios apdoroja Indijos piliečių duomenis.

Techniniai Terminai

Pavadinimų Atpažinimas (NER)

NLP technika, kuri identifikuoja ir klasifikuoja pavadinimus tekste į iš anksto nustatytas kategorijas, tokias kaip asmenų vardai, vietovės ir organizacijos.

Natūralios Kalbos Apdorojimas (NLP)

Dirbtinio intelekto šaka, leidžianti kompiuteriams suprasti, interpretuoti ir generuoti žmogaus kalbą.

Šablonų Atpažinimo Sistema

Taisyklėmis pagrįstas detektorius, naudojantis reguliarias išraiškas ir kontekstinius užuominas, kad identifikuotų specifinius duomenų šablonus, tokius kaip kredito kortelių numeriai ar socialinio draudimo numeriai.

Pasitikėjimo Balas

Skaitinė vertė nuo 0 iki 1, nurodanti, kiek tiksliai detekcijos variklis mano, kad tam tikras tekstas atitinka konkretų subjekto tipą.

Reguliari Išraiška (Regex)

Simbolių seka, apibrėžianti paieškos šabloną, dažnai naudojama struktūrizuotų duomenų formatų, tokių kaip telefono numeriai ar el. pašto adresai, patvirtinimui ir atpažinimui.

AES-256-GCM

Autentifikavimo šifravimo algoritmas, naudojantis 256 bitų raktą su Galois/Counter režimu, užtikrinantis tiek konfidencialumą, tiek šifruotų duomenų vientisumo patikrinimą.

Nulinės Žinios Šifravimas

Šifravimo architektūra, kurioje tik vartotojas turi dešifravimo raktą, tai reiškia, kad net paslaugų teikėjas negali pasiekti aiškių duomenų.

Tokenizacija

Jautrių duomenų pakeitimas neskaidriomis žymenų tokenais, kurie gali būti susieti su originaliais duomenimis per saugų paiešką.

Duomenų Maskavimas

Specifinių duomenų užtemdymas duomenų rinkinyje, kad jautri informacija būtų paslėpta, o duomenys liktų naudojami testavimui ar analizei.

Redagavimas

Jautrios informacijos nuolatinis pašalinimas iš dokumento ar duomenų rinkinio, pakeičiant ją žymekliu, tokiu kaip [REDACTED].

Sintetiniai duomenys

Dirbtinio intelekto sukurti duomenys, kurie statistiškai imituoja tikrus duomenis, tačiau neturi faktinių įrašų. Palyginti su anonimiškumu: anonimizuoti duomenys išsaugo didesnį analitinį tikslumą pasroviui ML; sintetiniai duomenys pašalina pakartotinio identifikavimo riziką, tačiau įveda statistinį poslinkį. Pirmenybė teikiama grįžtamam anonimiškumui, kai atitikties auditams gali prireikti originalių įrašų.

LLM greitas įpurškimas

Atakos technika, kai kenkėjiška įvestis manipuliuoja dideliu kalbos modeliu, kad būtų nepaisoma instrukcijų arba nutekėtų jautri informacija. AII apsaugos kontekste dėl greito įterpimo AI modelis gali atskleisti anoniminius duomenų šablonus arba vartotojo informaciją. Išankstinis įvesties anonimiškumas prieš jiems pasiekiant LLM sumažina atakos paviršių.

Privatumas pagal dizainą

GDPR Art. 25 principas, reikalaujantis, kad duomenų apsauga būtų integruota į sistemas nuo pat pradžių, o ne papildoma mintis. Dirbtinio intelekto sistemose privatumas pagal dizainą reiškia duomenų anonimiškumą prieš jiems patenkant į AI vamzdynus, nulinių žinių šifravimo įgyvendinimą ir duomenų saugojimo sumažinimą.

Anonimizacijos Metodai

Pakeisti

Pakeičia aptiktą PII bendru žymekliu to paties subjekto tipo, pavyzdžiui, 'John Smith' pakeičia '<PERSON>'.

Maskuoti

Iš dalies užtemdo PII, pakeisdama simbolius maskavimo simboliais, pavyzdžiui, '123-45-6789' paverčia '***-**-6789'.

Redaguoti

Visiškai pašalina aptiktą PII iš teksto, nepalikdama jokio originalios vertės pėdsako.

Hash

Paverčia PII į fiksuoto ilgio kriptografinį hash, leidžiantį nuoseklų pakeitimą, tuo pačiu padarant atvirkštinį procesą kompiuteriniu požiūriu neįmanomu.

Šifruoti

Paverčia PII naudojant AES-256-GCM šifravimą su vartotojo turimu raktu, leidžiančiu autorizuotą atvirkštinimą (de-anonimizaciją) prireikus.

Dažnai Užduodami Klausimai

Koks skirtumas tarp anonimizacijos ir pseudonimizacijos?

Anonimizacija negrįžtamai pašalina visą identifikuojančią informaciją, todėl re-identifikavimas yra neįmanomas. Pseudonimizacija pakeičia identifikatorius dirbtiniais, tuo pačiu išlaikydama atskirą raktą, leidžiantį re-identifikavimą, kai tai leidžiama. Pagal GDPR, pseudonimizuoti duomenys vis dar laikomi asmens duomenimis.

Kodėl PII atpažinimas naudoja tiek NLP, tiek šablonų atpažinimo sistemas?

NLP modeliai atpažįsta konteksto priklausomas entites, tokias kaip asmenų vardai ir vietovės, kurios neturi fiksuoto formato. Šablonų atpažinimo sistemos naudoja reguliarias išraiškas, kad užfiksuotų struktūrizuotus identifikatorius, tokius kaip socialinio draudimo numeriai, kredito kortelių numeriai ir telefono numeriai. Abu metodai kartu maksimizuoja atpažinimo tikslumą visų tipų subjektams.

Kas yra nulinės žinios šifravimas ir kodėl tai svarbu?

Nulinės žinios šifravimas reiškia, kad tik jūs turite dešifravimo raktą — paslaugų teikėjas negali perskaityti jūsų duomenų. Tai svarbu, nes net ir įvykus serverio pažeidimui, jūsų šifruoti duomenys lieka neskaitytini be jūsų rakto, užtikrinant stipriausią įmanomą duomenų apsaugą.

Kaip reversinis šifravimas skiriasi nuo hash'inimo?

Hash'inimas yra vienpusis transformavimas — kai duomenys yra hash'inami, originalių atkurti neįmanoma. Reversinis šifravimas (naudojant AES-256-GCM) leidžia autorizuotiems vartotojams su teisingu raktu dešifruoti ir atkurti originalius duomenis, leidžiant darbo procesus, kuriuose reikia de-anonimizacijos.

Apsaugokite Jautrius Duomenis Šiandien

Pradėkite anonimizuoti PII su 317 subjektų tipų, 48 kalbomis ir nulinės žinios šifravimu.