PII & Duomenų Privatumo Terminų Žodynas
Aiškūs pagrindinių privatumo, atitikties ir duomenų apsaugos terminų apibrėžimai, naudojami visoje pramonėje.
Privatumo & Atitikties Terminai
Asmens Identifikuojama Informacija (PII)
Bet kokie duomenys, kurie gali identifikuoti konkretų asmenį, tokie kaip vardai, el. pašto adresai, socialinio draudimo numeriai ar telefono numeriai.
Anonimizacija
Negrįžtamas procesas, keičiantis duomenis taip, kad asmenys negalėtų būti identifikuojami, tiesiogiai ar netiesiogiai.
Pseudonimizacija
Identifikuojamų duomenų pakeitimas dirbtiniais identifikatoriais (pseudonimais), kad re-identifikavimui reikėtų atskirai laikomo rakto.
De-identifikacija
Asmeninių identifikatorių pašalinimas arba užtemdymas iš duomenų, kad jie nebegalėtų būti susiję su konkrečiu asmeniu be papildomos informacijos.
Duomenų Subjektas
Identifikuotas arba identifikuojamas fizinis asmuo, kurio asmeniniai duomenys yra tvarkomi valdytojo arba apdorotojo.
Duomenų Valdytojas
Subjektas, kuris nustato asmens duomenų tvarkymo tikslus ir priemones.
Duomenų Apdorotojas
Subjektas, kuris tvarko asmens duomenis duomenų valdytojo vardu, laikydamasis valdytojo nurodymų.
Sutikimas
Laisvai duotas, konkretus, informuotas ir nedviprasmiškas duomenų subjekto sutikimas dėl jų asmens duomenų tvarkymo.
Teisinis Pagrindas
Teisinis pagrindas, pagal kurį leidžiama tvarkyti asmens duomenis, pavyzdžiui, sutikimas, sutarties būtinybė, teisinė prievolė arba teisėtas interesas.
Duomenų Minimizavimas
Principas, kad surinkti asmens duomenys turi būti adekvatūs, aktualūs ir apriboti iki to, kas būtina numatytam tikslui.
Teisė į Ištrynimą
Duomenų subjekto teisė turėti savo asmens duomenis ištrintus, kai jie nebeaktualūs, dar žinoma kaip 'teisė būti pamirštam' pagal GDPR.
Duomenų Perkeliamumas
Duomenų subjektų teisė gauti savo asmens duomenis struktūrizuotu, plačiai naudojamu formatu ir perkelti juos kitam valdytojui.
Duomenų Apsaugos Pareigūnas (DPO)
Nustatytas asmuo, atsakingas už organizacijos duomenų apsaugos strategijos priežiūrą ir atitikties privatumo taisyklėms užtikrinimą.
Duomenų Apsaugos Poveikio Vertinimas (DPIA)
Procesas, skirtas nustatyti ir sumažinti projekto duomenų apsaugos rizikas, reikalaujamas pagal GDPR aukštos rizikos tvarkymo veikloms.
Duomenų Pažeidimas
Saugumo incidentas, kai asmens duomenys yra pasiekiami, atskleidžiami, keičiami ar naikinami be leidimo.
Šešėlis AI
Darbuotojų neteisėtas dirbtinio intelekto įrankių (ChatGPT, Copilot, Gemini) naudojimas be IT patvirtinimo. „Shadow AI“ yra pagrindinė AII duomenų nutekėjimo priežastis, nes vartotojai įklijuoja jautrius verslo duomenis – klientų įrašus, informaciją apie pacientus, finansinius duomenis – tiesiai į AI raginimus.
Duomenų minimizavimas
GDPR principas (Art. 5(1)(c)), reikalaujantis, kad organizacijos rinktų ir tvarkytų tik minimalius asmens duomenis, reikalingus konkrečiam tikslui. Dirbtinio intelekto sistemose duomenų sumažinimas reiškia AII anonimiškumą arba pašalinimą prieš duomenims patenkant į DI vamzdynus, taip sumažinant atitikties riziką ir pažeidimo paviršių.
Reguliavimo Rėmai
GDPR (Bendrasis Duomenų Apsaugos Reglamentas)
ES reglamentas, reguliuojantis asmens duomenų tvarkymą asmenims, esantiems Europos ekonominėje erdvėje, galiojantis nuo 2018 m. gegužės mėn.
CCPA (Kalifornijos Vartotojų Privatumo Aktas)
Kalifornijos valstijos įstatymas, suteikiantis vartotojams teises dėl jų asmeninės informacijos, kurią renka verslai, galiojantis nuo 2020 m. sausio mėn.
HIPAA (Sveikatos Draudimo Perkeliamumo ir Atsakomybės Aktas)
JAV federalinis įstatymas, nustatantis standartus, skirtus apsaugoti jautrią pacientų sveikatos informaciją nuo atskleidimo be sutikimo.
ISO 27001
Tarptautinis standartas informacijos saugumo valdymo sistemoms (ISMS), nustatantis reikalavimus saugumo kontrolės nustatymui, įgyvendinimui ir nuolatiniam tobulinimui.
SOC 2 (Sistemų ir Organizacijų Kontrolės 2)
Audito sistema, skirta paslaugų organizacijoms, vertinanti kontrolės priemones, susijusias su saugumu, prieinamumu, apdorojimo vientisumu, konfidencialumu ir privatumu.
EU AI Act
Europos Sąjungos reglamentas dėl dirbtinio intelekto (galioja nuo 2026 m. rugpjūčio mėn.). Didelės rizikos AI sistemos turi įgyvendinti duomenų valdymo priemones, įskaitant asmens duomenų mažinimą, dokumentavimą ir DPIA. Organizacijos, kurios naudoja dirbtinį intelektą priimdamos sprendimus dėl asmenų, turi užtikrinti, kad mokymo duomenys būtų anonimizuoti arba pseudonimizuoti.
ISO 42001
Tarptautinis AI valdymo sistemų standartas (AIMS), paskelbtas 2023 m. Suteikia atsakingo AI kūrimo ir diegimo sistemą, įskaitant duomenų kokybę, šališkumo kontrolę ir privatumo apsaugos priemones. Dažnai suporuojamas su ISO 27001, skirtas organizacijoms, naudojančioms dirbtinio intelekto sistemas su asmeniniais duomenimis.
Indija DPDP Act
Indijos skaitmeninių asmens duomenų apsaugos įstatymas (2023), taikomas nuo 2025 m. Reikia aiškaus sutikimo tvarkyti Indijos gyventojų asmens duomenis, lokalizuoti neskelbtinus duomenis ir pranešti apie pažeidimą per 72 valandas. Taikoma organizacijoms visame pasaulyje, kurios apdoroja Indijos piliečių duomenis.
Techniniai Terminai
Pavadinimų Atpažinimas (NER)
NLP technika, kuri identifikuoja ir klasifikuoja pavadinimus tekste į iš anksto nustatytas kategorijas, tokias kaip asmenų vardai, vietovės ir organizacijos.
Natūralios Kalbos Apdorojimas (NLP)
Dirbtinio intelekto šaka, leidžianti kompiuteriams suprasti, interpretuoti ir generuoti žmogaus kalbą.
Šablonų Atpažinimo Sistema
Taisyklėmis pagrįstas detektorius, naudojantis reguliarias išraiškas ir kontekstinius užuominas, kad identifikuotų specifinius duomenų šablonus, tokius kaip kredito kortelių numeriai ar socialinio draudimo numeriai.
Pasitikėjimo Balas
Skaitinė vertė nuo 0 iki 1, nurodanti, kiek tiksliai detekcijos variklis mano, kad tam tikras tekstas atitinka konkretų subjekto tipą.
Reguliari Išraiška (Regex)
Simbolių seka, apibrėžianti paieškos šabloną, dažnai naudojama struktūrizuotų duomenų formatų, tokių kaip telefono numeriai ar el. pašto adresai, patvirtinimui ir atpažinimui.
AES-256-GCM
Autentifikavimo šifravimo algoritmas, naudojantis 256 bitų raktą su Galois/Counter režimu, užtikrinantis tiek konfidencialumą, tiek šifruotų duomenų vientisumo patikrinimą.
Nulinės Žinios Šifravimas
Šifravimo architektūra, kurioje tik vartotojas turi dešifravimo raktą, tai reiškia, kad net paslaugų teikėjas negali pasiekti aiškių duomenų.
Tokenizacija
Jautrių duomenų pakeitimas neskaidriomis žymenų tokenais, kurie gali būti susieti su originaliais duomenimis per saugų paiešką.
Duomenų Maskavimas
Specifinių duomenų užtemdymas duomenų rinkinyje, kad jautri informacija būtų paslėpta, o duomenys liktų naudojami testavimui ar analizei.
Redagavimas
Jautrios informacijos nuolatinis pašalinimas iš dokumento ar duomenų rinkinio, pakeičiant ją žymekliu, tokiu kaip [REDACTED].
Sintetiniai duomenys
Dirbtinio intelekto sukurti duomenys, kurie statistiškai imituoja tikrus duomenis, tačiau neturi faktinių įrašų. Palyginti su anonimiškumu: anonimizuoti duomenys išsaugo didesnį analitinį tikslumą pasroviui ML; sintetiniai duomenys pašalina pakartotinio identifikavimo riziką, tačiau įveda statistinį poslinkį. Pirmenybė teikiama grįžtamam anonimiškumui, kai atitikties auditams gali prireikti originalių įrašų.
LLM greitas įpurškimas
Atakos technika, kai kenkėjiška įvestis manipuliuoja dideliu kalbos modeliu, kad būtų nepaisoma instrukcijų arba nutekėtų jautri informacija. AII apsaugos kontekste dėl greito įterpimo AI modelis gali atskleisti anoniminius duomenų šablonus arba vartotojo informaciją. Išankstinis įvesties anonimiškumas prieš jiems pasiekiant LLM sumažina atakos paviršių.
Privatumas pagal dizainą
GDPR Art. 25 principas, reikalaujantis, kad duomenų apsauga būtų integruota į sistemas nuo pat pradžių, o ne papildoma mintis. Dirbtinio intelekto sistemose privatumas pagal dizainą reiškia duomenų anonimiškumą prieš jiems patenkant į AI vamzdynus, nulinių žinių šifravimo įgyvendinimą ir duomenų saugojimo sumažinimą.
Anonimizacijos Metodai
Pakeisti
Pakeičia aptiktą PII bendru žymekliu to paties subjekto tipo, pavyzdžiui, 'John Smith' pakeičia '<PERSON>'.
Maskuoti
Iš dalies užtemdo PII, pakeisdama simbolius maskavimo simboliais, pavyzdžiui, '123-45-6789' paverčia '***-**-6789'.
Redaguoti
Visiškai pašalina aptiktą PII iš teksto, nepalikdama jokio originalios vertės pėdsako.
Hash
Paverčia PII į fiksuoto ilgio kriptografinį hash, leidžiantį nuoseklų pakeitimą, tuo pačiu padarant atvirkštinį procesą kompiuteriniu požiūriu neįmanomu.
Šifruoti
Paverčia PII naudojant AES-256-GCM šifravimą su vartotojo turimu raktu, leidžiančiu autorizuotą atvirkštinimą (de-anonimizaciją) prireikus.
Dažnai Užduodami Klausimai
Koks skirtumas tarp anonimizacijos ir pseudonimizacijos?
Anonimizacija negrįžtamai pašalina visą identifikuojančią informaciją, todėl re-identifikavimas yra neįmanomas. Pseudonimizacija pakeičia identifikatorius dirbtiniais, tuo pačiu išlaikydama atskirą raktą, leidžiantį re-identifikavimą, kai tai leidžiama. Pagal GDPR, pseudonimizuoti duomenys vis dar laikomi asmens duomenimis.
Kodėl PII atpažinimas naudoja tiek NLP, tiek šablonų atpažinimo sistemas?
NLP modeliai atpažįsta konteksto priklausomas entites, tokias kaip asmenų vardai ir vietovės, kurios neturi fiksuoto formato. Šablonų atpažinimo sistemos naudoja reguliarias išraiškas, kad užfiksuotų struktūrizuotus identifikatorius, tokius kaip socialinio draudimo numeriai, kredito kortelių numeriai ir telefono numeriai. Abu metodai kartu maksimizuoja atpažinimo tikslumą visų tipų subjektams.
Kas yra nulinės žinios šifravimas ir kodėl tai svarbu?
Nulinės žinios šifravimas reiškia, kad tik jūs turite dešifravimo raktą — paslaugų teikėjas negali perskaityti jūsų duomenų. Tai svarbu, nes net ir įvykus serverio pažeidimui, jūsų šifruoti duomenys lieka neskaitytini be jūsų rakto, užtikrinant stipriausią įmanomą duomenų apsaugą.
Kaip reversinis šifravimas skiriasi nuo hash'inimo?
Hash'inimas yra vienpusis transformavimas — kai duomenys yra hash'inami, originalių atkurti neįmanoma. Reversinis šifravimas (naudojant AES-256-GCM) leidžia autorizuotiems vartotojams su teisingu raktu dešifruoti ir atkurti originalius duomenis, leidžiant darbo procesus, kuriuose reikia de-anonimizacijos.