PII un Datu Privātuma Vārdnīca
Skaidras definīcijas galvenajiem privātuma, atbilstības un datu aizsardzības terminiem, kas tiek izmantoti nozarē.
Privātuma un Atbilstības Termini
Personiski identificējama informācija (PII)
Jebkuri dati, kas var identificēt konkrētu personu, piemēram, vārdi, e-pasta adreses, sociālās apdrošināšanas numuri vai tālruņa numuri.
Anonimizācija
Neatgriezenisks process, kas maina datus tā, lai indivīdus nevarētu identificēt, tieši vai netieši.
Pseidonimizācija
Identificējamu datu aizvietošana ar mākslīgiem identifikatoriem (pseidonīmiem), lai atkārtota identifikācija prasītu atsevišķi turētu atslēgu.
Datu deidentifikācija
Personisko identifikatoru noņemšana vai slēpšana no datiem, lai tos vairs nevarētu saistīt ar konkrētu personu bez papildu informācijas.
Datu subjekts
Identificēta vai identificējama fiziska persona, kuru personiskie dati tiek apstrādāti ar kontrolieri vai apstrādātāju.
Datu kontrolieris
Subjekts, kas nosaka personisko datu apstrādes mērķus un līdzekļus.
Datu apstrādātājs
Subjekts, kas apstrādā personiskos datus datu kontroliera vārdā, ievērojot kontroliera norādījumus.
Piekrišana
Brīvi sniegta, specifiska, informēta un nepārprotama datu subjekta norāde par piekrišanu savu personisko datu apstrādei.
Likumīgs pamats
Juridisks pamats, saskaņā ar kuru personisko datu apstrāde ir atļauta, piemēram, piekrišana, līguma nepieciešamība, juridiskais pienākums vai likumīgas intereses.
Datu minimizācija
Principi, ka savāktie personiskie dati jābūt atbilstošiem, saistītiem un ierobežotiem līdz tam, kas ir nepieciešams paredzētajam mērķim.
Tiesības uz dzēšanu
Datu subjekta tiesības panākt savu personisko datu dzēšanu, kad tie vairs nav nepieciešami, pazīstamas arī kā 'tiesības tikt aizmirstam' saskaņā ar GDPR.
Datu pārnesamība
Datu subjektu tiesības saņemt savus personiskos datus strukturētā, plaši izmantotā formātā un pārsūtīt tos citam kontrolierim.
Datu aizsardzības speciālists (DPO)
Noteikta persona, kas atbild par organizācijas datu aizsardzības stratēģijas uzraudzību un atbilstības nodrošināšanu privātuma noteikumiem.
Datu aizsardzības ietekmes novērtējums (DPIA)
Process, lai identificētu un samazinātu datu aizsardzības riskus projektā, kas ir nepieciešams saskaņā ar GDPR augsta riska apstrādes aktivitātēm.
Datu pārkāpums
Drošības incidents, kurā personiskie dati tiek piekļūti, atklāti, mainīti vai iznīcināti bez atļaujas.
Regulatīvie Rāmi
GDPR (Vispārīgā datu aizsardzības regula)
ES regula, kas regulē personisko datu apstrādi indivīdiem Eiropas Ekonomikas zonā, spēkā kopš 2018. gada maija.
CCPA (Kalifornijas patērētāju privātuma akts)
Kalifornijas štata likums, kas piešķir patērētājiem tiesības uz savu personisko informāciju, ko apkopo uzņēmumi, spēkā kopš 2020. gada janvāra.
HIPAA (Veselības apdrošināšanas pārnesamības un atbildības akts)
ASV federālais likums, kas nosaka standartus, lai aizsargātu jutīgu pacientu veselības informāciju no atklāšanas bez piekrišanas.
ISO 27001
Starptautisks standarts informācijas drošības pārvaldības sistēmām (ISMS), kas nosaka prasības drošības kontroļu izveidei, īstenošanai un nepārtrauktai uzlabošanai.
SOC 2 (Sistēmu un organizāciju kontroles 2)
Audita ietvars pakalpojumu organizācijām, kas novērtē kontroli attiecībā uz drošību, pieejamību, apstrādes integritāti, konfidencialitāti un privātumu.
Tehniskie Termini
Nosaukumu atpazīšana (NER)
NLP tehnika, kas identificē un klasificē nosaukumu entitātes tekstā iepriekš noteiktās kategorijās, piemēram, personu vārdi, vietas un organizācijas.
Dabas valodas apstrāde (NLP)
Mākslīgā intelekta nozare, kas ļauj datoriem saprast, interpretēt un ģenerēt cilvēku valodu.
Paraugu atpazītājs
Noteikumu balstīts detektors, kas izmanto regulāras izteiksmes un konteksta norādes, lai identificētu specifiskus datu paraugus, piemēram, kredītkartes numurus vai sociālās apdrošināšanas numurus.
Uzticības rezultāts
Skaitlisks vērtējums no 0 līdz 1, kas norāda, cik pārliecināts ir detekcijas dzinējs, ka teksta fragments atbilst konkrētam entitātes tipam.
Regulāra izteiksme (Regex)
Rakstzīmju secība, kas nosaka meklēšanas paraugu, parasti tiek izmantota, lai validētu un atklātu strukturētus datu formātus, piemēram, tālruņa numurus vai e-pasta adreses.
AES-256-GCM
Autentificēta šifrēšanas algoritms, kas izmanto 256 bitu atslēgu ar Galois/Counter režīmu, nodrošinot gan konfidencialitāti, gan integritātes pārbaudi šifrētiem datiem.
Nulles zināšanu šifrēšana
Šifrēšanas arhitektūra, kurā tikai lietotājs tur dekripcijas atslēgu, kas nozīmē, ka pat pakalpojumu sniedzējs nevar piekļūt nešifrētiem datiem.
Tokenizācija
Jutīgu datu aizvietošana ar ne-jutīgiem vietturu tokeniem, kurus var atgriezt pie oriģinālajiem datiem, izmantojot drošu meklēšanu.
Datu maskēšana
Specifisku datu slēpšana datu kopā, lai jutīga informācija tiktu paslēpta, kamēr dati paliek izmantojami testēšanai vai analīzei.
Redakcija
Jutīgas informācijas pastāvīga noņemšana no dokumenta vai datu kopas, aizstājot to ar marķieri, piemēram, [REDACTED].
Anonimizācijas Metodes
Aizvietot
Aizvieto atklāto PII ar vispārīgu vietturi, kas atbilst tai pašai entitātes tipam, piemēram, 'Džons Smits' ar '<PERSON>'.
Maskēt
Daļēji slēpj PII, aizvietojot rakstzīmes ar maskēšanas simboliem, piemēram, '123-45-6789' pārvēršot par '***-**-6789'.
Rediģēt
Pilnībā noņem atklāto PII no teksta, neatstājot nekādas oriģinālās vērtības pēdas.
Hash
Pārvērš PII par fiksētas garuma kriptogrāfisku hash, ļaujot konsekventu aizvietošanu, vienlaikus padarot reversēšanu aprēķināšanas ziņā neiespējamu.
Šifrēt
Pārvērš PII, izmantojot AES-256-GCM šifrēšanu ar lietotāja turētu atslēgu, ļaujot autorizētu reversēšanu (de-anonimizāciju) pēc nepieciešamības.
Biežāk Uzdotie Jautājumi
Kāda ir atšķirība starp anonimizāciju un pseidonimizāciju?
Anonimizācija neatgriezeniski noņem visu identificējošo informāciju, tāpēc atkārtota identifikācija nav iespējama. Pseidonimizācija aizvieto identifikatorus ar mākslīgiem, saglabājot atsevišķu atslēgu, kas ļauj atkārtotu identifikāciju, kad tas ir atļauts. Saskaņā ar GDPR pseidonimizētie dati joprojām tiek uzskatīti par personiskiem datiem.
Kāpēc PII atklāšana izmanto gan NLP, gan paraugu atpazītājus?
NLP modeļi atklāj konteksta atkarīgas entitātes, piemēram, personu vārdus un vietas, kurām nav fiksēta formāta. Paraugu atpazītāji izmanto regulāras izteiksmes, lai atklātu strukturētus identifikatorus, piemēram, sociālās apdrošināšanas numurus, kredītkartes numurus un tālruņa numurus. Apvienojot abus pieejas veidus, tiek maksimizēta atklāšanas precizitāte visiem entitātes tipiem.
Kas ir nulles zināšanu šifrēšana un kāpēc tā ir svarīga?
Nulles zināšanu šifrēšana nozīmē, ka tikai jūs turat dekripcijas atslēgu — pakalpojumu sniedzējs nevar izlasīt jūsu datus. Tas ir svarīgi, jo pat servera pārkāpuma gadījumā jūsu šifrētie dati paliek neizlasāmi bez jūsu atslēgas, nodrošinot visstiprāko iespējamo datu aizsardzību.
Kā reversējamā šifrēšana atšķiras no hashēšanas?
Hashēšana ir vienvirziena transformācija — kad dati ir hashēti, oriģināls nav atgūstams. Reversējamā šifrēšana (izmantojot AES-256-GCM) ļauj autorizētiem lietotājiem ar pareizo atslēgu dešifrēt un atgūt oriģinālos datus, ļaujot darba plūsmām, kurās nepieciešama de-anonimizācija.