Kamusi ya PII & Faragha ya Data
Maanani wazi ya masharti muhimu ya faragha, utii, na ulinzi wa data yanayotumika katika sekta.
Masharti ya Faragha & Utii
Taarifa Zinazoweza Kutambulika Binafsi (PII)
Taarifa yoyote inayoweza kutambulisha mtu maalum, kama vile majina, anwani za barua pepe, nambari za usalama wa jamii, au nambari za simu.
Anonymization
Mchakato usioweza kubadilishwa wa kubadilisha data ili watu wasiweze kutambulika, moja kwa moja au kwa njia isiyo ya moja kwa moja.
Pseudonymization
Kuweka data zinazoweza kutambulika na vitambulisho bandia (pseudonyms) ili utambulisho wa kurudi unahitaji funguo iliyoshikiliwa tofauti.
De-identification
Kuondoa au kuficha vitambulisho binafsi kutoka kwa data ili isiweze kuunganishwa tena na mtu maalum bila taarifa za ziada.
Mtu wa Data
Mtu wa asili aliyejulikana au anayejulikana ambaye data yake binafsi inashughulikiwa na mdhibiti au mchakataji.
Mdhibiti wa Data
Chombo kinachotunga malengo na njia za kushughulikia data binafsi.
Mchakataji wa Data
Chombo kinachoshughulikia data binafsi kwa niaba ya mdhibiti wa data, kufuata maelekezo ya mdhibiti.
Idhini
Dalili ya hiari, maalum, iliyo na taarifa, na isiyo na utata ya makubaliano ya mtu wa data kuhusu usindikaji wa data zao binafsi.
Msingi wa Kisheria
Sababu ya kisheria ambayo chini yake usindikaji wa data binafsi unaruhusiwa, kama vile idhini, umuhimu wa mkataba, wajibu wa kisheria, au maslahi halali.
Kupunguza Data
Kanuni kwamba data binafsi iliyokusanywa inapaswa kuwa ya kutosha, inayohusiana, na kupunguzika kwa kile kinachohitajika kwa kusudi lake lililokusudiwa.
Haki ya Kufutwa
Haki ya mtu wa data kuwa na data zao binafsi zifutwe wakati hazihitajiki tena, pia inajulikana kama 'haki ya kusahaulika' chini ya GDPR.
Uhamaji wa Data
Haki ya watu wa data kupokea data zao binafsi katika muundo ulio na mpangilio, unaotumika kwa kawaida na kuhamasisha kwa mdhibiti mwingine.
Afisa wa Ulinzi wa Data (DPO)
Mtu aliyepewa jukumu la kusimamia mkakati wa ulinzi wa data wa shirika na kuhakikisha utii wa kanuni za faragha.
Tathmini ya Athari za Ulinzi wa Data (DPIA)
Mchakato wa kubaini na kupunguza hatari za ulinzi wa data za mradi, zinazohitajika chini ya GDPR kwa shughuli za usindikaji zenye hatari kubwa.
Uvunjaji wa Data
Tukio la usalama ambapo data binafsi inapata, kufichuliwa, kubadilishwa, au kuharibiwa bila ruhusa.
Mifumo ya Kanuni
GDPR (Sheria ya Jumla ya Ulinzi wa Data)
Kanuni ya EU inayosimamia usindikaji wa data binafsi za watu ndani ya Eneo la Uchumi la Ulaya, inayofanya kazi tangu Mei 2018.
CCPA (Sheria ya Faragha ya Wateja wa California)
Sheria ya serikali ya California inayowapa watumiaji haki juu ya taarifa zao binafsi zilizokusanywa na biashara, inayofanya kazi tangu Januari 2020.
HIPAA (Sheria ya Uhamaji na Uwajibikaji wa Bima ya Afya)
Sheria ya shirikisho la Marekani inayoweka viwango vya kulinda taarifa nyeti za afya za wagonjwa kutokana na kufichuliwa bila idhini.
ISO 27001
Kiwango cha kimataifa cha mifumo ya usimamizi wa usalama wa taarifa (ISMS), kinachofafanua mahitaji ya kuanzisha, kutekeleza, na kuboresha mara kwa mara udhibiti wa usalama.
SOC 2 (Udhibiti wa Mfumo na Shirika 2)
Mfumo wa ukaguzi wa mashirika ya huduma unaothamini udhibiti unaohusiana na usalama, upatikanaji, uaminifu wa usindikaji, faragha, na faragha.
Masharti ya Kiufundi
Utambuzi wa Vitu Vilivyopewa Jina (NER)
Teknolojia ya NLP inayotambua na kuainisha vitu vilivyopewa jina katika maandiko katika makundi yaliyoainishwa kama vile majina ya watu, maeneo, na mashirika.
Usindikaji wa Lugha Asilia (NLP)
Tawi la akili bandia linalowezesha kompyuta kuelewa, kutafsiri, na kuunda lugha ya kibinadamu.
Mtambua Mifumo
Kigundua kinachotumia sheria za msingi ambacho kinatumia maelezo ya kawaida na vidokezo vya muktadha kutambua mifumo maalum ya data, kama vile nambari za kadi za mkopo au nambari za usalama wa jamii.
Alama ya Uhakika
Thamani ya nambari kati ya 0 na 1 inayoonyesha jinsi mhandisi wa ugunduzi anavyojua kwamba kipande cha maandiko kinalingana na aina maalum ya chombo.
Mwelekeo wa Kawaida (Regex)
Mfuatano wa wahusika unaofafanua muundo wa utafutaji, unaotumika kwa kawaida kuthibitisha na kugundua muundo wa data ulio na mpangilio kama vile nambari za simu au anwani za barua pepe.
AES-256-GCM
Algorithm ya usimbaji iliyothibitishwa inayotumia funguo ya 256-bit na Galois/Counter Mode, ikitoa ulinzi wa faragha na uthibitisho wa uaminifu wa data iliyosimbwa.
Usimbaji wa Zero-Knowledge
Muundo wa usimbaji ambapo ni wewe tu unayeweka funguo za ufichuzi, ikimaanisha hata mtoa huduma hawezi kufikia data ya wazi.
Tokenization
Kuweka data nyeti na tokeni zisizo nyeti ambazo zinaweza kuunganishwa tena na data ya asili kupitia utafutaji salama.
Kuficha Data
Kuficha data maalum ndani ya seti ya data ili taarifa nyeti ifichwe wakati data inabaki kutumika kwa ajili ya majaribio au uchambuzi.
Kufuta
Kuondoa kabisa taarifa nyeti kutoka kwa hati au seti ya data, ikibadilishwa na alama kama [REDACTED].
Mbinu za Anonymization
Badilisha
Inabadilisha PII iliyogunduliwa na alama ya jumla ya aina hiyo hiyo, kama vile kubadilisha 'John Smith' na '<PERSON>'.
Ficha
Inaficha sehemu ya PII kwa kubadilisha wahusika na alama za kuficha, kwa mfano kubadilisha '123-45-6789' kuwa '***-**-6789'.
Futa
Inafuta kabisa PII iliyogunduliwa kutoka kwa maandiko, bila kuacha alama ya thamani ya asili.
Hash
Inabadilisha PII kuwa hash ya kiusalama yenye urefu wa kudumu, ikiruhusu kubadilishana kwa kawaida huku ikifanya kurudi nyuma kuwa ngumu kihesabu.
Simbua
Inabadilisha PII kwa kutumia usimbaji wa AES-256-GCM na funguo inayoshikiliwa na mtumiaji, ikiruhusu kurudi nyuma kwa ruhusa (de-anonymization) inapohitajika.
Maswali Yanayoulizwa Mara kwa Mara
Nini tofauti kati ya anonymization na pseudonymization?
Anonymization inafuta kabisa taarifa zote zinazoweza kutambulika hivyo kurudi nyuma haiwezekani. Pseudonymization inabadilisha vitambulisho na vya bandia huku ikihifadhi funguo tofauti inayoruhusu utambulisho wa kurudi unapohitajika. Chini ya GDPR, data iliyopseudonymized bado inachukuliwa kama data binafsi.
Kwa nini ugunduzi wa PII unatumia NLP na watambua mifumo?
Mifano ya NLP inatambua vitu vinavyotegemea muktadha kama vile majina ya watu na maeneo ambayo hayana muundo wa kudumu. Watambua mifumo wanatumia mwelekeo wa kawaida kukamata vitambulisho vilivyo na mpangilio kama vile nambari za usalama wa jamii, nambari za kadi za mkopo, na nambari za simu. Kuunganisha mbinu zote mbili kunapanua usahihi wa ugunduzi katika aina zote za vitu.
Nini usimbaji wa zero-knowledge na kwa nini ni muhimu?
Usimbaji wa zero-knowledge unamaanisha ni wewe tu unayeweka funguo za ufichuzi — mtoa huduma hawezi kusoma data yako. Hii ni muhimu kwa sababu hata katika tukio la uvunjaji wa seva, data yako iliyosimbwa inabaki kuwa isiyo na uwezo wa kusomeka bila funguo yako, ikitoa ulinzi wa data wenye nguvu zaidi.
Usimbaji wa kurudi nyuma unavyotofautiana na hashing?
Hashing ni mabadiliko ya upande mmoja — mara data inapohashwa, asili haiwezi kurejeshwa. Usimbaji wa kurudi nyuma (ukitumia AES-256-GCM) unaruhusu watumiaji walioidhinishwa wenye funguo sahihi kufichua na kurejesha data ya asili, ikiruhusu michakato ambapo de-anonymization inahitajika.