واژهنامه اطلاعات شناسایی شخصی و حریم خصوصی
تعاریف واضح از اصطلاحات کلیدی حریم خصوصی، انطباق و حفاظت از دادهها که در صنعت استفاده میشود.
اصطلاحات حریم خصوصی و انطباق
اطلاعات شناسایی شخصی (PII)
هر دادهای که میتواند یک فرد خاص را شناسایی کند، مانند نامها، آدرسهای ایمیل، شمارههای تأمین اجتماعی یا شمارههای تلفن.
ناشناسسازی
فرآیند غیرقابل بازگشت تغییر دادهها بهگونهای که افراد نتوانند بهطور مستقیم یا غیرمستقیم شناسایی شوند.
پسو دونو میسازی
جایگزینی دادههای شناساییشده با شناسههای مصنوعی (پسو دونو) بهگونهای که شناسایی مجدد نیاز به یک کلید جداگانه داشته باشد.
حذف شناسایی
حذف یا پنهانسازی شناساییهای شخصی از دادهها بهگونهای که دیگر نتوان آن را به یک فرد خاص مرتبط کرد بدون اطلاعات اضافی.
موضوع داده
شخص طبیعی شناساییشده یا قابل شناسایی که دادههای شخصی او توسط یک کنترلکننده یا پردازشگر پردازش میشود.
کنترلکننده داده
نهادی که اهداف و روشهای پردازش دادههای شخصی را تعیین میکند.
پردازشگر داده
نهادی که دادههای شخصی را به نمایندگی از یک کنترلکننده داده پردازش میکند و از دستورالعملهای کنترلکننده پیروی میکند.
رضایت
نشانهای آزادانه، خاص، آگاهانه و بدون ابهام از توافق یک موضوع داده برای پردازش دادههای شخصی او.
پایه قانونی
زمینه قانونی که تحت آن پردازش دادههای شخصی مجاز است، مانند رضایت، ضرورت قرارداد، تعهد قانونی یا منافع مشروع.
حداقلسازی داده
اصطلاحی که بیان میکند دادههای شخصی جمعآوریشده باید کافی، مرتبط و محدود به آنچه برای هدف مورد نظر لازم است، باشد.
حق به حذف
حق یک موضوع داده برای حذف دادههای شخصی او زمانی که دیگر لازم نیست، که بهعنوان 'حق فراموش شدن' تحت GDPR نیز شناخته میشود.
قابلیت انتقال داده
حق موضوعات داده برای دریافت دادههای شخصی خود در یک فرمت ساختاریافته و معمولاً استفادهشده و انتقال آن به یک کنترلکننده دیگر.
مسئول حفاظت از داده (DPO)
فردی که بهطور مشخص مسئول نظارت بر استراتژی حفاظت از دادههای یک سازمان و اطمینان از انطباق با مقررات حریم خصوصی است.
ارزیابی تأثیر حفاظت از داده (DPIA)
فرآیندی برای شناسایی و کاهش ریسکهای حفاظت از داده یک پروژه، که تحت GDPR برای فعالیتهای پردازش با ریسک بالا الزامی است.
نقص داده
یک حادثه امنیتی که در آن دادههای شخصی بدون مجوز دسترسی، افشا، تغییر یا نابود میشوند.
چارچوبهای قانونی
GDPR (مقررات عمومی حفاظت از داده)
مقررات اتحادیه اروپا که بر پردازش دادههای شخصی افراد در منطقه اقتصادی اروپا حاکم است و از مه 2018 اجرایی شده است.
CCPA (قانون حریم خصوصی مصرفکنندگان کالیفرنیا)
قانون ایالتی کالیفرنیا که به مصرفکنندگان حقوقی بر اطلاعات شخصی خود که توسط کسبوکارها جمعآوری میشود، اعطا میکند و از ژانویه 2020 اجرایی شده است.
HIPAA (قانون قابلیت انتقال و مسئولیت بیمه سلامت)
قانون فدرال ایالات متحده که استانداردهایی برای حفاظت از اطلاعات حساس سلامت بیماران در برابر افشا بدون رضایت تعیین میکند.
ISO 27001
استاندارد بینالمللی برای سیستمهای مدیریت امنیت اطلاعات (ISMS) که الزامات لازم برای ایجاد، پیادهسازی و بهبود مستمر کنترلهای امنیتی را مشخص میکند.
SOC 2 (کنترلهای سیستم و سازمان 2)
چارچوبی برای حسابرسی سازمانهای خدماتی که کنترلهای مربوط به امنیت، در دسترس بودن، یکپارچگی پردازش، محرمانگی و حریم خصوصی را ارزیابی میکند.
اصطلاحات فنی
شناسایی موجودیت نامدار (NER)
یک تکنیک NLP که موجودیتهای نامدار را در متن شناسایی و طبقهبندی میکند به دستههای از پیش تعریفشده مانند نامهای شخصی، مکانها و سازمانها.
پردازش زبان طبیعی (NLP)
شاخهای از هوش مصنوعی که به کامپیوترها امکان میدهد زبان انسانی را درک، تفسیر و تولید کنند.
شناسایی الگو
یک تشخیصدهنده مبتنی بر قاعده که از عبارات منظم و نشانههای زمینهای برای شناسایی الگوهای خاص داده، مانند شمارههای کارت اعتباری یا شمارههای تأمین اجتماعی استفاده میکند.
نمره اطمینان
یک مقدار عددی بین 0 و 1 که نشان میدهد یک موتور تشخیص چقدر مطمئن است که یک قطعه متن با یک نوع موجودیت خاص مطابقت دارد.
عبارت منظم (Regex)
یک دنباله از کاراکترها که یک الگوی جستجو را تعریف میکند و معمولاً برای اعتبارسنجی و شناسایی فرمتهای داده ساختاریافته مانند شمارههای تلفن یا آدرسهای ایمیل استفاده میشود.
AES-256-GCM
یک الگوریتم رمزنگاری معتبر که از یک کلید 256 بیتی با حالت Galois/Counter استفاده میکند و همزمان محرمانگی و تأیید یکپارچگی دادههای رمزنگاریشده را فراهم میکند.
رمزنگاری بدون دانش
یک معماری رمزنگاری که تنها کاربر کلید رمزگشایی را در اختیار دارد، به این معنی که حتی ارائهدهنده خدمات نمیتواند به دادههای متن باز دسترسی پیدا کند.
توکنسازی
جایگزینی دادههای حساس با توکنهای غیرحساس که میتوانند از طریق یک جستجوی امن به دادههای اصلی متصل شوند.
پنهانسازی داده
پنهان کردن دادههای خاص در یک مجموعه داده بهگونهای که اطلاعات حساس پنهان شود در حالی که داده برای آزمایش یا تحلیل قابل استفاده باقی میماند.
حذف
حذف دائمی اطلاعات حساس از یک سند یا مجموعه داده، و جایگزینی آن با یک علامت مانند [REDACTED].
روشهای ناشناسسازی
جایگزینی
جایگزینی PII شناساییشده با یک جایگزین عمومی از همان نوع موجودیت، مانند جایگزینی 'جان اسمیت' با '<PERSON>'.
پنهانسازی
بهطور جزئی PII را با جایگزینی کاراکترها با نمادهای پنهانسازی، بهعنوان مثال تبدیل '123-45-6789' به '***-**-6789' پنهان میکند.
حذف
بهطور کامل PII شناساییشده را از متن حذف میکند و هیچ نشانهای از مقدار اصلی باقی نمیگذارد.
هش
تبدیل PII به یک هش رمزنگاری با طول ثابت، که امکان جایگزینی مداوم را فراهم میکند در حالی که معکوس کردن آن از نظر محاسباتی غیرممکن است.
رمزنگاری
تبدیل PII با استفاده از رمزنگاری AES-256-GCM با یک کلید در اختیار کاربر، که امکان معکوسسازی مجاز (ناشناسزدایی) را در صورت نیاز فراهم میکند.
سؤالات متداول
تفاوت بین ناشناسسازی و پسو دونو میسازی چیست؟
ناشناسسازی بهطور غیرقابل بازگشت تمام اطلاعات شناساییکننده را حذف میکند، بنابراین شناسایی مجدد غیرممکن است. پسو دونو میسازی شناسهها را با شناسههای مصنوعی جایگزین میکند در حالی که یک کلید جداگانه را نگه میدارد که اجازه شناسایی مجدد را در صورت مجاز بودن میدهد. تحت GDPR، دادههای پسو دونو شده هنوز بهعنوان دادههای شخصی در نظر گرفته میشوند.
چرا تشخیص PII از هر دو NLP و شناسایی الگو استفاده میکند؟
مدلهای NLP موجودیتهای وابسته به زمینه مانند نامهای شخصی و مکانها را که فرمت ثابتی ندارند، شناسایی میکنند. شناساییکنندههای الگو از عبارات منظم برای شناسایی شناسههای ساختاریافته مانند شمارههای تأمین اجتماعی، شمارههای کارت اعتباری و شمارههای تلفن استفاده میکنند. ترکیب هر دو رویکرد دقت تشخیص را در تمام نوعهای موجودیت به حداکثر میرساند.
رمزنگاری بدون دانش چیست و چرا مهم است؟
رمزنگاری بدون دانش به این معنی است که تنها شما کلید رمزگشایی را در اختیار دارید — ارائهدهنده خدمات نمیتواند دادههای شما را بخواند. این مهم است زیرا حتی در صورت نقض سرور، دادههای رمزنگاریشده شما بدون کلید شما غیرقابل خواندن باقی میماند و قویترین حفاظت ممکن از دادهها را فراهم میکند.
چگونه رمزنگاری معکوسپذیر با هشزنی متفاوت است؟
هشزنی یک تبدیل یکطرفه است — پس از هش شدن داده، نمیتوان آن را بازیابی کرد. رمزنگاری معکوسپذیر (با استفاده از AES-256-GCM) به کاربران مجاز با کلید صحیح اجازه میدهد تا داده اصلی را رمزگشایی و بازیابی کنند، که امکان کارکردهایی را فراهم میکند که در آن ناشناسزدایی لازم است.