مصطلحات PII وخصوصية البيانات

تعريفات واضحة لمصطلحات الخصوصية والامتثال وحماية البيانات المستخدمة في الصناعة.

مصطلحات الخصوصية والامتثال

معلومات التعريف الشخصية (PII)

أي بيانات يمكن أن تحدد فردًا معينًا، مثل الأسماء، وعناوين البريد الإلكتروني، وأرقام الضمان الاجتماعي، أو أرقام الهواتف.

التعقيم

عملية غير قابلة للعكس لتغيير البيانات بحيث لا يمكن التعرف على الأفراد، بشكل مباشر أو غير مباشر.

التعريف المستعار

استبدال البيانات القابلة للتعريف بمعرفات اصطناعية (أسماء مستعارة) بحيث يتطلب إعادة التعريف مفتاحًا محتفظًا به بشكل منفصل.

إزالة التعريف

إزالة أو إخفاء المعرفات الشخصية من البيانات بحيث لا يمكن ربطها بفرد معين دون معلومات إضافية.

موضوع البيانات

شخص طبيعي محدد أو يمكن تحديده يتم معالجة بياناته الشخصية بواسطة جهة تحكم أو معالج.

جهة التحكم في البيانات

الكيان الذي يحدد أغراض ووسائل معالجة البيانات الشخصية.

معالج البيانات

كيان يقوم بمعالجة البيانات الشخصية نيابة عن جهة التحكم في البيانات، وفقًا لتعليمات الجهة المراقبة.

الموافقة

إشارة محددة ومستنيرة وغير غامضة من موضوع البيانات لموافقته على معالجة بياناته الشخصية.

الأساس القانوني

أساس قانوني يُسمح بموجبه بمعالجة البيانات الشخصية، مثل الموافقة، أو ضرورة العقد، أو الالتزام القانوني، أو المصلحة المشروعة.

تقليل البيانات

المبدأ الذي ينص على أن البيانات الشخصية التي يتم جمعها يجب أن تكون كافية وذات صلة ومحدودة لما هو ضروري للغرض المقصود.

حق الحذف

حق موضوع البيانات في حذف بياناته الشخصية عندما لم تعد ضرورية، والمعروف أيضًا باسم 'الحق في النسيان' بموجب GDPR.

قابلية نقل البيانات

حق موضوع البيانات في تلقي بياناته الشخصية بتنسيق منظم ومستخدم بشكل شائع ونقلها إلى جهة تحكم أخرى.

مسؤول حماية البيانات (DPO)

شخص معين مسؤول عن الإشراف على استراتيجية حماية البيانات في منظمة وضمان الامتثال للوائح الخصوصية.

تقييم تأثير حماية البيانات (DPIA)

عملية لتحديد وتقليل مخاطر حماية البيانات لمشروع، مطلوبة بموجب GDPR للأنشطة عالية المخاطر.

خرق البيانات

حادثة أمنية يتم فيها الوصول إلى البيانات الشخصية أو الكشف عنها أو تغييرها أو تدميرها دون إذن.

الأطر التنظيمية

GDPR (اللائحة العامة لحماية البيانات)

اللائحة الأوروبية التي تحكم معالجة البيانات الشخصية للأفراد داخل المنطقة الاقتصادية الأوروبية، سارية منذ مايو 2018.

CCPA (قانون خصوصية المستهلك في كاليفورنيا)

قانون ولاية كاليفورنيا الذي يمنح المستهلكين حقوقًا على معلوماتهم الشخصية التي تجمعها الشركات، ساري منذ يناير 2020.

HIPAA (قانون قابلية التأمين الصحي والمساءلة)

قانون اتحادي أمريكي يحدد معايير لحماية معلومات صحة المرضى الحساسة من الكشف دون موافقة.

ISO 27001

معيار دولي لأنظمة إدارة أمن المعلومات (ISMS)، يحدد متطلبات إنشاء وتنفيذ وتحسين ضوابط الأمان بشكل مستمر.

SOC 2 (ضوابط النظام والتنظيم 2)

إطار تدقيق للمنظمات الخدمية يقيم الضوابط المتعلقة بالأمان، والتوافر، وسلامة المعالجة، والسرية، والخصوصية.

المصطلحات التقنية

التعرف على الكيانات المسماة (NER)

تقنية معالجة اللغة الطبيعية التي تحدد وتصنف الكيانات المسماة في النص إلى فئات محددة مسبقًا مثل أسماء الأشخاص، والمواقع، والمنظمات.

معالجة اللغة الطبيعية (NLP)

فرع من الذكاء الاصطناعي يمكّن الحواسيب من فهم وتفسير وتوليد اللغة البشرية.

مكتشف الأنماط

كاشف يعتمد على القواعد يستخدم التعبيرات العادية وأدلة السياق لتحديد أنماط بيانات محددة، مثل أرقام بطاقات الائتمان أو أرقام الضمان الاجتماعي.

درجة الثقة

قيمة عددية بين 0 و1 تشير إلى مدى تأكد محرك الكشف من أن قطعة نص تتطابق مع نوع كيان محدد.

التعبير العادي (Regex)

سلسلة من الأحرف تحدد نمط البحث، وتستخدم عادةً للتحقق من صحة واكتشاف تنسيقات البيانات المهيكلة مثل أرقام الهواتف أو عناوين البريد الإلكتروني.

AES-256-GCM

خوارزمية تشفير مصادق عليها تستخدم مفتاحًا بطول 256 بت مع وضع Galois/Counter، مما يوفر كل من السرية والتحقق من سلامة البيانات المشفرة.

تشفير بدون معرفة

بنية تشفير حيث يحتفظ المستخدم فقط بمفتاح فك التشفير، مما يعني أن مزود الخدمة لا يمكنه الوصول إلى البيانات النصية.

التوكنة

استبدال البيانات الحساسة برموز غير حساسة يمكن ربطها بالبيانات الأصلية من خلال بحث آمن.

إخفاء البيانات

إخفاء بيانات معينة داخل مجموعة بيانات بحيث تبقى المعلومات الحساسة مخفية بينما تظل البيانات قابلة للاستخدام للاختبار أو التحليل.

الحذف

الإزالة الدائمة للمعلومات الحساسة من مستند أو مجموعة بيانات، واستبدالها بعلامة مثل [محذوف].

طرق التعقيم

استبدال

يستبدل PII المكتشف بمكان مخصص عام من نفس نوع الكيان، مثل استبدال 'جون سميث' بـ '<شخص>'.

إخفاء

يخفي جزئيًا PII عن طريق استبدال الأحرف برموز إخفاء، على سبيل المثال تحويل '123-45-6789' إلى '***-**-6789'.

حذف

يزيل تمامًا PII المكتشف من النص، دون ترك أي أثر للقيمة الأصلية.

تجزئة

تحول PII إلى تجزئة تشفيرية ثابتة الطول، مما يسمح باستبدال متسق بينما يجعل عكس العملية غير ممكن حسابيًا.

تشفير

تحول PII باستخدام تشفير AES-256-GCM بمفتاح يحتفظ به المستخدم، مما يمكّن من العكس المصرح به (إعادة التعريف) عند الحاجة.

أسئلة شائعة

ما الفرق بين التعقيم والتعريف المستعار؟

التعقيم يزيل بشكل غير قابل للعكس جميع المعلومات التعريفية بحيث يصبح إعادة التعريف مستحيلاً. التعريف المستعار يستبدل المعرفات بأخرى اصطناعية بينما يحتفظ بمفتاح منفصل يسمح بإعادة التعريف عند التصريح. بموجب GDPR، تظل البيانات المستعارة تعتبر بيانات شخصية.

لماذا تستخدم اكتشاف PII كل من معالجة اللغة الطبيعية ومكتشفات الأنماط؟

تكتشف نماذج معالجة اللغة الطبيعية الكيانات المعتمدة على السياق مثل أسماء الأشخاص والمواقع التي تفتقر إلى تنسيق ثابت. تستخدم مكتشفات الأنماط التعبيرات العادية لالتقاط المعرفات الهيكلية مثل أرقام الضمان الاجتماعي، وأرقام بطاقات الائتمان، وأرقام الهواتف. يجمع الجمع بين كلا النهجين أقصى دقة في الكشف عبر جميع أنواع الكيانات.

ما هو التشفير بدون معرفة ولماذا هو مهم؟

التشفير بدون معرفة يعني أنك فقط من يحتفظ بمفتاح فك التشفير - لا يمكن لمزود الخدمة قراءة بياناتك. هذا مهم لأنه حتى في حالة حدوث خرق للخادم، تظل بياناتك المشفرة غير قابلة للقراءة دون مفتاحك، مما يوفر أقوى حماية ممكنة للبيانات.

كيف يختلف التشفير القابل للعكس عن التجزئة؟

التجزئة هي تحويل من اتجاه واحد - بمجرد تجزئة البيانات، لا يمكن استرداد الأصل. يسمح التشفير القابل للعكس (باستخدام AES-256-GCM) للمستخدمين المصرح لهم الذين يمتلكون المفتاح الصحيح بفك التشفير واسترداد البيانات الأصلية، مما يمكّن من سير العمل حيث تكون إعادة التعريف مطلوبة.

احمِ البيانات الحساسة اليوم

ابدأ في تعقيم PII مع أكثر من 320 نوعًا من الكيانات، و48 لغة، وتشفير بدون معرفة.