מילון PII ופרטיות נתונים

הגדרות ברורות של מונחי פרטיות, ציות והגנה על נתונים בשימוש בתעשייה.

מונחי פרטיות וציות

מידע אישי מזוהה (PII)

כל נתון שיכול לזהות אדם ספציפי, כגון שמות, כתובות דוא"ל, מספרי ביטוח לאומי או מספרי טלפון.

אנונימיזציה

התהליך הבלתי הפיך של שינוי נתונים כך שלא ניתן יהיה לזהות אנשים, ישירות או בעקיפין.

פסודונימיזציה

החלפת נתונים מזוהים בזיהויים מלאכותיים (פסודונים) כך שהזיהוי מחדש דורש מפתח שנשמר בנפרד.

הסרת זיהוי

הסרת או הסתרת מזהים אישיים מנתונים כך שלא ניתן יהיה לקשרם יותר לאדם ספציפי ללא מידע נוסף.

נושא נתונים

אדם טבעי מזוהה או ניתן לזיהוי שפרטיו האישיים מעובדים על ידי מנהל או מעבד נתונים.

מנהל נתונים

הישות שקובעת את המטרות והאמצעים לעיבוד נתונים אישיים.

מעבד נתונים

ישות שמעבדת נתונים אישיים בשם מנהל נתונים, בהתאם להוראות המנהל.

הסכמה

הבעת הסכמה חופשית, ספציפית, מודעת וחד משמעית של נושא הנתונים לעיבוד פרטיו האישיים.

בסיס חוקי

עילה חוקית שבה מותר לעבד נתונים אישיים, כגון הסכמה, צורך חוזי, חובה חוקית או עניין לגיטימי.

מינימיזציה של נתונים

העיקרון שלפיו הנתונים האישיים שנאספים צריכים להיות מספקים, רלוונטיים ומוגבלים למה שנדרש למטרה המיועדת.

זכות למחיקה

זכותו של נושא הנתונים למחוק את פרטיו האישיים כאשר הם כבר אינם נחוצים, הידועה גם כ'זכות לשכוח' תחת GDPR.

ניידות נתונים

זכותם של נושאי הנתונים לקבל את פרטיהם האישיים בפורמט מובנה, בשימוש נפוץ, ולהעבירם למנהל אחר.

קצין הגנת נתונים (DPO)

אדם מיועד האחראי על פיקוח על אסטרטגיית הגנת הנתונים של הארגון והבטחת ציות לרגולציות פרטיות.

הערכת השפעת הגנת נתונים (DPIA)

תהליך לזיהוי ומזעור סיכוני הגנת נתונים של פרויקט, הנדרש תחת GDPR לפעילויות עיבוד בסיכון גבוה.

הפרת נתונים

אירוע אבטחה שבו נתונים אישיים נחשפים, משתנים או נהרסים ללא הרשאה.

Shadow AI

שימוש לא מורשה בכלי AI (ChatGPT, Copilot, Gemini) על ידי עובדים ללא אישור IT. Shadow AI הוא הגורם המוביל לדליפות נתונים PII, מכיוון שמשתמשים מדביקים נתונים עסקיים רגישים - רישומי לקוחות, מידע על מטופלים, נתונים פיננסיים - ישירות לתוך הנחיות בינה מלאכותית.

מזעור נתונים

עקרון GDPR (Art. 5(1)(c)) המחייב ארגונים לאסוף ולעבד רק את הנתונים האישיים המינימליים הדרושים למטרה מסוימת. במערכות בינה מלאכותית, מזעור נתונים פירושה אנונימיזציה או הסרה של PII לפני שהנתונים נכנסים לצינורות בינה מלאכותית, מה שמפחית את סיכוני התאימות ומשטח הפריצה.

מסגרות רגולטוריות

GDPR (תקנת הגנת המידע הכללית)

הרגולציה של האיחוד האירופי המפקחת על עיבוד נתונים אישיים של אנשים בתוך אזור הכלכלה האירופית, בתוקף מאז מאי 2018.

CCPA (חוק פרטיות הצרכן של קליפורניה)

חוק מדינתי בקליפורניה המעניק לצרכנים זכויות על המידע האישי שלהם שנאסף על ידי עסקים, בתוקף מאז ינואר 2020.

HIPAA (חוק ניידות ואחריות ביטוח בריאות)

חוק פדרלי אמריקאי הקובע סטנדרטים להגנה על מידע בריאות רגיש של מטופלים מפני גילוי ללא הסכמה.

ISO 27001

תקן בינלאומי עבור מערכות ניהול אבטחת מידע (ISMS), המפרט דרישות להקמה, יישום ושיפור מתמשך של בקרות אבטחה.

SOC 2 (בקרות מערכת וארגון 2)

מסגרת ביקורת עבור ארגוני שירות המעריכה בקרות הקשורות לאבטחה, זמינות, שלמות עיבוד, סודיות ופרטיות.

EU AI Act

תקנת האיחוד האירופי בנושא בינה מלאכותית (נאכפת מאוגוסט 2026). מערכות בינה מלאכותית בסיכון גבוה חייבות ליישם אמצעי ניהול נתונים, כולל מזעור נתונים אישיים, תיעוד ו-DPIA. ארגונים המשתמשים בבינה מלאכותית לצורך קבלת החלטות לגבי אנשים חייבים להבטיח שנתוני ההדרכה יהיו אנונימיים או בדויים.

ISO 42001

תקן בינלאומי למערכות ניהול בינה מלאכותית (AIMS), שפורסם בשנת 2023. מספק מסגרת לפיתוח ופריסה אחראית של בינה מלאכותית, כולל איכות נתונים, בקרות הטיה והגנת הפרטיות. לעתים קרובות משולב עם ISO 27001 עבור ארגונים המפעילים מערכות בינה מלאכותית עם נתונים אישיים.

הודו DPDP Act

חוק הגנת הנתונים האישיים הדיגיטליים של הודו (2023), נאכף משנת 2025. דורש הסכמה מפורשת לעיבוד נתונים אישיים של תושבי הודו, לוקליזציה של נתונים עבור נתונים רגישים והתראה על הפרה בתוך 72 שעות. חל על ארגונים ברחבי העולם המעבדים נתונים של אזרחים הודים.

מונחים טכניים

זיהוי ישות בשם (NER)

טכניקת NLP המזהה ומסווגת ישויות בשם בטקסט לקטגוריות מוגדרות מראש כגון שמות אנשים, מקומות וארגונים.

עיבוד שפה טבעית (NLP)

ענף של אינטליגנציה מלאכותית המאפשר למחשבים להבין, לפרש וליצור שפה אנושית.

מזהה תבניות

מגלה מבוסס חוקים המשתמש בביטויים רגולריים ורמזי הקשר כדי לזהות תבניות נתונים ספציפיות, כגון מספרי כרטיסי אשראי או מספרי ביטוח לאומי.

ציון ביטחון

ערך מספרי בין 0 ל-1 המצביע על כמה בטוח מנגנון הגילוי שהטקסט תואם לסוג ישות ספציפי.

ביטוי רגולרי (Regex)

רצף של תווים המגדיר תבנית חיפוש, בשימוש נפוץ לאימות ולזיהוי פורמטים של נתונים מובנים כמו מספרי טלפון או כתובות דוא"ל.

AES-256-GCM

אלגוריתם הצפנה מאומת המשתמש במפתח של 256 ביט עם מצב גאלואה/ספירה, המספק גם סודיות וגם אימות שלמות של נתונים מוצפנים.

הצפנה ללא ידע

ארכיטקטורת הצפנה שבה רק המשתמש מחזיק במפתח ההצפנה, כלומר גם ספק השירות אינו יכול לגשת לנתוני הטקסט הפשוט.

טוקניזציה

החלפת נתונים רגישים בטוקנים שאינם רגישים שניתן למפות חזרה לנתונים המקוריים באמצעות חיפוש מאובטח.

הסתרת נתונים

הסתרת נתונים ספציפיים בתוך מערך נתונים כך שהמידע הרגיש מוסתר בעוד שהנתונים נשארים ניתנים לשימוש לבדיקה או לניתוח.

מחיקה

הסרה קבועה של מידע רגיש ממסמך או מערך נתונים, והחלפתו בסימן כגון [REDACED].

נתונים סינתטיים

נתונים שנוצרו בינה מלאכותית המחקים באופן סטטיסטי נתונים אמיתיים מבלי להכיל רשומות ממשיות. בהשוואה לאנונימיזציה: נתונים אנונימיים משמרים דיוק אנליטי גבוה יותר עבור ML במורד הזרם; synthetic data eliminates re-identification risk but introduces statistical drift. אנונימיזציה הפיכה מועדפת כאשר ייתכן שיהיה צורך ברשומות מקוריות לצורך ביקורת ציות.

LLM הזרקה מהירה

טכניקת תקיפה שבה קלט זדוני מפעיל מודל שפה גדול כדי להתעלם מהוראות או להדליף מידע רגיש. בהקשרי הגנה על PII, הזרקה מהירה יכולה לגרום למודל AI לחשוף דפוסי נתונים אנונימיים או מידע משתמש. טרום אנונימיזציה של כניסות לפני שהן מגיעות ל-LLMs מקטינה את משטח ההתקפה.

פרטיות לפי עיצוב

עיקרון GDPR Art. 25 המחייב שהגנת נתונים תהיה מובנית במערכות מהיסוד במקום להוסיף כמחשבה שלאחר מכן. עבור מערכות בינה מלאכותית, פרטיות לפי עיצוב פירושה אנונימיזציה של נתונים לפני שהם נכנסים לצינורות בינה מלאכותית, הטמעת הצפנת אפס ידע וצמצום שמירת הנתונים.

שיטות אנונימיזציה

החלפה

מחזירה PII מזוהה עם מקום מחזיק גנרי של אותו סוג ישות, כגון החלפת 'ג'ון סמית' ב'<PERSON>'.

הסתרה

מסתירה חלקית PII על ידי החלפת תווים בסימני הסתרה, לדוגמה הפיכת '123-45-6789' ל'***-**-6789'.

מחיקה

מסירה מוחלטת של PII מזוהה מהטקסט, מבלי להשאיר עקבות של הערך המקורי.

האש

ממיר PII להאש קריפטוגרפי באורך קבוע, המאפשר החלפה עקבית תוך הפיכת ההיפוך לבלתי אפשרי מבחינה חישובית.

הצפנה

משנה PII באמצעות הצפנת AES-256-GCM עם מפתח הנמצא בידיו של המשתמש, ומאפשרת היפוך מורשה (דה-אנונימיזציה) כאשר יש צורך.

שאלות נפוצות

מה ההבדל בין אנונימיזציה לפסודונימיזציה?

אנונימיזציה מסירה באופן בלתי הפיך את כל המידע המזהה כך שהזיהוי מחדש אינו אפשרי. פסודונימיזציה מחליפה מזהים במזהים מלאכותיים תוך שמירה על מפתח נפרד המאפשר זיהוי מחדש כאשר הוא מורשה. תחת GDPR, נתונים פסודונימיים נחשבים עדיין לנתונים אישיים.

למה גילוי PII משתמש גם ב-NLP וגם במזהי תבניות?

מודלים של NLP מזהים ישויות תלויות הקשר כמו שמות אנשים ומיקומים שאין להם פורמט קבוע. מזהי תבניות משתמשים בביטויים רגולריים כדי לתפוס מזהים מובנים כמו מספרי ביטוח לאומי, מספרי כרטיסי אשראי ומספרי טלפון. שילוב של שתי הגישות מקסימלי את דיוק הגילוי בכל סוגי הישויות.

מהי הצפנה ללא ידע ולמה זה חשוב?

הצפנה ללא ידע פירושה שרק אתה מחזיק במפתח ההצפנה — ספק השירות אינו יכול לקרוא את הנתונים שלך. זה חשוב מכיוון שגם במקרה של פרצת שרת, הנתונים המוצפנים שלך נשארים בלתי ניתנים לקריאה ללא המפתח שלך, ומספקים את ההגנה החזקה ביותר על הנתונים.

איך הצפנה הפיכה שונה מהאש?

האש היא טרנספורמציה חד-כיוונית — לאחר שדאטה הומש, המקורי אינו יכול להתאושש. הצפנה הפיכה (באמצעות AES-256-GCM) מאפשרת למשתמשים מורשים עם המפתח הנכון לפענח ולהשיב את הנתונים המקוריים, ומאפשרת זרימות עבודה שבהן יש צורך בדה-אנונימיזציה.

הגן על נתונים רגישים היום

התחל לאנונימיזציה של PII עם 317 סוגי ישויות, 48 שפות והצפנה ללא ידע.