כיצד הזיהוי עובד
התאמת תבניות Regex (PII מובנה)
317 מזהי תבניות מותאמים אישית עם תבניות regex מזהים נתונים מובנים כמו תעודות זהות לאומיות, מספרי מס, דרכונים ורישיונות נהיגה. כל תבנית משתמשת בהצהרות גבול כדי למנוע התאמות שגויות בקוד או בנתונים מובנים.
זיהוי ישויות בשמות NLP (שמות ומיקומים)
spaCy (25 שפות), Stanza NER (7 שפות), ו-XLM-RoBERTa transformers (16 שפות) מזהים PII לא מובנה כמו שמות אנשים, מיקומים וארגונים שלא ניתן ללכוד על ידי regex בלבד. כל המודלים פועלים על השרתים שלנו בגרמניה — אין נתונים שנשלחים ל-Meta, Google, Stanford או כל צד שלישי.
ניקוד ביטחון
כל זיהוי כולל ניקוד ביטחון (0.0–1.0) להחלטות עם מעורבות אנושית. פורמטים מאוד ספציפיים (למשל, IBAN גרמני DE89 3704 0044 0532 0130 00) מקבלים ניקוד של 0.85+, בעוד שתבניות ספרות גנריות מקבלות ניקוד של 0.3–0.5 ותלויות במילות הקשר לאישור. צוותי תאימות יכולים לסקור ולבטל זיהויים לפני אנונימיזציה.
ניתוח מילים בהקשר
לכל מזהה יש מילים בהקשר בשפה הרלוונטית (למשל, 'Personalausweis' לתעודות זהות גרמניות, 'kitambulisho' לתעודות זהות קנייתיות). כאשר מילים בהקשר מופיעות ליד התאמה, ניקוד הביטחון מוגבר.
סוגי ישויות נתמכים
כיסוי מקיף של סוגי מידע אישי לפי קטגוריות
מזהים אישיים
- שמות אנשים
- כתובות דוא"ל
- מספרי טלפון
- תאריך לידה
- גיל
- מין
- לאום
מידע פיננסי
- מספרי כרטיסי אשראי
- IBAN
- BIC/SWIFT
- מספרי חשבון בנק
- מספרי מס
- מספרי מע"מ
תעודות זהות ממשלתיות
- מספרי ביטוח לאומי (SSN)
- מספרי תעודת זהות לאומית
- מספרי דרכון
- רישיון נהיגה
- מספרי ביטוח בריאות
נתוני מיקום
- כתובות רחוב
- ערים
- מיקודים/קודי דואר
- מדינות
- קואורדינטות GPS
מזהים דיגיטליים
- כתובות IP (v4/v6)
- כתובות MAC
- כתובות URL
- שמות דומיין
- מזהי משתמש
נתוני ארגון
- שמות חברות
- מזהי ארגון
- מספרי רישום
- שמות מחלקות
נתונים זמניים
- תאריכים
- שעות
- טווחי תאריכים
- חותמות זמן
פורמטים בינלאומיים
- תעודת זהות גרמנית (Personalausweis)
- ביטוח לאומי בריטי
- ספרדי DNI/NIE
- קוד פיסקלי איטלקי
- ועוד 70+ פורמטים ספציפיים למדינות
תמיכה בישויות מותאמות אישית
צריך לזהות תבניות מותאמות אישית? צור סוגי ישויות משלך עם תבניות regex או השתמש במחולל התבניות המונחה AI שלנו.
יצירת תבניות ידנית
הגדר תבניות regex למזהים קנייניים כמו מזהי עובדים פנימיים, קודי פרויקטים או מספרי ייחוס מותאמים אישית.
מחולל תבניות AI
תאר מה אתה רוצה לזהות בשפה פשוטה, וה-AI שלנו יוצר עבורך תבניות regex אופטימליות.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient