كشف PII: 320+ نوع من الكيانات

يجمع محرك الكشف لدينا بين 317 من أدوات التعرف على الأنماط المخصصة مع نماذج NLP لتحديد أكثر من 320 نوعًا من المعلومات الشخصية عبر أكثر من 70 دولة. نفس المدخلات، نفس المخرجات - في كل مرة.

كيف يعمل الكشف

مطابقة الأنماط باستخدام Regex (PII المهيكلة)

317 من أدوات التعرف على الأنماط المخصصة باستخدام أنماط regex تكتشف البيانات المهيكلة مثل الهويات الوطنية، أرقام الضرائب، جوازات السفر، ورخص القيادة. كل نمط يستخدم تأكيدات الحدود لمنع المطابقات الخاطئة في الأكواد أو البيانات المهيكلة.

التعرف على الكيانات المسماة باستخدام NLP (الأسماء والمواقع)

spaCy (25 لغة)، NER من Stanza (7 لغات)، ومحولات XLM-RoBERTa (16 لغة) تكتشف PII غير المهيكلة مثل أسماء الأشخاص، المواقع، والمنظمات التي لا يمكن التقاطها بواسطة regex فقط. جميع النماذج تعمل على خوادمنا في ألمانيا — لا يتم إرسال أي بيانات إلى Meta أو Google أو Stanford أو أي طرف ثالث.

تسجيل الثقة

يشمل كل كشف درجة ثقة (0.0–1.0) للقرارات البشرية في الحلقة. الأشكال المحددة للغاية (مثل IBAN الألماني DE89 3704 0044 0532 0130 00) تسجل 0.85+، بينما الأنماط الرقمية العامة تسجل 0.3–0.5 وتعتمد على كلمات السياق للتأكيد. يمكن لفِرق الامتثال مراجعة وتجاوز الاكتشافات قبل إخفاء الهوية.

تحليل كلمات السياق

كل أداة تعرف لديها كلمات سياق في اللغة ذات الصلة (مثل 'Personalausweis' للهويات الألمانية، 'kitambulisho' للهويات الكينية). عندما تظهر كلمات السياق بالقرب من مطابقة، يتم تعزيز درجة الثقة.

أنواع الكيانات المدعومة

تغطية شاملة لأنواع المعلومات الشخصية عبر الفئات

المعرفات الشخصية

  • أسماء الأشخاص
  • عناوين البريد الإلكتروني
  • أرقام الهواتف
  • تاريخ الميلاد
  • العمر
  • الجنس
  • الجنسية

المعلومات المالية

  • أرقام بطاقات الائتمان
  • IBAN
  • BIC/SWIFT
  • أرقام الحسابات البنكية
  • أرقام الضرائب
  • أرقام ضريبة القيمة المضافة

الهويات الحكومية

  • أرقام الضمان الاجتماعي (SSN)
  • أرقام الهوية الوطنية
  • أرقام جوازات السفر
  • رخص القيادة
  • أرقام التأمين الصحي

بيانات الموقع

  • عناوين الشوارع
  • المدن
  • الرموز البريدية/الرموز البريدية
  • الدول
  • إحداثيات GPS

المعرفات الرقمية

  • عناوين IP (v4/v6)
  • عناوين MAC
  • عناوين URL
  • أسماء النطاقات
  • معرفات المستخدم

بيانات المنظمة

  • أسماء الشركات
  • معرفات المنظمة
  • أرقام التسجيل
  • أسماء الأقسام

البيانات الزمنية

  • التواريخ
  • الأوقات
  • نطاقات التواريخ
  • الطوابع الزمنية

الصيغ الدولية

  • الهوية الألمانية (Personalausweis)
  • التأمين الوطني في المملكة المتحدة
  • DNI/NIE الإسباني
  • الرمز الضريبي الإيطالي
  • و70+ صيغة أخرى خاصة بالدول

دعم الكيانات المخصصة

تحتاج إلى اكتشاف أنماط مخصصة؟ أنشئ أنواع الكيانات الخاصة بك باستخدام أنماط regex أو استخدم مولد الأنماط المدعوم بالذكاء الاصطناعي الخاص بنا.

إنشاء الأنماط يدويًا

حدد أنماط regex للمعرفات الخاصة مثل معرفات الموظفين الداخلية، رموز المشاريع، أو أرقام المرجع المخصصة.

مولد الأنماط المدعوم بالذكاء الاصطناعي

وصف ما تريد اكتشافه بلغة بسيطة، وسيقوم الذكاء الاصطناعي الخاص بنا بإنشاء أنماط regex محسنة لك.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

ابدأ في كشف PII اليوم

جرب محرك الكشف الخاص بنا مجانًا مع 200 رمز لكل دورة. لا حاجة لبطاقة ائتمان.