كيف يعمل cloak.business | اكتشاف PII باستخدام Regex أولاً

اكتشاف PII باستخدام regex أولاً: 317 محدد نمط حتمي للبيانات المهيكلة (الهويات، أرقام الضرائب، بطاقات الائتمان)، بالإضافة إلى spaCy وStanza وXLM-RoBERTa NLP للأسماء والمواقع عبر 48 لغة.

جرّبه مجانًا التوثيق الفني

Regex أولاً: لماذا هو مهم

نهجنا: Regex + NLP

317 محدد نمط باستخدام regex: نتائج قابلة لإعادة الإنتاج 100% للبيانات المهيكلة
NLP للأسماء والمواقع مع درجات الثقة
قابلية تدقيق كاملة — كل اكتشاف يمكن تتبعه إلى نمط أو نموذج
شفافية: يمكنك دائمًا معرفة ما تم مطابقته ولماذا
أداء سريع وقابل للتنبؤ
48 لغة عبر 3 محركات NLP

النهج المعتمدة على الذكاء الاصطناعي فقط

كل الاكتشافات احتمالية
لا يمكن شرح سبب تمييز شيء ما
يتطلب مجموعات بيانات تدريبية ضخمة
صعوبة التدقيق من أجل الامتثال
تكلفة حسابية أعلى (تحتاج GPU)
انحراف النموذج يقلل الدقة مع الوقت

عملية من 10 خطوات

من الإدخال إلى الإخراج، إليك ما يحدث لوثيقتك بالضبط

إدخال النص

أرسل وثيقتك عبر واجهة الويب أو API أو إضافة Office

كشف اللغة

النظام يحدد لغة الوثيقة للمعالجة المثلى

تجزئة النص

يتم تقسيم النص إلى وحدات (tokens) لمطابقة الأنماط

مطابقة الأنماط

317 محدد نمط باستخدام regex ونماذج NLP تبحث عن 317 نوع كيان في أكثر من 70 دولة

تحليل السياق

النص المحيط يحسن دقة الاكتشاف

تقييم الثقة

كل اكتشاف يحصل على درجة ثقة (0.0–1.0) لتمكين قرارات المراجعة البشرية

تصنيف الكيانات

يتم تصنيف العناصر المكتشفة حسب النوع

مراجعة بشرية

راجع جميع الاكتشافات، وتجاوز الإيجابيات الكاذبة، ووافق قبل إخفاء الهوية

تطبيق إخفاء الهوية

اختر طريقتك: استبدال، إخفاء، تجزئة، تشفير، أو تمويه

إخراج الوثيقة

قم بتنزيل وثيقتك بعد إخفاء الهوية

خادم MCP: تكامل الذكاء الاصطناعي مع الخصوصية أولاً

كيف تتدفق بياناتك عبر خادم MCP للحفاظ على أمان أدوات الذكاء الاصطناعي

يعمل خادم MCP كدرع خصوصية، يعترض طلبات أدوات الذكاء الاصطناعي، يخفي PII، يعالج البيانات الآمنة عبر الذكاء الاصطناعي، ويعيد القيم الأصلية اختياريًا.

طلب أداة الذكاء الاصطناعي

ترسل أداة الذكاء الاصطناعي الخاصة بك (Cursor, Claude) طلبًا يحتوي على PII

اعتراض خادم MCP

الخادم يحلل ويكتشف جميع كيانات PII

إخفاء الهوية

يتم استبدال PII برموز أو إخفاؤها

معالجة الذكاء الاصطناعي

يتلقى الذكاء الاصطناعي ويعالج فقط البيانات المخفية

إرجاع الاستجابة

تعود استجابة الذكاء الاصطناعي عبر خادم MCP

إزالة الترميز

اختياري: استعادة القيم الأصلية للمستخدم

تعرف على المزيد حول خادم MCP →

استكشف المزيد

التقنية

تعرف بعمق على اكتشاف regex أولاً ولماذا هو أفضل للامتثال

البنية

بنية النظام وكيفية عمل المكونات معًا

الأمان

خمس طبقات أمان تحمي بياناتك في كل خطوة

الأسئلة الشائعة

هل يستخدم cloak.business الذكاء الاصطناعي للاكتشاف؟

لا. الاكتشاف يعتمد على أنماط regex الحتمية ونماذج NLP (spaCy, Stanza). هذا يضمن نتائج قابلة لإعادة الإنتاج 100% — نفس الإدخال يعطي نفس الإخراج دائمًا، على عكس النهج الاحتمالية للذكاء الاصطناعي.

لماذا أنماط regex بدلاً من الذكاء الاصطناعي؟

أنماط regex قابلة للتدقيق، وقابلة لإعادة الإنتاج، ومتوافقة. يمكنك فحص ما يطابقه كل نمط بالضبط. الاكتشاف المعتمد على الذكاء الاصطناعي غير حتمي — النتائج قد تختلف بين كل تشغيل، مما يصعب توثيق الامتثال.

ما مدى دقة الاكتشاف؟

مع 317 محدد نمط مخصص تشمل تحقق الشيك الرقمي (Luhn, IBAN, SSN)، يحقق cloak.business دقة أعلى بكثير من نماذج NER العامة، خاصة للمعرفات المهيكلة مثل بطاقات الائتمان وأرقام الضرائب والهويات الوطنية.

ما هي اللغات المدعومة؟

يدعم 48 لغة مع نماذج NLP مخصصة للتعرف على الكيانات المسماة. الاكتشاف المعتمد على الأنماط (regex) يعمل عبر جميع اللغات لأنه يطابق أنماط الحروف بغض النظر عن اللغة.

هل يمكنني إضافة أنماط كيانات مخصصة؟

نعم. يدعم API تعريف محددات مخصصة بحيث يمكنك إضافة أنماط لمعرفات خاصة أو أرقام مرجعية داخلية أو صيغ بيانات خاصة بالمجال.

شاهد التطبيق عمليًا

جرّب اكتشاف وإخفاء PII مجانًا مع 200 رمز في كل دورة.