كيف يعمل cloak.business

اكتشاف PII باستخدام regex أولاً: 317 محدد نمط حتمي للبيانات المهيكلة (الهويات، أرقام الضرائب، بطاقات الائتمان)، بالإضافة إلى spaCy وStanza وXLM-RoBERTa NLP للأسماء والمواقع عبر 48 لغة.

Regex أولاً: لماذا هو مهم

نهجنا: Regex + NLP

  • 317 محدد نمط باستخدام regex: نتائج قابلة لإعادة الإنتاج 100% للبيانات المهيكلة
  • NLP للأسماء والمواقع مع درجات الثقة
  • قابلية تدقيق كاملة — كل اكتشاف يمكن تتبعه إلى نمط أو نموذج
  • شفافية: يمكنك دائمًا معرفة ما تم مطابقته ولماذا
  • أداء سريع وقابل للتنبؤ
  • 48 لغة عبر 3 محركات NLP

النهج المعتمدة على الذكاء الاصطناعي فقط

  • كل الاكتشافات احتمالية
  • لا يمكن شرح سبب تمييز شيء ما
  • يتطلب مجموعات بيانات تدريبية ضخمة
  • صعوبة التدقيق من أجل الامتثال
  • تكلفة حسابية أعلى (تحتاج GPU)
  • انحراف النموذج يقلل الدقة مع الوقت

عملية من 10 خطوات

من الإدخال إلى الإخراج، إليك ما يحدث لوثيقتك بالضبط

1

إدخال النص

أرسل وثيقتك عبر واجهة الويب أو API أو إضافة Office

2

كشف اللغة

النظام يحدد لغة الوثيقة للمعالجة المثلى

3

تجزئة النص

يتم تقسيم النص إلى وحدات (tokens) لمطابقة الأنماط

4

مطابقة الأنماط

317 محدد نمط باستخدام regex ونماذج NLP تبحث عن أكثر من 320 نوع كيان في أكثر من 70 دولة

5

تحليل السياق

النص المحيط يحسن دقة الاكتشاف

6

تقييم الثقة

كل اكتشاف يحصل على درجة ثقة (0.0–1.0) لتمكين قرارات المراجعة البشرية

7

تصنيف الكيانات

يتم تصنيف العناصر المكتشفة حسب النوع

8

مراجعة بشرية

راجع جميع الاكتشافات، وتجاوز الإيجابيات الكاذبة، ووافق قبل إخفاء الهوية

9

تطبيق إخفاء الهوية

اختر طريقتك: استبدال، إخفاء، تجزئة، تشفير، أو تمويه

10

إخراج الوثيقة

قم بتنزيل وثيقتك بعد إخفاء الهوية

خادم MCP: تكامل الذكاء الاصطناعي مع الخصوصية أولاً

كيف تتدفق بياناتك عبر خادم MCP للحفاظ على أمان أدوات الذكاء الاصطناعي

يعمل خادم MCP كدرع خصوصية، يعترض طلبات أدوات الذكاء الاصطناعي، يخفي PII، يعالج البيانات الآمنة عبر الذكاء الاصطناعي، ويعيد القيم الأصلية اختياريًا.

طلب أداة الذكاء الاصطناعي

ترسل أداة الذكاء الاصطناعي الخاصة بك (Cursor, Claude) طلبًا يحتوي على PII

اعتراض خادم MCP

الخادم يحلل ويكتشف جميع كيانات PII

إخفاء الهوية

يتم استبدال PII برموز أو إخفاؤها

معالجة الذكاء الاصطناعي

يتلقى الذكاء الاصطناعي ويعالج فقط البيانات المخفية

إرجاع الاستجابة

تعود استجابة الذكاء الاصطناعي عبر خادم MCP

إزالة الترميز

اختياري: استعادة القيم الأصلية للمستخدم

الأسئلة الشائعة

هل يستخدم cloak.business الذكاء الاصطناعي للاكتشاف؟

لا. الاكتشاف يعتمد على أنماط regex الحتمية ونماذج NLP (spaCy, Stanza). هذا يضمن نتائج قابلة لإعادة الإنتاج 100% — نفس الإدخال يعطي نفس الإخراج دائمًا، على عكس النهج الاحتمالية للذكاء الاصطناعي.

لماذا أنماط regex بدلاً من الذكاء الاصطناعي؟

أنماط regex قابلة للتدقيق، وقابلة لإعادة الإنتاج، ومتوافقة. يمكنك فحص ما يطابقه كل نمط بالضبط. الاكتشاف المعتمد على الذكاء الاصطناعي غير حتمي — النتائج قد تختلف بين كل تشغيل، مما يصعب توثيق الامتثال.

ما مدى دقة الاكتشاف؟

مع 317 محدد نمط مخصص تشمل تحقق الشيك الرقمي (Luhn, IBAN, SSN)، يحقق cloak.business دقة أعلى بكثير من نماذج NER العامة، خاصة للمعرفات المهيكلة مثل بطاقات الائتمان وأرقام الضرائب والهويات الوطنية.

ما هي اللغات المدعومة؟

يدعم 48 لغة مع نماذج NLP مخصصة للتعرف على الكيانات المسماة. الاكتشاف المعتمد على الأنماط (regex) يعمل عبر جميع اللغات لأنه يطابق أنماط الحروف بغض النظر عن اللغة.

هل يمكنني إضافة أنماط كيانات مخصصة؟

نعم. يدعم API تعريف محددات مخصصة بحيث يمكنك إضافة أنماط لمعرفات خاصة أو أرقام مرجعية داخلية أو صيغ بيانات خاصة بالمجال.

شاهد التطبيق عمليًا

جرّب اكتشاف وإخفاء PII مجانًا مع 200 رمز في كل دورة.