Regex أولاً: لماذا هو مهم
نهجنا: Regex + NLP
- 317 محدد نمط باستخدام regex: نتائج قابلة لإعادة الإنتاج 100% للبيانات المهيكلة
- NLP للأسماء والمواقع مع درجات الثقة
- قابلية تدقيق كاملة — كل اكتشاف يمكن تتبعه إلى نمط أو نموذج
- شفافية: يمكنك دائمًا معرفة ما تم مطابقته ولماذا
- أداء سريع وقابل للتنبؤ
- 48 لغة عبر 3 محركات NLP
النهج المعتمدة على الذكاء الاصطناعي فقط
- كل الاكتشافات احتمالية
- لا يمكن شرح سبب تمييز شيء ما
- يتطلب مجموعات بيانات تدريبية ضخمة
- صعوبة التدقيق من أجل الامتثال
- تكلفة حسابية أعلى (تحتاج GPU)
- انحراف النموذج يقلل الدقة مع الوقت
عملية من 10 خطوات
من الإدخال إلى الإخراج، إليك ما يحدث لوثيقتك بالضبط
إدخال النص
أرسل وثيقتك عبر واجهة الويب أو API أو إضافة Office
كشف اللغة
النظام يحدد لغة الوثيقة للمعالجة المثلى
تجزئة النص
يتم تقسيم النص إلى وحدات (tokens) لمطابقة الأنماط
مطابقة الأنماط
317 محدد نمط باستخدام regex ونماذج NLP تبحث عن أكثر من 320 نوع كيان في أكثر من 70 دولة
تحليل السياق
النص المحيط يحسن دقة الاكتشاف
تقييم الثقة
كل اكتشاف يحصل على درجة ثقة (0.0–1.0) لتمكين قرارات المراجعة البشرية
تصنيف الكيانات
يتم تصنيف العناصر المكتشفة حسب النوع
مراجعة بشرية
راجع جميع الاكتشافات، وتجاوز الإيجابيات الكاذبة، ووافق قبل إخفاء الهوية
تطبيق إخفاء الهوية
اختر طريقتك: استبدال، إخفاء، تجزئة، تشفير، أو تمويه
إخراج الوثيقة
قم بتنزيل وثيقتك بعد إخفاء الهوية
خادم MCP: تكامل الذكاء الاصطناعي مع الخصوصية أولاً
كيف تتدفق بياناتك عبر خادم MCP للحفاظ على أمان أدوات الذكاء الاصطناعي
يعمل خادم MCP كدرع خصوصية، يعترض طلبات أدوات الذكاء الاصطناعي، يخفي PII، يعالج البيانات الآمنة عبر الذكاء الاصطناعي، ويعيد القيم الأصلية اختياريًا.
طلب أداة الذكاء الاصطناعي
ترسل أداة الذكاء الاصطناعي الخاصة بك (Cursor, Claude) طلبًا يحتوي على PII
اعتراض خادم MCP
الخادم يحلل ويكتشف جميع كيانات PII
إخفاء الهوية
يتم استبدال PII برموز أو إخفاؤها
معالجة الذكاء الاصطناعي
يتلقى الذكاء الاصطناعي ويعالج فقط البيانات المخفية
إرجاع الاستجابة
تعود استجابة الذكاء الاصطناعي عبر خادم MCP
إزالة الترميز
اختياري: استعادة القيم الأصلية للمستخدم
الأسئلة الشائعة
هل يستخدم cloak.business الذكاء الاصطناعي للاكتشاف؟
لا. الاكتشاف يعتمد على أنماط regex الحتمية ونماذج NLP (spaCy, Stanza). هذا يضمن نتائج قابلة لإعادة الإنتاج 100% — نفس الإدخال يعطي نفس الإخراج دائمًا، على عكس النهج الاحتمالية للذكاء الاصطناعي.
لماذا أنماط regex بدلاً من الذكاء الاصطناعي؟
أنماط regex قابلة للتدقيق، وقابلة لإعادة الإنتاج، ومتوافقة. يمكنك فحص ما يطابقه كل نمط بالضبط. الاكتشاف المعتمد على الذكاء الاصطناعي غير حتمي — النتائج قد تختلف بين كل تشغيل، مما يصعب توثيق الامتثال.
ما مدى دقة الاكتشاف؟
مع 317 محدد نمط مخصص تشمل تحقق الشيك الرقمي (Luhn, IBAN, SSN)، يحقق cloak.business دقة أعلى بكثير من نماذج NER العامة، خاصة للمعرفات المهيكلة مثل بطاقات الائتمان وأرقام الضرائب والهويات الوطنية.
ما هي اللغات المدعومة؟
يدعم 48 لغة مع نماذج NLP مخصصة للتعرف على الكيانات المسماة. الاكتشاف المعتمد على الأنماط (regex) يعمل عبر جميع اللغات لأنه يطابق أنماط الحروف بغض النظر عن اللغة.
هل يمكنني إضافة أنماط كيانات مخصصة؟
نعم. يدعم API تعريف محددات مخصصة بحيث يمكنك إضافة أنماط لمعرفات خاصة أو أرقام مرجعية داخلية أو صيغ بيانات خاصة بالمجال.