نحوه کار cloak.business

شناسایی PII مبتنی بر Regex: ۳۱۷ شناساگر الگوی قطعی برای داده‌های ساختاریافته (شناسه‌ها، شماره‌های مالیاتی، کارت‌های اعتباری)، به‌علاوه spaCy، Stanza و XLM-RoBERTa NLP برای نام‌ها و مکان‌ها در ۴۸ زبان.

مبتنی بر Regex: چرا اهمیت دارد

رویکرد ما: Regex + NLP

  • ۳۱۷ شناساگر regex: ۱۰۰٪ قابل تکرار برای داده‌های ساختاریافته
  • NLP برای نام‌ها و مکان‌ها با امتیاز اطمینان
  • کاملاً قابل ممیزی — هر شناسایی قابل ردیابی به الگو یا مدل
  • شفاف: همیشه می‌دانید چه چیزی و چرا شناسایی شده است
  • عملکرد سریع و قابل پیش‌بینی
  • ۴۸ زبان با ۳ موتور NLP

رویکردهای صرفاً هوش مصنوعی

  • همه شناسایی‌ها احتمالی هستند
  • دلیل پرچم‌گذاری قابل توضیح نیست
  • نیاز به مجموعه داده‌های آموزشی بزرگ
  • ممیزی برای تطابق دشوار است
  • هزینه پردازش بالاتر (نیاز به GPU)
  • انحراف مدل باعث کاهش دقت در طول زمان می‌شود

فرآیند ۱۰ مرحله‌ای

از ورودی تا خروجی، دقیقاً چه اتفاقی برای سند شما می‌افتد

1

متن ورودی

ارسال سند از طریق رابط وب، API یا افزونه Office

2

شناسایی زبان

سیستم زبان سند را برای پردازش بهینه تشخیص می‌دهد

3

توکنیزاسیون

متن به توکن‌ها تقسیم می‌شود تا تطبیق الگو انجام شود

4

تطبیق الگو

۳۱۷ شناساگر regex و مدل‌های NLP بیش از ۳۲۰ نوع موجودیت را در بیش از ۷۰ کشور اسکن می‌کنند

5

تحلیل زمینه

متن اطراف باعث افزایش دقت شناسایی می‌شود

6

امتیازدهی اطمینان

هر شناسایی یک امتیاز اطمینان (۰.۰ تا ۱.۰) دریافت می‌کند تا تصمیم‌گیری انسانی امکان‌پذیر باشد

7

طبقه‌بندی موجودیت

موارد شناسایی شده بر اساس نوع دسته‌بندی می‌شوند

8

بازبینی انسانی

همه شناسایی‌ها را بازبینی کنید، مثبت‌های کاذب را اصلاح کنید و پیش از ناشناس‌سازی تأیید نمایید

9

اعمال ناشناس‌سازی

روش خود را انتخاب کنید: جایگزینی، حذف، هش، رمزنگاری یا ماسک

10

سند خروجی

سند ناشناس‌شده خود را دانلود کنید

سرور MCP: یکپارچه‌سازی AI با محوریت حریم خصوصی

جریان داده شما از طریق سرور MCP برای ایمن‌سازی ابزارهای AI

سرور MCP به عنوان یک سپر حریم خصوصی عمل می‌کند، درخواست‌های ابزارهای AI را رهگیری کرده، PII را ناشناس می‌سازد، داده ایمن را به AI ارسال می‌کند و در صورت نیاز مقادیر اصلی را بازمی‌گرداند.

درخواست ابزار AI

ابزار AI شما (Cursor، Claude) درخواستی حاوی PII ارسال می‌کند

رهگیری توسط سرور MCP

سرور همه موجودیت‌های PII را تحلیل و شناسایی می‌کند

ناشناس‌سازی

PII با توکن جایگزین یا حذف می‌شود

پردازش AI

AI فقط داده‌های ناشناس‌شده را دریافت و پردازش می‌کند

بازگشت پاسخ

پاسخ AI از طریق سرور MCP بازمی‌گردد

بازگردانی توکن

اختیاری: مقادیر اصلی برای کاربر بازگردانده می‌شود

پرسش‌های متداول

آیا cloak.business برای شناسایی از AI استفاده می‌کند؟

خیر. شناسایی با الگوهای قطعی regex و مدل‌های NLP (spaCy، Stanza) انجام می‌شود. این کار نتایج ۱۰۰٪ قابل تکرار را تضمین می‌کند — همان ورودی همیشه همان خروجی را تولید می‌کند، برخلاف رویکردهای احتمالی AI.

چرا الگوهای regex به جای AI؟

الگوهای regex قابل ممیزی، تکرارپذیر و مطابق با مقررات هستند. شما دقیقاً می‌توانید ببینید هر الگو چه چیزی را شناسایی می‌کند. شناسایی مبتنی بر AI غیرقطعی است — نتایج بین اجراها متفاوت است و مستندسازی برای تطابق را دشوار می‌کند.

دقت شناسایی چقدر است؟

با ۳۱۷ شناساگر الگوی سفارشی شامل اعتبارسنجی چکسام (Luhn، IBAN، SSN)، cloak.business دقتی به مراتب بالاتر از مدل‌های NER عمومی، به ویژه برای شناسه‌های ساختاریافته مانند کارت اعتباری، شناسه مالیاتی و شماره ملی ارائه می‌دهد.

کدام زبان‌ها پشتیبانی می‌شوند؟

۴۸ زبان با مدل‌های NLP اختصاصی برای شناسایی موجودیت نامدار پشتیبانی می‌شوند. شناسایی مبتنی بر الگو (regex) در همه زبان‌ها کار می‌کند زیرا تطبیق الگوی کاراکتری مستقل از زبان است.

آیا می‌توانم الگوهای موجودیت سفارشی اضافه کنم؟

بله. API از تعریف شناساگر سفارشی پشتیبانی می‌کند تا بتوانید برای شناسه‌های اختصاصی، شماره‌های مرجع داخلی یا فرمت‌های داده خاص حوزه خود الگو اضافه کنید.

مشاهده عملکرد

شناسایی و ناشناس‌سازی PII را رایگان با ۲۰۰ توکن در هر چرخه امتحان کنید.