مبتنی بر Regex: چرا اهمیت دارد
رویکرد ما: Regex + NLP
- ۳۱۷ شناساگر regex: ۱۰۰٪ قابل تکرار برای دادههای ساختاریافته
- NLP برای نامها و مکانها با امتیاز اطمینان
- کاملاً قابل ممیزی — هر شناسایی قابل ردیابی به الگو یا مدل
- شفاف: همیشه میدانید چه چیزی و چرا شناسایی شده است
- عملکرد سریع و قابل پیشبینی
- ۴۸ زبان با ۳ موتور NLP
رویکردهای صرفاً هوش مصنوعی
- همه شناساییها احتمالی هستند
- دلیل پرچمگذاری قابل توضیح نیست
- نیاز به مجموعه دادههای آموزشی بزرگ
- ممیزی برای تطابق دشوار است
- هزینه پردازش بالاتر (نیاز به GPU)
- انحراف مدل باعث کاهش دقت در طول زمان میشود
فرآیند ۱۰ مرحلهای
از ورودی تا خروجی، دقیقاً چه اتفاقی برای سند شما میافتد
متن ورودی
ارسال سند از طریق رابط وب، API یا افزونه Office
شناسایی زبان
سیستم زبان سند را برای پردازش بهینه تشخیص میدهد
توکنیزاسیون
متن به توکنها تقسیم میشود تا تطبیق الگو انجام شود
تطبیق الگو
۳۱۷ شناساگر regex و مدلهای NLP بیش از ۳۲۰ نوع موجودیت را در بیش از ۷۰ کشور اسکن میکنند
تحلیل زمینه
متن اطراف باعث افزایش دقت شناسایی میشود
امتیازدهی اطمینان
هر شناسایی یک امتیاز اطمینان (۰.۰ تا ۱.۰) دریافت میکند تا تصمیمگیری انسانی امکانپذیر باشد
طبقهبندی موجودیت
موارد شناسایی شده بر اساس نوع دستهبندی میشوند
بازبینی انسانی
همه شناساییها را بازبینی کنید، مثبتهای کاذب را اصلاح کنید و پیش از ناشناسسازی تأیید نمایید
اعمال ناشناسسازی
روش خود را انتخاب کنید: جایگزینی، حذف، هش، رمزنگاری یا ماسک
سند خروجی
سند ناشناسشده خود را دانلود کنید
سرور MCP: یکپارچهسازی AI با محوریت حریم خصوصی
جریان داده شما از طریق سرور MCP برای ایمنسازی ابزارهای AI
سرور MCP به عنوان یک سپر حریم خصوصی عمل میکند، درخواستهای ابزارهای AI را رهگیری کرده، PII را ناشناس میسازد، داده ایمن را به AI ارسال میکند و در صورت نیاز مقادیر اصلی را بازمیگرداند.
درخواست ابزار AI
ابزار AI شما (Cursor، Claude) درخواستی حاوی PII ارسال میکند
رهگیری توسط سرور MCP
سرور همه موجودیتهای PII را تحلیل و شناسایی میکند
ناشناسسازی
PII با توکن جایگزین یا حذف میشود
پردازش AI
AI فقط دادههای ناشناسشده را دریافت و پردازش میکند
بازگشت پاسخ
پاسخ AI از طریق سرور MCP بازمیگردد
بازگردانی توکن
اختیاری: مقادیر اصلی برای کاربر بازگردانده میشود
پرسشهای متداول
آیا cloak.business برای شناسایی از AI استفاده میکند؟
خیر. شناسایی با الگوهای قطعی regex و مدلهای NLP (spaCy، Stanza) انجام میشود. این کار نتایج ۱۰۰٪ قابل تکرار را تضمین میکند — همان ورودی همیشه همان خروجی را تولید میکند، برخلاف رویکردهای احتمالی AI.
چرا الگوهای regex به جای AI؟
الگوهای regex قابل ممیزی، تکرارپذیر و مطابق با مقررات هستند. شما دقیقاً میتوانید ببینید هر الگو چه چیزی را شناسایی میکند. شناسایی مبتنی بر AI غیرقطعی است — نتایج بین اجراها متفاوت است و مستندسازی برای تطابق را دشوار میکند.
دقت شناسایی چقدر است؟
با ۳۱۷ شناساگر الگوی سفارشی شامل اعتبارسنجی چکسام (Luhn، IBAN، SSN)، cloak.business دقتی به مراتب بالاتر از مدلهای NER عمومی، به ویژه برای شناسههای ساختاریافته مانند کارت اعتباری، شناسه مالیاتی و شماره ملی ارائه میدهد.
کدام زبانها پشتیبانی میشوند؟
۴۸ زبان با مدلهای NLP اختصاصی برای شناسایی موجودیت نامدار پشتیبانی میشوند. شناسایی مبتنی بر الگو (regex) در همه زبانها کار میکند زیرا تطبیق الگوی کاراکتری مستقل از زبان است.
آیا میتوانم الگوهای موجودیت سفارشی اضافه کنم؟
بله. API از تعریف شناساگر سفارشی پشتیبانی میکند تا بتوانید برای شناسههای اختصاصی، شمارههای مرجع داخلی یا فرمتهای داده خاص حوزه خود الگو اضافه کنید.