نحوه عملکرد تشخیص
تطبیق الگوی Regex (PII ساختاریافته)
317 تشخیصگر الگوی سفارشی با الگوهای regex دادههای ساختاریافته مانند شناسههای ملی، شمارههای مالیاتی، گذرنامهها و گواهینامههای رانندگی را تشخیص میدهند. هر الگو از اظهارات مرزی برای جلوگیری از تطابقهای نادرست در کد یا دادههای ساختاریافته استفاده میکند.
تشخیص موجودیت نامگذاری شده NLP (نامها و مکانها)
spaCy (25 زبان)، NER Stanza (7 زبان) و ترانسفورمرهای XLM-RoBERTa (16 زبان) PII غیرساختاریافته مانند نامهای افراد، مکانها و سازمانها را که نمیتوانند تنها با regex شناسایی شوند، تشخیص میدهند. همه مدلها بر روی سرورهای خودمان در آلمان اجرا میشوند - هیچ دادهای هرگز به Meta، Google، Stanford یا هیچ شخص ثالثی ارسال نمیشود.
امتیازدهی به اطمینان
هر تشخیص شامل یک امتیاز اطمینان (0.0–1.0) برای تصمیمگیریهای انسانی در حلقه است. فرمتهای بسیار خاص (مثلاً IBAN آلمانی DE89 3704 0044 0532 0130 00) امتیاز 0.85+ میگیرند، در حالی که الگوهای عددی عمومی امتیاز 0.3–0.5 میگیرند و برای تأیید به کلمات زمینهای وابسته هستند. تیمهای انطباق میتوانند تشخیصها را قبل از ناشناسسازی مرور و لغو کنند.
تحلیل کلمات زمینهای
هر تشخیصگر دارای کلمات زمینهای در زبان مربوطه است (مثلاً 'Personalausweis' برای شناسههای آلمانی، 'kitambulisho' برای شناسههای کنیا). هنگامی که کلمات زمینهای در نزدیکی یک تطابق ظاهر میشوند، امتیاز اطمینان افزایش مییابد.
انواع موجودیتهای پشتیبانی شده
پوشش جامع انواع اطلاعات شخصی در دستهبندیها
شناسههای شخصی
- نامهای افراد
- آدرسهای ایمیل
- شمارههای تلفن
- تاریخ تولد
- سن
- جنسیت
- ملیت
اطلاعات مالی
- شمارههای کارت اعتباری
- IBAN
- BIC/SWIFT
- شمارههای حساب بانکی
- شناسههای مالیاتی
- شمارههای مالیات بر ارزش افزوده
شناسههای دولتی
- شمارههای تأمین اجتماعی (SSN)
- شمارههای شناسه ملی
- شمارههای گذرنامه
- گواهینامه رانندگی
- شناسههای بیمه سلامت
دادههای مکانی
- آدرسهای خیابان
- شهرها
- کدهای پستی/پستی
- کشورها
- مختصات GPS
شناسههای دیجیتال
- آدرسهای IP (v4/v6)
- آدرسهای MAC
- URLها
- نامهای دامنه
- شناسههای کاربری
دادههای سازمانی
- نامهای شرکت
- شناسههای سازمانی
- شمارههای ثبت
- نامهای بخش
دادههای زمانی
- تاریخها
- زمانها
- بازههای زمانی
- مهرهای زمانی
فرمتهای بینالمللی
- شناسه آلمانی (Personalausweis)
- بیمه ملی بریتانیا
- DNI/NIE اسپانیایی
- کد مالیاتی ایتالیایی
- و بیش از 70 فرمت خاص کشور دیگر
پشتیبانی از موجودیتهای سفارشی
نیاز به تشخیص الگوهای سفارشی دارید؟ نوع موجودیتهای خود را با الگوهای regex ایجاد کنید یا از تولیدکننده الگوی AI ما استفاده کنید.
ایجاد الگوی دستی
الگوهای regex را برای شناسههای اختصاصی مانند شناسههای کارمندی داخلی، کدهای پروژه یا شمارههای مرجع سفارشی تعریف کنید.
تولیدکننده الگوی AI
توصیف کنید که میخواهید چه چیزی را تشخیص دهید و AI ما الگوهای regex بهینهسازی شده را برای شما تولید میکند.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient