تشخیص PII: بیش از 320 نوع موجودیت

موتور تشخیص ما 317 تشخیص‌گر regex سفارشی را با مدل‌های NLP ترکیب می‌کند تا بیش از 320 نوع اطلاعات شخصی را در بیش از 70 کشور شناسایی کند. همان ورودی، همان خروجی - هر بار.

نحوه عملکرد تشخیص

تطبیق الگوی Regex (PII ساختاریافته)

317 تشخیص‌گر الگوی سفارشی با الگوهای regex داده‌های ساختاریافته مانند شناسه‌های ملی، شماره‌های مالیاتی، گذرنامه‌ها و گواهینامه‌های رانندگی را تشخیص می‌دهند. هر الگو از اظهارات مرزی برای جلوگیری از تطابق‌های نادرست در کد یا داده‌های ساختاریافته استفاده می‌کند.

تشخیص موجودیت نام‌گذاری شده NLP (نام‌ها و مکان‌ها)

spaCy (25 زبان)، NER Stanza (7 زبان) و ترانسفورمرهای XLM-RoBERTa (16 زبان) PII غیرساختاریافته مانند نام‌های افراد، مکان‌ها و سازمان‌ها را که نمی‌توانند تنها با regex شناسایی شوند، تشخیص می‌دهند. همه مدل‌ها بر روی سرورهای خودمان در آلمان اجرا می‌شوند - هیچ داده‌ای هرگز به Meta، Google، Stanford یا هیچ شخص ثالثی ارسال نمی‌شود.

امتیازدهی به اطمینان

هر تشخیص شامل یک امتیاز اطمینان (0.0–1.0) برای تصمیم‌گیری‌های انسانی در حلقه است. فرمت‌های بسیار خاص (مثلاً IBAN آلمانی DE89 3704 0044 0532 0130 00) امتیاز 0.85+ می‌گیرند، در حالی که الگوهای عددی عمومی امتیاز 0.3–0.5 می‌گیرند و برای تأیید به کلمات زمینه‌ای وابسته هستند. تیم‌های انطباق می‌توانند تشخیص‌ها را قبل از ناشناس‌سازی مرور و لغو کنند.

تحلیل کلمات زمینه‌ای

هر تشخیص‌گر دارای کلمات زمینه‌ای در زبان مربوطه است (مثلاً 'Personalausweis' برای شناسه‌های آلمانی، 'kitambulisho' برای شناسه‌های کنیا). هنگامی که کلمات زمینه‌ای در نزدیکی یک تطابق ظاهر می‌شوند، امتیاز اطمینان افزایش می‌یابد.

انواع موجودیت‌های پشتیبانی شده

پوشش جامع انواع اطلاعات شخصی در دسته‌بندی‌ها

شناسه‌های شخصی

  • نام‌های افراد
  • آدرس‌های ایمیل
  • شماره‌های تلفن
  • تاریخ تولد
  • سن
  • جنسیت
  • ملیت

اطلاعات مالی

  • شماره‌های کارت اعتباری
  • IBAN
  • BIC/SWIFT
  • شماره‌های حساب بانکی
  • شناسه‌های مالیاتی
  • شماره‌های مالیات بر ارزش افزوده

شناسه‌های دولتی

  • شماره‌های تأمین اجتماعی (SSN)
  • شماره‌های شناسه ملی
  • شماره‌های گذرنامه
  • گواهینامه رانندگی
  • شناسه‌های بیمه سلامت

داده‌های مکانی

  • آدرس‌های خیابان
  • شهرها
  • کدهای پستی/پستی
  • کشورها
  • مختصات GPS

شناسه‌های دیجیتال

  • آدرس‌های IP (v4/v6)
  • آدرس‌های MAC
  • URLها
  • نام‌های دامنه
  • شناسه‌های کاربری

داده‌های سازمانی

  • نام‌های شرکت
  • شناسه‌های سازمانی
  • شماره‌های ثبت
  • نام‌های بخش

داده‌های زمانی

  • تاریخ‌ها
  • زمان‌ها
  • بازه‌های زمانی
  • مهرهای زمانی

فرمت‌های بین‌المللی

  • شناسه آلمانی (Personalausweis)
  • بیمه ملی بریتانیا
  • DNI/NIE اسپانیایی
  • کد مالیاتی ایتالیایی
  • و بیش از 70 فرمت خاص کشور دیگر

پشتیبانی از موجودیت‌های سفارشی

نیاز به تشخیص الگوهای سفارشی دارید؟ نوع موجودیت‌های خود را با الگوهای regex ایجاد کنید یا از تولیدکننده الگوی AI ما استفاده کنید.

ایجاد الگوی دستی

الگوهای regex را برای شناسه‌های اختصاصی مانند شناسه‌های کارمندی داخلی، کدهای پروژه یا شماره‌های مرجع سفارشی تعریف کنید.

تولیدکننده الگوی AI

توصیف کنید که می‌خواهید چه چیزی را تشخیص دهید و AI ما الگوهای regex بهینه‌سازی شده را برای شما تولید می‌کند.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

امروز تشخیص PII را شروع کنید

موتور تشخیص ما را با 200 توکن در هر چرخه به صورت رایگان امتحان کنید. نیازی به کارت اعتباری نیست.