شناسایی PII در ۴۸ زبان

شناسایی و ناشناس‌سازی PII در ۴۸ زبان با پشتیبانی از الگوهای بومی. پشتیبانی کامل از راست به چپ برای عربی، عبری، فارسی و اردو.

پشتیبانی از ۴۸ زبان

شناسایی و ناشناس‌سازی کامل PII در سراسر پلتفرم

spaCy NLP - اجرا به صورت محلی (۲۵ زبان)

انگلیسیآلمانیاسپانیاییفرانسویایتالیاییپرتغالیهلندیلهستانیروسیژاپنیچینیکره‌ایرومانیایییونانیکرواتیاسلوونیاییمقدونیسوئدیدانمارکینروژیفنلاندیاوکراینیلیتوانیاییکاتالانترکی

Stanza NER - اجرا به صورت محلی (۷ زبان)

بلغاریمجارستانیعبری (راست به چپ)ویتنامیآفریکانسارمنیباسکی

XLM-RoBERTa Transformer - اجرا به صورت محلی (۱۶ زبان)

عربی (راست به چپ)هندیچکیاسلواکیاندونزیاییتایلندیفارسی (راست به چپ)صربیلتونیاستونیاییمالاییبنگالیاردو (راست به چپ)سواحیلیتاگالوگایسلندی

پشتیبانی از راست به چپ

عربیعبریفارسیاردو

قدرت گرفته از NLP پیشرفته

سه موتور NLP با هم برای پوشش حداکثری زبان‌ها

  • مدل‌های بارگذاری تنبل (حداکثر ۵ مدل کش شده) برای بهره‌وری حافظه
  • شناسایی خودکار زبان
  • پردازش اسناد چندزبانه
  • الگوهای موجودیت خاص زبان

فرمت‌های خاص کشور

ما PII را در فرمت‌های خاص هر کشور و منطقه شناسایی می‌کنیم.

فرمت‌های اروپایی

  • آلمانی: Personalausweis، Steuer-ID، Reisepass
  • فرانسوی: NIR، Carte Nationale، Permis
  • ایتالیایی: Codice Fiscale، Carta d'Identità
  • اسپانیایی: DNI، NIE، NIF
  • هلندی: BSN، Rijbewijs
  • لهستانی: PESEL، NIP، REGON

فرمت‌های آسیا-اقیانوسیه

  • ژاپن: My Number، پاسپورت
  • هند: Aadhaar، PAN، GSTIN، ثبت نام خودرو
  • تایلند: شناسه ملی، شناسه مالیاتی، پاسپورت
  • اندونزی: NIK، NPWP، پاسپورت
  • ویتنام: CCCD، کد مالیاتی، پاسپورت
  • مالزی: MyKad، شناسه مالیاتی، پاسپورت

آمریکا، آفریقا و خاورمیانه

  • آمریکا: SSN، گواهینامه رانندگی، پاسپورت
  • انگلیس: بیمه ملی، شماره NHS
  • کانادا: SIN، گواهینامه رانندگی
  • استرالیا: TFN، مدیکر، ABN
  • کنیا: شناسه ملی، KRA PIN، پاسپورت
  • آفریقای جنوبی: شماره شناسه، شماره مالیاتی، پاسپورت

سوالات متداول

کدام ۴۸ زبان توسط cloak.business پشتیبانی می‌شوند؟

cloak.business از زبان‌های آفریکانس، عربی، ارمنی، باسکی، بنگالی، بلغاری، کاتالان، چینی، کرواتی، چکی، دانمارکی، هلندی، انگلیسی، استونیایی، فنلاندی، فرانسوی، آلمانی، یونانی، عبری، هندی، مجارستانی، ایسلندی، اندونزیایی، ایتالیایی، ژاپنی، کره‌ای، لتونی، لیتوانی، مقدونی، مالایی، نروژی، فارسی، لهستانی، پرتغالی، رومانیایی، روسی، صربی، اسلواکی، اسلوونیایی، اسپانیایی، سواحیلی، سوئدی، تاگالوگ، تایلندی، ترکی، اوکراینی، اردو و ویتنامی پشتیبانی می‌کند - با پشتیبانی کامل از راست به چپ برای عربی، عبری، فارسی و اردو.

آیا شناسایی PII در همه زبان‌ها به یک شکل کار می‌کند؟

شناسایی از دو روش استفاده می‌کند: تطبیق الگوهای regex برای داده‌های ساختاریافته (شناسه‌ها، شماره‌های تلفن، شماره‌های مالیاتی) و مدل‌های NLP برای موجودیت‌های غیرساختاریافته (نام‌ها، مکان‌ها). شناسایی مبتنی بر الگو همه ۴۸ زبان را پوشش می‌دهد. شناسایی مبتنی بر NLP در زبان‌هایی که مدل‌های آموزش دیده دارند موجود است.

چگونه فرمت‌های شناسه خاص کشور مدیریت می‌شوند؟

cloak.business شامل ۳۱۷ شناسگر الگو است که بیش از ۷۰ کشور را پوشش می‌دهد. هر شناسگر فرمت خاص، چک‌سام و ساختار شناسه‌های ملی، شماره‌های مالیاتی، شناسه‌های بهداشتی و داده‌های مالی آن کشور را اعتبارسنجی می‌کند.

آیا می‌توانم PII را در چندین زبان در یک سند شناسایی کنم؟

بله. cloak.business می‌تواند اسناد چندزبانه را پردازش کرده و PII را در زبان‌های مختلف در یک درخواست شناسایی کند. سیستم به طور خودکار الگوهای زبانی را که باید اعمال شوند شناسایی می‌کند.

چگونه می‌توانم پشتیبانی از یک زبان یا نوع موجودیت جدید را اضافه کنم؟

شما می‌توانید شناسگرهای موجودیت سفارشی با استفاده از الگوهای regex یا لیست‌های رد ایجاد کنید. این به شما امکان می‌دهد شناسه‌های خاص دامنه را اضافه کنید یا پوشش را به فرمت‌های اضافی که هنوز در کتابخانه شناسگر داخلی گنجانده نشده‌اند، گسترش دهید.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

ناشناس‌سازی در هر زبانی

با ۲۰۰ توکن رایگان شروع کنید. با تمام ۴۸ زبان کار می‌کند.