پشتیبانی از ۴۸ زبان
شناسایی و ناشناسسازی کامل PII در سراسر پلتفرم
spaCy NLP - اجرا به صورت محلی (۲۵ زبان)
Stanza NER - اجرا به صورت محلی (۷ زبان)
XLM-RoBERTa Transformer - اجرا به صورت محلی (۱۶ زبان)
پشتیبانی از راست به چپ
قدرت گرفته از NLP پیشرفته
سه موتور NLP با هم برای پوشش حداکثری زبانها
- مدلهای بارگذاری تنبل (حداکثر ۵ مدل کش شده) برای بهرهوری حافظه
- شناسایی خودکار زبان
- پردازش اسناد چندزبانه
- الگوهای موجودیت خاص زبان
فرمتهای خاص کشور
ما PII را در فرمتهای خاص هر کشور و منطقه شناسایی میکنیم.
فرمتهای اروپایی
- آلمانی: Personalausweis، Steuer-ID، Reisepass
- فرانسوی: NIR، Carte Nationale، Permis
- ایتالیایی: Codice Fiscale، Carta d'Identità
- اسپانیایی: DNI، NIE، NIF
- هلندی: BSN، Rijbewijs
- لهستانی: PESEL، NIP، REGON
فرمتهای آسیا-اقیانوسیه
- ژاپن: My Number، پاسپورت
- هند: Aadhaar، PAN، GSTIN، ثبت نام خودرو
- تایلند: شناسه ملی، شناسه مالیاتی، پاسپورت
- اندونزی: NIK، NPWP، پاسپورت
- ویتنام: CCCD، کد مالیاتی، پاسپورت
- مالزی: MyKad، شناسه مالیاتی، پاسپورت
آمریکا، آفریقا و خاورمیانه
- آمریکا: SSN، گواهینامه رانندگی، پاسپورت
- انگلیس: بیمه ملی، شماره NHS
- کانادا: SIN، گواهینامه رانندگی
- استرالیا: TFN، مدیکر، ABN
- کنیا: شناسه ملی، KRA PIN، پاسپورت
- آفریقای جنوبی: شماره شناسه، شماره مالیاتی، پاسپورت
سوالات متداول
کدام ۴۸ زبان توسط cloak.business پشتیبانی میشوند؟
cloak.business از زبانهای آفریکانس، عربی، ارمنی، باسکی، بنگالی، بلغاری، کاتالان، چینی، کرواتی، چکی، دانمارکی، هلندی، انگلیسی، استونیایی، فنلاندی، فرانسوی، آلمانی، یونانی، عبری، هندی، مجارستانی، ایسلندی، اندونزیایی، ایتالیایی، ژاپنی، کرهای، لتونی، لیتوانی، مقدونی، مالایی، نروژی، فارسی، لهستانی، پرتغالی، رومانیایی، روسی، صربی، اسلواکی، اسلوونیایی، اسپانیایی، سواحیلی، سوئدی، تاگالوگ، تایلندی، ترکی، اوکراینی، اردو و ویتنامی پشتیبانی میکند - با پشتیبانی کامل از راست به چپ برای عربی، عبری، فارسی و اردو.
آیا شناسایی PII در همه زبانها به یک شکل کار میکند؟
شناسایی از دو روش استفاده میکند: تطبیق الگوهای regex برای دادههای ساختاریافته (شناسهها، شمارههای تلفن، شمارههای مالیاتی) و مدلهای NLP برای موجودیتهای غیرساختاریافته (نامها، مکانها). شناسایی مبتنی بر الگو همه ۴۸ زبان را پوشش میدهد. شناسایی مبتنی بر NLP در زبانهایی که مدلهای آموزش دیده دارند موجود است.
چگونه فرمتهای شناسه خاص کشور مدیریت میشوند؟
cloak.business شامل ۳۱۷ شناسگر الگو است که بیش از ۷۰ کشور را پوشش میدهد. هر شناسگر فرمت خاص، چکسام و ساختار شناسههای ملی، شمارههای مالیاتی، شناسههای بهداشتی و دادههای مالی آن کشور را اعتبارسنجی میکند.
آیا میتوانم PII را در چندین زبان در یک سند شناسایی کنم؟
بله. cloak.business میتواند اسناد چندزبانه را پردازش کرده و PII را در زبانهای مختلف در یک درخواست شناسایی کند. سیستم به طور خودکار الگوهای زبانی را که باید اعمال شوند شناسایی میکند.
چگونه میتوانم پشتیبانی از یک زبان یا نوع موجودیت جدید را اضافه کنم؟
شما میتوانید شناسگرهای موجودیت سفارشی با استفاده از الگوهای regex یا لیستهای رد ایجاد کنید. این به شما امکان میدهد شناسههای خاص دامنه را اضافه کنید یا پوشش را به فرمتهای اضافی که هنوز در کتابخانه شناسگر داخلی گنجانده نشدهاند، گسترش دهید.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only