48 زبانوں میں PII کی شناخت

48 زبانوں میں PII کی شناخت اور گمنامی کریں، مقامی نمونہ کی معاونت کے ساتھ۔ عربی، عبرانی، فارسی، اور اردو کے لیے مکمل RTL معاونت۔

48 زبانوں کی معاونت

پوری پلیٹ فارم پر مکمل PII کی شناخت اور گمنامی

spaCy NLP - مقامی طور پر چلتا ہے (25 زبانیں)

انگریزیجرمنہسپانویفرانسیسیاطالویپرتگالیڈچپولشروسیجاپانیچینیکورینرومانیائییونانیکروشیائیسلووینیائیمقدونیائیسویڈشڈینشنارویجینفنشیوکرینیلتھوانیائیکاتالانترکی

Stanza NER - مقامی طور پر چلتا ہے (7 زبانیں)

بلغاریائیہنگریائیعبرانی (RTL)ویتنامیافریقیآرمینیائیباسکی

XLM-RoBERTa Transformer - مقامی طور پر چلتا ہے (16 زبانیں)

عربی (RTL)ہندیچیکسلوواکانڈونیشیائیتھائیفارسی (RTL)سربیائیلیٹوینایسٹونینمالےبنگالیاردو (RTL)سواحلیٹیگالوگآئس لینڈک

RTL معاونت

عربیعبرانیفارسیاردو

جدید NLP کے ذریعہ تقویت یافتہ

زیادہ سے زیادہ زبان کی کوریج کے لیے تین NLP انجن مل کر کام کر رہے ہیں

  • میموری کی کارکردگی کے لیے سست لوڈ شدہ ماڈلز (زیادہ سے زیادہ 5 کیشڈ)
  • خودکار زبان کی شناخت
  • مخلوط زبان کی دستاویز پروسیسنگ
  • زبان کے مخصوص ادارے کے نمونے

ملک کے مخصوص فارمیٹس

ہم ہر ملک اور خطے کے مخصوص فارمیٹس میں PII کی شناخت کرتے ہیں۔

یورپی فارمیٹس

  • جرمن: Personalausweis, Steuer-ID, Reisepass
  • فرانسیسی: NIR, Carte Nationale, Permis
  • اطالوی: Codice Fiscale, Carta d'Identità
  • ہسپانوی: DNI, NIE, NIF
  • ڈچ: BSN, Rijbewijs
  • پولش: PESEL, NIP, REGON

ایشیا پیسیفک فارمیٹس

  • جاپان: My Number, Passport
  • بھارت: Aadhaar, PAN, GSTIN, Vehicle Registration
  • تھائی لینڈ: National ID, Tax ID, Passport
  • انڈونیشیا: NIK, NPWP, Passport
  • ویتنام: CCCD, Tax Code, Passport
  • ملائیشیا: MyKad, Tax ID, Passport

امریکاز، افریقہ اور مشرق وسطیٰ

  • امریکہ: SSN, Driver's License, Passport
  • برطانیہ: National Insurance, NHS Number
  • کینیڈا: SIN, Driver's License
  • آسٹریلیا: TFN, Medicare, ABN
  • کینیا: National ID, KRA PIN, Passport
  • جنوبی افریقہ: ID Number, Tax Number, Passport

اکثر پوچھے جانے والے سوالات

cloak.business کون سی 48 زبانوں کی معاونت کرتا ہے؟

cloak.business افریقی، عربی، آرمینیائی، باسکی، بنگالی، بلغاریائی، کاتالان، چینی، کروشیائی، چیک، ڈینش، ڈچ، انگریزی، ایسٹونین، فنش، فرانسیسی، جرمن، یونانی، عبرانی، ہندی، ہنگریائی، آئس لینڈک، انڈونیشیائی، اطالوی، جاپانی، کورین، لیٹوین، لتھوانیائی، مقدونیائی، مالے، نارویجین، فارسی، پولش، پرتگالی، رومانیائی، روسی، سربیائی، سلوواک، سلووینیائی، ہسپانوی، سواحلی، سویڈش، ٹیگالوگ، تھائی، ترکی، یوکرینی، اردو، اور ویتنامی کی معاونت کرتا ہے — عربی، عبرانی، فارسی، اور اردو کے لیے مکمل RTL معاونت کے ساتھ۔

کیا PII کی شناخت تمام زبانوں میں ایک جیسی کام کرتی ہے؟

شناخت دو طریقوں کا استعمال کرتی ہے: ساختی ڈیٹا (IDs، فون نمبرز، ٹیکس نمبرز) کے لیے regex پر مبنی پیٹرن میچنگ اور غیر ساختی اداروں (نام، مقامات) کے لیے NLP ماڈلز۔ پیٹرن پر مبنی شناخت تمام 48 زبانوں کا احاطہ کرتی ہے۔ NLP پر مبنی شناخت ان زبانوں میں دستیاب ہے جن میں تربیت یافتہ ماڈلز ہیں۔

ملک کے مخصوص ID فارمیٹس کو کیسے ہینڈل کیا جاتا ہے؟

cloak.business میں 317 پیٹرن شناخت کنندگان شامل ہیں جو 70+ ممالک کا احاطہ کرتے ہیں۔ ہر شناخت کنندہ اس ملک کے قومی IDs، ٹیکس نمبرز، صحت کے شناخت کنندگان، اور مالیاتی ڈیٹا کے مخصوص فارمیٹ، چیکسم، اور ساخت کی توثیق کرتا ہے۔

کیا میں ایک ہی دستاویز میں متعدد زبانوں میں PII کی شناخت کر سکتا ہوں؟

جی ہاں۔ cloak.business کثیر لسانی دستاویزات کو پروسیس کر سکتا ہے اور ایک ہی درخواست میں مختلف زبانوں میں PII کی شناخت کر سکتا ہے۔ نظام خود بخود شناخت کرتا ہے کہ کون سے زبان کے نمونے لاگو کرنے ہیں۔

میں نئی زبان یا ادارے کی قسم کی معاونت کیسے شامل کر سکتا ہوں؟

آپ regex پیٹرن یا انکار کی فہرستوں کا استعمال کرتے ہوئے کسٹم ادارے کے شناخت کنندگان بنا سکتے ہیں۔ یہ آپ کو ڈومین کے مخصوص شناخت کنندگان شامل کرنے یا بلٹ ان شناخت کنندہ لائبریری میں ابھی شامل نہ کیے گئے اضافی فارمیٹس کے لیے کوریج کو بڑھانے کی اجازت دیتا ہے۔

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

کسی بھی زبان میں گمنام بنائیں

200 مفت ٹوکنز کے ساتھ شروع کریں۔ تمام 48 زبانوں کے ساتھ کام کرتا ہے۔