cloak.business

৪৮ ভাষায় PII সনাক্তকরণ

৪৮ ভাষায় PII সনাক্ত এবং অজ্ঞাত করুন স্থানীয় প্যাটার্ন সমর্থন সহ। আরবি, হিব্রু, ফারসি এবং উর্দুর জন্য পূর্ণ RTL সমর্থন।

৪৮ ভাষা সমর্থিত

সম্পূর্ণ প্ল্যাটফর্ম জুড়ে পূর্ণ PII সনাক্তকরণ এবং অজ্ঞাতকরণ

spaCy NLP - স্থানীয়ভাবে চালায় (২৫ ভাষা)

ইংরেজিজার্মানস্প্যানিশফরাসিইতালীয়পর্তুগিজডাচপোলিশরাশিয়ানজাপানিচীনাকোরিয়ানরোমানিয়ানগ্রিকক্রোয়েশিয়ানস্লোভেনিয়ানম্যাসেডোনিয়ানসুইডিশড্যানিশনরওয়েজিয়ানফিনিশইউক্রেনীয়লিথুয়ানিয়ানকাতালানতুর্কি

Stanza NER - স্থানীয়ভাবে চালায় (৭ ভাষা)

বুলগেরিয়ানহাঙ্গেরিয়ানহিব্রু (RTL)ভিয়েতনামিজআফ্রিকান্সআর্মেনিয়ানবাস্ক

XLM-RoBERTa ট্রান্সফরমার - স্থানীয়ভাবে চালায় (১৬ ভাষা)

আরবি (RTL)হিন্দিচেকস্লোভাকইন্দোনেশিয়ানথাইফারসি (RTL)সার্বিয়ানলাটভিয়ানএস্তোনিয়ানমালয়বাংলাউর্দু (RTL)সোয়াহিলিটাগালোগআইসল্যান্ডিক

RTL সমর্থন

আরবিহিব্রুফারসিউর্দু

উন্নত NLP দ্বারা চালিত

সর্বাধিক ভাষার কভারেজের জন্য তিনটি NLP ইঞ্জিন একসাথে কাজ করছে

  • স্মৃতি দক্ষতার জন্য অলস-লোডেড মডেল (সর্বাধিক ৫টি ক্যাশড)
  • স্বয়ংক্রিয় ভাষা সনাক্তকরণ
  • মিশ্র-ভাষা ডকুমেন্ট প্রসেসিং
  • ভাষা-নির্দিষ্ট সত্তা প্যাটার্ন

দেশ-নির্দিষ্ট ফরম্যাট

আমরা প্রতিটি দেশ এবং অঞ্চলের নির্দিষ্ট ফরম্যাটে PII সনাক্ত করি।

ইউরোপীয় ফরম্যাট

  • জার্মান: Personalausweis, Steuer-ID, Reisepass
  • ফরাসি: NIR, Carte Nationale, Permis
  • ইতালীয়: Codice Fiscale, Carta d'Identità
  • স্প্যানিশ: DNI, NIE, NIF
  • ডাচ: BSN, Rijbewijs
  • পোলিশ: PESEL, NIP, REGON

এশিয়া-প্যাসিফিক ফরম্যাট

  • জাপান: My Number, Passport
  • ভারত: Aadhaar, PAN, GSTIN, Vehicle Registration
  • থাইল্যান্ড: National ID, Tax ID, Passport
  • ইন্দোনেশিয়া: NIK, NPWP, Passport
  • ভিয়েতনাম: CCCD, Tax Code, Passport
  • মালয়েশিয়া: MyKad, Tax ID, Passport

আমেরিকা, আফ্রিকা এবং মধ্যপ্রাচ্য

  • মার্কিন যুক্তরাষ্ট্র: SSN, Driver's License, Passport
  • যুক্তরাজ্য: National Insurance, NHS Number
  • কানাডা: SIN, Driver's License
  • অস্ট্রেলিয়া: TFN, Medicare, ABN
  • কেনিয়া: National ID, KRA PIN, Passport
  • দক্ষিণ আফ্রিকা: ID Number, Tax Number, Passport

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

cloak.business কোন ৪৮টি ভাষা সমর্থন করে?

cloak.business আফ্রিকান্স, আরবি, আর্মেনিয়ান, বাস্ক, বাংলা, বুলগেরিয়ান, কাতালান, চীনা, ক্রোয়েশিয়ান, চেক, ড্যানিশ, ডাচ, ইংরেজি, এস্তোনিয়ান, ফিনিশ, ফরাসি, জার্মান, গ্রিক, হিব্রু, হিন্দি, হাঙ্গেরিয়ান, আইসল্যান্ডিক, ইন্দোনেশিয়ান, ইতালীয়, জাপানি, কোরিয়ান, লাটভিয়ান, লিথুয়ানিয়ান, ম্যাসেডোনিয়ান, মালয়, নরওয়েজিয়ান, ফারসি, পোলিশ, পর্তুগিজ, রোমানিয়ান, রাশিয়ান, সার্বিয়ান, স্লোভাক, স্লোভেনিয়ান, স্প্যানিশ, সোয়াহিলি, সুইডিশ, টাগালোগ, থাই, তুর্কি, ইউক্রেনীয়, উর্দু এবং ভিয়েতনামিজ সমর্থন করে — আরবি, হিব্রু, ফারসি এবং উর্দুর জন্য পূর্ণ RTL সমর্থন সহ।

সব ভাষায় PII সনাক্তকরণ কি একইভাবে কাজ করে?

সনাক্তকরণ দুটি পদ্ধতি ব্যবহার করে: গঠনমূলক ডেটার জন্য রেগেক্স-ভিত্তিক প্যাটার্ন ম্যাচিং (ID, ফোন নম্বর, ট্যাক্স নম্বর) এবং অগঠিত সত্তার জন্য NLP মডেল (নাম, অবস্থান)। প্যাটার্ন-ভিত্তিক সনাক্তকরণ সব ৪৮টি ভাষা কভার করে। NLP-ভিত্তিক সনাক্তকরণ প্রশিক্ষিত মডেল সহ ভাষায় উপলব্ধ।

দেশ-নির্দিষ্ট ID ফরম্যাটগুলি কীভাবে পরিচালিত হয়?

cloak.business ৭০+ দেশের জন্য ৩১৭টি প্যাটার্ন রিকগনাইজার অন্তর্ভুক্ত করে। প্রতিটি রিকগনাইজার সেই দেশের জাতীয় ID, ট্যাক্স নম্বর, স্বাস্থ্য শনাক্তকারী এবং আর্থিক ডেটার নির্দিষ্ট ফরম্যাট, চেকসাম এবং কাঠামো যাচাই করে।

একই ডকুমেন্টে একাধিক ভাষায় PII সনাক্ত করতে পারি কি?

হ্যাঁ। cloak.business বহুভাষিক ডকুমেন্ট প্রক্রিয়া করতে পারে এবং একটি একক অনুরোধে বিভিন্ন ভাষায় PII সনাক্ত করতে পারে। সিস্টেম স্বয়ংক্রিয়ভাবে কোন ভাষার প্যাটার্ন প্রয়োগ করতে হবে তা সনাক্ত করে।

আমি কীভাবে একটি নতুন ভাষা বা সত্তা প্রকারের জন্য সমর্থন যোগ করব?

আপনি রেগেক্স প্যাটার্ন বা ডিনাই লিস্ট ব্যবহার করে কাস্টম সত্তা রিকগনাইজার তৈরি করতে পারেন। এটি আপনাকে ডোমেইন-নির্দিষ্ট শনাক্তকারী যোগ করতে বা বিল্ট-ইন রিকগনাইজার লাইব্রেরিতে এখনও অন্তর্ভুক্ত নয় এমন অতিরিক্ত ফরম্যাটে কভারেজ প্রসারিত করতে দেয়।

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

যেকোন ভাষায় অজ্ঞাতকরণ করুন

২০০টি বিনামূল্যের টোকেন দিয়ে শুরু করুন। সব ৪৮টি ভাষার সাথে কাজ করে।