৪৮ ভাষা সমর্থিত
সম্পূর্ণ প্ল্যাটফর্ম জুড়ে পূর্ণ PII সনাক্তকরণ এবং অজ্ঞাতকরণ
spaCy NLP - স্থানীয়ভাবে চালায় (২৫ ভাষা)
Stanza NER - স্থানীয়ভাবে চালায় (৭ ভাষা)
XLM-RoBERTa ট্রান্সফরমার - স্থানীয়ভাবে চালায় (১৬ ভাষা)
RTL সমর্থন
উন্নত NLP দ্বারা চালিত
সর্বাধিক ভাষার কভারেজের জন্য তিনটি NLP ইঞ্জিন একসাথে কাজ করছে
- স্মৃতি দক্ষতার জন্য অলস-লোডেড মডেল (সর্বাধিক ৫টি ক্যাশড)
- স্বয়ংক্রিয় ভাষা সনাক্তকরণ
- মিশ্র-ভাষা ডকুমেন্ট প্রসেসিং
- ভাষা-নির্দিষ্ট সত্তা প্যাটার্ন
দেশ-নির্দিষ্ট ফরম্যাট
আমরা প্রতিটি দেশ এবং অঞ্চলের নির্দিষ্ট ফরম্যাটে PII সনাক্ত করি।
ইউরোপীয় ফরম্যাট
- জার্মান: Personalausweis, Steuer-ID, Reisepass
- ফরাসি: NIR, Carte Nationale, Permis
- ইতালীয়: Codice Fiscale, Carta d'Identità
- স্প্যানিশ: DNI, NIE, NIF
- ডাচ: BSN, Rijbewijs
- পোলিশ: PESEL, NIP, REGON
এশিয়া-প্যাসিফিক ফরম্যাট
- জাপান: My Number, Passport
- ভারত: Aadhaar, PAN, GSTIN, Vehicle Registration
- থাইল্যান্ড: National ID, Tax ID, Passport
- ইন্দোনেশিয়া: NIK, NPWP, Passport
- ভিয়েতনাম: CCCD, Tax Code, Passport
- মালয়েশিয়া: MyKad, Tax ID, Passport
আমেরিকা, আফ্রিকা এবং মধ্যপ্রাচ্য
- মার্কিন যুক্তরাষ্ট্র: SSN, Driver's License, Passport
- যুক্তরাজ্য: National Insurance, NHS Number
- কানাডা: SIN, Driver's License
- অস্ট্রেলিয়া: TFN, Medicare, ABN
- কেনিয়া: National ID, KRA PIN, Passport
- দক্ষিণ আফ্রিকা: ID Number, Tax Number, Passport
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী
cloak.business কোন ৪৮টি ভাষা সমর্থন করে?
cloak.business আফ্রিকান্স, আরবি, আর্মেনিয়ান, বাস্ক, বাংলা, বুলগেরিয়ান, কাতালান, চীনা, ক্রোয়েশিয়ান, চেক, ড্যানিশ, ডাচ, ইংরেজি, এস্তোনিয়ান, ফিনিশ, ফরাসি, জার্মান, গ্রিক, হিব্রু, হিন্দি, হাঙ্গেরিয়ান, আইসল্যান্ডিক, ইন্দোনেশিয়ান, ইতালীয়, জাপানি, কোরিয়ান, লাটভিয়ান, লিথুয়ানিয়ান, ম্যাসেডোনিয়ান, মালয়, নরওয়েজিয়ান, ফারসি, পোলিশ, পর্তুগিজ, রোমানিয়ান, রাশিয়ান, সার্বিয়ান, স্লোভাক, স্লোভেনিয়ান, স্প্যানিশ, সোয়াহিলি, সুইডিশ, টাগালোগ, থাই, তুর্কি, ইউক্রেনীয়, উর্দু এবং ভিয়েতনামিজ সমর্থন করে — আরবি, হিব্রু, ফারসি এবং উর্দুর জন্য পূর্ণ RTL সমর্থন সহ।
সব ভাষায় PII সনাক্তকরণ কি একইভাবে কাজ করে?
সনাক্তকরণ দুটি পদ্ধতি ব্যবহার করে: গঠনমূলক ডেটার জন্য রেগেক্স-ভিত্তিক প্যাটার্ন ম্যাচিং (ID, ফোন নম্বর, ট্যাক্স নম্বর) এবং অগঠিত সত্তার জন্য NLP মডেল (নাম, অবস্থান)। প্যাটার্ন-ভিত্তিক সনাক্তকরণ সব ৪৮টি ভাষা কভার করে। NLP-ভিত্তিক সনাক্তকরণ প্রশিক্ষিত মডেল সহ ভাষায় উপলব্ধ।
দেশ-নির্দিষ্ট ID ফরম্যাটগুলি কীভাবে পরিচালিত হয়?
cloak.business ৭০+ দেশের জন্য ৩১৭টি প্যাটার্ন রিকগনাইজার অন্তর্ভুক্ত করে। প্রতিটি রিকগনাইজার সেই দেশের জাতীয় ID, ট্যাক্স নম্বর, স্বাস্থ্য শনাক্তকারী এবং আর্থিক ডেটার নির্দিষ্ট ফরম্যাট, চেকসাম এবং কাঠামো যাচাই করে।
একই ডকুমেন্টে একাধিক ভাষায় PII সনাক্ত করতে পারি কি?
হ্যাঁ। cloak.business বহুভাষিক ডকুমেন্ট প্রক্রিয়া করতে পারে এবং একটি একক অনুরোধে বিভিন্ন ভাষায় PII সনাক্ত করতে পারে। সিস্টেম স্বয়ংক্রিয়ভাবে কোন ভাষার প্যাটার্ন প্রয়োগ করতে হবে তা সনাক্ত করে।
আমি কীভাবে একটি নতুন ভাষা বা সত্তা প্রকারের জন্য সমর্থন যোগ করব?
আপনি রেগেক্স প্যাটার্ন বা ডিনাই লিস্ট ব্যবহার করে কাস্টম সত্তা রিকগনাইজার তৈরি করতে পারেন। এটি আপনাকে ডোমেইন-নির্দিষ্ট শনাক্তকারী যোগ করতে বা বিল্ট-ইন রিকগনাইজার লাইব্রেরিতে এখনও অন্তর্ভুক্ত নয় এমন অতিরিক্ত ফরম্যাটে কভারেজ প্রসারিত করতে দেয়।
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only