Regex-First: কেন এটি গুরুত্বপূর্ণ
আমাদের পদ্ধতি: Regex + NLP
- ৩১৭টি regex রেকগনাইজার: গঠিত ডেটার জন্য ১০০% পুনরুত্পাদনযোগ্য
- নাম ও অবস্থানের জন্য NLP, কনফিডেন্স স্কোরসহ
- সম্পূর্ণ নিরীক্ষাযোগ্য — প্রতিটি শনাক্তকরণ প্যাটার্ন বা মডেলের সাথে ট্রেসযোগ্য
- স্বচ্ছ: আপনি সবসময় জানবেন কী মেলেছে এবং কেন
- দ্রুত, পূর্বানুমানযোগ্য পারফরম্যান্স
- ৩টি NLP ইঞ্জিনে ৪৮টি ভাষা
শুধুমাত্র AI ভিত্তিক পদ্ধতি
- সব শনাক্তকরণ সম্ভাব্যতাভিত্তিক
- কেন কিছু ফ্ল্যাগ হয়েছে ব্যাখ্যা করা যায় না
- বড় প্রশিক্ষণ ডেটাসেটের প্রয়োজন
- কমপ্লায়েন্সের জন্য নিরীক্ষা করা কঠিন
- উচ্চ কম্পিউট খরচ (GPU প্রয়োজন)
- মডেল ড্রিফটের কারণে সময়ের সাথে নির্ভুলতা কমে যায়
১০-ধাপের প্রক্রিয়া
ইনপুট থেকে আউটপুট পর্যন্ত, আপনার ডকুমেন্টে ঠিক কী ঘটে দেখুন
ইনপুট টেক্সট
ওয়েব ইন্টারফেস, API, অথবা Office Add-in এর মাধ্যমে আপনার ডকুমেন্ট জমা দিন
ভাষা শনাক্তকরণ
সিস্টেম ডকুমেন্টের ভাষা শনাক্ত করে সর্বোত্তম প্রসেসিংয়ের জন্য
টোকেনাইজেশন
প্যাটার্ন মেলানোর জন্য টেক্সটকে টোকেনে বিভক্ত করা হয়
প্যাটার্ন মেলানো
৩১৭টি regex রেকগনাইজার ও NLP মডেল ৭০+ দেশের ৩২০+ সত্তার ধরন স্ক্যান করে
প্রসঙ্গ বিশ্লেষণ
চারপাশের টেক্সট শনাক্তকরণের নির্ভুলতা বাড়ায়
কনফিডেন্স স্কোরিং
প্রতিটি শনাক্তকরণে কনফিডেন্স স্কোর (০.০–১.০) প্রদান করা হয়, যা মানব-পর্যালোচনার সিদ্ধান্তে সহায়তা করে
সত্তা শ্রেণিবিন্যাস
শনাক্ত আইটেমগুলোকে ধরন অনুযায়ী শ্রেণিবদ্ধ করা হয়
মানব-পর্যালোচনা
সব শনাক্তকরণ পর্যালোচনা করুন, ভুল পজিটিভ ওভাররাইড করুন এবং অ্যানোনিমাইজেশনের আগে অনুমোদন দিন
অ্যানোনিমাইজেশন প্রয়োগ
আপনার পদ্ধতি নির্বাচন করুন: Replace, Redact, Hash, Encrypt, অথবা Mask
আউটপুট ডকুমেন্ট
আপনার অ্যানোনিমাইজড ডকুমেন্ট ডাউনলোড করুন
MCP সার্ভার: গোপনীয়তা-প্রথম AI ইন্টিগ্রেশন
AI টুল নিরাপদ রাখতে MCP সার্ভারের মাধ্যমে আপনার ডেটা কীভাবে প্রবাহিত হয়
MCP সার্ভার একটি গোপনীয়তা শিল্ড হিসেবে কাজ করে, AI টুলের অনুরোধ গ্রহণ করে, PII অ্যানোনিমাইজ করে, নিরাপদ ডেটা AI-তে প্রসেস করে এবং প্রয়োজনে আসল মান পুনরুদ্ধার করে।
AI টুল অনুরোধ
আপনার AI টুল (Cursor, Claude) PII-সহ অনুরোধ পাঠায়
MCP সার্ভার ইন্টারসেপ্ট করে
সার্ভার সব PII সত্তা বিশ্লেষণ ও শনাক্ত করে
অ্যানোনিমাইজেশন
PII টোকেন দ্বারা প্রতিস্থাপিত বা রেডাক্টেড হয়
AI প্রসেসিং
AI কেবল অ্যানোনিমাইজড ডেটা পায় ও প্রসেস করে
রেসপন্স ফেরত
AI রেসপন্স MCP সার্ভারের মাধ্যমে ফেরত আসে
ডি-টোকেনাইজেশন
ঐচ্ছিক: ব্যবহারকারীর জন্য আসল মান পুনরুদ্ধার
প্রায়শই জিজ্ঞাসিত প্রশ্ন
cloak.business কি শনাক্তকরণের জন্য AI ব্যবহার করে?
না। শনাক্তকরণে নির্ধারিত regex প্যাটার্ন ও NLP মডেল (spaCy, Stanza) ব্যবহার করা হয়। এতে ১০০% পুনরুত্পাদনযোগ্য ফলাফল নিশ্চিত হয় — একই ইনপুটে সবসময় একই আউটপুট, যা সম্ভাব্যতাভিত্তিক AI পদ্ধতির বিপরীত।
AI-এর পরিবর্তে regex প্যাটার্ন কেন?
Regex প্যাটার্ন নিরীক্ষাযোগ্য, পুনরুত্পাদনযোগ্য ও কমপ্লায়েন্ট। আপনি ঠিক কী মেলে তা দেখতে পারবেন। AI-ভিত্তিক শনাক্তকরণ অনির্ধারিত — প্রতিবার ফলাফল ভিন্ন হতে পারে, ফলে কমপ্লায়েন্স ডকুমেন্টেশন কঠিন হয়।
শনাক্তকরণের নির্ভুলতা কতটা?
৩১৭টি কাস্টম প্যাটার্ন রেকগনাইজার ও চেকসাম যাচাইকরণ (Luhn, IBAN, SSN) সহ cloak.business গঠিত শনাক্তকারীর (যেমন ক্রেডিট কার্ড, ট্যাক্স আইডি, জাতীয় আইডি নম্বর) জন্য সাধারণ NER মডেলের তুলনায় উল্লেখযোগ্যভাবে বেশি নির্ভুলতা অর্জন করে।
কোন ভাষাসমূহ সমর্থিত?
৪৮টি ভাষা সমর্থিত, নাম শনাক্তকরণের জন্য ডেডিকেটেড NLP মডেলসহ। প্যাটার্ন-ভিত্তিক শনাক্তকরণ (regex) সব ভাষায় কাজ করে, কারণ এটি ভাষা নির্বিশেষে অক্ষরের প্যাটার্ন মেলে।
আমি কি কাস্টম সত্তা প্যাটার্ন যোগ করতে পারি?
হ্যাঁ। API কাস্টম রেকগনাইজার সংজ্ঞা সমর্থন করে, যাতে আপনি নিজস্ব শনাক্তকারী, অভ্যন্তরীণ রেফারেন্স নম্বর, বা ডোমেইন-নির্দিষ্ট ডেটা ফরম্যাটের জন্য প্যাটার্ন যোগ করতে পারেন।