কেন Regex-First?
নিয়ন্ত্রক কমপ্লায়েন্সের জন্য আপনাকে ব্যাখ্যাযোগ্য ও পুনরুত্পাদনযোগ্য ফলাফল দরকার। আমাদের regex-first পদ্ধতিতে গঠিত ডেটা শনাক্তকরণ সম্পূর্ণ নির্ধারিত থাকে, আর NLP নাম ও অবস্থান শনাক্ত করে স্বচ্ছ কনফিডেন্স স্কোরসহ।
বিস্তারিত তুলনা
| Regex-First (আমরা) | AI/ML-ভিত্তিক | |
|---|---|---|
| পুনরুত্পাদনযোগ্যতা | গঠিত ডেটা: ১০০% অভিন্ন। নাম: কনফিডেন্স-স্কোরযুক্ত | সব ফলাফল প্রতিবার আলাদা হয় |
| নিরীক্ষাযোগ্যতা | প্রতিটি শনাক্তকরণ প্যাটার্ন বা NLP মডেলে ট্রেসযোগ্য | ব্ল্যাক বক্স — সিদ্ধান্ত ব্যাখ্যা করা যায় না |
| প্রশিক্ষণ ডেটা | Regex: নেই। NLP: প্রি-ট্রেইনড মডেল অন্তর্ভুক্ত | কাস্টম প্রশিক্ষণ ডেটাসেটের প্রয়োজন |
| মডেল ড্রিফট | Regex: নেই। NLP: ভার্সনড, স্থিতিশীল মডেল | সময়ের সাথে অনির্দেশ্যভাবে কমে যায় |
| পারফরম্যান্স | দ্রুত, শুধুমাত্র CPU | পরিবর্তনশীল, GPU-নির্ভর |
| কম্পিউট খরচ | কম (শুধু CPU) | উচ্চ (GPU প্রায়ই প্রয়োজন) |
| নিয়ন্ত্রক কমপ্লায়েন্স | সহজ — প্যাটার্ন ও কনফিডেন্স স্কোর নিরীক্ষাযোগ্য, মানব-পর্যবেক্ষণে ওভাররাইড করা যায় | নিয়ন্ত্রকদের কাছে প্রমাণ করা কঠিন |
প্যাটার্ন মেলানো কীভাবে কাজ করে
প্রতিটি সত্তার ধরনে নির্দিষ্ট ফরম্যাটের জন্য যত্নসহকারে তৈরি regex প্যাটার্ন থাকে।
ইমেইল ঠিকানা
স্ট্যান্ডার্ড ইমেইল ফরম্যাট মেলে: local-part@domain.tld
ক্রেডিট কার্ড নম্বর
Visa, Mastercard, Amex ও অন্যান্য কার্ড ফরম্যাট মেলে Luhn যাচাইকরণসহ
জার্মান IBAN
জার্মান IBAN ফরম্যাট মেলে, ঐচ্ছিক স্পেসসহ
কমপ্লায়েন্সের জন্য তৈরি
নিরীক্ষকরা যখন জিজ্ঞাসা করেন "কেন এটি শনাক্ত হয়েছে?" তখন আপনাকে স্পষ্ট উত্তর দিতে হবে। Regex শনাক্তকরণ নির্দিষ্ট প্যাটার্নে ট্রেসযোগ্য। NLP শনাক্তকরণে মডেল নাম ও কনফিডেন্স স্কোর থাকে। মানব-পর্যালোচনা নিশ্চিত করে কমপ্লায়েন্স টিম অ্যানোনিমাইজেশনের আগে শনাক্তকরণ ওভাররাইড করতে পারে।
- GDPR অনুচ্ছেদ ২৫: ব্যাখ্যাযোগ্য প্রসেসিংসহ ডিজাইন অনুযায়ী গোপনীয়তা
- ISO 27001: নথিভুক্ত, পুনরাবৃত্তিযোগ্য প্রক্রিয়া
- অডিট ট্রেইল: প্রতিটি শনাক্তকরণ নির্দিষ্ট প্যাটার্নে ট্রেসযোগ্য
নিরীক্ষা উত্তরের উদাহরণ
প্র: কেন "john.smith@company.com" ফ্ল্যাগ হয়েছে?
উ: ইমেইল প্যাটার্নের সাথে পজিশন ৪৫-৬৮-এ মেলেছে, কনফিডেন্স ০.৯৫। প্যাটার্ন: স্ট্যান্ডার্ড ইমেইল ফরম্যাট যাচাইকরণ।