cloak.business

cloak.business কীভাবে কাজ করে

Regex-first PII শনাক্তকরণ: গঠিত ডেটার জন্য ৩১৭টি নির্ধারিত প্যাটার্ন রেকগনাইজার (আইডি, ট্যাক্স নম্বর, ক্রেডিট কার্ড), এবং ৪৮টি ভাষায় নাম ও অবস্থানের জন্য spaCy, Stanza, ও XLM-RoBERTa NLP।

Regex-First: কেন এটি গুরুত্বপূর্ণ

আমাদের পদ্ধতি: Regex + NLP

  • ৩১৭টি regex রেকগনাইজার: গঠিত ডেটার জন্য ১০০% পুনরুত্পাদনযোগ্য
  • নাম ও অবস্থানের জন্য NLP, কনফিডেন্স স্কোরসহ
  • সম্পূর্ণ নিরীক্ষাযোগ্য — প্রতিটি শনাক্তকরণ প্যাটার্ন বা মডেলের সাথে ট্রেসযোগ্য
  • স্বচ্ছ: আপনি সবসময় জানবেন কী মেলেছে এবং কেন
  • দ্রুত, পূর্বানুমানযোগ্য পারফরম্যান্স
  • ৩টি NLP ইঞ্জিনে ৪৮টি ভাষা

শুধুমাত্র AI ভিত্তিক পদ্ধতি

  • সব শনাক্তকরণ সম্ভাব্যতাভিত্তিক
  • কেন কিছু ফ্ল্যাগ হয়েছে ব্যাখ্যা করা যায় না
  • বড় প্রশিক্ষণ ডেটাসেটের প্রয়োজন
  • কমপ্লায়েন্সের জন্য নিরীক্ষা করা কঠিন
  • উচ্চ কম্পিউট খরচ (GPU প্রয়োজন)
  • মডেল ড্রিফটের কারণে সময়ের সাথে নির্ভুলতা কমে যায়

১০-ধাপের প্রক্রিয়া

ইনপুট থেকে আউটপুট পর্যন্ত, আপনার ডকুমেন্টে ঠিক কী ঘটে দেখুন

1

ইনপুট টেক্সট

ওয়েব ইন্টারফেস, API, অথবা Office Add-in এর মাধ্যমে আপনার ডকুমেন্ট জমা দিন

2

ভাষা শনাক্তকরণ

সিস্টেম ডকুমেন্টের ভাষা শনাক্ত করে সর্বোত্তম প্রসেসিংয়ের জন্য

3

টোকেনাইজেশন

প্যাটার্ন মেলানোর জন্য টেক্সটকে টোকেনে বিভক্ত করা হয়

4

প্যাটার্ন মেলানো

৩১৭টি regex রেকগনাইজার ও NLP মডেল ৭০+ দেশের ৩২০+ সত্তার ধরন স্ক্যান করে

5

প্রসঙ্গ বিশ্লেষণ

চারপাশের টেক্সট শনাক্তকরণের নির্ভুলতা বাড়ায়

6

কনফিডেন্স স্কোরিং

প্রতিটি শনাক্তকরণে কনফিডেন্স স্কোর (০.০–১.০) প্রদান করা হয়, যা মানব-পর্যালোচনার সিদ্ধান্তে সহায়তা করে

7

সত্তা শ্রেণিবিন্যাস

শনাক্ত আইটেমগুলোকে ধরন অনুযায়ী শ্রেণিবদ্ধ করা হয়

8

মানব-পর্যালোচনা

সব শনাক্তকরণ পর্যালোচনা করুন, ভুল পজিটিভ ওভাররাইড করুন এবং অ্যানোনিমাইজেশনের আগে অনুমোদন দিন

9

অ্যানোনিমাইজেশন প্রয়োগ

আপনার পদ্ধতি নির্বাচন করুন: Replace, Redact, Hash, Encrypt, অথবা Mask

10

আউটপুট ডকুমেন্ট

আপনার অ্যানোনিমাইজড ডকুমেন্ট ডাউনলোড করুন

MCP সার্ভার: গোপনীয়তা-প্রথম AI ইন্টিগ্রেশন

AI টুল নিরাপদ রাখতে MCP সার্ভারের মাধ্যমে আপনার ডেটা কীভাবে প্রবাহিত হয়

MCP সার্ভার একটি গোপনীয়তা শিল্ড হিসেবে কাজ করে, AI টুলের অনুরোধ গ্রহণ করে, PII অ্যানোনিমাইজ করে, নিরাপদ ডেটা AI-তে প্রসেস করে এবং প্রয়োজনে আসল মান পুনরুদ্ধার করে।

AI টুল অনুরোধ

আপনার AI টুল (Cursor, Claude) PII-সহ অনুরোধ পাঠায়

MCP সার্ভার ইন্টারসেপ্ট করে

সার্ভার সব PII সত্তা বিশ্লেষণ ও শনাক্ত করে

অ্যানোনিমাইজেশন

PII টোকেন দ্বারা প্রতিস্থাপিত বা রেডাক্টেড হয়

AI প্রসেসিং

AI কেবল অ্যানোনিমাইজড ডেটা পায় ও প্রসেস করে

রেসপন্স ফেরত

AI রেসপন্স MCP সার্ভারের মাধ্যমে ফেরত আসে

ডি-টোকেনাইজেশন

ঐচ্ছিক: ব্যবহারকারীর জন্য আসল মান পুনরুদ্ধার

প্রায়শই জিজ্ঞাসিত প্রশ্ন

cloak.business কি শনাক্তকরণের জন্য AI ব্যবহার করে?

না। শনাক্তকরণে নির্ধারিত regex প্যাটার্ন ও NLP মডেল (spaCy, Stanza) ব্যবহার করা হয়। এতে ১০০% পুনরুত্পাদনযোগ্য ফলাফল নিশ্চিত হয় — একই ইনপুটে সবসময় একই আউটপুট, যা সম্ভাব্যতাভিত্তিক AI পদ্ধতির বিপরীত।

AI-এর পরিবর্তে regex প্যাটার্ন কেন?

Regex প্যাটার্ন নিরীক্ষাযোগ্য, পুনরুত্পাদনযোগ্য ও কমপ্লায়েন্ট। আপনি ঠিক কী মেলে তা দেখতে পারবেন। AI-ভিত্তিক শনাক্তকরণ অনির্ধারিত — প্রতিবার ফলাফল ভিন্ন হতে পারে, ফলে কমপ্লায়েন্স ডকুমেন্টেশন কঠিন হয়।

শনাক্তকরণের নির্ভুলতা কতটা?

৩১৭টি কাস্টম প্যাটার্ন রেকগনাইজার ও চেকসাম যাচাইকরণ (Luhn, IBAN, SSN) সহ cloak.business গঠিত শনাক্তকারীর (যেমন ক্রেডিট কার্ড, ট্যাক্স আইডি, জাতীয় আইডি নম্বর) জন্য সাধারণ NER মডেলের তুলনায় উল্লেখযোগ্যভাবে বেশি নির্ভুলতা অর্জন করে।

কোন ভাষাসমূহ সমর্থিত?

৪৮টি ভাষা সমর্থিত, নাম শনাক্তকরণের জন্য ডেডিকেটেড NLP মডেলসহ। প্যাটার্ন-ভিত্তিক শনাক্তকরণ (regex) সব ভাষায় কাজ করে, কারণ এটি ভাষা নির্বিশেষে অক্ষরের প্যাটার্ন মেলে।

আমি কি কাস্টম সত্তা প্যাটার্ন যোগ করতে পারি?

হ্যাঁ। API কাস্টম রেকগনাইজার সংজ্ঞা সমর্থন করে, যাতে আপনি নিজস্ব শনাক্তকারী, অভ্যন্তরীণ রেফারেন্স নম্বর, বা ডোমেইন-নির্দিষ্ট ডেটা ফরম্যাটের জন্য প্যাটার্ন যোগ করতে পারেন।

লাইভ ডেমো দেখুন

প্রতি চক্রে ২০০ টোকেনসহ আমাদের PII শনাক্তকরণ ও অ্যানোনিমাইজেশন ফ্রি চেষ্টা করুন।