Regex-First: اس کی اہمیت
ہمارا طریقہ: Regex + NLP
- 317 regex ریکگنائزرز: ساختہ ڈیٹا کے لیے 100% قابل تکرار
- نام و مقامات کے لیے NLP اور اعتماد اسکورز
- مکمل طور پر قابل آڈٹ — ہر شناخت پیٹرن یا ماڈل سے منسلک
- شفاف: آپ ہمیشہ جانتے ہیں کیا اور کیوں میچ ہوا
- تیز، متوقع کارکردگی
- 3 NLP انجنز میں 48 زبانیں
صرف AI پر مبنی طریقے
- تمام شناختیں امکانی ہوتی ہیں
- وضاحت نہیں کی جا سکتی کہ کیوں نشان زد ہوا
- بڑے تربیتی ڈیٹا سیٹس درکار
- تصدیق کے لیے آڈٹ مشکل
- زیادہ کمپیوٹ لاگت (GPU درکار)
- وقت کے ساتھ ماڈل کی درستگی کم ہو سکتی ہے
10 مراحل کا عمل
ان پٹ سے آؤٹ پٹ تک، آپ کے دستاویز کے ساتھ کیا ہوتا ہے
ان پٹ ٹیکسٹ
اپنے دستاویز کو ویب انٹرفیس، API یا Office Add-in کے ذریعے جمع کروائیں
زبان کی شناخت
سسٹم بہترین پراسیسنگ کے لیے دستاویز کی زبان پہچانتا ہے
Tokenization
پیٹرن میچنگ کے لیے ٹیکسٹ کو ٹوکنز میں تقسیم کیا جاتا ہے
پیٹرن میچنگ
317 regex ریکگنائزرز اور NLP ماڈلز 70 سے زائد ممالک میں 320+ اقسام کی شناخت کرتے ہیں
سیاق و سباق کا تجزیہ
گرد و نواح کا ٹیکسٹ شناخت کی درستگی کو بہتر بناتا ہے
اعتماد اسکورنگ
ہر شناخت کو اعتماد اسکور (0.0–1.0) ملتا ہے، جس سے انسانی نظرثانی ممکن ہوتی ہے
انٹیٹی کی درجہ بندی
شناخت شدہ اشیاء کو ان کی قسم کے مطابق تقسیم کیا جاتا ہے
انسانی نظرثانی
تمام شناختیں دیکھیں، غلط مثبت کو مسترد کریں، اور گمنامی سے پہلے منظوری دیں
گمنامی کا اطلاق
اپنا طریقہ منتخب کریں: Replace، Redact، Hash، Encrypt یا Mask
آؤٹ پٹ دستاویز
اپنی گمنام دستاویز ڈاؤن لوڈ کریں
MCP سرور: پرائیویسی-فرسٹ AI انٹیگریشن
آپ کا ڈیٹا MCP سرور کے ذریعے AI ٹولز کے لیے کیسے محفوظ رہتا ہے
MCP سرور ایک پرائیویسی شیلڈ کے طور پر کام کرتا ہے، AI ٹولز کی درخواستوں کو روکتا ہے، PII کو گمنام بناتا ہے، محفوظ ڈیٹا کو AI کے ذریعے پراسیس کرتا ہے، اور اصل اقدار کو بحال کرنا اختیاری ہے۔
AI ٹول کی درخواست
آپ کا AI ٹول (Cursor، Claude) PII کے ساتھ درخواست بھیجتا ہے
MCP سرور روکتا ہے
سرور تمام PII انٹیٹیز کی شناخت اور تجزیہ کرتا ہے
گمنامی
PII کو ٹوکنز سے تبدیل یا ریڈیکٹ کیا جاتا ہے
AI پراسیسنگ
AI صرف گمنام ڈیٹا وصول اور پراسیس کرتا ہے
جواب کی واپسی
AI کا جواب MCP سرور کے ذریعے واپس آتا ہے
ڈی-ٹوکنائزیشن
اختیاری: اصل اقدار صارف کے لیے بحال کی جاتی ہیں
اکثر پوچھے جانے والے سوالات
کیا cloak.business شناخت کے لیے AI استعمال کرتا ہے؟
نہیں۔ شناخت کے لیے قطعی regex پیٹرنز اور NLP ماڈلز (spaCy, Stanza) استعمال کیے جاتے ہیں۔ اس سے 100% قابل تکرار نتائج ملتے ہیں — ہر بار ایک ہی ان پٹ سے ایک ہی آؤٹ پٹ آتا ہے، جو امکانی AI طریقوں کے برعکس ہے۔
AI کے بجائے regex پیٹرنز کیوں؟
Regex پیٹرنز قابل آڈٹ، قابل تکرار اور تعمیل کے مطابق ہیں۔ آپ دیکھ سکتے ہیں کہ ہر پیٹرن کیا میچ کرتا ہے۔ AI پر مبنی شناخت غیر قطعی ہے — نتائج ہر بار مختلف ہو سکتے ہیں، جس سے تعمیل کی دستاویزات مشکل ہو جاتی ہیں۔
شناخت کتنی درست ہے؟
317 کسٹم پیٹرن ریکگنائزرز (Luhn، IBAN، SSN چیکسم سمیت) کے ساتھ، cloak.business عمومی NER ماڈلز کے مقابلے میں نمایاں طور پر زیادہ درستگی حاصل کرتا ہے، خاص طور پر ساختہ شناخت کنندگان جیسے کریڈٹ کارڈز، ٹیکس IDs اور قومی شناختی نمبرز کے لیے۔
کون سی زبانیں سپورٹڈ ہیں؟
48 زبانیں سپورٹڈ ہیں، نام کی شناخت کے لیے مخصوص NLP ماڈلز کے ساتھ۔ پیٹرن پر مبنی شناخت (regex) تمام زبانوں میں کام کرتی ہے کیونکہ یہ حروف کے پیٹرنز کو زبان سے قطع نظر میچ کرتی ہے۔
کیا میں اپنی مرضی کے انٹیٹی پیٹرنز شامل کر سکتا ہوں؟
جی ہاں۔ API کسٹم ریکگنائزر ڈیفینیشنز کو سپورٹ کرتا ہے، تاکہ آپ اپنی کمپنی کے شناخت کنندگان، اندرونی ریفرنس نمبرز یا مخصوص ڈیٹا فارمیٹس کے لیے پیٹرنز شامل کر سکیں۔