مرکزی مواد پر جائیں
OpenAI

۲۸ اکتوبر، ۲۰۲۵

Doppel کا AI دفاعی نظام حملوں کو پھیلنے سے پہلے روک دیتا ہے

GPT‑5 اور ری اِنفورسمنٹ فائن-ٹیوننگ (RFT) کے ساتھ، Doppel نے تجزیہ کاروں کے کام کے بوجھ کو 80% تک کم کر دیا ہے اور اب گھنٹوں کے بجائے منٹوں میں خطرات کا تدارک کرتا ہے.

گہرے دھاتی بناوٹ والے پس منظر پر خمیدہ لکیروں اور رِویٹس کے ساتھ درمیان میں سفید رنگ میں Doppel کا لوگو.
کمپنی کا سائز: اسٹارٹ اپ
خطہ: شمالی امریکہ
صنعت: ٹیکنالوجی
پراڈکٹس: API

نتائج

80%

کم کردہ تجزیہ کار ورک فلو

نتائج

3x

خطرات سے نمٹنے کی صلاحیت

لوڈ ہو رہا ہے…

نقالی کی ایک ویب سائٹ شروع ہو سکتی ہے، ہزاروں صارفین کو نشانہ بنا سکتی ہے اور ایک گھنٹے سے بھی کم وقت میں غائب ہو سکتی ہے. یہ ایک حملہ آور کے لیے حقیقی نقصان پہنچانے کے لیے کافی سے بھی زیادہ وقت ہے. اور جنریٹو ٹولز کے ساتھ، وہ اسی طرح کی مزید سینکڑوں ویب سائٹس بنا سکتے ہیں.

Doppel تنظیموں کو ڈیپ فیکس اور آن لائن جعل سازی سے محفوظ رکھنے کے لیے بنایا گیا تھا، لیکن جلد ہی یہ احساس ہوا کہ AI کے باعث خطرات لامحدود پیمانے پر بڑھ سکتے ہیں. حملہ آوروں کو اب دھوکے ہاتھ سے تیار کرنے کی ضرورت نہیں رہی تھی؛ وہ فشنگ کٹس، جعلی ڈومینز اور نقالی اکاؤنٹس کی لامتناہی اقسام چند سیکنڈز میں تیار کر سکتے تھے.

"فشنگ حملوں سے ہونے والا نقصان چند منٹوں میں ہو سکتا ہے، جیسے ہی وہ سوشل میڈیا اور پیغام رسانی کے چینلز پر پھیلتے ہیں. تقریباً بغیر کسی لاگت کے لامحدود حد تک قائل کرنے کی صلاحیت پیدا کرنے کی قابلیت نے سب کچھ بدل دیا."
—راہول مدولوری، شریک بانی اور CTO، Doppel

رول آؤٹ کے اندر

سبقت برقرار رکھنے کے لیے، Doppel نے OpenAI GPT‑5 اور o4-mini ماڈل پر مبنی سوشل انجینئرنگ سے دفاعی نظام کی ایک نئی قسم تیار کی. Doppel کا پلیٹ فارم خودکار طور پر خطرات کا پتہ لگاتا، ان کی درجہ بندی کرتا اور انہیں ختم کرتا ہے، جس سے تجزیہ کاروں کے ورک لوڈ میں 80% کمی آتی ہے، خطرات سے نمٹنے کی صلاحیت تین گنا بڑھ جاتی ہے اور ردِعمل کا وقت گھنٹوں سے کم ہو کر منٹوں تک آ جاتا ہے.

بے حد تیز رفتار خطرات سے آگے رہنا

روایتی ڈیجیٹل رسک پروٹیکشن میں انسانوں پر انحصار کیا جاتا تھا کہ وہ جعل سازی والی سائٹس، فِشنگ ڈومینز اور سوشل میڈیا پروفائلز اور پوسٹس کا دستی طور پر جائزہ لیں. Doppel نے دیکھا کہ یہ ماڈل بکھر رہا تھا، کیونکہ حملہ آور خودکاری اپنانے لگے تھے اور وہ اتنی تیزی سے اور اتنی زیادہ سطحوں پر، خطرات شروع کر رہے تھے جتنا انسان ان کا جائزہ نہیں لے سکتے تھے.

ہمارا نظام شور کے درمیان حقیقی خطرات کی شناخت کے لیے مسلسل اشاروں کے سیلاب کو پراسیس کرتا ہے. ایک بار خطرے کا پتہ چل جائے تو نقصان ہونے سے پہلے کارروائی کرنے کے لیے بہت کم وقت ہوتا ہے. فیصلہ سازی کو خودکار بنانے کے لیے AI کا استعمال کمپنی کے لیے سب سے بڑی صلاحیتوں میں سے ایک ہے، جو ہمیں انٹرنیٹ کے پیمانے اور رفتار پر حملوں کا مقابلہ کرنے کے قابل بناتی ہے.
—راہول مدولوری، شریک بانی اور CTO، Doppel

یہ رفتار Doppel کے صارفین کے لیے نہایت اہم ہے، خاص طور پر وہ تنظیمیں جو کسی خطرے کی تصدیق کے لیے گھنٹوں انتظار نہیں کر سکتیں. Doppel کا نظام زیادہ تر خطرات کی خودکار درجہ بندی کرتا ہے، OpenAI ماڈلز کو ریزننگ کے لیے استعمال کرتے ہوئے اور وقت کے ساتھ ماڈل کو بہتر بنانے کے لیے ایک منظم فیڈبیک لوپ، جسے ری اِنفورسمنٹ فائن-ٹیوننگ (RFT) کہا جاتا ہے، استعمال کرتا ہے. RFT میں، انسانی فیڈبیک کو درجہ بند مثالوں کے طور پر استعمال کیا جاتا ہے، جو ماڈل کو خود سے یکساں اور قابل وضاحت فیصلے کرنا سکھاتا ہے.

LLM سے چلنے والی خطرات کی کھوج کو ترتیب دینا

Doppel کی LLM سے چلنے والی پائپ لائن اس کے ڈٹیکشن اسٹاک کے مرکز میں واقع ہے. سگنلز حاصل اور فلٹر کیے جانے کے بعد، سسٹم ہدفی ریزننگ ٹاسکس کا ایک سلسلہ انجام دیتا ہے: ممکنہ خطرات پر ریزننگ کرنا، ارادے کی تصدیق کرنا اور درجہ بندی سے متعلق فیصلوں کو آگے بڑھانا. ہر مرحلہ اس طرح ڈیزائن کیا گیا ہے کہ رفتار، درستگی اور یکسانیت کے درمیان توازن برقرار رہے، جبکہ تجزیہ کاروں کی توجہ ان باریک کیسز پر مرکوز رہے جن کے لیے انسانی فیصلے کی ضرورت ہوتی ہے.

ایک فلو چارٹ LLMs کا استعمال کرتے ہوئے خطرات کا پتہ لگانے کے لیے ایک پائپ لائن دکھاتا ہے، جو سورسنگ اور فلٹرنگ سے شروع ہو کر، فیچر ایکسٹریکشن اور کلاسیفیکیشن کے ذریعے، حتمی ویریفیکیشن اور ٹیک ڈاؤن سسٹمز تک جاتی ہے. GPT-5 اور o4-mini جیسے ماڈل اہم مراحل میں استعمال ہوتے ہیں.

یہ اس طرح کام کرتا ہے:

  • سگنل فلٹرنگ اور فیچر ایکسٹریکشن: Doppel کے نظام روزانہ لاکھوں ڈومینز، URLs اور اکاؤنٹس اِنجیسٹ کرتے ہیں. ہیورسٹکس اور OpenAI o4-mini کا ایک امتزاج شور کو فلٹر کرتا ہے اور ڈھانچہ بند خصوصیات اخذ کرتا ہے تاکہ ڈاؤن اسٹریم ماڈل ایویلیوایشنز کی رہنمائی ہو سکے.
  • متوازی خطرے کی توثیق: ہر سگنل کو GPT‑5 کی متعدد پرومپٹ سے گزارا جاتا ہے، جو خطرات کے تجزیے کی مختلف اقسام کے لیے خاص طور پر تیار کیے گئے ہیں. یہ پرومپٹ نقالی کے خطرے، برانڈ کے غلط استعمال، یا سوشل انجینئرنگ کے پیٹرنز جیسے عوامل کا جائزہ لیتے ہیں.
  • خطرے کی درجہ بندی: o4-mini کا RFT ورژن پہلے کی توثیقات کو یکجا کرتا ہے تاکہ ایک منظم لیبل تفویض کیا جا سکے—نقصان دہ، بے ضرر، یا مبہم—اور یہ سب پروڈکشن درجے کی یکسانیت کے ساتھ ہوتا ہے.
  • حتمی توثیق: GPT‑5 کا دوسرا پاس ماڈل کے فیصلے کی توثیق کرتا ہے اور قدرتی زبان میں جواز فراہم کرتا ہے. اگر اعتماد کی سطح حد سے تجاوز کر جائے، تو نظام خودکار طور پر نفاذ شروع کر دیتا ہے.
  • انسانی جائزہ: کم اعتماد والے یا متضاد نتائج انسانی تجزیہ کاروں کو بھیجے جاتے ہیں. ان کے فیصلے لاگ کیے جاتے ہیں اور ماڈل کی مستقل مزاجی کو مسلسل بہتر بنانے کے لیے انہیں RFT لوپ میں واپس شامل کیا جاتا ہے.

ری اِنفورسمنٹ فائن-ٹیوننگوننگ (RFT) کے ذریعے ماڈل کی تربیت

Doppel نے اپنی اصل LLM سے بہتر بنائی گئی ڈیٹیکشن پائپ لائن سے پہلے ہی نمایاں فوائد دیکھ لیے تھے، لیکن جب بات ایسے معاملات کی آئی جہاں ایک ہی خطرے کا اندازہ تجزیہ کار کے لحاظ سے مختلف ہو سکتا تھا، تو یکسانیت محدود کرنے والا عنصر بن گئی.

"RFT سے حاصل ہونے والا ایک حقیقی فائدہ یہ ہے کہ آپ اس ماڈل کے فیصلوں کو زیادہ یکساں بنا رہے ہیں."
—کیرن اری میلی، سافٹ ویئر انجینئر، Doppel

اس مستقل مزاجی کو قائم رکھنے کے لیے، Doppel نے اپنے تجزیہ کار ڈیٹا کو فیڈبیک کے ماخذ کے طور پر استعمال کرتے ہوئے RFT کا اطلاق کیا. کسی ڈومین کو بدنیتی پر مبنی، بے ضرر، یا غیر واضح کے طور پر درجہ بندی کرنے کا ہر فیصلہ ایک درجہ بند مثال بن گیا. ان لیبل شدہ مثالوں نے ماڈل کو تربیت دی کہ وہ مبہم غیر معمولی صورتوں میں بھی ماہر کے فیصلے کی نقل کر سکے.

ایک دائروی خاکہ Doppel خطرے کی درجہ بندی کے ورک فلو کو دکھاتا ہے: پروڈکشن LLMs فیصلے کرتے ہیں → انسانی جائزہ لینے والے تصحیحات فراہم کرتے ہیں → ماڈل کی تربیت ماڈلز کو اپ ڈیٹ کرتی ہے → تعیناتی اپ ڈیٹ شدہ ماڈلز کو پروڈکشن میں بھیجتی ہے.

OpenAI کی اپلائیڈ انجینئرنگ ٹیم کے ساتھ قریبی تعاون کرتے ہوئے، Doppel نے ایسے گریڈر فنکشنز ڈیزائن کیے جو نہ صرف درستگی بلکہ وضاحتی معیار کا بھی جائزہ لیتے تھے اور ایسے ماڈل کو ترجیح دیتے تھے جو واضح استدلال کے ساتھ درست نتائج فراہم کرتے تھے. تجزیہ کاروں کے فیڈبیک کو منظم تربیتی ڈیٹا میں تبدیل کر کے، Doppel نے یہ ظاہر کیا کہ RFT کس طرح خودکار شناخت کو زیادہ مستقل اور قابل اعتماد بنا سکتا ہے.

شفافیت کے ذریعے اعتماد کو عملی جامہ پہنانا

ہائپرپیرامیٹر ٹیوننگ اور تکراری ایوالز نے ماڈل کو انسانی سطح کی مستقل مزاجی کے قریب تر لے آیا. لیکن Doppel کے لیے، آٹومیشن کے آخری مرحلے کو مکمل کرنے کا مطلب یہ بھی تھا کہ فیصلوں کو فوری طور پر قابل فہم بنایا جائے.

ہر خودکار ہٹانے میں اب ایک AI سے تیار کردہ جواز شامل ہے جس میں بتایا گیا ہے کہ دھمکی کو کیوں ہٹایا گیا، صارفین کو فوری بصیرت فراہم کرتا ہے کہ کارروائی کیوں کی گئی—ایسی چیز جو ایک بار تجزیہ کار کی مداخلت کی ضرورت تھی.

ایک ڈیش بورڈ ویو، جس میں ڈومین "d0ppel.click" کے لیے ایک ٹیک ڈاؤن الرٹ دکھایا گیا ہے، Doppel کی نقالی کرنے پر نشان زد کیا گیا. خلاصے میں فشنگ اور اسناد کی چوری کا حوالہ دیا گیا ہے، جبکہ دائیں جانب موجود ٹائم لائن 10.10.2025 کو تخلیق سے حل ہونے تک کے اسٹیٹس اپڈیٹس دکھاتی ہے.

یہ شفافیت اعتماد بڑھاتی ہے، جو Doppel کے صارفین کے لیے ایک نہایت اہم عنصر ہے. یہ سمجھنا کہ صرف کون سی کارروائی کی گئی ہی نہیں بلکہ کیوں کی گئی، ٹیموں کو تیزی سے ردِعمل دینے کا اعتماد دیتا ہے اور ایسا سیاق و سباق فراہم کرتا ہے کہ وہ ان فیصلوں کی وضاحت اندرونی طور پر یا متعلقہ فریقین کو کر سکیں.

نتائج کا خلاصہ

  • تجزیہ کاروں کے کام کے بوجھ میں 80% تک کمی کریں
  • خطرے کے جواب کے وقت کو گھنٹوں سے منٹوں تک کم کر دیا
  • خطرات سے نمٹنے کی صلاحیت تین گنا
  • زیادہ تر خطرات کی درجہ بندی خودکار طور پر

اگلا قدم کیا ہے

فشنگ اور جعل سازی کے شعبوں میں تقریباً مکمل خودکار نظام تک پہنچنے کے بعد، Doppel اب اسی ماڈل سے چلنے والے فریم ورک کو دیگر زیادہ تغیر والے چینلز پر بھی لاگو کر رہا ہے.

"ڈومینز شاید سب سے مشکل چینل ہیں جنہیں ہم سنبھالتے ہیں،" مڈولوری نے کہا. "سگنلز بکھرے ہوئے ہیں، مواد مسلسل بدلتا رہتا ہے اور خطرات ایک ہی وقت میں کئی سطحوں پر تیزی سے ارتقاء پذیر ہوتے ہیں. اگر ہم اسے شروع سے آخر تک خودکار بنا دیں، تو ہم یہ کسی بھی چیز کے لیے کر سکتے ہیں: سوشل میڈیا، بامعاوضہ اشتہارات، بس آپ نام بتائیں."

اگلے سنگ میلوں میں ان کے RFT ڈیٹا سیٹ کو ایک درجۂ وسعت تک بڑھانا، نئی درجہ بندی کی حکمت عملیوں کے ساتھ تجربہ کرنا اور ابتدائی مرحلے میں فیچر استخراج کے لیے GPT‑5 کا استعمال کرنا شامل ہے. یہ تبدیلیاں Doppel کو پائپ لائن کے مراحل کو یکجا کرنے اور عمل کے پہلے ہی مرحلے میں زیادہ پیچیدہ خطرے کے اشاریوں پر غور کرنے کے قابل بنائیں گی.

ہر تکرار کے ساتھ، Doppel ایک ایسے نظام کی تعمیر کر رہا ہے جو ہر اُس سطح پر حقیقی چیزوں کا دفاع کرتا ہے جہاں اعتماد خطرے میں ہو.