स्किप करके मेन कंटेंट पर जाऍं
OpenAI

28 अक्टूबर 2025

Doppel का AI डिफ़ेंस सिस्टम अटैक्स को फ़ैलने से पहले ही रोक देता है

GPT‑5 और रिइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) के साथ, Doppel ने एनालिस्ट्स के वर्कलोड को 80% तक कम किया और अब यह खतरों को घंटों के बजाय मिनटों में कम कर देता है.

गहरे मैटेलिक टेक्सचर वाले बैकग्राउंड पर, जिस पर घुमावदार लाइनें और रिवेट्स हों, उसके बीचोंबीच सफ़ेद रंग में Doppel का लोगो.
कंपनी की साइज़: स्टार्टअप
क्षेत्र: उत्तरी अमेरिका
इंडस्‍ट्री: टेक्‍नोलॉजी
प्रॉडक्ट्स: API

नतीजे

80%

कम किए गए एनालिस्ट वर्कफ़्लो

नतीजे

3x

खतरे से निपटने की क्षमता

लोड किया जा रहा है...

एक अकेली नकल करने वाली साइट लॉन्च हो सकती है, हज़ारों उपयोगकर्ताओं को निशाना बना सकती है, और एक घंटे से भी कम समय में गायब हो सकती है. एक हमलावर के लिए गंभीर नुकसान पहुंचाने के लिए यह समय पर्याप्त से अधिक है. और जेनरेटिव टूल्स के साथ, वे इसी तरह के सैकड़ों और बना सकते हैं.

Doppel को डीपफ़ेक और ऑनलाइन नकल-करने वालों से संस्थाओं की रक्षा करने के लिए बनाया गया था, लेकिन जल्दी ही ये समझ आ गया कि AI के कारण खतरे अनगिनत तरह से फ़ैल सकते हैं. हमलावरों को अब घोटाले करने की ज़रूरत नहीं है; वे कुछ ही सेकंड में फ़िशिंग किट, नकली डोमेन और नकल किए गए अकाउंट्स के अनगिनत वैरिएंट्स तैयार कर सकते हैं.

फ़िशिंग हमलों से होने वाला नुकसान मिनटों में हो सकता है क्योंकि ये सोशल मीडिया और मैसेजिंग चैनलों पर तेजी से फैलते हैं. लगभग बिना किसी खर्चे पर असीमित प्रभाव पैदा करने की क्षमता ने सब कुछ बदल दिया.
—Rahul Madduluri, सह-संस्थापक और CTO, Doppel

रोलआउट के भीतर

आगे बने रहने के लिए, Doppel ने OpenAI GPT‑5 और o4-mini मॉडल पर आधारित एक नए प्रकार का सोशल इंजीनियरिंग डिफेंस सिस्टम विकसित किया. Doppel का प्लेटफ़ॉर्म स्वचालित रूप से ख़तरों का पता लगाता है, उन्हें वर्गीकृत करता है और समाप्त करता है. इससे एनालिस्ट्स का वर्कलोड 80% तक कम हो जाता है, ख़तरों से निपटने की क्षमता तीन गुना बढ़ जाती है और प्रतिक्रिया समय घंटों से घटकर मिनटों में आ जाता है.

असीम तरीके से बढ़ते तेज़ खतरों से आगे बने रहना

पारंपरिक डिजिटल रिस्क प्रोटेक्शन नकल करने वाली साइट्स, फ़िशिंग डोमेन्स, और सोशल मीडिया प्रोफाइल्स और पोस्ट का मैन्युअल रिव्यू करने के लिए इंसानों पर निर्भर करता था. Doppel ने देखा कि जैसे ही हमलावरों ने ऑटोमेशन शुरू किया, यह मॉडल टूटने लगा. वे इंसानों की मूल्यांकन क्षमता से तेज़ और अधिक सतह क्षेत्रों में हमले करने लगे.

हमारा सिस्टम लगातार आने वाले सिग्नलों को प्रोसेस करता है ताकि शोर के बीच असली खतरों की पहचान की जा सके. एक बार किसी खतरे का पता चल जाने पर, नुकसान होने से पहले कार्रवाई करने के लिए बहुत ही कम समय मिलता है. फ़ैसला लेने की प्रक्रिया को ऑटोमेट करने के लिए AI का इस्तेमाल करना कंपनी की सबसे बड़ी संभावनाओं में से एक है, जिससे हमें इंटरनेट के स्तर और गति पर हमलों का मुकाबला करने में मदद मिलती है.
—Rahul Madduluri, सह-संस्थापक और CTO, Doppel

ये स्पीड Doppel के कस्टमर्स के लिए ज़रूरी है, यानी ऐसे ऑर्गनाइज़ेशन्स जो किसी खतरे को कन्फ़र्म करने के लिए घंटों इंतज़ार नहीं कर सकते. Doppel का सिस्टम ज़्यादातर खतरों को अपने आप वर्गीकृत करता है, रीज़निंग के लिए OpenAI मॉडल का उपयोग करता है और समय के साथ मॉडल को बेहतर बनाने के लिए रिइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) नामक एक संरचित फ़ीडबैक लूप का उपयोग करता है. RFT में, ह्यूमन फ़ीडबैक का उपयोग ग्रेडेड उदाहरणों के रूप में किया जाता है, जिससे मॉडल अपने आप सुसंगत और व्याख्यायोग्य निर्णय लेना सीखते हैं.

LLM-आधारित खतरों को डिटेक्ट करने की रूपरेखा तैयार करना

Doppel की LLM-आधारित पाइपलाइन इसके डिटेक्शन स्टैक के केंद्र में स्थित है. सिग्नल्स को स्रोत और फ़िल्टर किए जाने के बाद, सिस्टम कई लक्षित रीज़निंग कार्य करता है: संभावित खतरों का विश्लेषण करना, इरादे की पुष्टि करना, और वर्गीकरण के निर्णय लेना. प्रत्येक चरण को गति, सटीकता और एकरूपता के बीच संतुलन बनाए रखने के लिए डिज़ाइन किया गया है, जबकि विश्लेषकों का ध्यान उन विशेष मामलों पर केंद्रित रखा जाता है जिनमें मानवीय निर्णय की आवश्यकता होती है.

एक फ़्लोचार्ट LLMs का उपयोग करके खतरे का पता लगाने के लिए एक पाइपलाइन दिखाता है, जो सोर्सिंग और फ़िल्टरिंग से शुरू होकर फ़ीचर एक्सट्रैक्शन और क्लासिफ़िकेशन के माध्यम से अंतिम सत्यापन और टेकडाउन सिस्टम तक जाती है. GPT-5 और o4-mini जैसे मॉडल का उपयोग प्रमुख चरणों में किया जाता है.

देखें कि ये ऐसे काम करता है:

  • सिग्नल फ़िल्टरिंग और फ़ीचर एक्सट्रैक्शन: Doppel के सिस्टम रोज़ाना लाखों डोमेन, URL और अकाउंट को प्रोसेस करते हैं. ह्यूरिस्टिक्स और OpenAI o4-mini का संयोजन शोर को फ़िल्टर करता है और डाउनस्ट्रीम मॉडल इवैल्यूएशन्स को गाइड करने के लिए स्ट्रक्चर्ड फ़ीचर्स को निकालता है.
  • समानांतर ख़तरे की पुष्टि: प्रत्येक सिग्नल को कई GPT‑5 प्रॉम्प्ट्स से गुज़ारा जाता है, जिन्हें विशेष रूप से विभिन्न प्रकार के ख़तरे के विश्लेषण के लिए तैयार किया गया है. ये प्रॉम्प्ट नक़ल के जोखिम, ब्रांड के दुरुपयोग, या सोशल इंजीनियरिंग पैटर्न जैसे कारकों का मूल्यांकन करते हैं.
  • ख़तरों को वर्गीकृत करना: o4-mini का RFT संस्करण पिछली पुष्टियों को संश्लेषित करके, उत्पादन-स्तर की एकरूपता के साथ एक संरचित लेबल—दुर्भावनापूर्ण, हानिरहित, या अस्पष्ट—निर्धारित करता है.
  • फ़ाइनल वेरिफ़िकेशन: GPT‑5 का दूसरा पास मॉडल के निर्णय को मान्य करता है और प्राकृतिक भाषा में उसका औचित्य प्रस्तुत करता है. अगर कॉन्फिडेंस थ्रेशोल्ड से ज़्यादा हो जाता है, तो सिस्टम अपने आप इन्फोर्समेंट शुरू कर देता है.
  • मानवीय समीक्षा: कम भरोसे वाले या परस्पर विरोधी परिणामों को मानवीय विश्लेषकों के पास भेजा जाता है. उनके निर्णयों को लॉग किया जाता है और मॉडल की निरंतर एकरूपता में सुधार के लिए उन्हें RFT लूप में वापस भेजा जाता है.

रीइन्फ़ोर्समेंट फ़ाइन-ट्यूनिंग (RFT) के ज़रिये मॉडल्स को ट्रेन करना

Doppel ने पहले ही अपने ओरिजिनल LLM-आधारित डिटेक्शन पाइपलाइन से अच्छे नतीजे मिले थे, लेकिन जब ऐसे मामलों की बात आई जहां एक ही खतरे पर एनालिस्ट के आधार पर अलग-अलग रे होती थी, तो स्थिरता एक समस्या बन गई.

"RFT से जो एक असली फ़ायदा सामने आया है, वो ये है कि उस मॉडल के फ़ैसले और ज़्यादा स्थिर और एकसमान हो जाते हैं."
—Kiran Arimilli, सॉफ़्टवेयर इंजीनियर, Doppel

ऐसी स्थिरता बनाने के लिए, Doppel ने फ़ीडबैक सोर्स के तौर पर अपने खुद के एनालिस्ट डेटा का इस्तेमाल करके RFT लागू किया. किसी डोमेन को खराब, सुरक्षित, या अनिश्चित के रूप में वर्गीकृत करने का प्रत्येक फ़ैसला एक ग्रेडेड उदाहरण बन गया. उन लेबल किए गए एग्ज़ाम्पल्स ने मॉडल को एक्सपर्ट जजमेंट को दोहराने के लिए ट्रेन किया, यहाँ तक कि अस्पष्ट एज केसेस पर भी.

एक सर्कुलर डायग्राम Doppel खतरा क्लासिफ़िकेशन वर्कफ़्लो दिखाता है: प्रोडक्शन LLMs फ़ैसले लेते हैं → ह्यूमन रिव्युअर्स सुधार करेक्शन्स करते हैं → मॉडल ट्रेनिंग मॉडल्स को अपडेट करती है → डिप्लॉयमेंट अपडेटेड मॉडल्स को प्रोडक्शन में भेजता है.

OpenAI की एप्लाईड इंजीनियरिंग टीम के साथ मिलकर काम करते हुए, Doppel ने ग्रेडर फ़ंक्शन्स डिज़ाइन किए, जो न केवल सटीकता बल्कि समझाने की गुणवत्ता को भी मापते थे, और उन मॉडल को पुरस्कृत करते थे जो न केवल सही बल्कि स्पष्ट रीज़निंग प्रदान करते थे. एनालिस्ट फ़ीडबैक को संरचित ट्रेनिंग डेटा में बदलकर, Doppel ने यह दिखाने में मदद की कि RFT कैसे स्वचालित डिटेक्शन को अधिक स्थिर और भरोसेमंद बना सकता है.

ट्रांसपेरेंसी के ज़रिये भरोसे को व्यवहार में लाना

हाइपरपैरामीटर ट्यूनिंग और इटरेटिव इवैल्स ने मॉडल को मानव-स्तर की स्थिरता के करीब ला दिया. लेकिन Doppel के लिए, ऑटोमेशन के अंतिम चरण को पूरा करने का मतलब निर्णयों को तुरंत समझने योग्य बनाना भी था.

अब हर ऑटोमेटेड टेकेडाउन के साथ AI द्वारा तैयार की गई एक वजह शामिल होती है, जो बताती है कि खतरे को क्यों हटाया गया — जिससे कस्टमर्स को तुरंत ये समझ में आता है कि एक्शन क्यों लिया गया, जबकि पहले इसके लिए एनालिस्ट की दखलंदाज़ी की ज़रुरत पड़ती थी.

एक डैशबोर्ड व्यू डोमेन “d0ppel.click” के लिए एक टेकडाउन अलर्ट दिखाता है. Doppel का रूप धारण करने के लिए फ़्लैग किया गया. समरी में फ़िशिंग और क्रिडेंशियल्स चोरी के बारे में बताया गया है, और दाईं ओर टाइमलाइन दी गई है, जिसमें 10 अक्टूबर, 2025 को क्रिएशन से लेकर रिज़ॉल्युशन तक के स्टेटस के अपडेट्स दिखाए गए हैं.

यह दृश्यता भरोसे को बढ़ाती है, जो Doppel के उपयोगकर्ताओं के लिए एक महत्वपूर्ण कारक है. न केवल यह देखना कि क्या कार्रवाई की गई, बल्कि यह भी कि क्यों की गई, टीमों को तेज़ी से प्रतिक्रिया देने का आत्मविश्वास और उन निर्णयों को आंतरिक रूप से या हितधारकों को समझाने का संदर्भ प्रदान करता है.

एक नज़र में परिणाम

  • विश्लेषकों के काम का बोझ 80% तक कम करें
  • खतरे पर प्रतिक्रिया देने का समय घंटों से घटाकर मिनटों तक किया
  • खतरों से निपटने की क्षमता तीन गुना बढ़ी
  • अधिकांश खतरे स्वचालित रूप से वर्गीकृत किए जाते हैं

आगे और क्या है

फ़िशिंग और नकली डोमेन्स बनाने के लिए लगभग-पूरे ऑटोमेशन तक पहुंचने के बाद, Doppel अब उसी मॉडल-आधारित फ़्रेमवर्क को दूसरे हाई-वैरिएंस चैनल्स पर लागू कर रहा है.

Madduluri ने कहा, "डोमेन्स शायद सबसे मुश्किल चैनल हैं जिन्हें हम संबोधित करते हैं." "संकेत अस्त-व्यस्त हैं, सामग्री लगातार बदलती रहती है, और खतरे एक साथ कई मंचों पर तेजी से उभरते रहते हैं." अगर हम इसे शुरू से आखिर तक स्वचालित कर सकें, तो हम इसे किसी भी चीज़ के लिए कर सकते हैं: सोशल मीडिया, पेड विज्ञापन, आप जो चाहें.

अगले मील के पत्थरों में उनके RFT डेटासेट को एक ऑर्डर ऑफ मैग्निट्यूड तक बढ़ाना, नई ग्रेडिंग स्ट्रेटेजियों पर प्रयोग करना, और अपस्ट्रीम फ़ीचर एक्सट्रैक्शन के लिए GPT‑5 का उपयोग करना शामिल है. ये बदलाव Doppel को पाइपलाइन स्टेजों को एकीकृत करने और प्रक्रिया की शुरुआत में ही अधिक जटिल खतरे के संकेतकों पर विचार करने में सक्षम बनाएंगे.

हरेक सुधार के साथ, Doppel एक ऐसा सिस्टम बना रहा है जो उन सभी प्लेटफ़ॉर्म पर वास्तविकता की रक्षा करता है जहां भरोसे पर हमला हो रहा है.