Doppel का AI डिफ़ेंस सिस्टम अटैक्स को फ़ैलने से पहले ही रोक देता है
GPT‑5 और रिइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) के साथ, Doppel ने एनालिस्ट्स के वर्कलोड को 80% तक कम किया और अब यह खतरों को घंटों के बजाय मिनटों में कम कर देता है.

नतीजे
80%
कम किए गए एनालिस्ट वर्कफ़्लो
नतीजे
3x
खतरे से निपटने की क्षमता
एक अकेली नकल करने वाली साइट लॉन्च हो सकती है, हज़ारों उपयोगकर्ताओं को निशाना बना सकती है, और एक घंटे से भी कम समय में गायब हो सकती है. एक हमलावर के लिए गंभीर नुकसान पहुंचाने के लिए यह समय पर्याप्त से अधिक है. और जेनरेटिव टूल्स के साथ, वे इसी तरह के सैकड़ों और बना सकते हैं.
Doppel को डीपफ़ेक और ऑनलाइन नकल-करने वालों से संस्थाओं की रक्षा करने के लिए बनाया गया था, लेकिन जल्दी ही ये समझ आ गया कि AI के कारण खतरे अनगिनत तरह से फ़ैल सकते हैं. हमलावरों को अब घोटाले करने की ज़रूरत नहीं है; वे कुछ ही सेकंड में फ़िशिंग किट, नकली डोमेन और नकल किए गए अकाउंट्स के अनगिनत वैरिएंट्स तैयार कर सकते हैं.
फ़िशिंग हमलों से होने वाला नुकसान मिनटों में हो सकता है क्योंकि ये सोशल मीडिया और मैसेजिंग चैनलों पर तेजी से फैलते हैं. लगभग बिना किसी खर्चे पर असीमित प्रभाव पैदा करने की क्षमता ने सब कुछ बदल दिया.
रोलआउट के भीतर
आगे बने रहने के लिए, Doppel ने OpenAI GPT‑5 और o4-mini मॉडल पर आधारित एक नए प्रकार का सोशल इंजीनियरिंग डिफेंस सिस्टम विकसित किया. Doppel का प्लेटफ़ॉर्म स्वचालित रूप से ख़तरों का पता लगाता है, उन्हें वर्गीकृत करता है और समाप्त करता है. इससे एनालिस्ट्स का वर्कलोड 80% तक कम हो जाता है, ख़तरों से निपटने की क्षमता तीन गुना बढ़ जाती है और प्रतिक्रिया समय घंटों से घटकर मिनटों में आ जाता है.
असीम तरीके से बढ़ते तेज़ खतरों से आगे बने रहना
पारंपरिक डिजिटल रिस्क प्रोटेक्शन नकल करने वाली साइट्स, फ़िशिंग डोमेन्स, और सोशल मीडिया प्रोफाइल्स और पोस्ट का मैन्युअल रिव्यू करने के लिए इंसानों पर निर्भर करता था. Doppel ने देखा कि जैसे ही हमलावरों ने ऑटोमेशन शुरू किया, यह मॉडल टूटने लगा. वे इंसानों की मूल्यांकन क्षमता से तेज़ और अधिक सतह क्षेत्रों में हमले करने लगे.
हमारा सिस्टम लगातार आने वाले सिग्नलों को प्रोसेस करता है ताकि शोर के बीच असली खतरों की पहचान की जा सके. एक बार किसी खतरे का पता चल जाने पर, नुकसान होने से पहले कार्रवाई करने के लिए बहुत ही कम समय मिलता है. फ़ैसला लेने की प्रक्रिया को ऑटोमेट करने के लिए AI का इस्तेमाल करना कंपनी की सबसे बड़ी संभावनाओं में से एक है, जिससे हमें इंटरनेट के स्तर और गति पर हमलों का मुकाबला करने में मदद मिलती है.
ये स्पीड Doppel के कस्टमर्स के लिए ज़रूरी है, यानी ऐसे ऑर्गनाइज़ेशन्स जो किसी खतरे को कन्फ़र्म करने के लिए घंटों इंतज़ार नहीं कर सकते. Doppel का सिस्टम ज़्यादातर खतरों को अपने आप वर्गीकृत करता है, रीज़निंग के लिए OpenAI मॉडल का उपयोग करता है और समय के साथ मॉडल को बेहतर बनाने के लिए रिइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) नामक एक संरचित फ़ीडबैक लूप का उपयोग करता है. RFT में, ह्यूमन फ़ीडबैक का उपयोग ग्रेडेड उदाहरणों के रूप में किया जाता है, जिससे मॉडल अपने आप सुसंगत और व्याख्यायोग्य निर्णय लेना सीखते हैं.
LLM-आधारित खतरों को डिटेक्ट करने की रूपरेखा तैयार करना
Doppel की LLM-आधारित पाइपलाइन इसके डिटेक्शन स्टैक के केंद्र में स्थित है. सिग्नल्स को स्रोत और फ़िल्टर किए जाने के बाद, सिस्टम कई लक्षित रीज़निंग कार्य करता है: संभावित खतरों का विश्लेषण करना, इरादे की पुष्टि करना, और वर्गीकरण के निर्णय लेना. प्रत्येक चरण को गति, सटीकता और एकरूपता के बीच संतुलन बनाए रखने के लिए डिज़ाइन किया गया है, जबकि विश्लेषकों का ध्यान उन विशेष मामलों पर केंद्रित रखा जाता है जिनमें मानवीय निर्णय की आवश्यकता होती है.

देखें कि ये ऐसे काम करता है:
- सिग्नल फ़िल्टरिंग और फ़ीचर एक्सट्रैक्शन: Doppel के सिस्टम रोज़ाना लाखों डोमेन, URL और अकाउंट को प्रोसेस करते हैं. ह्यूरिस्टिक्स और OpenAI o4-mini का संयोजन शोर को फ़िल्टर करता है और डाउनस्ट्रीम मॉडल इवैल्यूएशन्स को गाइड करने के लिए स्ट्रक्चर्ड फ़ीचर्स को निकालता है.
- समानांतर ख़तरे की पुष्टि: प्रत्येक सिग्नल को कई GPT‑5 प्रॉम्प्ट्स से गुज़ारा जाता है, जिन्हें विशेष रूप से विभिन्न प्रकार के ख़तरे के विश्लेषण के लिए तैयार किया गया है. ये प्रॉम्प्ट नक़ल के जोखिम, ब्रांड के दुरुपयोग, या सोशल इंजीनियरिंग पैटर्न जैसे कारकों का मूल्यांकन करते हैं.
- ख़तरों को वर्गीकृत करना: o4-mini का RFT संस्करण पिछली पुष्टियों को संश्लेषित करके, उत्पादन-स्तर की एकरूपता के साथ एक संरचित लेबल—दुर्भावनापूर्ण, हानिरहित, या अस्पष्ट—निर्धारित करता है.
- फ़ाइनल वेरिफ़िकेशन: GPT‑5 का दूसरा पास मॉडल के निर्णय को मान्य करता है और प्राकृतिक भाषा में उसका औचित्य प्रस्तुत करता है. अगर कॉन्फिडेंस थ्रेशोल्ड से ज़्यादा हो जाता है, तो सिस्टम अपने आप इन्फोर्समेंट शुरू कर देता है.
- मानवीय समीक्षा: कम भरोसे वाले या परस्पर विरोधी परिणामों को मानवीय विश्लेषकों के पास भेजा जाता है. उनके निर्णयों को लॉग किया जाता है और मॉडल की निरंतर एकरूपता में सुधार के लिए उन्हें RFT लूप में वापस भेजा जाता है.
रीइन्फ़ोर्समेंट फ़ाइन-ट्यूनिंग (RFT) के ज़रिये मॉडल्स को ट्रेन करना
Doppel ने पहले ही अपने ओरिजिनल LLM-आधारित डिटेक्शन पाइपलाइन से अच्छे नतीजे मिले थे, लेकिन जब ऐसे मामलों की बात आई जहां एक ही खतरे पर एनालिस्ट के आधार पर अलग-अलग रे होती थी, तो स्थिरता एक समस्या बन गई.
"RFT से जो एक असली फ़ायदा सामने आया है, वो ये है कि उस मॉडल के फ़ैसले और ज़्यादा स्थिर और एकसमान हो जाते हैं."
ऐसी स्थिरता बनाने के लिए, Doppel ने फ़ीडबैक सोर्स के तौर पर अपने खुद के एनालिस्ट डेटा का इस्तेमाल करके RFT लागू किया. किसी डोमेन को खराब, सुरक्षित, या अनिश्चित के रूप में वर्गीकृत करने का प्रत्येक फ़ैसला एक ग्रेडेड उदाहरण बन गया. उन लेबल किए गए एग्ज़ाम्पल्स ने मॉडल को एक्सपर्ट जजमेंट को दोहराने के लिए ट्रेन किया, यहाँ तक कि अस्पष्ट एज केसेस पर भी.

OpenAI की एप्लाईड इंजीनियरिंग टीम के साथ मिलकर काम करते हुए, Doppel ने ग्रेडर फ़ंक्शन्स डिज़ाइन किए, जो न केवल सटीकता बल्कि समझाने की गुणवत्ता को भी मापते थे, और उन मॉडल को पुरस्कृत करते थे जो न केवल सही बल्कि स्पष्ट रीज़निंग प्रदान करते थे. एनालिस्ट फ़ीडबैक को संरचित ट्रेनिंग डेटा में बदलकर, Doppel ने यह दिखाने में मदद की कि RFT कैसे स्वचालित डिटेक्शन को अधिक स्थिर और भरोसेमंद बना सकता है.
ट्रांसपेरेंसी के ज़रिये भरोसे को व्यवहार में लाना
हाइपरपैरामीटर ट्यूनिंग और इटरेटिव इवैल्स ने मॉडल को मानव-स्तर की स्थिरता के करीब ला दिया. लेकिन Doppel के लिए, ऑटोमेशन के अंतिम चरण को पूरा करने का मतलब निर्णयों को तुरंत समझने योग्य बनाना भी था.
अब हर ऑटोमेटेड टेकेडाउन के साथ AI द्वारा तैयार की गई एक वजह शामिल होती है, जो बताती है कि खतरे को क्यों हटाया गया — जिससे कस्टमर्स को तुरंत ये समझ में आता है कि एक्शन क्यों लिया गया, जबकि पहले इसके लिए एनालिस्ट की दखलंदाज़ी की ज़रुरत पड़ती थी.

यह दृश्यता भरोसे को बढ़ाती है, जो Doppel के उपयोगकर्ताओं के लिए एक महत्वपूर्ण कारक है. न केवल यह देखना कि क्या कार्रवाई की गई, बल्कि यह भी कि क्यों की गई, टीमों को तेज़ी से प्रतिक्रिया देने का आत्मविश्वास और उन निर्णयों को आंतरिक रूप से या हितधारकों को समझाने का संदर्भ प्रदान करता है.
एक नज़र में परिणाम
- विश्लेषकों के काम का बोझ 80% तक कम करें
- खतरे पर प्रतिक्रिया देने का समय घंटों से घटाकर मिनटों तक किया
- खतरों से निपटने की क्षमता तीन गुना बढ़ी
- अधिकांश खतरे स्वचालित रूप से वर्गीकृत किए जाते हैं
आगे और क्या है
फ़िशिंग और नकली डोमेन्स बनाने के लिए लगभग-पूरे ऑटोमेशन तक पहुंचने के बाद, Doppel अब उसी मॉडल-आधारित फ़्रेमवर्क को दूसरे हाई-वैरिएंस चैनल्स पर लागू कर रहा है.
Madduluri ने कहा, "डोमेन्स शायद सबसे मुश्किल चैनल हैं जिन्हें हम संबोधित करते हैं." "संकेत अस्त-व्यस्त हैं, सामग्री लगातार बदलती रहती है, और खतरे एक साथ कई मंचों पर तेजी से उभरते रहते हैं." अगर हम इसे शुरू से आखिर तक स्वचालित कर सकें, तो हम इसे किसी भी चीज़ के लिए कर सकते हैं: सोशल मीडिया, पेड विज्ञापन, आप जो चाहें.
अगले मील के पत्थरों में उनके RFT डेटासेट को एक ऑर्डर ऑफ मैग्निट्यूड तक बढ़ाना, नई ग्रेडिंग स्ट्रेटेजियों पर प्रयोग करना, और अपस्ट्रीम फ़ीचर एक्सट्रैक्शन के लिए GPT‑5 का उपयोग करना शामिल है. ये बदलाव Doppel को पाइपलाइन स्टेजों को एकीकृत करने और प्रक्रिया की शुरुआत में ही अधिक जटिल खतरे के संकेतकों पर विचार करने में सक्षम बनाएंगे.
हरेक सुधार के साथ, Doppel एक ऐसा सिस्टम बना रहा है जो उन सभी प्लेटफ़ॉर्म पर वास्तविकता की रक्षा करता है जहां भरोसे पर हमला हो रहा है.


