स्किप करके मेन कंटेंट पर जाऍं
OpenAI

9 सितंबर 2025

SafetyKit OpenAI के सक्षम मॉडल से जोखिम एजेंट्स स्केल करता है

शुरुआती विज़न मॉडल प्रीव्यू के साथ प्रोटोटाइपिंग से लेकर GPT‑5 के साथ स्केलिंग तक, SafetyKit के मल्टी-मोडल एजेंट नए डोमेन में विस्तार करते हैं और सटीकता बढ़ाते हैं.

नारंगी, पीली और टील रोशनी के वॉर्म ग्रेडिएंट के साथ गहरे, वर्टिकली टेक्सचर्ड बैकग्राउंड के बीचों-बीच सफ़ेद रंग में SafetyKit का लोगो.
कंपनी की साइज़: स्टार्टअप
क्षेत्र: उत्तरी अमेरिका
इंडस्‍ट्री: टेक्‍नोलॉजी, सेवाएँ
प्रॉडक्ट्स: API

परिणाम

95%+

ग्राहक सामग्री के 100% की सटीकता की समीक्षा (SafetyKit एवल्यूएशन्स)

परिणाम

16B

रोज़ाना प्रोसेस किए जाने वाले टोकन, जो छह महीने पहले 200M थे

परिणाम

10+

सबसे कठिन विज़न कार्यों में GPT-5 के साथ प्रदर्शन में सुधार

लोड किया जा रहा है...

SafetyKit(एक नई विंडो में खुलेगा) टेक्स्ट, इमेजेज़, फ़ाइनेंशियल ट्रांज़ैक्शंस, प्रोडक्ट लिस्टिंग्स और अन्य माध्यमों में धोखाधड़ी और प्रोहिबिटेड एक्टिविटीज़ का पता लगाने और उन पर कार्रवाई करने में मार्केटप्लेसेज़, पेमेंट प्लेटफ़ॉर्म्स और फिनटेक्स की मदद करने के लिए मल्टीमॉडल AI एजेंट्स बनाता है. मॉडल रीज़निंग और मल्टीमोडल समझ में हालिया प्रगति अब इसे अधिक प्रभावी बनाती है, जिससे जोखिम, अनुपालन और सुरक्षा संचालन के लिए एक नया मानक स्थापित होता है.

SafetyKit के एजेंट्स, SafetyKit के evals के आधार पर 95% से अधिक सटीकता के साथ ग्राहकों के 100% कॉन्टेंट की समीक्षा करने के लिए GPT‑5, GPT‑4.1, डीप रिसर्च और कंप्यूटर-यूज़िंग एजेंट (CUA) का उपयोग करते हैं. वे प्लेटफ़ॉर्म्स को यूज़र्स की सुरक्षा करने, फ़्रॉड को रोकने, विनियामक जुर्मानों से बचने, और ऐसी जटिल नीतियों को लागू करने में मदद कर सकते हैं जिन्हें पुरानी प्रणालियाँ पहचान नहीं पातीं, जैसे क्षेत्र-विशिष्ट नियम, स्कैम इमेजेज़ में एम्बेड किए गए फ़ोन नंबर, या अश्लील कंटेंट. ऑटोमेशन मानव मॉडरेटर्स को आपत्तिजनक सामग्री के संपर्क में आने से भी बचा सकता है और उन्हें नीतियों से जुड़े बारीक फैसलों को संभालने के लिए मुक्त करता है.

“OpenAI हमें बाज़ार में उपलब्ध सबसे उन्नत रीज़निंग और मल्टी-मॉडल मॉडलों का एक्सेस देता है. यह हमें तेज़ी से अनुकूलित होने, नए एजेंट्स को तेज़ी से शिप करने, और उन कंटेंट टाइप्स को संभालने में सक्षम बनाता है जिन्हें दूसरे समाधान पार्स तक नहीं कर पाते.”
David Graunke, SafetyKit के संस्थापक और CEO

टास्क की मांग के अनुसार एजेंट्स डिज़ाइन करें, फिर सही मॉडल चुनें

SafetyKit के प्रत्येक एजेंट को स्कैम्स से लेकर अवैध उत्पादों तक, एक विशेष जोखिम श्रेणी से निपटने के लिए बनाया गया है. कॉन्टेंट के हर हिस्से को उस उल्लंघन के लिए सबसे उपयुक्त एजेंट के पास, इष्टतम OpenAI मॉडल का उपयोग करके भेजा जाता है:

  • GPT‑5 टेक्स्ट, इमेज और UI में मल्टीमॉडल रीज़निंग लागू करके छिपे हुए जोखिमों को उजागर करता है और स्तरीय व सटीक निर्णय-निर्माण का समर्थन करता है
  • GPT‑4.1 कॉन्टेंट-पॉलिसी निर्देशों का भरोसेमंद तरीके से पालन करता है और बड़े पैमाने पर मॉडरेशन वर्कफ़्लो को आसानी से संभालता है
  • रिइन्फोर्समेंट फाइन-ट्यूनिंग (RFT) डिफ़ॉल्ट मॉडल्स से आगे बढ़कर रिकॉल और प्रिसिजन को बेहतर बनाता है, और जटिल सुरक्षा नीतियों के साथ अत्याधुनिक प्रदर्शन हासिल करता है
  • डीप रिसर्च मर्चेंट रिव्यू और वेरिफिकेशन में रियल-टाइम ऑनलाइन जांच को इंटीग्रेट करता है
  • कंप्यूटर-यूज़िंग एजेंट (CUA) जटिल पॉलिसी कार्यों को स्वचालित करता है, जिससे महंगी मैनुअल समीक्षाओं पर निर्भरता कम होती है

यह मॉडल-मैचिंग दृष्टिकोण SafetyKit को विभिन्न मोडैलिटीज़ में कॉन्टेंट रिव्यू को पुराने समाधानों की तुलना में अधिक सूक्ष्मता और सटीकता के साथ स्केल करने की अनुमति देता है.

उदाहरण के लिए, स्कैम डिटेक्शन एजेंट केवल टेक्स्ट स्कैन करने से कहीं आगे जाता है. यह QR कोड या उत्पाद छवियों में एम्बेड किए गए फोन नंबर जैसे दृश्य तत्वों का विश्लेषण करता है. GPT‑4.1 इसे छवि का विश्लेषण करने, लेआउट को समझने और यह तय करने में मदद करता है कि क्या यह नीति का उल्लंघन है.

पॉलिसी डिस्क्लोज़र एजेंट लिस्टिंग या लैंडिंग पेज में आवश्यक भाषा की जांच करता है, जैसे कि कानूनी डिस्क्लेमर या क्षेत्र-विशिष्ट अनुपालन चेतावनियां. GPT‑4.1 प्रासंगिक सेक्शंस निकालता है, GPT‑5 अनुपालन का मूल्यांकन करता है, और एजेंट उल्लंघनों को चिह्नित करता है.

Graunke कहते हैं, “हम अपने एजेंट्स को खास उद्देश्यों के लिए बनाए गए वर्कफ़्लोज़ के रूप में देखते हैं.” “कुछ कार्यों के लिए डीप रीज़निंग की ज़रूरत होती है, जबकि अन्य को मल्टीमॉडल कॉन्टेक्स्ट चाहिए. OpenAI ही एकमात्र स्टैक है जो दोनों में विश्वसनीय परफॉर्मेंस देता है.”

हल्के बैकग्राउंड पर “SafetyKit” लेबल वाला लाइन और बार चार्ट, जो कई श्रेणियों में डेटा ट्रेंड और तुलना दिखाता है.

ग्रे एरियाज़ में आगे बढ़ने और उच्च-दांव वाले फ़ैसलों के लिए GPT‑5 का उपयोग करें

नीतिगत निर्णय अक्सर सूक्ष्म भेदों पर निर्भर करते हैं. ऐसे मार्केटप्लेस का उदाहरण लें, जिसमें सेलर्स को वेलनेस प्रोडक्ट्स के लिए एक अस्वीकरण शामिल करना आवश्यक हो, और जिसकी आवश्यकताएँ प्रोडक्ट के दावों और क्षेत्रीय नियमों के आधार पर अलग-अलग हों. लेगेसी प्रोवाइडर्स कीवर्ड ट्रिगर्स या रिजिड रूलसेट्स का इस्तेमाल करते हैं, जो इन फ़ैसलों के लिए ज़रूरी ज़्यादा गहरे निर्णयात्मक आकलन को मिस कर सकते हैं, जिससे एनफ़ोर्समेंट छूट सकता है या ग़लत हो सकता है.

SafetyKit का पॉलिसी डिस्क्लोज़र एजेंट पहले SafetyKit की आंतरिक लाइब्रेरी से नीतियों का संदर्भ लेता है, फिर GPT‑5 कॉन्टेंट का मूल्यांकन करता है: क्या इसमें व्यवहार या रोकथाम का उल्लेख है? क्या इसे ऐसे क्षेत्र में बेचा जा रहा है जहाँ प्रकटीकरण अनिवार्य है? और अगर हां, तो क्या आवश्यक भाषा वास्तव में सूची में शामिल है? अगर किसी चीज़ में कमी रह जाती है, तो GPT‑5 स्ट्रक्चर्ड आउटपुट लौटाता है, जिसका उपयोग एजेंट समस्या को चिह्नित करने के लिए करता है.

Graukne कहते हैं, “GPT‑5 की शक्ति इस बात में है कि वास्तविक नीति पर आधारित होने पर यह कितनी सटीकता से तर्क कर सकता है.” “यह हमें उन मामलों में भी सटीक और ठोस निर्णय लेने में सक्षम बनाता है, जहाँ अन्य सिस्टम विफल हो जाते हैं.”

हर मॉडल रिलीज को प्रोडक्ट की जीत में बदलें

SafetyKit हर नए OpenAI मॉडल को अपने सबसे मुश्किल मामलों के मुकाबले बेंचमार्क करता है, और अक्सर टॉप परफ़ॉर्मर्स को उसी दिन डिप्लॉय भी करता है. बेहद सख्त इंटर्नल इवैल्यूएशन्स टीम को जल्दी से यह पहचानने में मदद करते हैं कि नए मॉडल परफ़ॉर्मेंस को कैसे बेहतर बना सकते हैं और उनके कोर इंफ़्रास्ट्रक्चर में आसानी से इंटीग्रेट हो सकते है.

जब OpenAI o3 लॉन्च हुआ, तब SafetyKit ने मुख्य पॉलिसी क्षेत्रों में एज केस प्रदर्शन को बढ़ाने के लिए इसका उपयोग किया. इसके बाद GPT‑5 आया, और कुछ ही दिनों में इसे उनके सबसे ज़्यादा डिमांडिंग एजेंट्स में डिप्लॉय कर दिया गया, जिससे उनके सबसे कठिन विज़न कार्यों पर बेंचमार्क स्कोर में 10 से अधिक अंकों का सुधार हुआ.

“OpenAI तेज है, और हमने अपने सिस्टम को उसके साथ तालमेल बनाए रखने के लिए डिज़ाइन किया है. हर नई रिलीज हमें परिचालन में श्रेष्ठता देती है—यह नई क्षमताओं और डोमेन्स के द्वार खोलती है, जिन्हें हम पहले समर्थन नहीं कर सकते थे, और ग्राहकों को प्रदान की जाने वाली हमारी कवरेज और सटीकता को बढ़ाती है.
—David Graunke, SafetyKit के संस्थापक और CEO

SafetyKit इकोसिस्टम में सुधारों को वापस जोड़ता है और सुरक्षा-महत्वपूर्ण वर्कलोड्स के लिए भविष्य के मॉडल प्रदर्शन को आकार देने हेतु इवैल परिणाम, एज केस विफलताएँ और नीति-विशिष्ट इनसाइट्स सीधे OpenAI के साथ साझा करता है.

सबसे बेहतरीन OpenAI स्टैक के साथ ग्राहक और वॉल्यूम वृद्धि को बढ़ावा दें

SafetyKit का आर्किटेक्चर बड़े पैमाने पर नीति लागू करता है, और गति, सटीकता और व्यापक जोखिम कवरेज प्रदान करता है. पर्दे के पीछे, यह अब रोज़ाना 16 billion से अधिक टोकन संभालता है, जो छह महीने पहले के 200 million से अधिक है, और सटीकता से समझौता किए बिना अधिक कॉन्टेंट का विश्लेषण करता है.

उसी अवधि में, SafetyKit ने भुगतान जोखिम, धोखाधड़ी, बाल शोषण-रोधी, मनी लॉन्ड्रिंग-रोधी, और नए ग्राहकों तक विस्तार किया है, जिनके करोड़ों अंतिम उपयोगकर्ता SafetyKit की सुरक्षा में हैं. यह आधार ग्राहकों को उभरते जोखिमों पर तेज़ी और आत्मविश्वास के साथ प्रतिक्रिया करने में सक्षम बनाता है.

“हमने एक ऐसा लूप बनाया है, जहाँ OpenAI की हर रिलीज़ सीधे हमारी क्षमताओं को मजबूत करती है,” Graunke कहते हैं. “इसी वजह से सिस्टम लगातार बेहतर होता रहता है और बदलते रिस्क से हमेशा आगे रहता है.”

एक नज़र में परिणाम

  • 100% ग्राहक सामग्री की समीक्षा में 95%+ सटीकता
  • रोज़ 16B टोकन प्रोसेस किए जाते हैं, जो छह महीनों में 200M से अधिक हैं
  • सबसे कठिन विज़न कार्यों पर बेंचमार्क में 10+ पॉइंट का सुधार

काम के नए दौर से जुड़ें

दुनिया भर में 10 लाख से अधिक व्यवसाय OpenAI के साथ सार्थक परिणाम हासिल कर रहे हैं.