12 सितंबर 2024

पेश है OpenAI o1‑preview

मुश्किल प्रॉब्‍लम को हल करने के लिए रीज़निंग मॉडल की नई सीरीज़. अब उपलब्ध है.

लोड किया जा रहा है...

17 सितंबर, 2024 को अपडेट: अब रेट लिमिट o1‑preview के लिए 50 क्‍वेरी प्रति हफ़्ता और o1‑mini के लिए 50 क्‍वेरी हर रोज़ हैं.

हमने AI मॉडल की एक नई सीरीज़ बनाई है, जो रिस्‍पांस देने से पहले सोच-विचार करने में ज्‍़यादा समय लगाने के लिए डिज़ाइन की गई है. ये साइंस, कोडिंग और मैथ में पिछले मॉडल के मुक़ाबले पेचीदा टास्क और मुश्किल सवालों को हल करने में रीज़न कर सकते हैं.

आज हम ChatGPT और हमारी API की यी पहली सीरीज़ जारी कर रहे हैं. यह एक प्रीव्यू है और हमें इसके लगातार अपडेट और सुधारों के आने की उम्‍मीद है. इसे जारी करने के साथ-साथ हम इसके अगले अपडेट के मूल्यांकन भी शामिल कर रहे हैं, जो अभी डेवलपमेंट में हैं.

ये कैसे काम करता है

हमने इन मॉडल को, बिल्‍कुल इंसानों की तरह, प्रॉब्‍लम पर सिस्‍पांस देने से पहले ज्‍़यादा देर तक सोचने के लिए ट्रेन किया है. ट्रेनिंग से, वे अपनी सोचने की प्रोसेस को रिफ़ाइन करना, अलग-अलग स्ट्रैेटेजी आज़माना और अपनी ग़लतियों को पहचानना सीखते हैं.

हमारे कई टेस्ट में, अगला मॉडल अपडेट फ़ि‍ज़ि‍क्स, केमिस्ट्री और बायोलॉजी में चुनौतीपूर्ण बेंचमार्क टास्क पर पीएचडी स्टूडेंटरों जैसा परफ़ॉर्म करता है. हमने यह भी पाया कि यह मैथ और कोडिंग में बेहतर है. इंटरनैशनल मैथेमैटिक्स ओलंपियाड (IMO) के क्वालिफ़ाइंग एग्ज़ाम में, GPT‑4o ने सिर्फ़ 13% प्रॉब्लम को सही से हल किया, जबकि रीज़निंग मॉडल में 83% का स्कोर किया. मुक़ाबलों में उनकी कोडिंग क्षमताओं का मूल्यांकन किया गया और Codeforces कंपिटिशंस में वे 89वें पर्सेंटाइल तक पहुंच गए. आप हमारी टेक्निकल रिसर्च पोस्‍ट में इसके बारे में और ज़्यादा पढ़ सकते हैं.

शुरुआती मॉडल होने से, इसमें अभी भी कई फ़ीचर नहीं हैं, जो ChatGPT को काम का बनाते हैं, जैसे कि जानकारी के लिए वेब ब्राउज़िंग और फ़ाइल और इमेज अपलोड करना. कई आम चीज़ों में आगे चलकर GPT‑4o ज्‍़यादा कारगर साबित होगा.

लेकिन पे‍चीदा रीज़निंग टास्क के लिए यह एक महत्वपूर्ण उन्नति है और AI क्षमता के एक नए लेवल को पेश करती है. इसी करके, हम काउंटर को एक बार फिर 1 पर रीसेट कर रहे हैं और इस सीरीज़ को नाम दे रहे हैं OpenAI o1.

सुरक्षा

इन नए मॉडल को डेवलप करने के एक हिस्से के तौर पर, हम एक नई सुरक्षा ट्रेनिंग अप्रोच लेकर आए हैं, जो इनकी रीज़निंग क्षमताओं को बढ़ाकर सुरक्षा और अलाइनमेंट से जुड़ी गाइडलाइंस पर अमल करने के‍ लिए तैयार करता है. कॉन्टेक्स्ट में हमारे सुरक्षा से जुड़े नियमों के बारे में रीज़न कर पाने से, वह उन्हें ज़्यादा असरदार तरीक़े से लागू कर सकता है.

सुरक्षा को जांचने का एक तरीका यह टेस्ट करना है कि अगर कोई यूज़र सुरक्षा नियमों को अनदेखी करने की कोशिश करता है (जिसे "जेलब्रेकिंग" के तौर पर जाना जाता है) तो हमारा मॉडल कितनी अच्छी तरह से अपने सुरक्षा नियमों का लगातार पालन करता है. हमारे सबसे सख़्त एक जेलब्रेकिंग टेस्ट में, GPT‑4o ने 22 (0-100 के स्‍केल पर) का स्कोर किया, जबकि हमारे o1‑preview मॉडल ने 84 का स्कोर किया. इसके बारे में आप सिस्‍टम कार्ड और हमारी रिसर्च पोस्ट पर और ज़्यादा पढ़ सकते हैं.

इन मॉडल की नई क्षमताओं के हिसाब से ही हमने अपने सुरक्षा काम, इंटर्नल गवर्नेंस और फ़ेडरल सरकार के साथ सहयोग को मज़बूती दी है. इसमें बड़े सख़्त टेस्ट और मूल्यांकन शामिल हैं, जिसमें हमारी तैयारी का फ़्रेमवर्क⁠(एक नई विंडो में खुलेगा), सबसे बेहतरीन रेड टीमिंग, और हमारी सेफ़्टी एंड‍ सिक्योरिटी कमिटी समेत बोर्ड-लेवल रिव्यु प्रोसेस का इस्तेमाल किया जाता है.

AI सुरक्षा के प्रति अपनी कमिटमेंट को आगे बढ़ाते हुए, हमने हाल ही में यू.एस. और यू.के. के साथ एग्रीमेंट किए हैं. AI सेफ़्टी इंस्‍टि‍ट्यूट. हमने इन एग्रीमेंट पर काम शुरू कर दिया है, जिसमें इस्टिट्यूट्स को इस मॉडल के रिसर्च वर्ज़न की जल्दीु ही एक्सेस देना भी शामिल है. यह हमारी पार्टनरशिप का पहला अहम क़दम था, जिससे आगे के मॉडल के पब्लिक रिलीज़ से पहले और बाद में उनके रिसर्च, मूल्यांकन और टेस्टिंग के लिए प्रोसेस सेट करने में मदद मिली.

यह किनके लिए है

ये बेहतर रीज़निंग क्षमताएं ख़ास तौर पर तब ज्‍़यादा काम की हो सकती हैं, जब आप साइंस, कोडिंग, मैथ और ऐसी ही किसी और फ़ील्ड में पेचीदा प्रॉब्लम से जूझ रहे हों. उदाहरण के लिए, o1 का इस्तेनमाल हेल्थकेयर रिसर्चर द्वारा सेल सिक्वेंसिंग डेटा को एनोटेट करने, फ़ि‍ज़ि‍सिस्ट द्वारा क्वांटम ऑप्टिक्स के लिए ज़रूरी पेचीदा मैथेमैटिकल फ़ार्मूला जनरेट करने, और सभी फ़ील्ड के डेवलपर द्वारा मल्टी-स्टेप वर्कफ़्लो बनाने और उन्हें पूरा करने के लिए किया जा सकता है.

OpenAI o1-mini

o1 सीरीज़ पेचीदा कोड को एक्यूरेट तरीक़े से जनरेट और डीबग करने में बेहतरीन है. डेवलपर के लिए ज़्gयादा कारगर सोल्यूhशन पेश करने के लिए, हम तेज़ और सस्‍ता रीजनिंग मॉडल – nAI o1‑mini भी रिलीज़ कर रहे हैं, जो कोडिंग में ख़ास तौर पर असरदार है. छोटा मॉडल होने के नाते, o1‑mini, o1‑preview के मुक़ाबले 80% सस्‍ता है, जो इसे उन ऐप्लिकेशन के लिए ज़ोरदार, किफ़ायती मॉडल बनाता है, जिनमें पूरी दुनिया की जानकारी की बजाय रीज़निंग की ज़रूरत होती है.

OpenAI o1 को इस्तेमाल कैसे करें

ChatGPT Plus और Team यूज़र आज से ही ChatGPT में o1 मॉडल को एक्सेस कर पाएंगे. o1‑preview और o1‑mini दोनों को ही मॉडल पिकर में मैन्युअल तरीक़े से चुना जा सकता है, और लॉन्च के समय, साप्ताहिक रेट लिमिट o1‑preview के लिए 30 मैसेज और o1‑mini के लिए 50 मैसेज होगी. हम उन रेट्स को बढ़ाने और किसी दिए गए प्रॉम्प्ट पर ऑटोमेटिक तरीक़े से सही मॉडल चुनने में ChatGPT को इनेबल बनाने के लिए काम कर रहे हैं.

नए ChatGPT ड्रॉपडाउन की इमेज में चटख पीले और नीले ऐब्स्ट्रैक्ट बैकग्राउंड पर नया "o1-preview" मॉडल का ऑप्शन दिख रहा है.

ChatGPT Enterprise और Edu यूज़र को अगले हफ़्ते से दोनों मॉडल की एक्सेस मिल जाएगी.

डेवलपर जिन्‍होंने API यूसेज टीयर 5⁠(एक नई विंडो में खुलेगा) को क्‍वालिफ़ाई किया है, वे आज से API में दोनों मॉडल पर फ़ोटोटाइपिंग शुरू सकते हैं, इसकी रेट लिमिट RPM होगी. कुछ और टेस्टिंग के बाद हम इनकी लिमिट बढ़ाने पर काम कर रहे हैं. इन मॉडल के लिए API में अभी फ़ंक्शन कॉलिंग, स्‍ट्रीमिंग, सिस्‍टम मैसेज के लिए सपोर्ट और बाक़ी के फ़ीचर शामिल नहीं हैं. शुरू करने के लिए API डॉक्यूमेंटेशन⁠(एक नई विंडो में खुलेगा) को देखें.

हम सभी ChatGPT Free यूज़र को o1‑mini की एक्सेस देने का प्‍लान भी बना रहे हैं.

आगे क्या है

यह ChatGPT और API में इन रीज़निंग मॉडल का शुरुआती प्रीव्यू है. मॉडल अपडेट के अलावा, इन्हेंं हर किसी के लिए ज़्यादा कारगर बनाने के लिए हमें इसमें ब्राउज़िंग, फ़ाइल और इमेज अपलोड करना और अन्य फ़ीचर भी जोड़े जाने की उम्मीद है.

नई OpenAI o1 सीरीज़ के अलावा, हम अपनी GPT सीरीज़ में मॉडल डेवलप और रिलीज़ करने का भी प्लान कर रहे हैं.

लेखक

OpenAI