पेश है Codex
एक क्लाउड-बेस्ड सॉफ़्टवेयर इंजीनियरिंग एजेंट जो Codex-1 द्वारा संचालित, पैरेलल तरीके से कई टास्क पर काम कर सकता है.

3 जून, 2025 का अपडेट: Codex अब ChatGPT Plus यूज़र्स के लिए उपलब्ध है. हम यूज़र्स को टास्क एक्सीक्यूशन के दौरान Codex को इंटरनेट एक्सेस देने में भी इनेबल कर रहे हैं. और ज़्यादा जानकारी के लिए कृपया चेंजलॉग(एक नई विंडो में खुलेगा) और डॉक्स(एक नई विंडो में खुलेगा) को देखें.
आज हम Codex का एक रिसर्च प्रीव्यू लॉन्च कर रहे हैं: एक ऐसा क्लाउड-बेस्ड सॉफ़्टवेयर इंजीनियरिंग एजेंट जो पैरेलल तरीके से कई टास्क पर एक साथ काम कर सकता है. Codex आपके लिए कार्य कर सकता है जैसे कि फ़ीचर्स लिखना, आपके कोडबेस के बारे में सवालों के जवाब देना, बग्स को फ़िक्स करना, और रिव्यु के लिए पुल अनुरोध का प्रस्ताव करना; हरेक टास्क आपकी रिपॉज़िटरी के साथ पहले से लोड किए गए अपने खुद के क्लाउड सैंडबॉक्स एन्वायर्नमेंट में रन करती है.
Codex, codex-1 द्वारा संचालित है, जो सॉफ़्टवेयर इंजीनियरिंग के लिए ऑप्टिमाइज़ किया गया OpenAI o3 का एक वर्ज़न है. इसे अलग-अलग तरह के एन्वायर्नमेंट्स में असली दुनिया के कोडिंग टास्क पर रीइंफ़ोर्समेंट लर्निंग का इस्तेमाल करके ट्रेन किया गया था ताकि ऐसा कोड जनरेट किया जा सके जो ह्यूमन स्टाइल और PR प्रेफ़रेंस को बारीकी से प्रतिबिंबित करता हो, निर्देशों का सटीक तरीके से पालन करता हो, और तब तक इटरेटिव तरीके से टेस्ट रन कर सकता हो जब तक कि इसे एक पासिंग रिज़ल्ट न मिल जाए. हम आज से ChatGPT Pro, Enterprise और Team यूज़र्स के लिए Codex शुरू कर रहे हैं, जल्द ही Plus और Edu के लिए भी सपोर्ट उपलब्ध होगा.
आज आप ChatGPT में साइडबार के ज़रिये Codex को एक्सेस कर सकते हैं और एक प्रॉम्प्ट टाइप करके और "कोड" पर क्लिक करके इसे नए कोडिंग टास्क सौंप सकते हैं. अगर आप Codex से अपने कोडबेस के बारे में कोई सवाल पूछना चाहते हैं, तो “पूछें” पर क्लिक करें. हरेक टास्क को आपके कोडबेस के साथ पहले से लोड किए गए एक आइसोलेटेड एन्वायर्नमेंट में स्वतंत्र तरीके से प्रोसेस किया जाता है. Codex फ़ाइलों को पढ़ और एडिट कर सकता है, साथ ही टेस्ट हार्नेस, लिंटर्स और टाइप चेकर्स सहित कमांड भी चला सकता है. टास्क पूरा होने में आमतौर पर 1 से 30 मिनट का समय लगता है, जो इस पर निर्भर करता है कि वो कितना मुश्किल है, और आप रियल-टाइम में Codex की प्रोग्रेस को मॉनिटर कर सकते हैं.
एक बार Codex कोई टास्क पूरा कर लेता है, तो वो अपने एन्वायर्नमेंट में बदलाव कर देता है. Codex, टर्मिनल लॉग्स और टेस्ट आउटपुट की साइटेशन्स के ज़रिये अपने एक्शन का वेरिफ़ाई करने लायक सबूत देता है, जिससे आपको टास्क पूरा होने के दौरान उठाए गए हरेक स्टेप को ट्रेस करने में मदद मिलती है. फ़िर आप रिज़ल्ट्स को रिव्यु कर सकते हैं, आगे बदलावों का अनुरोध कर सकते हैं, GitHub पुल अनुरोध खोल सकते हैं, या बदलावों को सीधे अपने लोकल एन्वायर्नमेंट में इंटीग्रेट कर सकते हैं. प्रोडक्ट में, आप Codex एन्वायर्नमेंट को अपने असली डेवलपमेंट एन्वायर्नमेंट से जितना मुमकिन हो, उतना मैच करने के लिए कॉन्फ़िगर कर सकते हैं.
Codex को आपके रिपॉजिटरी में रखी गई AGENTS.md फ़ाइलों द्वारा गाइड किया जा सकता है. ये README.md के समान टेक्स्ट फ़ाइलें हैं, जहां आप Codex को बता सकते हैं कि आपके कोडबेस को कैसे नेविगेट किया जाए, टेस्टिंग के लिए कौन से कमांड रन किए जाएं, और आपके प्रोजेक्ट की स्टैंडर्ड प्रैक्टिसेस का बेहतरीन तरीके से फ़ॉलो कैसे किया जाए. ह्यूमन डेवलपर्स की तरह, Codex एजेंट्स भी तब बेहतरीन तरीके से परफ़ॉर्म करते हैं जब उन्हें कॉन्फ़िगर किया गया डेवलपमेंट एन्वायर्नमेंट, भरोसेमंद टेस्टिंग के सेटअप, और क्लियर डॉक्यूमेंटेशन उपलब्ध कराए जाते हैं.
कोडिंग मूल्यांकन और इंटर्नल बेंचमार्क पर, codex-1 AGENTS.md फ़ाइलों या कस्टम स्कैफ़ोल्डिंग के बिना भी बेहतरीन परफ़ॉर्मेंस दिखाता है.
23 SWE-बेंच वेरिफ़ाइड सैंपल्स, जो हमारे इंटर्नल इंफ़्रास्ट्रक्चर पर रन करने लायक नहीं थे, उन्हें बाहर रखा गया. Codex-1 का टेस्ट मैक्सिमम 192k टोकन की कॉन्टेक्स्ट लेंग्थ और मीडियम 'रीज़निंग प्रयास' पर किया गया, जो कि वो सेटिंग है जो आज प्रोडक्ट में उपलब्ध होगी. o3 एवल्युएशन पर जानकारी के लिए, यहां देखें.
हमारा इंटर्नल SWE टास्क बेंचमार्क, OpenAI में रियल-वर्ल्ड के इंटर्नल SWE टास्क का एक क्यूरेटेड सेट है.
हम अपनी इटरेटिव डिप्लॉयमेंट स्ट्रैटेजी के अनुरूप Codex को एक रिसर्च प्रीव्यू के तौर पर रिलीज़ कर रहे हैं. Codex को डिज़ाइन करते समय हमने सुरक्षा और पारदर्शिता को प्राथमिकता दी, ताकि यूज़र इसके आउटपुट को वेरिफ़ाई कर सकें - एक ऐसा सुरक्षा उपाय जो और ज़्यादा ज़रूरी होता जा रहा है क्योंकि AI मॉडल्स और ज़्यादा मुश्किल कोडिंग टास्क को स्वतंत्र तरीके से हैंडल करते हैं और सुरक्षा संबंधी विचार उभरते हैं. यूज़र Codex के काम को साइटेशन्स, टर्मिनल लॉग और टेस्ट रिज़ल्ट्स के ज़रिये चेक कर सकते हैं. जब अनिश्चितता हो या टेस्ट में असफ़लता का सामना करना पड़े, तो Codex एजेंट स्पष्ट तरीके से इन मुद्दों के बारे में सूचित करता है, जिससे यूज़र आगे बढ़ने के बारे में सोच-समझ कर फ़ैसले ले पाते हैं. यूज़र के लिए इंटीग्रेशन और एक्सीक्यूशन से पहले सभी एजेंट-जनरेटेड कोड को मैन्युअल तरीके से रिव्यु और वैलिडेट करना अभी भी ज़रूरी है.


codex-1 को ट्रेन करने के पीछे सबसे ज़रूरी लक्ष्य आउटपुट को ह्यूमन कोडिंग के प्रेफ़रेंस और स्टैंडर्ड के साथ अलाइन करना था. OpenAI o3 के मुकाबले, Codex-1 लगातार जल्द ह्यूमन रिव्यु और स्टैंडर्ड वर्कफ़्लो में इंटीग्रेशन के लिए तैयार ज़्यादा क्लीन पैच तैयार करता है.
AI-संचालित सॉफ़्टवेयर इंजीनियरिंग के दुर्भावनापूर्ण ऐप्लिकेशन्स, जैसे मैलवेयर डेवलपमेंट, के खिलाफ़ सुरक्षा करना बेहद ज़रूरी होता जा रहा है. साथ ही, ये भी ज़रूरी है कि सुरक्षात्मक उपाय उन वैध और फ़ायदेमंद ऐप्लिकेशन में बिना मतलब से रुकावट न डालें, जिनमें निम्न स्तरीय केर्नल इंजीनियरिंग जैसी तकनीकें शामिल हो सकती हैं, जिनका इस्तेमाल कभी-कभी मैलवेयर डेवलपमेंट के लिए भी किया जाता है.
सुरक्षा और उपयोगिता के बीच बैलेंस बनाए रखने के लिए, Codex को दुर्भावनापूर्ण सॉफ़्टवेयर के डेवलपमेंट के लिए किए गए अनुरोधों की पहचान करने और उन्हें अस्वीकार करने के लिए ट्रेन किया गया, साथ ही वैध टास्क को स्पष्ट तरीके से पहचानने और उन्हें सपोर्ट करने के लिए भी ट्रेन किया गया. हमने अपनी पॉलिसी फ्रेमवर्क को और मज़बूत किया है और सख़्त सेफ़्टी इवैल्यूएशन को शामिल किया है ताकि इन सीमाओं को असरदार तरीक़े से मज़बूती दी जा सके. हमने इन मूल्यांकनों को दर्शाने के लिए o3 सिस्टम कार्ड में एक ऐडेंडम पब्लिश किया है.
Codex एजेंट पूरी तरह से क्लाउड में एक सुरक्षित, आइसोलेटेड कंटेनर के अंदर काम करता है. टास्क एक्सीक्यूशन के दौरान, इंटरनेट एक्सेस डिसेबल कर दिया जाता है, जिससे एजेंट की सहभागिता केवल GitHub रिपॉज़िटरी के ज़रिये स्पष्ट तरीके से दिए गए कोड और यूज़र द्वारा सेटअप स्क्रिप्ट के ज़रिये कॉन्फ़िगर किए गए प्री-इंस्टॉल की गई निर्भरताओं तक सीमित हो जाती है. एजेंट बाहरी वेबसाइट, API या अन्य सेवाओं को एक्सेस नहीं कर सकता.
OpenAI की तकनीकी टीम ने Codex को अपने दैनिक टूलकिट के भाग के तौर पर इस्तेमाल करना शुरू कर दिया है. इसका इस्तेमाल अक्सर OpenAI इंजीनियरों द्वारा दोहराए जाने वाले, अच्छी तरह से परिभाषित टास्क को निपटाने के लिए किया जाता है, जैसे कि रीफ़ैक्टरिंग, नाम बदलना और टेस्ट लिखना, वरना जो ध्यान भंग कर देते हैं. ये नए फ़ीचर्स को तैयार करने, कॉम्पोनेन्ट को जोड़ने, बग्स को फ़िक्स करने और डॉक्यूमेंट ड्राफ़्ट करने के लिए समान रूप से फ़ायदेमंद है. टीम इसके इर्द-गिर्द नई आदतें बना रही हैं: ऑन-कॉल समस्याओं का समाधान करना, दिन की शुरुआत में टास्क प्लॉन करना, और आगे बढ़ते रहने के लिए बैकग्राउंड के काम को निपटाना. कॉन्टेक्स्ट-स्विचिंग को कम करके और भूले हुए कामों को सामने लाकर, Codex इंजीनियरों को तेज़ी से काम पूरा करने और सबसे ज़रूरी चीज़ों पर फ़ोकस करने में मदद करता है.
रिलीज़ से पहले, हम बाहरी टेस्टर्स के एक छोटे-से ग्रुप के साथ भी काम कर रहे हैं ताकि ये बेहतर ढंग से समझा जा सके कि Codex बहुत सारे कोडबेस, डेवलपमेंट प्रोसेसेस और टीमों में कैसा प्रदर्शन करता है.
- Cisco(एक नई विंडो में खुलेगा) इस बात पर विचार कर रहा है कि Codex किस तरह उनकी इंजीनियरिंग टीमों को महत्वाकांक्षी विचारों को तेज़ी से मूर्त रूप देने में मदद कर सकता है. शुरूआती डिज़ाइन पार्टनर्स के तौर पर, Cisco अपने प्रोडक्ट पोर्टफ़ोलियो में रियल-वर्ल्ड के यूज़ केस के लिए Codex का मूल्यांकन करके और OpenAI टीम को फ़ीडबैक दे कर Codex के भविष्य को आकार देने में मदद कर रहा है.
- टेम्पोरल(एक नई विंडो में खुलेगा) फ़ीचर डेवलपमेंट में तेज़ी लाने, समस्याओं को डीबग करने, टेस्ट लिखने और एक्सीक्यूट करने, और बड़े कोडबेसेस को रीफ़ैक्टर करने के लिए Codex का इस्तेमाल करता है. ये बैकग्राउंड में मुश्किल टास्क को रन करके उन्हें फ़ोकस बनाए रखने में भी मदद करता है—जिससे इंजीनियरों को प्रवाह में बने रहने के साथ-साथ इटरेशन की स्पीड भी तेज़ होती है.
- सुपरह्यूमन(एक नई विंडो में खुलेगा) Codex का इस्तेमाल छोटे लेकिन दोहराए जाने वाले टास्क को स्पीड अप करने के लिए करता है, जैसे टेस्ट कवरेज में सुधार और इंटीग्रेशन विफ़लताओं को फ़िक्स करना. ये प्रोडक्ट मैनेजर्स को कोड रिव्यु के अलावा, किसी इंजीनियर की मदद लिए बिना, हल्के कोड बदलने में इनेबल करके, उन्हें तेज़ी से काम करने में भी मदद करता है.
- Kodiak(एक नई विंडो में खुलेगा) डीबगिंग टूल्स लिखने, टेस्ट कवरेज में सुधार करने और कोड को रीफ़ैक्टर करने में मदद के लिए Codex का इस्तेमाल कर रहा है—इससे उनकी ऑटोनोमस ड्राइविंग टेक्नोलॉजी, Kodiak ड्राइवर का डेवलपमेंट तेज़ हो गया. Codex एक कीमती रेफ़रेंस टूल भी बन गया है, जो प्रासंगिक कॉन्टेक्स्ट और पिछले बदलावों को सामने लाकर इंजीनियरों को स्टैक के अपरिचित भागों को समझने में मदद करता है.
शुरुआती टेस्टर्स से मिली सीख के आधार पर, हम एक साथ कई एजेंट्स को अच्छी स्कोप वाले परिभाषित टास्क असाइन करके मॉडल की क्षमताओं का प्रभावी ढंग से पता लगाने के लिए अलग-अलग तरह के टास्क और प्रॉम्प्ट के साथ प्रयोग करने की सलाह देते हैं.
पिछले महीने, हमने Codex CLI लॉन्च किया, जो एक हल्का ओपन-सोर्स कोडिंग एजेंट है जो आपके टर्मिनल में रन करता है. ये o3 और o4-mini जैसे मॉडल की ताकत को आपके लोकल वर्कफ़्लो में लाता है, जिससे टास्क को तेज़ी से पूरा करने के लिए उनके साथ पेअर करना आसान हो जाता है.
आज, हम codex-1 का एक छोटा वर्ज़न भी रिलीज़ कर रहे हैं, जो o4-mini का एक वर्ज़न है जिसे ख़ास तौर से Codex CLI में इस्तेमाल के लिए डिज़ाइन किया गया है. ये नया मॉडल CLI में तेज़ वर्कफ़्लो को सपोर्ट करता है और कम-लेटेंसी वाले कोड प्रश्नोत्तर और एडिटिंग के लिए ऑप्टिमाइज़्ड है, जबकि निर्देशों को फ़ॉलो करने और स्टाइल में समान ताकतों को बरकरार रखता है. ये अब Codex CLI में डिफ़ॉल्ट मॉडल के तौर पर और API में codex-mini-latest के तौर पर उपलब्ध है. अंतर्निहित स्नैपशॉट को नियमित तरीके से अपडेट किया जाएगा क्योंकि हम Codex-mini मॉडल में सुधार जारी रखेंगे.
हम आपके डेवलपर अकाउंट को Codex CLI से कनेक्ट करना भी बहुत आसान बना रहे हैं. API टोकन को मैन्युअल तरीके से जेनरेट और कॉन्फ़िगर करने के बजाय, अब आप अपने ChatGPT अकाउंट से साइन इन कर सकते हैं और उस API संगठन को चुन सकते हैं जिसका आप इस्तेमाल करना चाहते हैं. हम आपके लिए अपने आप API की जनरेट और कॉन्फ़िगर करेंगे. Plus और Pro यूज़र जो ChatGPT के साथ Codex CLI में साइन इन करते हैं, वे आज से अगले 30 दिनों के लिए, क्रमशः, $5 और $50 का मुफ़्त API क्रेडिट प्राप्त करना शुरू कर सकते हैं.
आज से, हम वैश्विक स्तर पर ChatGPT Pro, Enterprise और टीम यूज़र के लिए Codex शुरू कर रहे हैं, जल्द ही Plus और Edu के लिए भी सपोर्ट उपलब्ध होगा. आने वाले हफ्तों में यूज़र को बिना किसी अतिरिक्त खर्चे के उदार एक्सेस प्राप्त होगी, ताकि आप ये एक्सप्लोर कर सकें कि Codex क्या कर सकता है, जिसके बाद हम दर-सीमित एक्सेस और फ़्लेक्सिबल प्राइसिंग ऑप्शन्स पेश करेंगे जो आपको ऑन-डिमांड अतिरिक्त इस्तेमाल खरीदने में मदद करेंगे. हम जल्द ही Plus और Edu यूज़र तक एक्सेस बढ़ाने का प्लॉन कर रहे हैं.
Codex-mini-latest के साथ बनाने वाले डेवलपर्स के लिए, मॉडल रिस्पॉन्स API पर उपलब्ध है और इसकी कीमत 1.50 डॉलर प्रति 1M इनपुट टोकन्स और 6 डॉलर प्रति 1M आउटपुट टोकन्स है, जिसमें 75% प्रॉम्प्ट कैशिंग छूट है.
Codex अभी भी अपने डेवलपमेंट के शुरूआती स्टेज में है. रिसर्च प्रीव्यू के तौर पर, इसमें फ़िलहाल फ़्रंटएंड काम के लिए इमेज इनपुट, और काम करते समय एजेंट को सही दिशा में ले जाने की क्षमता जैसे फ़ीचर्स की कमी है. इसके अलावा, एक रिमोट एजेंट को काम सौंपने में इंटरैक्टिव एडिटिंग के मुकाबले और ज़्यादा समय लगता है, जिसकी आदत डालने में कुछ समय लग सकता है. समय के साथ, Codex एजेंट्स के साथ बातचीत करना सहकर्मियों के साथ एसिंक्रोनस सहयोग जैसा हो जाएगा. जैसे-जैसे मॉडल की क्षमताएं आगे बढ़ेंगी, हम अनुमान लगाते हैं कि एजेंट लंबे पीरियड तक और ज़्यादा मुश्किल टास्क को हैंडल कर पाएंगे.
हम एक ऐसे भविष्य की कल्पना करते हैं, जहां डेवलपर उस काम को खुद करेंगे, जिसे वे खुद करना चाहते हैं, और बाकी काम एजेंट्स को सौंप देंगे—जिससे वे AI के साथ तेज़ी से आगे बढ़ेंगे तथा और ज़्यादा प्रोडक्टिव बनेंगे. इसे हासिल करने के लिए, हम Codex टूल्स का एक सुइट बना रहे हैं जो रियल-टाइम सहयोग और एसिंक्रोनस डेलिगेशन दोनों को सपोर्ट करता है.
Codex CLI और अन्य जैसे AI टूल्स के साथ पेयरिंग बनाना तेज़ी से इंडस्ट्री का मानक बन गया है, जिससे डेवलपर्स को कोड करते समय तेज़ी से आगे बढ़ने में मदद मिलती है. लेकिन हमारा मानना है कि Codex द्वारा ChatGPT में प्रस्तुत किया गया एसिंक्रोनस, मल्टी-एजेंट वर्कफ़्लो, इंजीनियरों के लिए ऊंची-क्वालिटी वाला कोड तैयार करने का असली तरीका बन जाएगा.
आख़िरकार, हम बातचीत के इन दो तरीकों—रियल-टाइम पेयरिंग और टास्क डेलिगेशन—को एक साथ आते हुए देखते हैं. डेवलपर्स अपने IDEs और रोज़मर्रा के टूल्स पर AI एजेंट्स के साथ सहयोग करेंगे, ताकि वे सवाल पूछ सकें, सुझाव प्राप्त कर सकें और लंबे टास्क को एक यूनिफ़ाइड वर्कफ़्लो में निपटा सकें.
भविष्य की ओर देखते हुए, हम और ज़्यादा इंटरैक्टिव और फ़्लेक्सिबल एजेंट वर्कफ़्लोज़ शुरू करने का प्लॉन कर रहे हैं. डेवलपर्स जल्द ही टास्क के बीच में गाइडेंस देने, लागू करने की स्ट्रैटेजियों पर सहयोग करने और प्रोग्रेस से जुड़े प्रोएक्टिव अपडेट पा सकेंगे. हम आपके द्वारा पहले से इस्तेमाल किए जा रहे टूल्स में डीप इंटीग्रेशन की भी कल्पना करते हैं: आज Codex GitHub से कनेक्ट करता है, और जल्द ही आप Codex CLI, ChatGPT डेस्कटॉप, या यहां तक कि आपके इश्यु ट्रैकर या CI सिस्टम जैसे टूल्स से भी टास्क असाइन कर पाएंगे.
सॉफ़्टवेयर इंजीनियरिंग उन पहली इंडस्ट्रीज़ में से एक है, जिसने अहमण AI-ड्रिवन प्रोडक्टिविटी फ़ायदों का अनुभव किया है, जिससे लोगों और छोटी टीमों के लिए नई संभावनाएं खुली हैं. हालांकि हम इन फ़ायदों के बारे में आशावादी हैं, हम डेवलपर वर्कफ़्लो, लोगों के स्किल डेवलपमेंट, स्किल लेवल्स और भौगोलिक क्षेत्रों पर बड़े पैमाने पर एजेंट अपनाने के प्रभावों को बेहतर ढंग से समझने के लिए पार्टनर्स के साथ कोलैबोरेट भी कर रहे हैं.
ये तो बस शुरुआत है - और हम ये देखने के लिए उत्साहित हैं कि आप Codex के साथ क्या बनाते हैं.
सिस्टम मेसेज
हम डेवलपर को मॉडल के डिफ़ॉल्ट बिहेवियर को समझने और कस्टम वर्कफ़्लो में प्रभावी ढंग से काम करने के लिए Codex को तैयार करने में मदद करने के लिए Codex-1 सिस्टम मैसेज शेयर कर रहे हैं. जैसे कि, codex-1 सिस्टम मेसेज Codex को AGENTS.md फ़ाइल में दिए गए सभी टेस्ट रन करने के लिए प्रोत्साहित करता है, लेकिन अगर आपके पास समय कम है, तो आप Codex को इन टेस्ट को छोड़ने के लिए भी कह सकते हैं.