16 मई 2025

पेश है Codex

एक क्लाउड-बेस्ड सॉफ़्टवेयर इंजीनियरिंग एजेंट जो Codex-1 द्वारा संचालित, पैरेलल तरीके से कई टास्क पर काम कर सकता है.

एक प्रॉम्प्ट बॉक्स, रेपो/ब्रांच सिलेक्टर्स और पेस्टल कोड-थीम वाले बैकग्राउंड पर एक टास्क लिस्ट के साथ डैशबोर्ड ये सवाल पूछता है कि ‘हमें आगे क्या कोड करना चाहिए?’.

लोड किया जा रहा है...

3 जून, 2025 का अपडेट: Codex अब ChatGPT Plus यूज़र्स के लिए उपलब्ध है. हम यूज़र्स को टास्क एक्सीक्यूशन के दौरान Codex को इंटरनेट एक्सेस देने में भी इनेबल कर रहे हैं. और ज़्यादा जानकारी के लिए कृपया चेंजलॉग⁠(एक नई विंडो में खुलेगा) और डॉक्स⁠(एक नई विंडो में खुलेगा) को देखें.

आज हम Codex का एक रिसर्च प्रीव्यू लॉन्च कर रहे हैं: एक ऐसा क्लाउड-बेस्ड सॉफ़्टवेयर इंजीनियरिंग एजेंट जो पैरेलल तरीके से कई टास्क पर एक साथ काम कर सकता है. Codex आपके लिए कार्य कर सकता है जैसे कि फ़ीचर्स लिखना, आपके कोडबेस के बारे में सवालों के जवाब देना, बग्स को फ़िक्स करना, और रिव्यु के लिए पुल अनुरोध का प्रस्ताव करना; हरेक टास्क आपकी रिपॉज़िटरी के साथ पहले से लोड किए गए अपने खुद के क्लाउड सैंडबॉक्स एन्वायर्नमेंट में रन करती है.

Codex, codex-1 द्वारा संचालित है, जो सॉफ़्टवेयर इंजीनियरिंग के लिए ऑप्टिमाइज़ किया गया OpenAI o3 का एक वर्ज़न है. इसे अलग-अलग तरह के एन्वायर्नमेंट्स में असली दुनिया के कोडिंग टास्क पर रीइंफ़ोर्समेंट लर्निंग का इस्तेमाल करके ट्रेन किया गया था ताकि ऐसा कोड जनरेट किया जा सके जो ह्यूमन स्टाइल और PR प्रेफ़रेंस को बारीकी से प्रतिबिंबित करता हो, निर्देशों का सटीक तरीके से पालन करता हो, और तब तक इटरेटिव तरीके से टेस्ट रन कर सकता हो जब तक कि इसे एक पासिंग रिज़ल्ट न मिल जाए. हम आज से ChatGPT Pro, Enterprise और Team यूज़र्स के लिए Codex शुरू कर रहे हैं, जल्द ही Plus और Edu के लिए भी सपोर्ट उपलब्ध होगा.

Codex कैसे काम करता है

आज आप ChatGPT में साइडबार के ज़रिये Codex को एक्सेस कर सकते हैं और एक प्रॉम्प्ट टाइप करके और "कोड" पर क्लिक करके इसे नए कोडिंग टास्क सौंप सकते हैं. अगर आप Codex से अपने कोडबेस के बारे में कोई सवाल पूछना चाहते हैं, तो “पूछें” पर क्लिक करें. हरेक टास्क को आपके कोडबेस के साथ पहले से लोड किए गए एक आइसोलेटेड एन्वायर्नमेंट में स्वतंत्र तरीके से प्रोसेस किया जाता है. Codex फ़ाइलों को पढ़ और एडिट कर सकता है, साथ ही टेस्ट हार्नेस, लिंटर्स और टाइप चेकर्स सहित कमांड भी चला सकता है. टास्क पूरा होने में आमतौर पर 1 से 30 मिनट का समय लगता है, जो इस पर निर्भर करता है कि वो कितना मुश्किल है, और आप रियल-टाइम में Codex की प्रोग्रेस को मॉनिटर कर सकते हैं.

एक बार Codex कोई टास्क पूरा कर लेता है, तो वो अपने एन्वायर्नमेंट में बदलाव कर देता है. Codex, टर्मिनल लॉग्स और टेस्ट आउटपुट की साइटेशन्स के ज़रिये अपने एक्शन का वेरिफ़ाई करने लायक सबूत देता है, जिससे आपको टास्क पूरा होने के दौरान उठाए गए हरेक स्टेप को ट्रेस करने में मदद मिलती है. फ़िर आप रिज़ल्ट्स को रिव्यु कर सकते हैं, आगे बदलावों का अनुरोध कर सकते हैं, GitHub पुल अनुरोध खोल सकते हैं, या बदलावों को सीधे अपने लोकल एन्वायर्नमेंट में इंटीग्रेट कर सकते हैं. प्रोडक्ट में, आप Codex एन्वायर्नमेंट को अपने असली डेवलपमेंट एन्वायर्नमेंट से जितना मुमकिन हो, उतना मैच करने के लिए कॉन्फ़िगर कर सकते हैं.

Codex को आपके रिपॉजिटरी में रखी गई AGENTS.md फ़ाइलों द्वारा गाइड किया जा सकता है. ये README.md के समान टेक्स्ट फ़ाइलें हैं, जहां आप Codex को बता सकते हैं कि आपके कोडबेस को कैसे नेविगेट किया जाए, टेस्टिंग के लिए कौन से कमांड रन किए जाएं, और आपके प्रोजेक्ट की स्टैंडर्ड प्रैक्टिसेस का बेहतरीन तरीके से फ़ॉलो कैसे किया जाए. ह्यूमन डेवलपर्स की तरह, Codex एजेंट्स भी तब बेहतरीन तरीके से परफ़ॉर्म करते हैं जब उन्हें कॉन्फ़िगर किया गया डेवलपमेंट एन्वायर्नमेंट, भरोसेमंद टेस्टिंग के सेटअप, और क्लियर डॉक्यूमेंटेशन उपलब्ध कराए जाते हैं.

कोडिंग मूल्यांकन और इंटर्नल बेंचमार्क पर, codex-1 AGENTS.md फ़ाइलों या कस्टम स्कैफ़ोल्डिंग के बिना भी बेहतरीन परफ़ॉर्मेंस दिखाता है.

23 SWE-बेंच वेरिफ़ाइड सैंपल्स, जो हमारे इंटर्नल इंफ़्रास्ट्रक्चर पर रन करने लायक नहीं थे, उन्हें बाहर रखा गया. Codex-1 का टेस्ट मैक्सिमम 192k टोकन की कॉन्टेक्स्ट लेंग्थ और मीडियम 'रीज़निंग प्रयास' पर किया गया, जो कि वो सेटिंग है जो आज प्रोडक्ट में उपलब्ध होगी. o3 एवल्युएशन पर जानकारी के लिए, यहां⁠ देखें.

हमारा इंटर्नल SWE टास्क बेंचमार्क, OpenAI में रियल-वर्ल्ड के इंटर्नल SWE टास्क का एक क्यूरेटेड सेट है.

सुरक्षित और भरोसेमंद एजेंट्स बनाना

हम अपनी इटरेटिव डिप्लॉयमेंट स्ट्रैटेजी के अनुरूप Codex को एक रिसर्च प्रीव्यू के तौर पर रिलीज़ कर रहे हैं. Codex को डिज़ाइन करते समय हमने सुरक्षा और पारदर्शिता को प्राथमिकता दी, ताकि यूज़र इसके आउटपुट को वेरिफ़ाई कर सकें - एक ऐसा सुरक्षा उपाय जो और ज़्यादा ज़रूरी होता जा रहा है क्योंकि AI मॉडल्स और ज़्यादा मुश्किल कोडिंग टास्क को स्वतंत्र तरीके से हैंडल करते हैं और सुरक्षा संबंधी विचार उभरते हैं. यूज़र Codex के काम को साइटेशन्स, टर्मिनल लॉग और टेस्ट रिज़ल्ट्स के ज़रिये चेक कर सकते हैं. जब अनिश्चितता हो या टेस्ट में असफ़लता का सामना करना पड़े, तो Codex एजेंट स्पष्ट तरीके से इन मुद्दों के बारे में सूचित करता है, जिससे यूज़र आगे बढ़ने के बारे में सोच-समझ कर फ़ैसले ले पाते हैं. यूज़र के लिए इंटीग्रेशन और एक्सीक्यूशन से पहले सभी एजेंट-जनरेटेड कोड को मैन्युअल तरीके से रिव्यु और वैलिडेट करना अभी भी ज़रूरी है.

नीले रंग के बैकग्राउंड पर क्वोट किए गए फ़ाइलों के नामों को वेरिफ़ाई करने वाले टेस्ट-फ़ाइल ओवरले के साथ कोड-रिव्यु स्क्रीनशॉट, साथ ही सारांश और पास किए गए टेस्ट.

ब्लैक टर्मिनल ओवरले के साथ कोड-रिव्यु स्क्रीनशॉट, जिसमें क्वोट किए गए फ़ाइलों के नामों के लिए एक पासिंग टेस्ट दिखाया गया है; एक नीले-पेस्टल बैकग्राउंड पर दिखाई देने वाले 'स्पेशल करैक्टर्स के साथ /diff एरर को फ़िक्स करें' बदलाव की समरी और अंतर.

ह्यूमन प्रेफ़रेंस के अनुरूप ढलना

codex-1 को ट्रेन करने के पीछे सबसे ज़रूरी लक्ष्य आउटपुट को ह्यूमन कोडिंग के प्रेफ़रेंस और स्टैंडर्ड के साथ अलाइन करना था. OpenAI o3 के मुकाबले, Codex-1 लगातार जल्द ह्यूमन रिव्यु और स्टैंडर्ड वर्कफ़्लो में इंटीग्रेशन के लिए तैयार ज़्यादा क्लीन पैच तैयार करता है.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

दुरुपयोग को रोकना

AI-संचालित सॉफ़्टवेयर इंजीनियरिंग के दुर्भावनापूर्ण ऐप्लिकेशन्स, जैसे मैलवेयर डेवलपमेंट, के खिलाफ़ सुरक्षा करना बेहद ज़रूरी होता जा रहा है. साथ ही, ये भी ज़रूरी है कि सुरक्षात्मक उपाय उन वैध और फ़ायदेमंद ऐप्लिकेशन में बिना मतलब से रुकावट न डालें, जिनमें निम्न स्तरीय केर्नल इंजीनियरिंग जैसी तकनीकें शामिल हो सकती हैं, जिनका इस्तेमाल कभी-कभी मैलवेयर डेवलपमेंट के लिए भी किया जाता है.

सुरक्षा और उपयोगिता के बीच बैलेंस बनाए रखने के लिए, Codex को दुर्भावनापूर्ण सॉफ़्टवेयर के डेवलपमेंट के लिए किए गए अनुरोधों की पहचान करने और उन्हें अस्वीकार करने के लिए ट्रेन किया गया, साथ ही वैध टास्क को स्पष्ट तरीके से पहचानने और उन्हें सपोर्ट करने के लिए भी ट्रेन किया गया. हमने अपनी पॉलिसी फ्रेमवर्क को और मज़बूत किया है और सख़्त सेफ़्टी इवैल्यूएशन को शामिल किया है ताकि इन सीमाओं को असरदार तरीक़े से मज़बूती दी जा सके. हमने इन मूल्यांकनों को दर्शाने के लिए o3 सिस्टम कार्ड में एक ऐडेंडम⁠ पब्लिश किया है.

सुरक्षित एक्सीक्यूशन

Codex एजेंट पूरी तरह से क्लाउड में एक सुरक्षित, आइसोलेटेड कंटेनर के अंदर काम करता है. टास्क एक्सीक्यूशन के दौरान, इंटरनेट एक्सेस डिसेबल कर दिया जाता है, जिससे एजेंट की सहभागिता केवल GitHub रिपॉज़िटरी के ज़रिये स्पष्ट तरीके से दिए गए कोड और यूज़र द्वारा सेटअप स्क्रिप्ट के ज़रिये कॉन्फ़िगर किए गए प्री-इंस्टॉल की गई निर्भरताओं तक सीमित हो जाती है. एजेंट बाहरी वेबसाइट, API या अन्य सेवाओं को एक्सेस नहीं कर सकता.

शुरूआती यूज़ केस

OpenAI की तकनीकी टीम ने Codex को अपने दैनिक टूलकिट के भाग के तौर पर इस्तेमाल करना शुरू कर दिया है. इसका इस्तेमाल अक्सर OpenAI इंजीनियरों द्वारा दोहराए जाने वाले, अच्छी तरह से परिभाषित टास्क को निपटाने के लिए किया जाता है, जैसे कि रीफ़ैक्टरिंग, नाम बदलना और टेस्ट लिखना, वरना जो ध्यान भंग कर देते हैं. ये नए फ़ीचर्स को तैयार करने, कॉम्पोनेन्ट को जोड़ने, बग्स को फ़िक्स करने और डॉक्यूमेंट ड्राफ़्ट करने के लिए समान रूप से फ़ायदेमंद है. टीम इसके इर्द-गिर्द नई आदतें बना रही हैं: ऑन-कॉल समस्याओं का समाधान करना, दिन की शुरुआत में टास्क प्लॉन करना, और आगे बढ़ते रहने के लिए बैकग्राउंड के काम को निपटाना. कॉन्टेक्स्ट-स्विचिंग को कम करके और भूले हुए कामों को सामने लाकर, Codex इंजीनियरों को तेज़ी से काम पूरा करने और सबसे ज़रूरी चीज़ों पर फ़ोकस करने में मदद करता है.

रिलीज़ से पहले, हम बाहरी टेस्टर्स के एक छोटे-से ग्रुप के साथ भी काम कर रहे हैं ताकि ये बेहतर ढंग से समझा जा सके कि Codex बहुत सारे कोडबेस, डेवलपमेंट प्रोसेसेस और टीमों में कैसा प्रदर्शन करता है.

Cisco⁠(एक नई विंडो में खुलेगा) इस बात पर विचार कर रहा है कि Codex किस तरह उनकी इंजीनियरिंग टीमों को महत्वाकांक्षी विचारों को तेज़ी से मूर्त रूप देने में मदद कर सकता है. शुरूआती डिज़ाइन पार्टनर्स के तौर पर, Cisco अपने प्रोडक्ट पोर्टफ़ोलियो में रियल-वर्ल्ड के यूज़ केस के लिए Codex का मूल्यांकन करके और OpenAI टीम को फ़ीडबैक दे कर Codex के भविष्य को आकार देने में मदद कर रहा है.
टेम्पोरल⁠(एक नई विंडो में खुलेगा) फ़ीचर डेवलपमेंट में तेज़ी लाने, समस्याओं को डीबग करने, टेस्ट लिखने और एक्सीक्यूट करने, और बड़े कोडबेसेस को रीफ़ैक्टर करने के लिए Codex का इस्तेमाल करता है. ये बैकग्राउंड में मुश्किल टास्क को रन करके उन्हें फ़ोकस बनाए रखने में भी मदद करता है—जिससे इंजीनियरों को प्रवाह में बने रहने के साथ-साथ इटरेशन की स्पीड भी तेज़ होती है.
सुपरह्यूमन⁠(एक नई विंडो में खुलेगा) Codex का इस्तेमाल छोटे लेकिन दोहराए जाने वाले टास्क को स्पीड अप करने के लिए करता है, जैसे टेस्ट कवरेज में सुधार और इंटीग्रेशन विफ़लताओं को फ़िक्स करना. ये प्रोडक्ट मैनेजर्स को कोड रिव्यु के अलावा, किसी इंजीनियर की मदद लिए बिना, हल्के कोड बदलने में इनेबल करके, उन्हें तेज़ी से काम करने में भी मदद करता है.
Kodiak⁠(एक नई विंडो में खुलेगा) डीबगिंग टूल्स लिखने, टेस्ट कवरेज में सुधार करने और कोड को रीफ़ैक्टर करने में मदद के लिए Codex का इस्तेमाल कर रहा है—इससे उनकी ऑटोनोमस ड्राइविंग टेक्नोलॉजी, Kodiak ड्राइवर का डेवलपमेंट तेज़ हो गया. Codex एक कीमती रेफ़रेंस टूल भी बन गया है, जो प्रासंगिक कॉन्टेक्स्ट और पिछले बदलावों को सामने लाकर इंजीनियरों को स्टैक के अपरिचित भागों को समझने में मदद करता है.

शुरुआती टेस्टर्स से मिली सीख के आधार पर, हम एक साथ कई एजेंट्स को अच्छी स्कोप वाले परिभाषित टास्क असाइन करके मॉडल की क्षमताओं का प्रभावी ढंग से पता लगाने के लिए अलग-अलग तरह के टास्क और प्रॉम्प्ट के साथ प्रयोग करने की सलाह देते हैं.

Codex CLI में अपडेट

पिछले महीने, हमने Codex CLI लॉन्च किया, जो एक हल्का ओपन-सोर्स कोडिंग एजेंट है जो आपके टर्मिनल में रन करता है. ये o3 और o4-mini जैसे मॉडल की ताकत को आपके लोकल वर्कफ़्लो में लाता है, जिससे टास्क को तेज़ी से पूरा करने के लिए उनके साथ पेअर करना आसान हो जाता है.

आज, हम codex-1 का एक छोटा वर्ज़न भी रिलीज़ कर रहे हैं, जो o4-mini का एक वर्ज़न है जिसे ख़ास तौर से Codex CLI में इस्तेमाल के लिए डिज़ाइन किया गया है. ये नया मॉडल CLI में तेज़ वर्कफ़्लो को सपोर्ट करता है और कम-लेटेंसी वाले कोड प्रश्नोत्तर और एडिटिंग के लिए ऑप्टिमाइज़्ड है, जबकि निर्देशों को फ़ॉलो करने और स्टाइल में समान ताकतों को बरकरार रखता है. ये अब Codex CLI में डिफ़ॉल्ट मॉडल के तौर पर और API में codex-mini-latest के तौर पर उपलब्ध है. अंतर्निहित स्नैपशॉट को नियमित तरीके से अपडेट किया जाएगा क्योंकि हम Codex-mini मॉडल में सुधार जारी रखेंगे.

हम आपके डेवलपर अकाउंट को Codex CLI से कनेक्ट करना भी बहुत आसान बना रहे हैं. API टोकन को मैन्युअल तरीके से जेनरेट और कॉन्फ़िगर करने के बजाय, अब आप अपने ChatGPT अकाउंट से साइन इन कर सकते हैं और उस API संगठन को चुन सकते हैं जिसका आप इस्तेमाल करना चाहते हैं. हम आपके लिए अपने आप API की जनरेट और कॉन्फ़िगर करेंगे. Plus और Pro यूज़र जो ChatGPT के साथ Codex CLI में साइन इन करते हैं, वे आज से अगले 30 दिनों के लिए, क्रमशः, $5 और $50 का मुफ़्त API क्रेडिट प्राप्त करना शुरू कर सकते हैं.

Codex की उपलब्धता, दाम, और सीमाएं

आज से, हम वैश्विक स्तर पर ChatGPT Pro, Enterprise और टीम यूज़र के लिए Codex शुरू कर रहे हैं, जल्द ही Plus और Edu के लिए भी सपोर्ट उपलब्ध होगा. आने वाले हफ्तों में यूज़र को बिना किसी अतिरिक्त खर्चे के उदार एक्सेस प्राप्त होगी, ताकि आप ये एक्सप्लोर कर सकें कि Codex क्या कर सकता है, जिसके बाद हम दर-सीमित एक्सेस और फ़्लेक्सिबल प्राइसिंग ऑप्शन्स पेश करेंगे जो आपको ऑन-डिमांड अतिरिक्त इस्तेमाल खरीदने में मदद करेंगे. हम जल्द ही Plus और Edu यूज़र तक एक्सेस बढ़ाने का प्लॉन कर रहे हैं.

Codex-mini-latest के साथ बनाने वाले डेवलपर्स के लिए, मॉडल रिस्पॉन्स API पर उपलब्ध है और इसकी कीमत 1.50 डॉलर प्रति 1M इनपुट टोकन्स और 6 डॉलर प्रति 1M आउटपुट टोकन्स है, जिसमें 75% प्रॉम्प्ट कैशिंग छूट है.

Codex अभी भी अपने डेवलपमेंट के शुरूआती स्टेज में है. रिसर्च प्रीव्यू के तौर पर, इसमें फ़िलहाल फ़्रंटएंड काम के लिए इमेज इनपुट, और काम करते समय एजेंट को सही दिशा में ले जाने की क्षमता जैसे फ़ीचर्स की कमी है. इसके अलावा, एक रिमोट एजेंट को काम सौंपने में इंटरैक्टिव एडिटिंग के मुकाबले और ज़्यादा समय लगता है, जिसकी आदत डालने में कुछ समय लग सकता है. समय के साथ, Codex एजेंट्स के साथ बातचीत करना सहकर्मियों के साथ एसिंक्रोनस सहयोग जैसा हो जाएगा. जैसे-जैसे मॉडल की क्षमताएं आगे बढ़ेंगी, हम अनुमान लगाते हैं कि एजेंट लंबे पीरियड तक और ज़्यादा मुश्किल टास्क को हैंडल कर पाएंगे.

आगे क्या है

हम एक ऐसे भविष्य की कल्पना करते हैं, जहां डेवलपर उस काम को खुद करेंगे, जिसे वे खुद करना चाहते हैं, और बाकी काम एजेंट्स को सौंप देंगे—जिससे वे AI के साथ तेज़ी से आगे बढ़ेंगे तथा और ज़्यादा प्रोडक्टिव बनेंगे. इसे हासिल करने के लिए, हम Codex टूल्स का एक सुइट बना रहे हैं जो रियल-टाइम सहयोग और एसिंक्रोनस डेलिगेशन दोनों को सपोर्ट करता है.

Codex CLI और अन्य जैसे AI टूल्स के साथ पेयरिंग बनाना तेज़ी से इंडस्ट्री का मानक बन गया है, जिससे डेवलपर्स को कोड करते समय तेज़ी से आगे बढ़ने में मदद मिलती है. लेकिन हमारा मानना है कि Codex द्वारा ChatGPT में प्रस्तुत किया गया एसिंक्रोनस, मल्टी-एजेंट वर्कफ़्लो, इंजीनियरों के लिए ऊंची-क्वालिटी वाला कोड तैयार करने का असली तरीका बन जाएगा.

आख़िरकार, हम बातचीत के इन दो तरीकों—रियल-टाइम पेयरिंग और टास्क डेलिगेशन—को एक साथ आते हुए देखते हैं. डेवलपर्स अपने IDEs और रोज़मर्रा के टूल्स पर AI एजेंट्स के साथ सहयोग करेंगे, ताकि वे सवाल पूछ सकें, सुझाव प्राप्त कर सकें और लंबे टास्क को एक यूनिफ़ाइड वर्कफ़्लो में निपटा सकें.

भविष्य की ओर देखते हुए, हम और ज़्यादा इंटरैक्टिव और फ़्लेक्सिबल एजेंट वर्कफ़्लोज़ शुरू करने का प्लॉन कर रहे हैं. डेवलपर्स जल्द ही टास्क के बीच में गाइडेंस देने, लागू करने की स्ट्रैटेजियों पर सहयोग करने और प्रोग्रेस से जुड़े प्रोएक्टिव अपडेट पा सकेंगे. हम आपके द्वारा पहले से इस्तेमाल किए जा रहे टूल्स में डीप इंटीग्रेशन की भी कल्पना करते हैं: आज Codex GitHub से कनेक्ट करता है, और जल्द ही आप Codex CLI, ChatGPT डेस्कटॉप, या यहां तक कि आपके इश्यु ट्रैकर या CI सिस्टम जैसे टूल्स से भी टास्क असाइन कर पाएंगे.

सॉफ़्टवेयर इंजीनियरिंग उन पहली इंडस्ट्रीज़ में से एक है, जिसने अहमण AI-ड्रिवन प्रोडक्टिविटी फ़ायदों का अनुभव किया है, जिससे लोगों और छोटी टीमों के लिए नई संभावनाएं खुली हैं. हालांकि हम इन फ़ायदों के बारे में आशावादी हैं, हम डेवलपर वर्कफ़्लो, लोगों के स्किल डेवलपमेंट, स्किल लेवल्स और भौगोलिक क्षेत्रों पर बड़े पैमाने पर एजेंट अपनाने के प्रभावों को बेहतर ढंग से समझने के लिए पार्टनर्स के साथ कोलैबोरेट भी कर रहे हैं.

ये तो बस शुरुआत है - और हम ये देखने के लिए उत्साहित हैं कि आप Codex के साथ क्या बनाते हैं.

लाइवस्ट्रीम रीप्ले

एपेंडिक्स

सिस्टम मेसेज

हम डेवलपर को मॉडल के डिफ़ॉल्ट बिहेवियर को समझने और कस्टम वर्कफ़्लो में प्रभावी ढंग से काम करने के लिए Codex को तैयार करने में मदद करने के लिए Codex-1 सिस्टम मैसेज शेयर कर रहे हैं. जैसे कि, codex-1 सिस्टम मेसेज Codex को AGENTS.md फ़ाइल में दिए गए सभी टेस्ट रन करने के लिए प्रोत्साहित करता है, लेकिन अगर आपके पास समय कम है, तो आप Codex को इन टेस्ट को छोड़ने के लिए भी कह सकते हैं.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

लेखक

OpenAI