GPT‑5.2‑Codex पेश कर रहे हैं.
प्रोफेशनल सॉफ्टवेयर इंजीनियरिंग और डिफेंसिव साइबरसिक्योरिटी के लिए सबसे एडवांस्ड एजेंटिक कोडिंग मॉडल.
आज हम GPT‑5.2‑Codex रिलीज़ कर रहे हैं, जो जटिल, रियल-वर्ल्ड सॉफ्टवेयर इंजीनियरिंग के लिए अब तक का सबसे एडवांस्ड एजेंटिक कोडिंग मॉडल है. GPT‑5.2‑Codex, GPT‑5.2 का एक वर्ज़न है जिसे Codex में एजेंटिक कोडिंग के लिए और ज्यादा ऑप्टिमाइज़ किया गया है. इसमें कॉन्टेक्स्ट कंपैक्शन के ज़रिए लॉन्ग-होराइज़न काम में सुधार, रिफैक्टर्स और माइग्रेशन्स जैसे बड़े कोड बदलावों पर बेहतर परफॉर्मेंस, Windows एनवायरनमेंट्स में बेहतर प्रदर्शन, और काफी ज्यादा मजबूत साइबरसिक्योरिटी क्षमताएं शामिल हैं.
जैसे-जैसे हमारे मॉडल इंटेलिजेंस फ्रंटियर पर आगे बढ़ते जा रहे हैं, हमने देखा है कि ये सुधार cybersecurity जैसे स्पेशलाइज़्ड डोमेन्स में भी कैपेबिलिटी में बड़े जंप के रूप में सामने आते हैं. उदाहरण के तौर पर, सिर्फ पिछले हफ्ते, GPT‑5.1‑Codex‑Max का इस्तेमाल कर रहे एक सिक्योरिटी रिसर्चर ने. Codex CLI के साथ, React में एक ऐसी वल्नरेबिलिटी को खोजा और जिम्मेदारी से disclosed(एक नई विंडो में खुलेगा) किया, जो सोर्स कोड के एक्सपोज़ होने का कारण बन सकती थी.
GPT‑5.2‑Codex में अब तक हमारे द्वारा रिलीज़ किए गए किसी भी मॉडल से ज़्यादा मज़बूत साइबरसिक्योरिटी कैपेबिलिटीज़ हैं. ये प्रगति बड़े पैमाने पर साइबरसिक्योरिटी को मज़बूत करने में मदद कर सकती है, लेकिन साथ ही इससे दोहरे उपयोग से जुड़े नए जोखिम भी सामने आते हैं, जिनके लिए सावधानीपूर्वक तैनाती ज़रूरी है. हालाँकि GPT‑5.2‑Codex हमारे Preparedness Framework के तहत साइबर कैपेबिलिटी के ‘High’ लेवल तक नहीं पहुँचता है, फिर भी हम भविष्य में कैपेबिलिटी के बढ़ने को ध्यान में रखते हुए अपना डिप्लॉयमेंट अप्रोच डिज़ाइन कर रहे हैं.
हम GPT‑5.2‑Codex को रिलीज़ कर रहे हैं. आज सभी पेड ChatGPT यूज़र्स के लिए सभी Codex सरफेसेज़ पर GPT‑5.2‑Codex रिलीज़ किया जा रहा है, और आने वाले हफ्तों में API यूज़र्स के लिए GPT‑5.2‑Codex की एक्सेस को सुरक्षित तरीके से सक्षम करने पर काम किया जा रहा है. इसके साथ-साथ, हम डिफेंसिव साइबरसिक्योरिटी पर केंद्रित, वेरिफ़ाइड प्रोफेशनल्स और संगठनों के लिए आने वाली कैपेबिलिटीज़ और ज़्यादा परमिसिव मॉडल्स तक इनवाइट-ओनली ट्रस्टेड एक्सेस का पायलट चला रहे हैं. हमें लगता है कि डिप्लॉयमेंट का यह तरीका एक्सेसिबिलिटी और सेफ्टी के बीच सही संतुलन बनाए रखेगा.
GPT‑5.2‑Codex, प्रोफेशनल नॉलेज वर्क में GPT‑5.2 की मज़बूतियों और GPT‑5.1‑Codex‑Max की क्षमताओं पर आगे निर्माण करता है. फ्रंटियर एजेंटिक कोडिंग और टर्मिनल का इस्तेमाल करने वाली कैपेबिलिटीज़. GPT‑5.2‑Codex अब लंबे कॉन्टेक्स्ट को समझने, भरोसेमंद टूल कॉलिंग, बेहतर तथ्यात्मक सटीकता और नेटिव कम्पैक्शन में पहले से बेहतर है, जिससे यह लंबे समय तक चलने वाले कोडिंग टास्क्स के लिए एक ज़्यादा भरोसेमंद पार्टनर बनता है, और साथ ही अपनी रीजनिंग में टोकन-एफ़िशिएंट भी रहता है.
GPT‑5.2‑Codex, SWE-Bench Pro और Terminal-Bench 2.0 पर स्टेट-ऑफ-द-आर्ट परफॉर्मेंस हासिल करता है. ये बेंचमार्क्स रियलिस्टिक टर्मिनल एनवायरनमेंट्स में अलग-अलग तरह के टास्क्स पर एजेंटिक परफॉर्मेंस को टेस्ट करने के लिए बनाए गए हैं. GPT‑5.1‑Codex‑Max में पेश की गई क्षमताओं पर आगे बढ़ते हुए, यह नेटिव Windows एनवायरनमेंट्स में एजेंटिक कोडिंग के लिए कहीं ज्यादा प्रभावी और भरोसेमंद है.
इन सुधारों के साथ, Codex अब बड़े रिपॉज़िटरीज़ में लंबे सेशंस के दौरान पूरे कॉन्टेक्स्ट को बनाए रखते हुए ज़्यादा प्रभावी तरीके से काम कर सकता है. यह बड़े रिफ़ैक्टर, कोड माइग्रेशन और फीचर बिल्ड जैसे जटिल कामों को ज़्यादा भरोसेमंद तरीके से पूरा कर सकता है — और प्लान बदलने या कोशिशें फेल होने पर भी बिना ट्रैक खोए लगातार सुधार करता रहता है.
SWE-Bench Pro में, एक मॉडल को एक कोड रिपॉज़िटरी दी जाती है और उसे एक वास्तविक सॉफ़्टवेयर इंजीनियरिंग टास्क को हल करने के लिए एक पैच जनरेट करना होता है. Terminal-Bench 2.0 एक बेंचमार्क है, जिसका इस्तेमाल असली टर्मिनल एनवायरनमेंट्स में AI एजेंट्स की टेस्टिंग के लिए किया जाता है. इन टास्क्स में कोड को कम्पाइल करना, मॉडल्स को ट्रेन करना और सर्वर्स को सेट अप करना शामिल है.
ज़्यादा मज़बूत विज़न परफ़ॉर्मेंस GPT‑5.2‑Codex को कोडिंग सेशंस के दौरान शेयर किए गए स्क्रीनशॉट्स, टेक्निकल डायग्राम्स, चार्ट्स और UI सरफेसेज़ को और ज़्यादा सटीक तरीके से समझने में सक्षम बनाती है.
Codex डिज़ाइन मॉक्स को लेकर उन्हें तेज़ी से फ़ंक्शनल प्रोटोटाइप्स में बदल सकता है, और आप Codex के साथ मिलकर इन प्रोटोटाइप्स को सीधे प्रोडक्शन तक ले जा सकते हैं.
डिज़ाइन मॉकअप

GPT‑5.2‑Codex द्वारा जनरेट किया गया प्रोटोटाइप
समय के साथ हमारी एक मुख्य साइबरसिक्योरिटी इवैल्यूएशन में परफ़ॉर्मेंस को देखते हुए, हमें GPT‑5‑Codex से कैपेबिलिटी में तेज़ उछाल दिखाई देता है, फिर GPT‑5.1‑Codex‑Max के साथ एक और बड़ा उछाल, और अब GPT‑5.2‑Codex के साथ तीसरा उछाल नज़र आता है. हमें उम्मीद है कि आने वाले AI मॉडल्स भी इसी दिशा में आगे बढ़ते रहेंगे. तैयारी के तौर पर, हम इस मानकर योजना बना रहे हैं और मूल्यांकन कर रहे हैं कि हर नया मॉडल साइबरसिक्योरिटी कैपेबिलिटी के ‘High’ लेवल तक पहुँच सकता है, जैसा कि हमारे Preparedness Framework(एक नई विंडो में खुलेगा) से मापा जाता है. हालाँकि GPT‑5.2‑Codex अभी साइबर कैपेबिलिटी के ‘High’ लेवल तक नहीं पहुँचा है, लेकिन हम उन भविष्य के मॉडल्स के लिए तैयारी कर रहे हैं जो इस थ्रेशहोल्ड को पार करेंगे. साइबर क्षमताओं में बढ़ोतरी के कारण, हमने मॉडल और प्रॉडक्ट दोनों में अतिरिक्त सुरक्षा उपाय जोड़े हैं, जिनका विवरण system card में दिया गया है.
Professional Capture-the-Flag (CTF) eval यह मापता है कि Linux एनवायरनमेंट में प्रोफेशनल-लेवल साइबरसिक्योरिटी स्किल्स की ज़रूरत वाले एडवांस्ड, मल्टी-स्टेप रियल-वर्ल्ड चैलेंजेज़ को मॉडल कितनी बार सॉल्व कर पाता है.
आधुनिक समाज सॉफ्टवेयर पर चलता है, और उसकी विश्वसनीयता मजबूत साइबरसिक्योरिटी पर निर्भर करती है—बैंकिंग, हेल्थकेयर, कम्युनिकेशन्स और जरूरी सेवाओं में क्रिटिकल सिस्टम्स को ऑनलाइन रखना, सेंसिटिव डेटा की सुरक्षा करना, और यह सुनिश्चित करना कि लोग रोज़ जिन सॉफ्टवेयर पर भरोसा करते हैं, उन पर भरोसा बना रहे. वल्नरेबिलिटीज़ किसी को पता चलने से बहुत पहले से मौजूद हो सकती हैं, और उन्हें ढूंढना, वैलिडेट करना और ठीक करना अक्सर सही टूल्स से लैस इंजीनियर्स और इंडिपेंडेंट सिक्योरिटी रिसर्चर्स की कम्युनिटी पर निर्भर करता है.
11 दिसंबर, 2025 को React टीम ने React सर्वर कॉम्पोनेंट्स से बने ऐप्स को प्रभावित करने वाली तीन सुरक्षा कमजोरियाँ प्रकाशित कीं. इस डिस्क्लोज़र को खास बनाने वाली बात सिर्फ ये कमजोरियाँ नहीं थीं, बल्कि यह भी था कि उन्हें किस तरह उजागर किया गया.
Privy (एक Stripe कंपनी) में प्रिंसिपल सिक्योरिटी इंजीनियर Andrew MacPherson, GPT‑5.1‑Codex‑Max का इस्तेमाल कर रहे थे. Codex CLI और अन्य कोडिंग एजेंट्स के साथ, वे पिछले हफ्ते डिस्क्लोज़ की गई React की एक अलग क्रिटिकल वल्नरेबिलिटी को दोबारा रीप्रोड्यूस करने और उसका अध्ययन करने पर काम कर रहे थे, जिसे React2Shell(एक नई विंडो में खुलेगा) (CVE-2025-55182(एक नई विंडो में खुलेगा)) के नाम से जाना जाता है. उनका लक्ष्य यह परखना था कि मॉडल असली दुनिया की वल्नरेबिलिटी रिसर्च में कितनी अच्छी तरह मदद कर सकता है.
शुरुआत में उन्होंने कई ज़ीरो-शॉट एनालिसिस करने की कोशिश की, जिसमें मॉडल से पैच की जाँच करने और यह पहचानने को कहा गया कि वह किस वल्नरेबिलिटी को संबोधित करता है. जब उससे नतीजे नहीं मिले, तो उन्होंने ज़्यादा मात्रा में, बार-बार दोहराए जाने वाले प्रॉम्प्टिंग वाले तरीके की ओर रुख किया. जब वे तरीके भी सफल नहीं हुए, तो उन्होंने Codex को स्टैंडर्ड डिफेंसिव सिक्योरिटी वर्कफ़्लोज़ के ज़रिए गाइड किया—एक लोकल टेस्ट एनवायरनमेंट सेट करना, संभावित अटैक सरफेसेज़ पर तर्क करना, और गलत इनपुट्स के साथ सिस्टम की जाँच के लिए फ़ज़िंग का इस्तेमाल करना. मूल React2Shell समस्या को दोबारा रीप्रोड्यूस करने की कोशिश के दौरान, Codex ने कुछ ऐसे अनपेक्षित बिहेवियर्स सामने लाए जिनके लिए और गहराई से जाँच करना ज़रूरी हो गया. सिर्फ एक हफ्ते के दौरान, इस प्रक्रिया से पहले से अज्ञात कई कमजोरियों की खोज हुई, जिन्हें जिम्मेदारी के साथ React टीम को डिस्क्लोज़ किया गया.
यह दिखाता है कि एडवांस्ड AI सिस्टम्स किस तरह व्यापक रूप से इस्तेमाल होने वाले, असली दुनिया के सॉफ़्टवेयर में डिफेंसिव सिक्योरिटी के काम को ठोस रूप से तेज़ कर सकते हैं. इसी समय, जो क्षमताएँ डिफेंडर्स को तेज़ी से काम करने में मदद करती हैं, उनका दुरुपयोग बुरे इरादों वाले लोग भी कर सकते हैं.
जैसे-जैसे एजेंटिक सिस्टम्स साइबरसिक्योरिटी से जुड़े टास्क्स में ज्यादा सक्षम होते जा रहे हैं, हम यह सुनिश्चित करना अपनी मुख्य प्राथमिकता बना रहे हैं कि इन प्रगतियों को जिम्मेदारी से डिप्लॉय किया जाए—हर क्षमता वृद्धि के साथ मजबूत सेफगार्ड्स, कड़े एक्सेस कंट्रोल्स, और सिक्योरिटी कम्युनिटी के साथ लगातार सहयोग जोड़ते हुए.
थ्रेट एक्टर्स की नकल करने, रेमेडिएशन के लिए मैलवेयर का विश्लेषण करने, या क्रिटिकल इन्फ्रास्ट्रक्चर का स्ट्रेस टेस्ट करने की कोशिश करते समय सिक्योरिटी टीमों को कई तरह की सीमाओं का सामना करना पड़ सकता है. हम योग्य यूज़र्स और संगठनों के लिए उस रुकावट को हटाने हेतु एक ट्रस्टेड एक्सेस पायलट विकसित कर रहे हैं, ताकि भरोसेमंद डिफेंडर्स फ्रंटियर AI साइबर क्षमताओं का इस्तेमाल करके साइबर डिफेंस को तेज़ कर सकें.
शुरुआत में यह पायलट प्रोग्राम केवल invite-only होगा, और उन वेरिफ़ाइड सिक्योरिटी प्रोफेशनल्स के लिए होगा जिनका जिम्मेदार वल्नरेबिलिटी डिस्क्लोज़र का रिकॉर्ड है, साथ ही उन संगठनों के लिए जिनके पास प्रोफेशनल साइबरसिक्योरिटी से जुड़ा स्पष्ट उपयोग-मामला है. योग्य प्रतिभागियों को डिफेंसिव उपयोग-मामलों के लिए हमारे सबसे सक्षम मॉडल्स तक एक्सेस मिलेगा, ताकि वैध दोहरे-उपयोग वाले काम को सक्षम किया जा सके.
अगर आप एक सिक्योरिटी प्रोफेशनल हैं या किसी ऐसे संगठन का हिस्सा हैं जो वल्नरेबिलिटी रिसर्च या अधिकृत रेड-टीमिंग जैसे एथिकल सिक्योरिटी काम करता है, तो हम आपको इस प्रोग्राम से जुड़ने में रुचि दिखाने और आप इसमें क्या देखना चाहते हैं उस पर अपनी प्रतिक्रिया यहाँ(एक नई विंडो में खुलेगा) साझा करने के लिए आमंत्रित करते हैं.
GPT‑5.2‑Codex इस दिशा में एक अहम कदम है कि एडवांस्ड AI असली दुनिया की सॉफ़्टवेयर इंजीनियरिंग और साइबरसिक्योरिटी जैसे स्पेशलाइज़्ड डोमेन्स को कैसे सपोर्ट कर सकता है—डेवलपर्स और डिफेंडर्स को जटिल, लंबे समय तक चलने वाले काम संभालने में मदद करता है, और जिम्मेदार सिक्योरिटी रिसर्च के लिए उपलब्ध टूल्स को और मज़बूत बनाता है.
GPT‑5.2‑Codex को रोलआउट करके इसे धीरे-धीरे रोलआउट करते हुए, डिप्लॉयमेंट को सुरक्षा उपायों के साथ जोड़कर, और सिक्योरिटी कम्युनिटी के साथ मिलकर काम करते हुए, हमारा लक्ष्य डिफेंसिव प्रभाव को अधिकतम करना है और दुरुपयोग के जोखिम को कम करना है. इस रिलीज़ से हम जो सीखेंगे, वह सीधे तौर पर यह तय करेगा कि जैसे-जैसे सॉफ़्टवेयर और साइबर फ्रंटियर्स आगे बढ़ते रहेंगे, हम समय के साथ एक्सेस को कैसे विस्तार देंगे.


