18 दिसंबर 2025

GPT‑5.2‑Codex पेश कर रहे हैं.

प्रोफेशनल सॉफ्टवेयर इंजीनियरिंग और डिफेंसिव साइबरसिक्योरिटी के लिए सबसे एडवांस्ड एजेंटिक कोडिंग मॉडल.

आज हम GPT‑5.2‑Codex रिलीज़ कर रहे हैं, जो जटिल, रियल-वर्ल्ड सॉफ्टवेयर इंजीनियरिंग के लिए अब तक का सबसे एडवांस्ड एजेंटिक कोडिंग मॉडल है. GPT‑5.2‑Codex, GPT‑5.2⁠ का एक वर्ज़न है जिसे Codex में एजेंटिक कोडिंग के लिए और ज्यादा ऑप्टिमाइज़ किया गया है. इसमें कॉन्टेक्स्ट कंपैक्शन के ज़रिए लॉन्ग-होराइज़न काम में सुधार, रिफैक्टर्स और माइग्रेशन्स जैसे बड़े कोड बदलावों पर बेहतर परफॉर्मेंस, Windows एनवायरनमेंट्स में बेहतर प्रदर्शन, और काफी ज्यादा मजबूत साइबरसिक्योरिटी क्षमताएं शामिल हैं.

जैसे-जैसे हमारे मॉडल इंटेलिजेंस फ्रंटियर पर आगे बढ़ते जा रहे हैं, हमने देखा है कि ये सुधार cybersecurity⁠ जैसे स्पेशलाइज़्ड डोमेन्स में भी कैपेबिलिटी में बड़े जंप के रूप में सामने आते हैं. उदाहरण के तौर पर, सिर्फ पिछले हफ्ते, GPT‑5.1‑Codex‑Max का इस्तेमाल कर रहे एक सिक्योरिटी रिसर्चर ने. Codex CLI के साथ, React में एक ऐसी वल्नरेबिलिटी को खोजा और जिम्मेदारी से disclosed⁠(एक नई विंडो में खुलेगा) किया, जो सोर्स कोड के एक्सपोज़ होने का कारण बन सकती थी.

GPT‑5.2‑Codex में अब तक हमारे द्वारा रिलीज़ किए गए किसी भी मॉडल से ज़्यादा मज़बूत साइबरसिक्योरिटी कैपेबिलिटीज़ हैं. ये प्रगति बड़े पैमाने पर साइबरसिक्योरिटी को मज़बूत करने में मदद कर सकती है, लेकिन साथ ही इससे दोहरे उपयोग से जुड़े नए जोखिम भी सामने आते हैं, जिनके लिए सावधानीपूर्वक तैनाती ज़रूरी है. हालाँकि GPT‑5.2‑Codex हमारे Preparedness Framework के तहत साइबर कैपेबिलिटी के ‘High’ लेवल तक नहीं पहुँचता है, फिर भी हम भविष्य में कैपेबिलिटी के बढ़ने को ध्यान में रखते हुए अपना डिप्लॉयमेंट अप्रोच⁠ डिज़ाइन कर रहे हैं.

हम GPT‑5.2‑Codex को रिलीज़ कर रहे हैं. आज सभी पेड ChatGPT यूज़र्स के लिए सभी Codex सरफेसेज़ पर GPT‑5.2‑Codex रिलीज़ किया जा रहा है, और आने वाले हफ्तों में API यूज़र्स के लिए GPT‑5.2‑Codex की एक्सेस को सुरक्षित तरीके से सक्षम करने पर काम किया जा रहा है. इसके साथ-साथ, हम डिफेंसिव साइबरसिक्योरिटी पर केंद्रित, वेरिफ़ाइड प्रोफेशनल्स और संगठनों के लिए आने वाली कैपेबिलिटीज़ और ज़्यादा परमिसिव मॉडल्स तक इनवाइट-ओनली ट्रस्टेड एक्सेस का पायलट चला रहे हैं. हमें लगता है कि डिप्लॉयमेंट का यह तरीका एक्सेसिबिलिटी और सेफ्टी के बीच सही संतुलन बनाए रखेगा.

रियल-वर्ल्ड सॉफ्टवेयर इंजीनियरिंग में फ्रंटियर को आगे बढ़ाना.

GPT‑5.2‑Codex, प्रोफेशनल नॉलेज वर्क में GPT‑5.2 की मज़बूतियों⁠ और GPT‑5.1‑Codex‑Max⁠ की क्षमताओं पर आगे निर्माण करता है. फ्रंटियर एजेंटिक कोडिंग और टर्मिनल का इस्तेमाल करने वाली कैपेबिलिटीज़. GPT‑5.2‑Codex अब लंबे कॉन्टेक्स्ट को समझने, भरोसेमंद टूल कॉलिंग, बेहतर तथ्यात्मक सटीकता और नेटिव कम्पैक्शन में पहले से बेहतर है, जिससे यह लंबे समय तक चलने वाले कोडिंग टास्क्स के लिए एक ज़्यादा भरोसेमंद पार्टनर बनता है, और साथ ही अपनी रीजनिंग में टोकन-एफ़िशिएंट भी रहता है.

GPT‑5.2‑Codex, SWE-Bench Pro और Terminal-Bench 2.0 पर स्टेट-ऑफ-द-आर्ट परफॉर्मेंस हासिल करता है. ये बेंचमार्क्स रियलिस्टिक टर्मिनल एनवायरनमेंट्स में अलग-अलग तरह के टास्क्स पर एजेंटिक परफॉर्मेंस को टेस्ट करने के लिए बनाए गए हैं. GPT‑5.1‑Codex‑Max में पेश की गई क्षमताओं पर आगे बढ़ते हुए, यह नेटिव Windows एनवायरनमेंट्स में एजेंटिक कोडिंग के लिए कहीं ज्यादा प्रभावी और भरोसेमंद है.

इन सुधारों के साथ, Codex अब बड़े रिपॉज़िटरीज़ में लंबे सेशंस के दौरान पूरे कॉन्टेक्स्ट को बनाए रखते हुए ज़्यादा प्रभावी तरीके से काम कर सकता है. यह बड़े रिफ़ैक्टर, कोड माइग्रेशन और फीचर बिल्ड जैसे जटिल कामों को ज़्यादा भरोसेमंद तरीके से पूरा कर सकता है — और प्लान बदलने या कोशिशें फेल होने पर भी बिना ट्रैक खोए लगातार सुधार करता रहता है.

SWE-Bench Pro में, एक मॉडल को एक कोड रिपॉज़िटरी दी जाती है और उसे एक वास्तविक सॉफ़्टवेयर इंजीनियरिंग टास्क को हल करने के लिए एक पैच जनरेट करना होता है. Terminal-Bench 2.0 एक बेंचमार्क है, जिसका इस्तेमाल असली टर्मिनल एनवायरनमेंट्स में AI एजेंट्स की टेस्टिंग के लिए किया जाता है. इन टास्क्स में कोड को कम्पाइल करना, मॉडल्स को ट्रेन करना और सर्वर्स को सेट अप करना शामिल है.

ज़्यादा मज़बूत विज़न परफ़ॉर्मेंस GPT‑5.2‑Codex को कोडिंग सेशंस के दौरान शेयर किए गए स्क्रीनशॉट्स, टेक्निकल डायग्राम्स, चार्ट्स और UI सरफेसेज़ को और ज़्यादा सटीक तरीके से समझने में सक्षम बनाती है.

Codex डिज़ाइन मॉक्‍स को लेकर उन्हें तेज़ी से फ़ंक्शनल प्रोटोटाइप्स में बदल सकता है, और आप Codex के साथ मिलकर इन प्रोटोटाइप्स को सीधे प्रोडक्शन तक ले जा सकते हैं.

डिज़ाइन मॉकअप

Codex-5.2 के साथ वेब प्रोटोटाइप जनरेट करने के लिए इस्तेमाल किया गया डिज़ाइन मॉक.

GPT‑5.2‑Codex द्वारा जनरेट किया गया प्रोटोटाइप

साइबर फ्रंटियर को आगे बढ़ाना.

समय के साथ हमारी एक मुख्य साइबरसिक्योरिटी इवैल्यूएशन में परफ़ॉर्मेंस को देखते हुए, हमें GPT‑5‑Codex से कैपेबिलिटी में तेज़ उछाल दिखाई देता है, फिर GPT‑5.1‑Codex‑Max के साथ एक और बड़ा उछाल, और अब GPT‑5.2‑Codex के साथ तीसरा उछाल नज़र आता है. हमें उम्मीद है कि आने वाले AI मॉडल्स भी इसी दिशा में आगे बढ़ते रहेंगे. तैयारी के तौर पर, हम इस मानकर योजना बना रहे हैं और मूल्यांकन कर रहे हैं कि हर नया मॉडल साइबरसिक्योरिटी कैपेबिलिटी के ‘High’ लेवल तक पहुँच सकता है, जैसा कि हमारे Preparedness Framework⁠⁠(एक नई विंडो में खुलेगा) से मापा जाता है. हालाँकि GPT‑5.2‑Codex अभी साइबर कैपेबिलिटी के ‘High’ लेवल तक नहीं पहुँचा है, लेकिन हम उन भविष्य के मॉडल्स के लिए तैयारी कर रहे हैं जो इस थ्रेशहोल्ड को पार करेंगे. साइबर क्षमताओं में बढ़ोतरी के कारण, हमने मॉडल और प्रॉडक्ट दोनों में अतिरिक्त सुरक्षा उपाय जोड़े हैं, जिनका विवरण system card⁠ में दिया गया है.

Professional Capture-the-Flag (CTF) eval यह मापता है कि Linux एनवायरनमेंट में प्रोफेशनल-लेवल साइबरसिक्योरिटी स्किल्स की ज़रूरत वाले एडवांस्ड, मल्टी-स्टेप रियल-वर्ल्ड चैलेंजेज़ को मॉडल कितनी बार सॉल्व कर पाता है.

रियल-वर्ल्ड साइबर क्षमताएं.

आधुनिक समाज सॉफ्टवेयर पर चलता है, और उसकी विश्वसनीयता मजबूत साइबरसिक्योरिटी पर निर्भर करती है—बैंकिंग, हेल्थकेयर, कम्युनिकेशन्स और जरूरी सेवाओं में क्रिटिकल सिस्टम्स को ऑनलाइन रखना, सेंसिटिव डेटा की सुरक्षा करना, और यह सुनिश्चित करना कि लोग रोज़ जिन सॉफ्टवेयर पर भरोसा करते हैं, उन पर भरोसा बना रहे. वल्नरेबिलिटीज़ किसी को पता चलने से बहुत पहले से मौजूद हो सकती हैं, और उन्हें ढूंढना, वैलिडेट करना और ठीक करना अक्सर सही टूल्स से लैस इंजीनियर्स और इंडिपेंडेंट सिक्योरिटी रिसर्चर्स की कम्युनिटी पर निर्भर करता है.

11 दिसंबर, 2025 को React टीम ने React सर्वर कॉम्पोनेंट्स से बने ऐप्स को प्रभावित करने वाली तीन सुरक्षा कमजोरियाँ प्रकाशित कीं. इस डिस्क्लोज़र को खास बनाने वाली बात सिर्फ ये कमजोरियाँ नहीं थीं, बल्कि यह भी था कि उन्हें किस तरह उजागर किया गया.

Privy (एक Stripe कंपनी) में प्रिंसिपल सिक्योरिटी इंजीनियर Andrew MacPherson, GPT‑5.1‑Codex‑Max का इस्तेमाल कर रहे थे. Codex CLI और अन्य कोडिंग एजेंट्स के साथ, वे पिछले हफ्ते डिस्क्लोज़ की गई React की एक अलग क्रिटिकल वल्नरेबिलिटी को दोबारा रीप्रोड्यूस करने और उसका अध्ययन करने पर काम कर रहे थे, जिसे React2Shell⁠(एक नई विंडो में खुलेगा) (CVE-2025-55182⁠(एक नई विंडो में खुलेगा)) के नाम से जाना जाता है. उनका लक्ष्य यह परखना था कि मॉडल असली दुनिया की वल्नरेबिलिटी रिसर्च में कितनी अच्छी तरह मदद कर सकता है.

शुरुआत में उन्होंने कई ज़ीरो-शॉट एनालिसिस करने की कोशिश की, जिसमें मॉडल से पैच की जाँच करने और यह पहचानने को कहा गया कि वह किस वल्नरेबिलिटी को संबोधित करता है. जब उससे नतीजे नहीं मिले, तो उन्होंने ज़्यादा मात्रा में, बार-बार दोहराए जाने वाले प्रॉम्प्टिंग वाले तरीके की ओर रुख किया. जब वे तरीके भी सफल नहीं हुए, तो उन्होंने Codex को स्टैंडर्ड डिफेंसिव सिक्योरिटी वर्कफ़्लोज़ के ज़रिए गाइड किया—एक लोकल टेस्ट एनवायरनमेंट सेट करना, संभावित अटैक सरफेसेज़ पर तर्क करना, और गलत इनपुट्स के साथ सिस्टम की जाँच के लिए फ़ज़िंग का इस्तेमाल करना. मूल React2Shell समस्या को दोबारा रीप्रोड्यूस करने की कोशिश के दौरान, Codex ने कुछ ऐसे अनपेक्षित बिहेवियर्स सामने लाए जिनके लिए और गहराई से जाँच करना ज़रूरी हो गया. सिर्फ एक हफ्ते के दौरान, इस प्रक्रिया से पहले से अज्ञात कई कमजोरियों की खोज हुई, जिन्हें जिम्मेदारी के साथ React टीम को डिस्क्लोज़ किया गया.

"Vulnerability Discovery with Codex: CVE-2025-55183” शीर्षक वाला फ़्लो डायग्राम, जो Git रिपॉज़िटरी से शुरू होने वाले वर्कफ़्लो को दिखाता है, जहाँ Codex वल्नरेबिलिटीज़ के लिए कोड को स्कैन करता है. एक ज़ीरो-शॉट प्रयास विफल हो जाता है, जिसके बाद एक एक्सपर्ट-गाइडेड प्रक्रिया अपनाई जाती है, जिसमें कोडबेस की जाँच की जाती है, संभावित टार्गेट्स पहचाने जाते हैं, एक हार्नेस तैयार किया जाता है, और री-वैलिडेशन के साथ एक उदाहरण ऐप पर फ़ज़ टेस्टिंग की जाती है. नतीजों को वेरिफ़ाई करके एक प्रूफ़ ऑफ़ कॉन्सेप्ट तैयार किया जाता है, जिसके बाद जिम्मेदारी से डिस्क्लोज़र किया जाता है और रिपॉज़िटरी में वापस एक पैच लागू किया जाता है.

यह दिखाता है कि एडवांस्ड AI सिस्टम्स किस तरह व्यापक रूप से इस्तेमाल होने वाले, असली दुनिया के सॉफ़्टवेयर में डिफेंसिव सिक्योरिटी के काम को ठोस रूप से तेज़ कर सकते हैं. इसी समय, जो क्षमताएँ डिफेंडर्स को तेज़ी से काम करने में मदद करती हैं, उनका दुरुपयोग बुरे इरादों वाले लोग भी कर सकते हैं.

जैसे-जैसे एजेंटिक सिस्टम्स साइबरसिक्योरिटी से जुड़े टास्क्स में ज्यादा सक्षम होते जा रहे हैं, हम यह सुनिश्चित करना अपनी मुख्य प्राथमिकता बना रहे हैं कि इन प्रगतियों को जिम्मेदारी से डिप्लॉय किया जाए—हर क्षमता वृद्धि के साथ मजबूत सेफगार्ड्स, कड़े एक्सेस कंट्रोल्स, और सिक्योरिटी कम्युनिटी के साथ लगातार सहयोग जोड़ते हुए.

ट्रस्टेड एक्सेस के ज़रिए साइबरडिफेंस को सशक्त बनाना.

थ्रेट एक्टर्स की नकल करने, रेमेडिएशन के लिए मैलवेयर का विश्लेषण करने, या क्रिटिकल इन्फ्रास्ट्रक्चर का स्ट्रेस टेस्ट करने की कोशिश करते समय सिक्योरिटी टीमों को कई तरह की सीमाओं का सामना करना पड़ सकता है. हम योग्य यूज़र्स और संगठनों के लिए उस रुकावट को हटाने हेतु एक ट्रस्टेड एक्सेस पायलट विकसित कर रहे हैं, ताकि भरोसेमंद डिफेंडर्स फ्रंटियर AI साइबर क्षमताओं का इस्तेमाल करके साइबर डिफेंस को तेज़ कर सकें.

शुरुआत में यह पायलट प्रोग्राम केवल invite-only होगा, और उन वेरिफ़ाइड सिक्योरिटी प्रोफेशनल्स के लिए होगा जिनका जिम्मेदार वल्नरेबिलिटी डिस्क्लोज़र का रिकॉर्ड है, साथ ही उन संगठनों के लिए जिनके पास प्रोफेशनल साइबरसिक्योरिटी से जुड़ा स्पष्ट उपयोग-मामला है. योग्य प्रतिभागियों को डिफेंसिव उपयोग-मामलों के लिए हमारे सबसे सक्षम मॉडल्स तक एक्सेस मिलेगा, ताकि वैध दोहरे-उपयोग वाले काम को सक्षम किया जा सके.

अगर आप एक सिक्योरिटी प्रोफेशनल हैं या किसी ऐसे संगठन का हिस्सा हैं जो वल्नरेबिलिटी रिसर्च या अधिकृत रेड-टीमिंग जैसे एथिकल सिक्योरिटी काम करता है, तो हम आपको इस प्रोग्राम से जुड़ने में रुचि दिखाने और आप इसमें क्या देखना चाहते हैं उस पर अपनी प्रतिक्रिया यहाँ⁠(एक नई विंडो में खुलेगा) साझा करने के लिए आमंत्रित करते हैं.

निष्कर्ष

GPT‑5.2‑Codex इस दिशा में एक अहम कदम है कि एडवांस्ड AI असली दुनिया की सॉफ़्टवेयर इंजीनियरिंग और साइबरसिक्योरिटी जैसे स्पेशलाइज़्ड डोमेन्स को कैसे सपोर्ट कर सकता है—डेवलपर्स और डिफेंडर्स को जटिल, लंबे समय तक चलने वाले काम संभालने में मदद करता है, और जिम्मेदार सिक्योरिटी रिसर्च के लिए उपलब्ध टूल्स को और मज़बूत बनाता है.

GPT‑5.2‑Codex को रोलआउट करके इसे धीरे-धीरे रोलआउट करते हुए, डिप्लॉयमेंट को सुरक्षा उपायों के साथ जोड़कर, और सिक्योरिटी कम्युनिटी के साथ मिलकर काम करते हुए, हमारा लक्ष्य डिफेंसिव प्रभाव को अधिकतम करना है और दुरुपयोग के जोखिम को कम करना है. इस रिलीज़ से हम जो सीखेंगे, वह सीधे तौर पर यह तय करेगा कि जैसे-जैसे सॉफ़्टवेयर और साइबर फ्रंटियर्स आगे बढ़ते रहेंगे, हम समय के साथ एक्सेस को कैसे विस्तार देंगे.

लेखक

OpenAI

पढ़ते रहें

सभी देखें

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 अब Microsoft 365 Copilot में पसंदीदा मॉडल है

प्रोडक्ट9 जुलाई 2026

ChatGPT अब आपके सबसे महत्वाकांक्षी काम का साथी है

प्रोडक्ट9 जुलाई 2026

GPT-5.6: अत्याधुनिक इंटेलिजेंस, जो आपकी महत्वाकांक्षा के साथ स्केल होती है

प्रोडक्ट9 जुलाई 2026