13 नवंबर 2025

डेवलपर्स के लिए GPT‑5.1 पेश कर रहे हैं

लोड किया जा रहा है...

आज हम API प्लेटफ़ॉर्म पर GPT‑5.1 रिलीज़ कर रहे हैं, जो GPT‑5 सीरीज़ का अगला मॉडल है और एजेंटिक व कोडिंग टास्क्स की एक बड़ी रेंज के लिए इंटेलिजेंस और स्पीड का सही बैलेंस देता है.GPT‑5.1 टास्क की जटिलता के हिसाब से अपना थिंकिंग टाइम डायनेमिकली एडजस्ट करता है, जिससे मॉडल रोज़मर्रा के आसान टास्क्स में काफ़ी तेज़ और ज़्यादा टोकन-इफ़िशिएंट बन जाता है.मॉडल में “no reasoning” मोड भी है, जो डीप थिंकिंग की ज़रूरत न होने वाले टास्क्स पर और भी तेज़ी से जवाब देता है, जबकि GPT‑5.1 की फ़्रंटियर इंटेलिजेंस बरक़रार रहती है.

GPT‑5.1 को और ज़्यादा इफ़िशिएंट बनाने के लिए हम एक्सटेंडेड प्रॉम्प्ट कैशिंग ला रहे हैं, जो 24 घंटे तक कैश रिटेंशन देता है और फ़ॉलो-अप सवालों पर तेज़ जवाब कम लागत में सुनिश्चित करता है.हमारे Priority Processing⁠(एक नई विंडो में खुलेगा) कस्टमर्स को भी GPT‑5 की तुलना में GPT‑5.1 पर काफ़ी तेज़ परफ़ॉर्मेंस महसूस होगी.

कोडिंग के मामले में, हमने Cursor, Cognition, Augment Code, Factory और Warp जैसी स्टार्टअप्स के साथ क़रीबी तौर पर काम किया है ताकि GPT‑5.1 की क्षमता बेहतर की जा सके.कोडिंग पर्सनैलिटी, स्टीयरएबिलिटी और कोड क्वालिटी.कुल मिलाकर, GPT‑5.1 कोडिंग के लिए इस्तेमाल करने में ज़्यादा इन्ट्यूटिव लगता है और टास्क पूरे करते समय यूज़र-फ़ेसिंग अपडेट्स के साथ ज़्यादा कम्युनिकेटिव रहता है.

आख़िर में, हम GPT‑5.1 के साथ दो नए टूल्स पेश कर रहे हैं: एक apply_patch टूल, जो कोड को ज़्यादा रिलायबली एडिट करने के लिए बनाया गया है, और एक shell टूल, जो मॉडल को शेल कमांड्स रन करने देता है.

GPT‑5.1 GPT‑5 सीरीज़ में अगला एडवांसमेंट है, और हम डेवलपर्स को भरोसेमंद एजेंटिक वर्कफ़्लोज़ बनाने में मदद करने के लिए और भी इंटेलिजेंट और केपेबल मॉडल्स में निवेश करते रहेंगे.

टास्क्स में इफ़िशिएंट रीज़निंग

डैप्टिव रीज़निंग

GPT‑5.1 को तेज़ बनाने के लिए, हमने इसे थिंक कराने के अपने ट्रेनिंग तरीक़ों को पूरी तरह बदल दिया.सीधे-सादे टास्क्स में GPT‑5.1 कम टोकन्स में थिंक करता है, जिससे प्रॉडक्ट एक्सपीरियंस और भी स्नैपी बनता है और टोकन खर्च भी कम होता है.मुश्किल टास्क्स में, जहाँ ज़्यादा थिंकिंग की ज़रूरत होती है, GPT‑5.1 लगातार बना रहता है—विकल्प एक्सप्लोर करता है और अपना काम चेक करता है ताकि रिलायबिलिटी को अधिकतम किया जा सके.

Balyasny Asset Management⁠(एक नई विंडो में खुलेगा) ने कहा कि GPT‑5.1 "हमारी पूरी डायनामिक इवैल्युएशन सूट में GPT‑4.1 और GPT‑5 दोनों से बेहतर निकला, और GPT‑5 से 2–3 गुना तेज़ चला."उन्होंने यह भी कहा कि अपने टूल-हेवी रीज़निंग टास्क्स में GPT‑5.1 “लगातार इतने ही या बेहतर क्वालिटी पर लीडिंग कम्पेटिटर्स की तुलना में लगभग आधे टोकन्स इस्तेमाल करता है.”इसी तरह, AI इंश्योरेंस BPO Pace⁠(एक नई विंडो में खुलेगा) ने भी मॉडल को टेस्ट किया और कहा कि उनके एजेंट्स "GPT‑5.1 पर 50% तेज़ चलते हैं, और हमारे इवैल्स में GPT‑5 व अन्य लीडिंग मॉडेल्स की accuracy से भी बेहतर प्रदर्शन करते हैं."

GPT‑5.1 GPT‑5 की तुलना में अपना थिंकिंग टाइम और भी डायनेमिक तरीके से बदलता है.ChatGPT टास्क्स की एक प्रतिनिधि डिस्ट्रीब्यूशन पर, GPT‑5.1 आसान टास्क्स में काफ़ी तेज़ है, यहाँ तक कि हाई रीज़निंग एफर्ट पर भी.

उदाहरण के तौर पर, जब पूछा गया "ग्लोबली इंस्टॉल्ड पैकेजेज लिस्ट करने के लिए npm कमांड दिखाओ", तो GPT‑5.1 दस सेकंड की जगह दो सेकंड में जवाब देता है.

GPT-5 (मध्यम) ~250 token (~10 सेकंड) लेता है

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (मध्यम) ~50 token (~2 सेकंड) लेता है

show an npm command to list globally installed packages

You can list globally installed npm packages with:

Just package names: npm ls -g --depth=0
Including their install paths: npm ls -g

The first one is usually what you want.

नया “no reasoning” मोड

डेवलपर्स अब reasoning_effort को 'none' सेट करके GPT‑5.1 को बिना रीज़निंग के इस्तेमाल कर सकते हैं.इससे मॉडल लेटेंसी-सेंसिटिव यूज़ केसेज़ में एक नॉन-रीज़निंग मॉडल की तरह बिहेव करता है, जबकि GPT‑5.1 की हाई इंटेलिजेंस और परफ़ॉर्मेंट टूल-कॉलिंग का बोनस भी मिलता है.'मिनिमल' रीज़निंग वाले GPT‑5 की तुलना में, बिना रीज़निंग वाला GPT‑5.1 पैरेलल टूल कॉलिंग (जो खुद ही एंड-टू-एंड टास्क कम्प्लीशन स्पीड बढ़ाता है), कोडिंग टास्क्स, इंस्ट्रक्शन्स फ़ॉलो करने, और सर्च टूल्स इस्तेमाल करने में बेहतर है—और हमारी API प्लेटफ़ॉर्म में वेब सर्च⁠(एक नई विंडो में खुलेगा) को भी सपोर्ट करता है.Sierra⁠(एक नई विंडो में खुलेगा) ने बताया कि उनके रियल-वर्ल्ड इवैल्स में “no reasoning” मोड पर GPT‑5.1 ने “GPT‑5 मिनिमल रीज़निंग की तुलना में लो-लेटेंसी टूल कॉलिंग परफ़ॉर्मेंस में 20% सुधार” दिखाया.

reasoning_effort में 'none' वैल्यू जोड़ने के बाद, डेवलपर्स को अब अपने यूज़ केस के लिए स्पीड, कॉस्ट, और इंटेलिजेंस के बीच बैलेंस पर और भी ज़्यादा फ़्लेक्सिबिलिटी और कंट्रोल मिलता है.GPT‑5.1 का डिफ़ॉल्ट 'none' है, जो लेटेंसी-सेंसिटिव वर्कलोड्स के लिए बिल्कुल सही रहता है.हम सलाह देते हैं कि डेवलपर्स ज़्यादा जटिल टास्क्स के लिए 'low' या 'medium' चुनें, और जब स्पीड से ज़्यादा इंटेलिजेंस और रिलायबिलिटी मायने रखती हो तो 'high' चुनें.

एक्सटेंडेड प्रॉम्प्ट कैशिंग

एक्सटेंडेड कैशिंग रीज़निंग इफ़िशिएंसी बढ़ाती है क्योंकि इससे प्रॉम्प्ट्स कुछ मिनटों की बजाय 24 घंटे तक कैश में एक्टिव रह सकते हैं.लंबी रिटेंशन विंडो के साथ, ज़्यादा फ़ॉलो-अप रिक्वेस्ट्स कैश्ड कॉन्टेक्स्ट का फ़ायदा उठा सकती हैं—जिससे लेटेंसी कम होती है, लागत घटती है, और मल्टी-टर्न चैट, कोडिंग सेशन्स या नॉलेज रिट्रीवल वर्कफ़्लोज़ जैसी लंबी इंटरैक्शन्स में परफ़ॉर्मेंस और स्मूद हो जाती है.

प्रॉम्प्ट कैश प्राइसिंग पहले जैसी ही है—कैश्ड इनपुट टोकन्स अनकैश्ड टोकन्स से 90% सस्ते हैं, और कैश राइट्स या स्टोरेज पर कोई अतिरिक्त चार्ज नहीं लगता.GPT‑5.1 में एक्सटेंडेड कैशिंग इस्तेमाल करने के लिए, Responses या Chat Completions API पर “prompt_cache_retention='24h'” पैरामीटर जोड़ें.अधिक जानकारी के लिए प्रॉम्प्ट कैशिंग डॉक्स⁠(एक नई विंडो में खुलेगा) देखें.

कोडिंग

GPT‑5.1 GPT‑5 की कोडिंग केपेबिलिटीज़ को आगे बढ़ाता है—with ज़्यादा स्टीयरएबल कोडिंग पर्सनैलिटी, कम ओवरथिंकिंग, बेहतर कोड क्वालिटी, टूल कॉल्स की सीक्वेन्स के दौरान ज़्यादा यूज़र-टार्गेटेड अपडेट मैसेजेज़ (प्रीऐम्बल्स), और और भी फ़ंक्शनल फ्रंटएंड डिज़ाइन्स—खासकर लो रीज़निंग एफर्ट पर.

क्विक कोड एडिट्स जैसे आसान कोडिंग टास्क्स में, GPT‑5.1 कातेज़ स्पीड बैक-एंड-फ़ोर्थ इटरेट करना और भी आसान बना देती है.GPT‑5.1 का सिंपल टास्क्स पर तेज़ स्पीड मुश्किल टास्क्स की परफ़ॉर्मेंस को कम नहीं करती.SWE-bench Verified पर, GPT‑5.1 GPT‑5 से भी ज़्यादा देर तक काम करता है और 76.3% तक पहुँचता है.

SWE-bench Verified⁠ में, एक मॉडल को कोड रिपॉजिटरी और समस्या का विवरण दिया जाता है, और उसे समस्या को हल करने के लिए एक पैच जनरेट करना होता है. लेबल्स तर्क प्रयास को दर्शाते हैं. सटीकता सभी 500 समस्याओं में औसत की जाती है। सभी मॉडलों ने JSON-आधारित apply_patch टूल के साथ हार्नेस का उपयोग किया.

हमें कुछ कोडिंग कंपनियों से GPT‑5.1 पर शुरुआती फ़ीडबैक मिला.यहाँ उनके विचार हैं:

Augment Code⁠(एक नई विंडो में खुलेगा) ने GPT‑5.1 को “कम बेकार ऐक्शन्स के साथ ज़्यादा डिलिबरेट, ज़्यादा इफ़िशिएंट रीज़निंग वाला, और टास्क फ़ोकस में बेहतर” बताया, और वे “ज़्यादा एक्यूरेट चेंजिस, स्मूदर पुल रिक्वेस्ट्स, और मल्टी-फ़ाइल प्रोजेक्ट्स में तेज़ इटरेशन” देख रहे हैं.
Cline⁠(एक नई विंडो में खुलेगा) ने साझा किया कि उनके इवैल्स में “GPT‑5.1 ने हमारे डिफ़ एडिटिंग बेंचमार्क पर 7% सुधार के साथ SOTA हासिल किया, जो कॉम्प्लेक्स कोडिंग टास्क्स में असाधारण रिलायबिलिटी दिखाता है.”
CodeRabbit⁠(एक नई विंडो में खुलेगा) ने GPT‑5.1 को अपने “PR रिव्यूज़ के लिए टॉप मॉडल ऑफ़ चॉइस” कहा.
Cognition⁠(एक नई विंडो में खुलेगा) ने कहा कि GPT‑5.1 “आप क्या माँग रहे हैं इसे समझने में काफ़ी बेहतर है और आपके साथ मिलकर काम पूरा करने में भी ज़्यादा असरदार है.”
Factory⁠(एक नई विंडो में खुलेगा) ने कहा, “GPT‑5.1 काफ़ी स्नैपियर रिस्पॉन्स देता है और टास्क के हिसाब से अपनी रीज़निंग डेप्थ एडजस्ट करता है, जिससे ओवरथिंकिंग कम होती है और ओवरऑल डेवलपर एक्सपीरियंस बेहतर होता है.”
Warp⁠(एक नई विंडो में खुलेगा) नए यूज़र्स के लिए GPT‑5.1 को डिफ़ॉल्ट बना रहा है, यह कहते हुए कि यह “GPT‑5 सीरीज़ की इम्प्रेसिव इंटेलिजेंस गेन पर आगे बनता है, और साथ ही काफ़ी ज़्यादा रिस्पॉन्सिव मॉडल भी है.”

"GPT 5.1 सिर्फ़ एक और LLM नहीं है—यह सच में एजेंटिक है, सबसे नैचुरली ऑटोनॉमस मॉडल जो मैंने अब तक टेस्ट किया है."यह आपकी तरह लिखता है, आपकी तरह कोड करता है, कॉम्प्लेक्स इंस्ट्रक्शन्स को आसानी से फ़ॉलो करता है, और फ्रंट-एंड टास्क्स में बेहतरीन प्रदर्शन करते हुए आपके मौजूदा कोडबेस में सहजता से फिट हो जाता है.आप Responses API में इसकी पूरी पोटेंशियल को सच में अनलॉक कर सकते हैं और हम इसे अपने IDE में ऑफ़र करने को लेकर काफ़ी उत्साहित हैं."

—Denis Shiryaev, AI DevTools इकोसिस्टम के प्रमुख, JetBrains

GPT‑5.1 में नए टूल्स

हम GPT‑5.1 के साथ दो नए टूल पेश कर रहे हैं ताकि डेवलपर रिस्पॉन्स API में मॉडल का अधिकतम लाभ उठा सकें: JSON से बचने की आवश्यकता के बिना कोड संपादन को और भी विश्वसनीय बनाने के लिए एक फ्रीफॉर्म apply_patch टूल, और एक शेल टूल जो मॉडल को आपके लोकल मशीन पर रन होने वाली कमांड्स लिखने देता है.

Apply_patch टूल

फ़्रीफ़ॉर्म apply_patch टूल GPT‑5.1 को स्ट्रक्चर्ड डिफ़्स का इस्तेमाल करके कोडबेस में फ़ाइलें बनाने, अपडेट करने और डिलीट करने देता है.सिर्फ़ एडिट्स सजेस्ट करने की बजाय, मॉडल ऐसे पैच ऑपरेशन्स देता है जिन्हें ऐप्लिकेशन अप्लाई करता है और फिर रिपोर्ट करता है—जिससे इटरेटिव, मल्टी-स्टेप कोड एडिटिंग वर्कफ़्लोज़ संभव हो पाते हैं.

Responses API में apply_patch टूल इस्तेमाल करने के लिए, इसे tools array में "tools": [{“type”: “apply_patch”}] के साथ शामिल करें, और या तो अपनी इनपुट में फ़ाइल कंटेंट जोड़ें या मॉडल को आपके फ़ाइल सिस्टम के साथ इंटरैक्ट करने वाले टूल्स दें.मॉडल apply_patch_call आइटम्स जनरेट करेगा, जिनमें ऐसे डिफ़्स होंगे जिन्हें आप अपने फ़ाइल सिस्टम पर अप्लाई करके फ़ाइलें बना सकते हैं, अपडेट कर सकते हैं या डिलीट कर सकते हैं.apply_patch टूल के साथ इंटीग्रेट करने के तरीके के बारे में अधिक जानकारी के लिए, हमारे डेवलपर दस्तावेज़ देखें.⁠(एक नई विंडो में खुलेगा)

शेल टूल

शेल टूल मॉडल को एक कंट्रोल्ड कमांड-लाइन इंटरफ़ेस के ज़रिए लोकल कंप्यूटर के साथ इंटरैक्ट करने देता है.मॉडल शेल कमांड्स प्रपोज़ करता है; डेवलपर का इंटीग्रेशन उन्हें एक्सिक्यूट करता है और आउटपुट वापस भेजता है.इससे एक सिंपल प्लान-एग्ज़िक्यूट लूप बनता है, जो मॉडल्स को सिस्टम इंस्पेक्ट करने, यूटिलिटीज़ रन करने, और डेटा इकट्ठा करने देता है जब तक कि वे टास्क पूरा न कर लें.

Responses API में शेल टूल इस्तेमाल करने के लिए, डेवलपर्स इसे tools array में "tools": [{“type”: “shell”}]" के साथ शामिल कर सकते हैं.API ऐसे "shell_call" आइटम्स जनरेट करेगी, जिनमें एक्सिक्यूट होने वाली शेल कमांड्स शामिल होंगी.डेवलपर्स लोकल एनवायरनमेंट में कमांड्स एक्सिक्यूट करते हैं और उनके रिज़ल्ट्स को अगली API रिक्वेस्ट में "shell_call_output" आइटम में वापस भेजते हैं.हमारे डेवलपर दस्तावेज़⁠(एक नई विंडो में खुलेगा) में अधिक जानें.

प्राइसिंग और उपलब्धता

GPT‑5.1 और gpt-5.1-chat-latest API में सभी पेड टियर्स पर डेवलपर्स के लिए उपलब्ध हैं.प्राइसिंग और रेट लिमिट्स⁠(एक नई विंडो में खुलेगा) GPT‑5 जैसी ही हैं.हम gpt-5.1-codex भी रिलीज़ कर रहे हैं.और API में gpt-5.1-codex-mini .जबकि GPT‑5.1 अधिकांश कोडिंग टास्क में उत्कृष्ट है, gpt-5.1-codex ये मॉडल्स Codex या Codex-जैसे हार्नेसज़ में लंबे चलने वाले एजेंटिक कोडिंग टास्क्स के लिए ऑप्टिमाइज़ किए गए हैं.

डेवलपर हमारे GPT‑5.1 डेवलपर दस्तावेज़⁠(एक नई विंडो में खुलेगा) और मॉडल प्रॉम्प्टिंग गाइड⁠(एक नई विंडो में खुलेगा) का इस्तेमाल करके बिल्डिंग शुरू कर सकते हैं.हम फिलहाल API में GPT‑5 को डिप्रिकेट करने की योजना नहीं रखते, और अगर कभी ऐसा करने का निर्णय हुआ तो डेवलपर्स को पहले से नोटिस दे दिया जाएगा.

आगे क्या है

हम असली एजेंटिक और कोडिंग वर्क के लिए सबसे केपेबल और रिलायबल मॉडल्स को इटरेटिव तरीक़े से डिप्लॉय करने के लिए प्रतिबद्ध हैं—ऐसे मॉडल्स जो इफ़िशिएंटली सोचते हैं, जल्दी इटरेट करते हैं, और कॉम्प्लेक्स टास्क्स को संभालते हुए डेवलपर्स को फ़्लो में बनाए रखते हैं.एडैप्टिव रीज़निंग, मजबूत कोडिंग परफ़ॉर्मेंस, और क्लियर यूज़र-फ़ेसिंग अपडेट्स के साथ, साथ ही apply_patch और shell जैसे नए टूल्स, GPT‑5.1 आपको कम फ़्रिक्शन के साथ बिल्ड करने में मदद करने के लिए डिज़ाइन किया गया है.और हम यहाँ बड़े पैमाने पर निवेश करते रहेंगे: आने वाले हफ़्तों और महीनों में आप और भी केपेबल एजेंटिक और कोडिंग मॉडल्स की उम्मीद कर सकते हैं.

एपेंडिक्स: मॉडल इवैल्युएशन्स

इवैल्युएशन	GPT‑5.1 (हाई)	GPT‑5 (हाई)
SWE-bench Verified ^{(सभी 500 समस्याएं)}	76.3%	72.8%
GPQA Diamond ^{(no tools)}	88.1%	85.7%
AIME 2025 ^{(no tools)}	94.0%	94.6%
FrontierMath ^{(Python टूल के साथ)}	26.7%	26.3%
MMMU	85.4%	84.2%
Tau²-bench Airline	67.0%	62.6%
Tau²-bench Telecom*	95.6%	96.7%
Tau²-bench Retail	77.9%	81.1%
ब्राउज़कॉम्प लॉन्ग कॉन्टेक्स्ट 128k	90.0%	90.0%

* Tau²-बेंच टेलीकॉम के लिए, हमने GPT‑5.1 को इसके प्रदर्शन को सुधारने के लिए एक छोटा, सामान्य रूप से सहायक प्रॉम्प्ट दिया.

लेखक

OpenAI

पढ़ते रहें

सभी देखें

GPT 5.6 के साथ मूल्य-प्रदर्शन की सीमाएं आगे बढ़ाना

प्रोडक्ट30 जुलाई 2026

ChatGPT में हेल्थ लॉन्च कर रहे हैं

प्रोडक्ट23 जुलाई 2026

OpenAI Presence का परिचय

प्रोडक्ट22 जुलाई 2026