डेवलपर्स के लिए GPT‑5.1 पेश कर रहे हैं
आज हम API प्लेटफ़ॉर्म पर GPT‑5.1 रिलीज़ कर रहे हैं, जो GPT‑5 सीरीज़ का अगला मॉडल है और एजेंटिक व कोडिंग टास्क्स की एक बड़ी रेंज के लिए इंटेलिजेंस और स्पीड का सही बैलेंस देता है.GPT‑5.1 टास्क की जटिलता के हिसाब से अपना थिंकिंग टाइम डायनेमिकली एडजस्ट करता है, जिससे मॉडल रोज़मर्रा के आसान टास्क्स में काफ़ी तेज़ और ज़्यादा टोकन-इफ़िशिएंट बन जाता है.मॉडल में “no reasoning” मोड भी है, जो डीप थिंकिंग की ज़रूरत न होने वाले टास्क्स पर और भी तेज़ी से जवाब देता है, जबकि GPT‑5.1 की फ़्रंटियर इंटेलिजेंस बरक़रार रहती है.
GPT‑5.1 को और ज़्यादा इफ़िशिएंट बनाने के लिए हम एक्सटेंडेड प्रॉम्प्ट कैशिंग ला रहे हैं, जो 24 घंटे तक कैश रिटेंशन देता है और फ़ॉलो-अप सवालों पर तेज़ जवाब कम लागत में सुनिश्चित करता है.हमारे Priority Processing(एक नई विंडो में खुलेगा) कस्टमर्स को भी GPT‑5 की तुलना में GPT‑5.1 पर काफ़ी तेज़ परफ़ॉर्मेंस महसूस होगी.
कोडिंग के मामले में, हमने Cursor, Cognition, Augment Code, Factory और Warp जैसी स्टार्टअप्स के साथ क़रीबी तौर पर काम किया है ताकि GPT‑5.1 की क्षमता बेहतर की जा सके.कोडिंग पर्सनैलिटी, स्टीयरएबिलिटी और कोड क्वालिटी.कुल मिलाकर, GPT‑5.1 कोडिंग के लिए इस्तेमाल करने में ज़्यादा इन्ट्यूटिव लगता है और टास्क पूरे करते समय यूज़र-फ़ेसिंग अपडेट्स के साथ ज़्यादा कम्युनिकेटिव रहता है.
आख़िर में, हम GPT‑5.1 के साथ दो नए टूल्स पेश कर रहे हैं: एक apply_patch टूल, जो कोड को ज़्यादा रिलायबली एडिट करने के लिए बनाया गया है, और एक shell टूल, जो मॉडल को शेल कमांड्स रन करने देता है.
GPT‑5.1 GPT‑5 सीरीज़ में अगला एडवांसमेंट है, और हम डेवलपर्स को भरोसेमंद एजेंटिक वर्कफ़्लोज़ बनाने में मदद करने के लिए और भी इंटेलिजेंट और केपेबल मॉडल्स में निवेश करते रहेंगे.
GPT‑5.1 को तेज़ बनाने के लिए, हमने इसे थिंक कराने के अपने ट्रेनिंग तरीक़ों को पूरी तरह बदल दिया.सीधे-सादे टास्क्स में GPT‑5.1 कम टोकन्स में थिंक करता है, जिससे प्रॉडक्ट एक्सपीरियंस और भी स्नैपी बनता है और टोकन खर्च भी कम होता है.मुश्किल टास्क्स में, जहाँ ज़्यादा थिंकिंग की ज़रूरत होती है, GPT‑5.1 लगातार बना रहता है—विकल्प एक्सप्लोर करता है और अपना काम चेक करता है ताकि रिलायबिलिटी को अधिकतम किया जा सके.
Balyasny Asset Management(एक नई विंडो में खुलेगा) ने कहा कि GPT‑5.1 "हमारी पूरी डायनामिक इवैल्युएशन सूट में GPT‑4.1 और GPT‑5 दोनों से बेहतर निकला, और GPT‑5 से 2–3 गुना तेज़ चला."उन्होंने यह भी कहा कि अपने टूल-हेवी रीज़निंग टास्क्स में GPT‑5.1 “लगातार इतने ही या बेहतर क्वालिटी पर लीडिंग कम्पेटिटर्स की तुलना में लगभग आधे टोकन्स इस्तेमाल करता है.”इसी तरह, AI इंश्योरेंस BPO Pace(एक नई विंडो में खुलेगा) ने भी मॉडल को टेस्ट किया और कहा कि उनके एजेंट्स "GPT‑5.1 पर 50% तेज़ चलते हैं, और हमारे इवैल्स में GPT‑5 व अन्य लीडिंग मॉडेल्स की accuracy से भी बेहतर प्रदर्शन करते हैं."
GPT‑5.1 GPT‑5 की तुलना में अपना थिंकिंग टाइम और भी डायनेमिक तरीके से बदलता है.ChatGPT टास्क्स की एक प्रतिनिधि डिस्ट्रीब्यूशन पर, GPT‑5.1 आसान टास्क्स में काफ़ी तेज़ है, यहाँ तक कि हाई रीज़निंग एफर्ट पर भी.
उदाहरण के तौर पर, जब पूछा गया "ग्लोबली इंस्टॉल्ड पैकेजेज लिस्ट करने के लिए npm कमांड दिखाओ", तो GPT‑5.1 दस सेकंड की जगह दो सेकंड में जवाब देता है.
GPT-5 (मध्यम) ~250 token (~10 सेकंड) लेता है
GPT-5.1 (मध्यम) ~50 token (~2 सेकंड) लेता है
डेवलपर्स अब reasoning_effort को 'none' सेट करके GPT‑5.1 को बिना रीज़निंग के इस्तेमाल कर सकते हैं.इससे मॉडल लेटेंसी-सेंसिटिव यूज़ केसेज़ में एक नॉन-रीज़निंग मॉडल की तरह बिहेव करता है, जबकि GPT‑5.1 की हाई इंटेलिजेंस और परफ़ॉर्मेंट टूल-कॉलिंग का बोनस भी मिलता है.'मिनिमल' रीज़निंग वाले GPT‑5 की तुलना में, बिना रीज़निंग वाला GPT‑5.1 पैरेलल टूल कॉलिंग (जो खुद ही एंड-टू-एंड टास्क कम्प्लीशन स्पीड बढ़ाता है), कोडिंग टास्क्स, इंस्ट्रक्शन्स फ़ॉलो करने, और सर्च टूल्स इस्तेमाल करने में बेहतर है—और हमारी API प्लेटफ़ॉर्म में वेब सर्च(एक नई विंडो में खुलेगा) को भी सपोर्ट करता है.Sierra(एक नई विंडो में खुलेगा) ने बताया कि उनके रियल-वर्ल्ड इवैल्स में “no reasoning” मोड पर GPT‑5.1 ने “GPT‑5 मिनिमल रीज़निंग की तुलना में लो-लेटेंसी टूल कॉलिंग परफ़ॉर्मेंस में 20% सुधार” दिखाया.
reasoning_effort में 'none' वैल्यू जोड़ने के बाद, डेवलपर्स को अब अपने यूज़ केस के लिए स्पीड, कॉस्ट, और इंटेलिजेंस के बीच बैलेंस पर और भी ज़्यादा फ़्लेक्सिबिलिटी और कंट्रोल मिलता है.GPT‑5.1 का डिफ़ॉल्ट 'none' है, जो लेटेंसी-सेंसिटिव वर्कलोड्स के लिए बिल्कुल सही रहता है.हम सलाह देते हैं कि डेवलपर्स ज़्यादा जटिल टास्क्स के लिए 'low' या 'medium' चुनें, और जब स्पीड से ज़्यादा इंटेलिजेंस और रिलायबिलिटी मायने रखती हो तो 'high' चुनें.
एक्सटेंडेड कैशिंग रीज़निंग इफ़िशिएंसी बढ़ाती है क्योंकि इससे प्रॉम्प्ट्स कुछ मिनटों की बजाय 24 घंटे तक कैश में एक्टिव रह सकते हैं.लंबी रिटेंशन विंडो के साथ, ज़्यादा फ़ॉलो-अप रिक्वेस्ट्स कैश्ड कॉन्टेक्स्ट का फ़ायदा उठा सकती हैं—जिससे लेटेंसी कम होती है, लागत घटती है, और मल्टी-टर्न चैट, कोडिंग सेशन्स या नॉलेज रिट्रीवल वर्कफ़्लोज़ जैसी लंबी इंटरैक्शन्स में परफ़ॉर्मेंस और स्मूद हो जाती है.
प्रॉम्प्ट कैश प्राइसिंग पहले जैसी ही है—कैश्ड इनपुट टोकन्स अनकैश्ड टोकन्स से 90% सस्ते हैं, और कैश राइट्स या स्टोरेज पर कोई अतिरिक्त चार्ज नहीं लगता.GPT‑5.1 में एक्सटेंडेड कैशिंग इस्तेमाल करने के लिए, Responses या Chat Completions API पर “prompt_cache_retention='24h'” पैरामीटर जोड़ें.अधिक जानकारी के लिए प्रॉम्प्ट कैशिंग डॉक्स(एक नई विंडो में खुलेगा) देखें.
GPT‑5.1 GPT‑5 की कोडिंग केपेबिलिटीज़ को आगे बढ़ाता है—with ज़्यादा स्टीयरएबल कोडिंग पर्सनैलिटी, कम ओवरथिंकिंग, बेहतर कोड क्वालिटी, टूल कॉल्स की सीक्वेन्स के दौरान ज़्यादा यूज़र-टार्गेटेड अपडेट मैसेजेज़ (प्रीऐम्बल्स), और और भी फ़ंक्शनल फ्रंटएंड डिज़ाइन्स—खासकर लो रीज़निंग एफर्ट पर.
क्विक कोड एडिट्स जैसे आसान कोडिंग टास्क्स में, GPT‑5.1 कातेज़ स्पीड बैक-एंड-फ़ोर्थ इटरेट करना और भी आसान बना देती है.GPT‑5.1 का सिंपल टास्क्स पर तेज़ स्पीड मुश्किल टास्क्स की परफ़ॉर्मेंस को कम नहीं करती.SWE-bench Verified पर, GPT‑5.1 GPT‑5 से भी ज़्यादा देर तक काम करता है और 76.3% तक पहुँचता है.
SWE-bench Verified में, एक मॉडल को कोड रिपॉजिटरी और समस्या का विवरण दिया जाता है, और उसे समस्या को हल करने के लिए एक पैच जनरेट करना होता है. लेबल्स तर्क प्रयास को दर्शाते हैं. सटीकता सभी 500 समस्याओं में औसत की जाती है। सभी मॉडलों ने JSON-आधारित apply_patch टूल के साथ हार्नेस का उपयोग किया.
हमें कुछ कोडिंग कंपनियों से GPT‑5.1 पर शुरुआती फ़ीडबैक मिला.यहाँ उनके विचार हैं:
- Augment Code(एक नई विंडो में खुलेगा) ने GPT‑5.1 को “कम बेकार ऐक्शन्स के साथ ज़्यादा डिलिबरेट, ज़्यादा इफ़िशिएंट रीज़निंग वाला, और टास्क फ़ोकस में बेहतर” बताया, और वे “ज़्यादा एक्यूरेट चेंजिस, स्मूदर पुल रिक्वेस्ट्स, और मल्टी-फ़ाइल प्रोजेक्ट्स में तेज़ इटरेशन” देख रहे हैं.
- Cline(एक नई विंडो में खुलेगा) ने साझा किया कि उनके इवैल्स में “GPT‑5.1 ने हमारे डिफ़ एडिटिंग बेंचमार्क पर 7% सुधार के साथ SOTA हासिल किया, जो कॉम्प्लेक्स कोडिंग टास्क्स में असाधारण रिलायबिलिटी दिखाता है.”
- CodeRabbit(एक नई विंडो में खुलेगा) ने GPT‑5.1 को अपने “PR रिव्यूज़ के लिए टॉप मॉडल ऑफ़ चॉइस” कहा.
- Cognition(एक नई विंडो में खुलेगा) ने कहा कि GPT‑5.1 “आप क्या माँग रहे हैं इसे समझने में काफ़ी बेहतर है और आपके साथ मिलकर काम पूरा करने में भी ज़्यादा असरदार है.”
- Factory(एक नई विंडो में खुलेगा) ने कहा, “GPT‑5.1 काफ़ी स्नैपियर रिस्पॉन्स देता है और टास्क के हिसाब से अपनी रीज़निंग डेप्थ एडजस्ट करता है, जिससे ओवरथिंकिंग कम होती है और ओवरऑल डेवलपर एक्सपीरियंस बेहतर होता है.”
- Warp(एक नई विंडो में खुलेगा) नए यूज़र्स के लिए GPT‑5.1 को डिफ़ॉल्ट बना रहा है, यह कहते हुए कि यह “GPT‑5 सीरीज़ की इम्प्रेसिव इंटेलिजेंस गेन पर आगे बनता है, और साथ ही काफ़ी ज़्यादा रिस्पॉन्सिव मॉडल भी है.”
"GPT 5.1 सिर्फ़ एक और LLM नहीं है—यह सच में एजेंटिक है, सबसे नैचुरली ऑटोनॉमस मॉडल जो मैंने अब तक टेस्ट किया है."यह आपकी तरह लिखता है, आपकी तरह कोड करता है, कॉम्प्लेक्स इंस्ट्रक्शन्स को आसानी से फ़ॉलो करता है, और फ्रंट-एंड टास्क्स में बेहतरीन प्रदर्शन करते हुए आपके मौजूदा कोडबेस में सहजता से फिट हो जाता है.आप Responses API में इसकी पूरी पोटेंशियल को सच में अनलॉक कर सकते हैं और हम इसे अपने IDE में ऑफ़र करने को लेकर काफ़ी उत्साहित हैं."
हम GPT‑5.1 के साथ दो नए टूल पेश कर रहे हैं ताकि डेवलपर रिस्पॉन्स API में मॉडल का अधिकतम लाभ उठा सकें: JSON से बचने की आवश्यकता के बिना कोड संपादन को और भी विश्वसनीय बनाने के लिए एक फ्रीफॉर्म apply_patch टूल, और एक शेल टूल जो मॉडल को आपके लोकल मशीन पर रन होने वाली कमांड्स लिखने देता है.
फ़्रीफ़ॉर्म apply_patch टूल GPT‑5.1 को स्ट्रक्चर्ड डिफ़्स का इस्तेमाल करके कोडबेस में फ़ाइलें बनाने, अपडेट करने और डिलीट करने देता है.सिर्फ़ एडिट्स सजेस्ट करने की बजाय, मॉडल ऐसे पैच ऑपरेशन्स देता है जिन्हें ऐप्लिकेशन अप्लाई करता है और फिर रिपोर्ट करता है—जिससे इटरेटिव, मल्टी-स्टेप कोड एडिटिंग वर्कफ़्लोज़ संभव हो पाते हैं.
Responses API में apply_patch टूल इस्तेमाल करने के लिए, इसे tools array में "tools": [{“type”: “apply_patch”}] के साथ शामिल करें, और या तो अपनी इनपुट में फ़ाइल कंटेंट जोड़ें या मॉडल को आपके फ़ाइल सिस्टम के साथ इंटरैक्ट करने वाले टूल्स दें.मॉडल apply_patch_call आइटम्स जनरेट करेगा, जिनमें ऐसे डिफ़्स होंगे जिन्हें आप अपने फ़ाइल सिस्टम पर अप्लाई करके फ़ाइलें बना सकते हैं, अपडेट कर सकते हैं या डिलीट कर सकते हैं.apply_patch टूल के साथ इंटीग्रेट करने के तरीके के बारे में अधिक जानकारी के लिए, हमारे डेवलपर दस्तावेज़ देखें.(एक नई विंडो में खुलेगा)
शेल टूल मॉडल को एक कंट्रोल्ड कमांड-लाइन इंटरफ़ेस के ज़रिए लोकल कंप्यूटर के साथ इंटरैक्ट करने देता है.मॉडल शेल कमांड्स प्रपोज़ करता है; डेवलपर का इंटीग्रेशन उन्हें एक्सिक्यूट करता है और आउटपुट वापस भेजता है.इससे एक सिंपल प्लान-एग्ज़िक्यूट लूप बनता है, जो मॉडल्स को सिस्टम इंस्पेक्ट करने, यूटिलिटीज़ रन करने, और डेटा इकट्ठा करने देता है जब तक कि वे टास्क पूरा न कर लें.
Responses API में शेल टूल इस्तेमाल करने के लिए, डेवलपर्स इसे tools array में "tools": [{“type”: “shell”}]" के साथ शामिल कर सकते हैं.API ऐसे "shell_call" आइटम्स जनरेट करेगी, जिनमें एक्सिक्यूट होने वाली शेल कमांड्स शामिल होंगी.डेवलपर्स लोकल एनवायरनमेंट में कमांड्स एक्सिक्यूट करते हैं और उनके रिज़ल्ट्स को अगली API रिक्वेस्ट में "shell_call_output" आइटम में वापस भेजते हैं.हमारे डेवलपर दस्तावेज़(एक नई विंडो में खुलेगा) में अधिक जानें.
GPT‑5.1 और gpt-5.1-chat-latest API में सभी पेड टियर्स पर डेवलपर्स के लिए उपलब्ध हैं.प्राइसिंग और रेट लिमिट्स(एक नई विंडो में खुलेगा) GPT‑5 जैसी ही हैं.हम gpt-5.1-codex भी रिलीज़ कर रहे हैं.और API में gpt-5.1-codex-mini .जबकि GPT‑5.1 अधिकांश कोडिंग टास्क में उत्कृष्ट है, gpt-5.1-codex ये मॉडल्स Codex या Codex-जैसे हार्नेसज़ में लंबे चलने वाले एजेंटिक कोडिंग टास्क्स के लिए ऑप्टिमाइज़ किए गए हैं.
डेवलपर हमारे GPT‑5.1 डेवलपर दस्तावेज़(एक नई विंडो में खुलेगा) और मॉडल प्रॉम्प्टिंग गाइड(एक नई विंडो में खुलेगा) का इस्तेमाल करके बिल्डिंग शुरू कर सकते हैं.हम फिलहाल API में GPT‑5 को डिप्रिकेट करने की योजना नहीं रखते, और अगर कभी ऐसा करने का निर्णय हुआ तो डेवलपर्स को पहले से नोटिस दे दिया जाएगा.
हम असली एजेंटिक और कोडिंग वर्क के लिए सबसे केपेबल और रिलायबल मॉडल्स को इटरेटिव तरीक़े से डिप्लॉय करने के लिए प्रतिबद्ध हैं—ऐसे मॉडल्स जो इफ़िशिएंटली सोचते हैं, जल्दी इटरेट करते हैं, और कॉम्प्लेक्स टास्क्स को संभालते हुए डेवलपर्स को फ़्लो में बनाए रखते हैं.एडैप्टिव रीज़निंग, मजबूत कोडिंग परफ़ॉर्मेंस, और क्लियर यूज़र-फ़ेसिंग अपडेट्स के साथ, साथ ही apply_patch और shell जैसे नए टूल्स, GPT‑5.1 आपको कम फ़्रिक्शन के साथ बिल्ड करने में मदद करने के लिए डिज़ाइन किया गया है.और हम यहाँ बड़े पैमाने पर निवेश करते रहेंगे: आने वाले हफ़्तों और महीनों में आप और भी केपेबल एजेंटिक और कोडिंग मॉडल्स की उम्मीद कर सकते हैं.
इवैल्युएशन | GPT‑5.1 (हाई) | GPT‑5 (हाई) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
ब्राउज़कॉम्प लॉन्ग कॉन्टेक्स्ट 128k | 90.0% | 90.0% |
* Tau2-बेंच टेलीकॉम के लिए, हमने GPT‑5.1 को इसके प्रदर्शन को सुधारने के लिए एक छोटा, सामान्य रूप से सहायक प्रॉम्प्ट दिया.


