विकसकांसाठी GPT‑5.1 सादर करत आहोत
आज आम्ही एपीआय प्लॅटफॉर्ममध्ये GPT‑5.1 रिलीज करत आहोत, GPT‑5 मालिकेतील पुढील मॉडेल जे बुद्धिमत्ता आणि वेग यांचा समतोल साधते आणि एजंटिक व कोडिंग कामांच्या विस्तृत श्रेणीसाठी उपयुक्त आहे. GPT‑5.1 कामाच्या जटिलतेनुसार विचार करण्यासाठी किती वेळ घालवायचा ते गतिशीलपणे जुळवतो, ज्यामुळे मॉडेल सोप्या दररोजच्या कामांवर लक्षणीय वेगवान आणि अधिक टोकन-कार्यक्षम बनतो. या मॉडेलमध्ये "नो रिझनिंग" मोड देखील आहे जो GPT‑5.1 ची फ्रंटियर इंटेलिजेंस राखून, खोल विचार करण्याची आवश्यकता नसलेल्या कामांवर जलद प्रतिसाद देतो.
GPT‑5.1 ला आणखी कार्यक्षम बनवण्यासाठी, आम्ही 24तासांपर्यंत कॅशे रिटेन्शनसाठी एक्सटेंडेड प्रॉम्प्ट कॅशिंग रिलीज करत आहोत, ज्यामुळे कमी खर्चात फॉलो-अप प्रश्नांसाठी जलद प्रतिसाद मिळतात. आमच्या प्राधान्य प्रक्रिया(नवीन विंडोमध्ये उघडेल) ग्राहकांना GPT‑5 पेक्षा GPT‑5.1 सह लक्षणीयरीत्या जलद कामगिरीचा अनुभव येईल.
कोडिंगवर, आम्ही GPT‑5.1 सुधारण्यासाठी कर्सर, कॉग्निशन, ऑगमेंट कोड, फॅक्टरी आणि वार्प सारख्या स्टार्टअप्ससोबत जवळून काम केले आहे कोडिंग पर्सनॅलिटी, स्टीअरेबिलिटी आणि कोड गुणवत्ता. सर्वसाधारणपणे, GPT‑5.1 कोडिंगसाठी वापरण्यास अधिक अंतर्ज्ञानी वाटते आणि कार्ये पूर्ण करताना वापरकर्त्यांना तोंड देणाऱ्या अद्यतनांसह अधिक संवादात्मक वाटते.
शेवटी, आम्ही GPT‑5.1 सह दोन नवीन साधने सादर करत आहोत: अधिक विश्वासार्हपणे कोड संपादित करण्यासाठी डिझाइन केलेले apply_patch साधन आणि मॉडेलला शेल कमांड्स चालविण्याची परवानगी देणारे शेल साधन.
GPT‑5.1 ही GPT‑5 मालिकेतील पुढची प्रगती आहे आणि आम्ही डेव्हलपर्सना विश्वासार्ह एजंटिक वर्कफ्लो तयार करण्यास मदत करण्यासाठी अधिक बुद्धिमान आणि सक्षम मॉडेल्समध्ये गुंतवणूक करत राहण्याची योजना आखत आहोत.
GPT‑5.1 ला अधिक वेगवान करण्यासाठी, आम्ही त्याला विचार करा म्हणून प्रशिक्षण देण्याच्या पद्धतीत आमूलाग्र बदल केले. सोप्या कामांवर, GPT‑5.1 कमी टोकन विचारात खर्च करते, ज्यामुळे उत्पादन अनुभव जलद होतात आणि टोकन बिल कमी होतात. अतिरिक्त विचारांची आवश्यकता असलेल्या कठीण कामांवर, GPT‑5.1 चिकाटीने कार्य करते, पर्याय एक्सप्लोर करते आणि विश्वासार्हता वाढवण्यासाठी त्याचे कार्य तपासते.
बाल्यास्नी अॅसेट मॅनेजमेंट(नवीन विंडोमध्ये उघडेल) ने म्हटले आहे की GPT‑5.1 ने "आमच्या पूर्ण डायनॅमिक मूल्यांकन सूटमध्ये GPT‑4.1 आणि GPT‑5 दोन्हीपेक्षा जास्त कामगिरी केली, तर GPT‑5 पेक्षा 2-3 पट वेगाने चालले." त्यांनी असेही म्हटले आहे की त्यांच्या साधन-हेवी तर्क कार्यांमध्ये, GPT‑5.1 ने "समान किंवा चांगल्या गुणवत्तेचे आघाडीचे स्पर्धकांपेक्षा निम्मे टोकन सातत्याने वापरले." त्याचप्रमाणे, एआय इन्शुरन्स बीपीओ पेस(नवीन विंडोमध्ये उघडेल) ने देखील मॉडेलची चाचणी केली आणि म्हटले की त्यांचे एजंट "GPT‑5.1 वर 50% वेगाने चालतात, तर आमच्या मूल्यांकनात GPT‑5 आणि इतर आघाडीच्या मॉडेल्सपेक्षा अचूकता ओलांडतात."
GPT‑5.1 त्याचा विचार करण्याचा वेळ GPT‑5 पेक्षा अधिक गतिशीलपणे बदलतो. ChatGPT कामांच्या प्रातिनिधिक वितरणावर, GPT‑5.1 सोप्या कामांमध्ये खूपच वेगवान आहे, अगदी उच्च तर्कशक्तीच्या प्रयत्नातही.
उदाहरणार्थ, "जागतिक स्तरावर स्थापित पॅकेजेसची यादी करण्यासाठी npm कमांड दाखवा" असे विचारले असता, GPT‑5.1 हे 10 सेकंदांऐवजी 2 सेकंदात उत्तर देते.
GPT-5 (मध्यम) सुमारे २५० टोकन्स घेतो (सुमारे १० सेकंद)
GPT-5.1 (मध्यम) ~50 token घेतो (~2 सेकंद)
विकसक आता reasoning_effort ला 'none' वर सेट करून तर्कशक्तीशिवाय GPT‑5.1 वापरू शकतात. यामुळे मॉडेल लेटन्सी-सेन्सिटिव्ह वापराच्या प्रकरणांमध्ये नॉन-रिझनिंग मॉडेलसारखे वागते, ज्यामध्ये GPT‑5.1 ची उच्च बुद्धिमत्ता आणि परफॉर्मंट टूल-कॉलिंगचा अतिरिक्त बोनस आहे. 'मिनिमल' रिझनिंग असलेल्या GPT‑5 च्या तुलनेत, रिझनिंगशिवाय GPT‑5.1 हे पॅरलल टूल कॉलिंग (जे स्वतःच एंड-टू-एंड टास्क पूर्ण करण्याची गती वाढवते), कोडिंग टास्क, सूचनांचे पालन आणि सर्च टूल्स वापरण्यात चांगले आहे—आणि आमच्या API प्लॅटफॉर्ममध्ये वेब सर्च(नवीन विंडोमध्ये उघडेल) ला सपोर्ट करते. सिएरा(नवीन विंडोमध्ये उघडेल) यांनी सामायिक केले की GPT‑5.1 ने “नो रिझनिंग” मोडमध्ये GPT‑5 किमान रिझनिंगच्या तुलनेत प्रलंबित टूल कॉलिंग कार्यक्षमतेत 20% सुधारणा दर्शविली त्यांच्या वास्तविक-जगातील मूल्यांकनांमध्ये.
reasoning_effort मध्ये 'none' हे मूल्य वापरल्याने, विकासकांना आता त्यांच्या वापराच्या बाबतीत वेग, खर्च आणि बुद्धिमत्तेमधील संतुलनावर अधिक लवचिकता आणि नियंत्रण मिळते. GPT‑5.1 'none' वर डीफॉल्ट होते, जे प्रलंबित-संवेदनशील वर्कलोडसाठी आदर्श आहे. आम्ही डेव्हलपर्सना जास्त गुंतागुंतीच्या कामांसाठी 'कमी' किंवा 'मध्यम' आणि जेव्हा बुद्धिमत्ता आणि विश्वासार्हता वेगापेक्षा जास्त महत्त्वाची असते तेव्हा 'उच्च' निवडण्याची शिफारस करतो.
विस्तारित कॅशिंग तर्क कार्यक्षमता सुधारते कारण ते प्रॉम्प्टना आज समर्थित काही मिनिटांऐवजी 24 तासांपर्यंत कॅशेमध्ये सक्रिय राहण्याची परवानगी देते. लांब रिटेन्शन विंडोसह, अधिक फॉलो-अप विनंत्या कॅश केलेल्या संदर्भाचा लाभ घेऊ शकतात—परिणामी कमी प्रलंबित, कमी खर्च, आणि दीर्घकालीन संवादांसाठी अधिक गुळगुळीत कार्यक्षमता जसे की मल्टी-टर्न गप्पा, कोडिंग सत्रे किंवा ज्ञान पुनर्प्राप्ती कार्यप्रवाह.
प्रॉम्प्ट कॅशेची किंमत अपरिवर्तित राहते, कॅशे केलेले इनपुट टोकन हे अनकॅश टोकन पेक्षा 90% स्वस्त आहेत आणि कॅशे लेखन किंवा संचयनासाठी कोणतेही अतिरिक्त शुल्क नाही. GPT‑5.1 सह विस्तारित कॅशिंग वापरण्यासाठी, प्रतिसाद किंवा गप्पा कम्प्लेशन्स API वर “prompt_cache_retention='24h'” पॅरामीटर जोडा. अधिक तपशीलांसाठी प्रॉम्प्ट कॅशिंग दस्तऐवज(नवीन विंडोमध्ये उघडेल) पहा.
GPT‑5.1 हे GPT‑5 च्या कोडिंग क्षमतांवर आधारित आहे ज्यामध्ये अधिक स्टीअरेबल कोडिंग व्यक्तिमत्व, कमी जास्त विचार करणे, सुधारित कोड गुणवत्ता, टूल कॉलच्या अनुक्रमांदरम्यान चांगले वापरकर्ता-लक्ष्यित अपडेट संदेश (प्रीअम्बल्स) आणि अधिक कार्यात्मक फ्रंटएंड डिझाइन आहेत - विशेषतः कमी तर्कसंगत प्रयत्नात.
जलद कोड संपादने, GPT‑5.1 सारख्या सोप्या कोडिंग कामांवर जलद गतीमुळे पुढे-मागे पुनरावृत्ती करणे सोपे होते. GPT‑5.1 चे सोप्या कामांवरील वेगवान गती कठीण कामांवरील कामगिरी कमी करत नाहीत. SWE-बेंच सत्यापित करा वर, GPT‑5.1 GPT‑5 पेक्षा अधिक काळ काम करते आणि 76.3% पर्यंत पोहोचते.
SWE-bench Verified मध्ये, मॉडेलला कोड रिपॉझिटरी आणि समस्येचे वर्णन दिले जाते आणि समस्येचे निराकरण करण्यासाठी पॅच तयार करणे आवश्यक आहे. लेबल्स तर्क प्रयत्न दर्शवतात. सर्व 500 समस्यांमध्ये अचूकता सरासरी काढली जाते. सर्व मॉडेल्समध्ये JSON-आधारित apply_patch टूलसह हार्नेस वापरला जातो.
आम्हाला काही कोडिंग कंपन्यांकडून GPT‑5.1 वर लवकर अभिप्राय मिळाला. त्यांचे छाप येथे आहेत:
- ऑगमेंट कोड(नवीन विंडोमध्ये उघडेल) ने GPT‑5.1 ला “कमी वाया जाणाऱ्या क्रिया, अधिक कार्यक्षम तर्कशक्ती, आणि चांगले काम फोकस” असे म्हटले आहे आणि ते “अधिक अचूक बदल, सुलभ पुल विनंत्या, आणि मल्टी-फाइल प्रोजेक्टमध्ये जलद पुनरावृत्ती” पाहत आहेत.
- क्लाइन(नवीन विंडोमध्ये उघडेल) ने शेअर केले की त्यांच्या मूल्यांकनात, "GPT‑5.1 ने आमच्या डिफ एडिटिंग बेंचमार्कवर 7% सुधारणासह SOTA साध्य केले, जटिल कोडिंग कार्यांसाठी अपवादात्मक विश्वासार्हता दर्शविली."
- CodeRabbit(नवीन विंडोमध्ये उघडेल) ने GPT‑5.1 ला “PR पुनरावलोकनांसाठी निवडीचे टॉप मॉडेल” म्हटले.
- Cognition(नवीन विंडोमध्ये उघडेल) म्हणाले की GPT‑5.1 “आपण काय विचारत आहात हे समजून घेण्यात आणि ते पूर्ण करण्यासाठी आपल्याबरोबर काम करण्यात लक्षणीयरीत्या चांगले आहे.”
- Factory(नवीन विंडोमध्ये उघडेल) म्हणाले, “GPT‑5.1 लक्षणीय वेगवान प्रतिसाद देते आणि त्याची तर्कशक्ती कामाच्या गरजेनुसार समायोजित करते, विचारांचा अतिरेक कमी करते आणि एकूणच विकसकांचा अनुभव सुधारतो.”
- Warp(नवीन विंडोमध्ये उघडेल) नवीन वापरकर्त्यांसाठी GPT‑5.1 ला डीफॉल्ट बनवत आहे, असे सांगत आहे की ते "GPT‑5 मालिकेने सादर केलेल्या प्रभावी बुद्धिमत्ता लाभांवर आधारित आहे, आणि हे अधिक प्रतिसादक्षम मॉडेल आहे."
"GPT 5.1 केवळ आणखी एक LLM नाही—हे खरोखरच एजंटिक आहे, मी कधीही चाचणी केलेले सर्वात नैसर्गिक स्वायत्त मॉडेल आहे. हे तुमच्यासारखे लिहिते, तुमच्यासारखे कोड करते, सहजपणे जटिल सूचनांचे पालन करते आणि फ्रंट-एंड कामांमध्ये उत्कृष्ट आहे, तुमच्या विद्यमान कोडबेसमध्ये सुबकपणे बसते. आपण प्रतिसाद एपीआयमध्ये खरोखर त्याची संपूर्ण क्षमता अनलॉक करू शकता आणि आम्ही आमच्या आयडीईमध्ये ती ऑफर करण्यास उत्सुक आहोत."
प्रतिसाद API मधील मॉडेलचा जास्तीत जास्त फायदा मिळविण्यासाठी आम्ही GPT‑5.1 सह दोन नवीन साधने विकसकांसाठी सादर करत आहोत: JSON एस्केपिंगची गरज न करता कोड संपादने अधिक विश्वसनीय करण्यासाठी फ्रीफॉर्म apply_patch टूल, आणि मॉडेलला आपल्या स्थानिक मशीनवर चालविण्यासाठी आदेश लिहण्यास देणारे शेल टूल.
फ्रीफॉर्म apply_patch साधन GPT‑5.1 ला संरचित डिफ्स वापरून कोडबेसमध्ये फाइल्स तयार करा, अद्यतनित करणे आणि हटवा याची परवानगी देते. केवळ संपादने सुचवण्याऐवजी, मॉडेल अॅप्लिकेशन लागू केलेले पॅच ऑपरेशन्स उत्सर्जित करते आणि परत अहवाल देते, ज्यामुळे पुनरावृत्ती होणारे, बहु-चरण कोड संपादन कार्यप्रवाह सक्षम होतात.
Responses API मध्ये apply_patch साधन वापरण्यासाठी, "tools": [{“type”: “apply_patch”}] सह टूल्स एरेमध्ये समाविष्ट करा आणि आपल्या इनपुटमध्ये फाइल सामग्री समाविष्ट करा किंवा आपल्या फाइल सिस्टमशी संवाद साधण्यासाठी मॉडेलला साधने द्या. आपण आपल्या फाइल सिस्टम वर लागू केलेल्या फायली तयार करण्यासाठी, अद्यतनित करण्यासाठी किंवा हटविण्यासाठी मॉडेल apply_patch_call आयटम तयार करेल. apply_patch टूलसह कसे एकत्रित करायचे याबद्दल अधिक माहितीसाठी, आमचे विकसक दस्तऐवजीकरण(नवीन विंडोमध्ये उघडेल) पहा.
शेल टूल मॉडेलला नियंत्रित कमांड-लाइन इंटरफेसद्वारे स्थानिक संगणकाशी संवाद साधण्याची परवानगी देते. मॉडेल शेल कमांड्स सुचवते; विकसकाचे एकत्रीकरण त्यांना अंमलात आणते आणि आउटपुट परत करते. हे एक साधे प्लॅन-एक्झिक्युट लूप तयार करते जे मॉडेल्सना सिस्टमची तपासणी करण्यास, युटिलिटीज चालवण्यास आणि कार्य पूर्ण होईपर्यंत डेटा गोळा करण्यास अनुमती देते.
Responses API मध्ये शेल टूल वापरण्यासाठी, विकसक "tools": [{“type”: “shell”}] सह टूल्स एरेमध्ये ते समाविष्ट करू शकतात. एपीआय "shell_call" आयटम उत्पन्न करेल ज्यात अंमल बजावणी करण्यासाठी शेल कमांड्स समाविष्ट असतील. विकसक स्थानिक वातावरणात आदेश अंमलात आणतात आणि पुढील API विनंतीमध्ये "shell_call_output" आयटममध्ये अंमलबजावणीचे परिणाम परत पाठवतात. आमच्या विकसक दस्तऐवजीकरणात(नवीन विंडोमध्ये उघडेल) अधिक जाणून घ्या.
GPT‑5.1 आणि GPT‑5.1‑गप्पा‑latest API मधील सर्व सशुल्क स्तरांवर विकसकांसाठी उपलब्ध आहेत. किंमत आणि दर मर्यादा(नवीन विंडोमध्ये उघडेल) GPT‑5 सारख्या आहेत. आम्ही gpt-5.1-कोडेक्स देखील रिलीज करत आहोत आणि एपीआय मध्ये GPT -5.1-कोडेक्स-मिनी. GPT‑5.1 बहुतेक कोडिंग कामांमध्ये उत्कृष्ट आहे, तर gpt-5.1-कोडेक्स कोडेक्स किंवा कोडेक्ससारख्या हार्नेसमध्ये दीर्घकाळ चालणाऱ्या, एजंटिक कोडिंग कामांसाठी मॉडेल्स अनुकूलित केलेले आहेत.
डेव्हलपर आमच्या GPT‑5.1 डेव्हलपर डॉक्युमेंटेशन(नवीन विंडोमध्ये उघडेल) आणि मॉडेल प्रॉम्प्टिंग गाइड(नवीन विंडोमध्ये उघडेल) वापरून बिल्डिंग सुरू करू शकतात. आम्ही सध्या API मध्ये GPT‑5 बंद करण्याची योजना आखत नाही आणि जर तसे करण्याचा निर्णय घेतला तर विकसकांना पूर्वसूचना देऊ.
आम्ही वास्तविक एजंटिक आणि कोडिंग कामासाठी सर्वात सक्षम, विश्वासार्ह मॉडेल्स पुनरावृत्ती पद्धतीने तैनात करण्यासाठी वचनबद्ध आहोत - असे मॉडेल जे कार्यक्षमतेने विचार करतात, जलद पुनरावृत्ती करतात आणि विकासकांना प्रवाहात ठेवत जटिल कामे हाताळतात. अनुकूलित तर्क, मजबूत कोडिंग कामगिरी, स्पष्ट वापरकर्त्याभिमुख अद्यतने आणि apply_patch आणि shell सारख्या नवीन साधनांसह, GPT‑5.1 आपल्याला कमी अडथळ्यांसह बांधकाम करण्यात मदत करण्यासाठी डिझाइन केले आहे. आणि आम्ही येथे मोठ्या प्रमाणात गुंतवणूक करत आहोत: येणाऱ्या आठवड्यात आणि महिन्यांत तुम्ही अधिक सक्षम एजंटिक आणि कोडिंग मॉडेल्सची अपेक्षा करू शकता.
मूल्यांकन | GPT‑5.1 (उच्च) | GPT‑5 (high) |
SWE-बेंच सत्यापित करा | 76.3% | 72.8% |
GPQA डायमंड | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench एअरलाइन | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long संदर्भ 128k | 90.0% | 90.0% |
* टाऊ2-बेंच टेलिकॉमसाठी, आम्ही GPT‑5.1 ची कार्यक्षमता सुधारण्यासाठी एक लहान, सामान्यतः उपयुक्त प्रॉम्प्ट दिला.


