मुख्य मजकूराकडे जा
OpenAI

१३ नोव्हेंबर, २०२५

प्रॉडक्ट

विकसकांसाठी GPT‑5.1 सादर करत आहोत

लोड होत आहे...

आज आम्ही एपीआय प्लॅटफॉर्ममध्ये GPT‑5.1 रिलीज करत आहोत, GPT‑5 मालिकेतील पुढील मॉडेल जे बुद्धिमत्ता आणि वेग यांचा समतोल साधते आणि एजंटिक व कोडिंग कामांच्या विस्तृत श्रेणीसाठी उपयुक्त आहे. GPT‑5.1 कामाच्या जटिलतेनुसार विचार करण्यासाठी किती वेळ घालवायचा ते गतिशीलपणे जुळवतो, ज्यामुळे मॉडेल सोप्या दररोजच्या कामांवर लक्षणीय वेगवान आणि अधिक टोकन-कार्यक्षम बनतो. या मॉडेलमध्ये "नो रिझनिंग" मोड देखील आहे जो GPT‑5.1 ची फ्रंटियर इंटेलिजेंस राखून, खोल विचार करण्याची आवश्यकता नसलेल्या कामांवर जलद प्रतिसाद देतो.

GPT‑5.1 ला आणखी कार्यक्षम बनवण्यासाठी, आम्ही 24तासांपर्यंत कॅशे रिटेन्शनसाठी एक्सटेंडेड प्रॉम्प्ट कॅशिंग रिलीज करत आहोत, ज्यामुळे कमी खर्चात फॉलो-अप प्रश्नांसाठी जलद प्रतिसाद मिळतात. आमच्या प्राधान्य प्रक्रिया(नवीन विंडोमध्ये उघडेल) ग्राहकांना GPT‑5 पेक्षा GPT‑5.1 सह लक्षणीयरीत्या जलद कामगिरीचा अनुभव येईल.

कोडिंगवर, आम्ही GPT‑5.1 सुधारण्यासाठी कर्सर, कॉग्निशन, ऑगमेंट कोड, फॅक्टरी आणि वार्प सारख्या स्टार्टअप्ससोबत जवळून काम केले आहे कोडिंग पर्सनॅलिटी, स्टीअरेबिलिटी आणि कोड गुणवत्ता. सर्वसाधारणपणे, GPT‑5.1 कोडिंगसाठी वापरण्यास अधिक अंतर्ज्ञानी वाटते आणि कार्ये पूर्ण करताना वापरकर्त्यांना तोंड देणाऱ्या अद्यतनांसह अधिक संवादात्मक वाटते.

शेवटी, आम्ही GPT‑5.1 सह दोन नवीन साधने सादर करत आहोत: अधिक विश्वासार्हपणे कोड संपादित करण्यासाठी डिझाइन केलेले apply_patch साधन आणि मॉडेलला शेल कमांड्स चालविण्याची परवानगी देणारे शेल साधन.

GPT‑5.1 ही GPT‑5 मालिकेतील पुढची प्रगती आहे आणि आम्ही डेव्हलपर्सना विश्वासार्ह एजंटिक वर्कफ्लो तयार करण्यास मदत करण्यासाठी अधिक बुद्धिमान आणि सक्षम मॉडेल्समध्ये गुंतवणूक करत राहण्याची योजना आखत आहोत.

कामांमध्ये कार्यक्षम तर्कशक्ती

अनुकूली विचारशक्ती

GPT‑5.1 ला अधिक वेगवान करण्यासाठी, आम्ही त्याला विचार करा म्हणून प्रशिक्षण देण्याच्या पद्धतीत आमूलाग्र बदल केले. सोप्या कामांवर, GPT‑5.1 कमी टोकन विचारात खर्च करते, ज्यामुळे उत्पादन अनुभव जलद होतात आणि टोकन बिल कमी होतात. अतिरिक्त विचारांची आवश्यकता असलेल्या कठीण कामांवर, GPT‑5.1 चिकाटीने कार्य करते, पर्याय एक्सप्लोर करते आणि विश्वासार्हता वाढवण्यासाठी त्याचे कार्य तपासते.

बाल्यास्नी अॅसेट मॅनेजमेंट(नवीन विंडोमध्ये उघडेल) ने म्हटले आहे की GPT‑5.1 ने "आमच्या पूर्ण डायनॅमिक मूल्यांकन सूटमध्ये GPT‑4.1 आणि GPT‑5 दोन्हीपेक्षा जास्त कामगिरी केली, तर GPT‑5 पेक्षा 2-3 पट वेगाने चालले." त्यांनी असेही म्हटले आहे की त्यांच्या साधन-हेवी तर्क कार्यांमध्ये, GPT‑5.1 ने "समान किंवा चांगल्या गुणवत्तेचे आघाडीचे स्पर्धकांपेक्षा निम्मे टोकन सातत्याने वापरले." त्याचप्रमाणे, एआय इन्शुरन्स बीपीओ पेस(नवीन विंडोमध्ये उघडेल) ने देखील मॉडेलची चाचणी केली आणि म्हटले की त्यांचे एजंट "GPT‑5.1 वर 50% वेगाने चालतात, तर आमच्या मूल्यांकनात GPT‑5 आणि इतर आघाडीच्या मॉडेल्सपेक्षा अचूकता ओलांडतात."

GPT‑5.1 त्याचा विचार करण्याचा वेळ GPT‑5 पेक्षा अधिक गतिशीलपणे बदलतो. ChatGPT कामांच्या प्रातिनिधिक वितरणावर, GPT‑5.1 सोप्या कामांमध्ये खूपच वेगवान आहे, अगदी उच्च तर्कशक्तीच्या प्रयत्नातही.

उदाहरणार्थ, "जागतिक स्तरावर स्थापित पॅकेजेसची यादी करण्यासाठी npm कमांड दाखवा" असे विचारले असता, GPT‑5.1 हे 10 सेकंदांऐवजी 2 सेकंदात उत्तर देते.

GPT-5 (मध्यम) सुमारे २५० टोकन्स घेतो (सुमारे १० सेकंद)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (मध्यम) ~50 token घेतो (~2 सेकंद)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

नवीन “नो रीझनिंग” मोड

विकसक आता reasoning_effort ला 'none' वर सेट करून तर्कशक्तीशिवाय GPT‑5.1 वापरू शकतात. यामुळे मॉडेल लेटन्सी-सेन्सिटिव्ह वापराच्या प्रकरणांमध्ये नॉन-रिझनिंग मॉडेलसारखे वागते, ज्यामध्ये GPT‑5.1 ची उच्च बुद्धिमत्ता आणि परफॉर्मंट टूल-कॉलिंगचा अतिरिक्त बोनस आहे. 'मिनिमल' रिझनिंग असलेल्या GPT‑5 च्या तुलनेत, रिझनिंगशिवाय GPT‑5.1 हे पॅरलल टूल कॉलिंग (जे स्वतःच एंड-टू-एंड टास्क पूर्ण करण्याची गती वाढवते), कोडिंग टास्क, सूचनांचे पालन आणि सर्च टूल्स वापरण्यात चांगले आहे—आणि आमच्या API प्लॅटफॉर्ममध्ये वेब सर्च(नवीन विंडोमध्ये उघडेल) ला सपोर्ट करते. सिएरा(नवीन विंडोमध्ये उघडेल) यांनी सामायिक केले की GPT‑5.1 ने “नो रिझनिंग” मोडमध्ये GPT‑5 किमान रिझनिंगच्या तुलनेत प्रलंबित टूल कॉलिंग कार्यक्षमतेत 20% सुधारणा दर्शविली त्यांच्या वास्तविक-जगातील मूल्यांकनांमध्ये.

reasoning_effort मध्ये 'none' हे मूल्य वापरल्याने, विकासकांना आता त्यांच्या वापराच्या बाबतीत वेग, खर्च आणि बुद्धिमत्तेमधील संतुलनावर अधिक लवचिकता आणि नियंत्रण मिळते. GPT‑5.1 'none' वर डीफॉल्ट होते, जे प्रलंबित-संवेदनशील वर्कलोडसाठी आदर्श आहे. आम्ही डेव्हलपर्सना जास्त गुंतागुंतीच्या कामांसाठी 'कमी' किंवा 'मध्यम' आणि जेव्हा बुद्धिमत्ता आणि विश्वासार्हता वेगापेक्षा जास्त महत्त्वाची असते तेव्हा 'उच्च' निवडण्याची शिफारस करतो.

विस्तारित प्रॉम्प्ट कॅशिंग

विस्तारित कॅशिंग तर्क कार्यक्षमता सुधारते कारण ते प्रॉम्प्टना आज समर्थित काही मिनिटांऐवजी 24 तासांपर्यंत कॅशेमध्ये सक्रिय राहण्याची परवानगी देते. लांब रिटेन्शन विंडोसह, अधिक फॉलो-अप विनंत्या कॅश केलेल्या संदर्भाचा लाभ घेऊ शकतात—परिणामी कमी प्रलंबित, कमी खर्च, आणि दीर्घकालीन संवादांसाठी अधिक गुळगुळीत कार्यक्षमता जसे की मल्टी-टर्न गप्पा, कोडिंग सत्रे किंवा ज्ञान पुनर्प्राप्ती कार्यप्रवाह.

प्रॉम्प्ट कॅशेची किंमत अपरिवर्तित राहते, कॅशे केलेले इनपुट टोकन हे अनकॅश टोकन पेक्षा 90% स्वस्त आहेत आणि कॅशे लेखन किंवा संचयनासाठी कोणतेही अतिरिक्त शुल्क नाही. GPT‑5.1 सह विस्तारित कॅशिंग वापरण्यासाठी, प्रतिसाद किंवा गप्पा कम्प्लेशन्स API वर “prompt_cache_retention='24h'” पॅरामीटर जोडा. अधिक तपशीलांसाठी प्रॉम्प्ट कॅशिंग दस्तऐवज(नवीन विंडोमध्ये उघडेल) पहा.

कोडिंग

GPT‑5.1 हे GPT‑5 च्या कोडिंग क्षमतांवर आधारित आहे ज्यामध्ये अधिक स्टीअरेबल कोडिंग व्यक्तिमत्व, कमी जास्त विचार करणे, सुधारित कोड गुणवत्ता, टूल कॉलच्या अनुक्रमांदरम्यान चांगले वापरकर्ता-लक्ष्यित अपडेट संदेश (प्रीअम्बल्स) आणि अधिक कार्यात्मक फ्रंटएंड डिझाइन आहेत - विशेषतः कमी तर्कसंगत प्रयत्नात.

जलद कोड संपादने, GPT‑5.1 सारख्या सोप्या कोडिंग कामांवर जलद गतीमुळे पुढे-मागे पुनरावृत्ती करणे सोपे होते. GPT‑5.1 चे सोप्या कामांवरील वेगवान गती कठीण कामांवरील कामगिरी कमी करत नाहीत. SWE-बेंच सत्यापित करा वर, GPT‑5.1 GPT‑5 पेक्षा अधिक काळ काम करते आणि 76.3% पर्यंत पोहोचते.

SWE-bench Verified⁠ मध्ये, मॉडेलला कोड रिपॉझिटरी आणि समस्येचे वर्णन दिले जाते आणि समस्येचे निराकरण करण्यासाठी पॅच तयार करणे आवश्यक आहे. लेबल्स तर्क प्रयत्न दर्शवतात. सर्व 500 समस्यांमध्ये अचूकता सरासरी काढली जाते. सर्व मॉडेल्समध्ये JSON-आधारित apply_patch टूलसह हार्नेस वापरला जातो.

आम्हाला काही कोडिंग कंपन्यांकडून GPT‑5.1 वर लवकर अभिप्राय मिळाला. त्यांचे छाप येथे आहेत:

  • ऑगमेंट कोड(नवीन विंडोमध्ये उघडेल) ने GPT‑5.1 ला “कमी वाया जाणाऱ्या क्रिया, अधिक कार्यक्षम तर्कशक्ती, आणि चांगले काम फोकस” असे म्हटले आहे आणि ते “अधिक अचूक बदल, सुलभ पुल विनंत्या, आणि मल्टी-फाइल प्रोजेक्टमध्ये जलद पुनरावृत्ती” पाहत आहेत.
  • क्लाइन(नवीन विंडोमध्ये उघडेल) ने शेअर केले की त्यांच्या मूल्यांकनात, "GPT‑5.1 ने आमच्या डिफ एडिटिंग बेंचमार्कवर 7% सुधारणासह SOTA साध्य केले, जटिल कोडिंग कार्यांसाठी अपवादात्मक विश्वासार्हता दर्शविली."
  • CodeRabbit(नवीन विंडोमध्ये उघडेल) ने GPT‑5.1 ला “PR पुनरावलोकनांसाठी निवडीचे टॉप मॉडेल” म्हटले.
  • Cognition(नवीन विंडोमध्ये उघडेल) म्हणाले की GPT‑5.1 “आपण काय विचारत आहात हे समजून घेण्यात आणि ते पूर्ण करण्यासाठी आपल्याबरोबर काम करण्यात लक्षणीयरीत्या चांगले आहे.”
  • Factory(नवीन विंडोमध्ये उघडेल) म्हणाले, “GPT‑5.1 लक्षणीय वेगवान प्रतिसाद देते आणि त्याची तर्कशक्ती कामाच्या गरजेनुसार समायोजित करते, विचारांचा अतिरेक कमी करते आणि एकूणच विकसकांचा अनुभव सुधारतो.”
  • Warp(नवीन विंडोमध्ये उघडेल) नवीन वापरकर्त्यांसाठी GPT‑5.1 ला डीफॉल्ट बनवत आहे, असे सांगत आहे की ते "GPT‑5 मालिकेने सादर केलेल्या प्रभावी बुद्धिमत्ता लाभांवर आधारित आहे, आणि हे अधिक प्रतिसादक्षम मॉडेल आहे."
"GPT 5.1 केवळ आणखी एक LLM नाही—हे खरोखरच एजंटिक आहे, मी कधीही चाचणी केलेले सर्वात नैसर्गिक स्वायत्त मॉडेल आहे. हे तुमच्यासारखे लिहिते, तुमच्यासारखे कोड करते, सहजपणे जटिल सूचनांचे पालन करते आणि फ्रंट-एंड कामांमध्ये उत्कृष्ट आहे, तुमच्या विद्यमान कोडबेसमध्ये सुबकपणे बसते. आपण प्रतिसाद एपीआयमध्ये खरोखर त्याची संपूर्ण क्षमता अनलॉक करू शकता आणि आम्ही आमच्या आयडीईमध्ये ती ऑफर करण्यास उत्सुक आहोत."
—डेनिस शिरयाव, एआय डेव्हटूल्स इकोसिस्टमचे प्रमुख, JetBrains

GPT‑5.1 मधील नवीन साधने

प्रतिसाद API मधील मॉडेलचा जास्तीत जास्त फायदा मिळविण्यासाठी आम्ही GPT‑5.1 सह दोन नवीन साधने विकसकांसाठी सादर करत आहोत: JSON एस्केपिंगची गरज न करता कोड संपादने अधिक विश्वसनीय करण्यासाठी फ्रीफॉर्म apply_patch टूल, आणि मॉडेलला आपल्या स्थानिक मशीनवर चालविण्यासाठी आदेश लिहण्यास देणारे शेल टूल.

Apply_patch साधन

फ्रीफॉर्म apply_patch साधन GPT‑5.1 ला संरचित डिफ्स वापरून कोडबेसमध्ये फाइल्स तयार करा, अद्यतनित करणे आणि हटवा याची परवानगी देते. केवळ संपादने सुचवण्याऐवजी, मॉडेल अॅप्लिकेशन लागू केलेले पॅच ऑपरेशन्स उत्सर्जित करते आणि परत अहवाल देते, ज्यामुळे पुनरावृत्ती होणारे, बहु-चरण कोड संपादन कार्यप्रवाह सक्षम होतात.

Responses API मध्ये apply_patch साधन वापरण्यासाठी, "tools": [{“type”: “apply_patch”}] सह टूल्स एरेमध्ये समाविष्ट करा आणि आपल्या इनपुटमध्ये फाइल सामग्री समाविष्ट करा किंवा आपल्या फाइल सिस्टमशी संवाद साधण्यासाठी मॉडेलला साधने द्या. आपण आपल्या फाइल सिस्टम वर लागू केलेल्या फायली तयार करण्यासाठी, अद्यतनित करण्यासाठी किंवा हटविण्यासाठी मॉडेल apply_patch_call आयटम तयार करेल. apply_patch टूलसह कसे एकत्रित करायचे याबद्दल अधिक माहितीसाठी, आमचे विकसक दस्तऐवजीकरण(नवीन विंडोमध्ये उघडेल) पहा.

शेल साधन

शेल टूल मॉडेलला नियंत्रित कमांड-लाइन इंटरफेसद्वारे स्थानिक संगणकाशी संवाद साधण्याची परवानगी देते. मॉडेल शेल कमांड्स सुचवते; विकसकाचे एकत्रीकरण त्यांना अंमलात आणते आणि आउटपुट परत करते. हे एक साधे प्लॅन-एक्झिक्युट लूप तयार करते जे मॉडेल्सना सिस्टमची तपासणी करण्यास, युटिलिटीज चालवण्यास आणि कार्य पूर्ण होईपर्यंत डेटा गोळा करण्यास अनुमती देते.

Responses API मध्ये शेल टूल वापरण्यासाठी, विकसक "tools": [{“type”: “shell”}] सह टूल्स एरेमध्ये ते समाविष्ट करू शकतात. एपीआय "shell_call" आयटम उत्पन्न करेल ज्यात अंमल बजावणी करण्यासाठी शेल कमांड्स समाविष्ट असतील. विकसक स्थानिक वातावरणात आदेश अंमलात आणतात आणि पुढील API विनंतीमध्ये "shell_call_output" आयटममध्ये अंमलबजावणीचे परिणाम परत पाठवतात. आमच्या विकसक दस्तऐवजीकरणात(नवीन विंडोमध्ये उघडेल) अधिक जाणून घ्या.

प्राइसिंग आणि उपलब्धता

GPT‑5.1 आणि GPT‑5.1‑गप्पा‑latest API मधील सर्व सशुल्क स्तरांवर विकसकांसाठी उपलब्ध आहेत. किंमत आणि दर मर्यादा(नवीन विंडोमध्ये उघडेल) GPT‑5 सारख्या आहेत. आम्ही gpt-5.1-कोडेक्स देखील रिलीज करत आहोत आणि एपीआय मध्ये GPT -5.1-कोडेक्स-मिनी. GPT‑5.1 बहुतेक कोडिंग कामांमध्ये उत्कृष्ट आहे, तर gpt-5.1-कोडेक्स कोडेक्स किंवा कोडेक्ससारख्या हार्नेसमध्ये दीर्घकाळ चालणाऱ्या, एजंटिक कोडिंग कामांसाठी मॉडेल्स अनुकूलित केलेले आहेत.

डेव्हलपर आमच्या GPT‑5.1 डेव्हलपर डॉक्युमेंटेशन(नवीन विंडोमध्ये उघडेल) आणि मॉडेल प्रॉम्प्टिंग गाइड(नवीन विंडोमध्ये उघडेल) वापरून बिल्डिंग सुरू करू शकतात. आम्ही सध्या API मध्ये GPT‑5 बंद करण्याची योजना आखत नाही आणि जर तसे करण्याचा निर्णय घेतला तर विकसकांना पूर्वसूचना देऊ.

पुढे काय

आम्ही वास्तविक एजंटिक आणि कोडिंग कामासाठी सर्वात सक्षम, विश्वासार्ह मॉडेल्स पुनरावृत्ती पद्धतीने तैनात करण्यासाठी वचनबद्ध आहोत - असे मॉडेल जे कार्यक्षमतेने विचार करतात, जलद पुनरावृत्ती करतात आणि विकासकांना प्रवाहात ठेवत जटिल कामे हाताळतात. अनुकूलित तर्क, मजबूत कोडिंग कामगिरी, स्पष्ट वापरकर्त्याभिमुख अद्यतने आणि apply_patch आणि shell सारख्या नवीन साधनांसह, GPT‑5.1 आपल्याला कमी अडथळ्यांसह बांधकाम करण्यात मदत करण्यासाठी डिझाइन केले आहे. आणि आम्ही येथे मोठ्या प्रमाणात गुंतवणूक करत आहोत: येणाऱ्या आठवड्यात आणि महिन्यांत तुम्ही अधिक सक्षम एजंटिक आणि कोडिंग मॉडेल्सची अपेक्षा करू शकता.

अपेंडिक्स: मॉडेल मूल्यांकन

मूल्यांकन

GPT‑5.1 (उच्च)

GPT‑5 (high)

SWE-बेंच सत्यापित करा
(सर्व 500 समस्या)

76.3%

72.8%

GPQA डायमंड
(साधनांशिवाय)

88.1%

85.7%

AIME 2025
(कोणतीही साधने नाहीत)

94.0%

94.6%

FrontierMath
(Python टूलसह)

26.7%

26.3%

MMMU

85.4%

84.2%

Tau2-bench एअरलाइन

67.0%

62.6%

Tau2-bench Telecom*

95.6%

96.7%

Tau2-bench Retail

77.9%

81.1%

BrowseComp Long संदर्भ 128k

90.0%

90.0%

* टाऊ2-बेंच टेलिकॉमसाठी, आम्ही GPT‑5.1 ची कार्यक्षमता सुधारण्यासाठी एक लहान, सामान्यतः उपयुक्त प्रॉम्प्ट दिला.