મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

13 નવેમ્બર, 2025

પ્રોડક્ટ

ડેવલપર્સ માટે GPT‑5.1 પરિચય

લોડિંગ…

આજે અમે API પ્લેટફોર્મમાં GPT‑5.1 રિલીઝ કરી રહ્યા છીએ, GPT‑5 શ્રેણીનું આગળનું મોડલ, જે વિવિધ એજન્ટિક અને કોડિંગ કાર્યો માટે બુદ્ધિમત્તા અને ઝડપનું સંતુલન જાળવે છે. GPT‑5.1 કાર્યની જટિલતા મુજબ વિચારોમાં કેટલો સમય ખર્ચવો તે ગતિશીલ રીતે અનુકૂલિત કરે છે, જેથી સરળ દૈનિક કાર્યો પર મોડલ નોંધપાત્ર રીતે વધુ ઝડપી અને વધુ ટોકન-કાર્યક્ષમ બને છે. મોડલમાં ઝડપી પ્રતિભાવ માટે “no reasoning” મોડ પણ છે, જે એવા કાર્યો માટે છે જ્યાં ઊંડા વિચારોની જરૂર નથી, અને સાથે GPT‑5.1ની અત્યાધુનિક બુદ્ધિમત્તા જાળવી રાખે છે.

GPT‑5.1ને વધુ કાર્યક્ષમ બનાવવા માટે, અમે 24 કલાક સુધી કેશ જાળવણી સાથે વિસ્તૃત પ્રોમ્પ્ટ કેશિંગ રિલીઝ કરી રહ્યા છીએ, જે અનુગામી પ્રશ્નો માટે ઓછા ખર્ચે વધુ ઝડપી પ્રતિભાવો આપે છે. અમારા Priority Processing(નવી વિન્ડોમાં ખૂલે છે) ગ્રાહકોને GPT‑5ની તુલનામાં GPT‑5.1 સાથે નોંધપાત્ર રીતે ઝડપી પ્રદર્શન પણ અનુભવાશે.

કોડિંગ માટે, અમે Cursor, Cognition, Augment Code, Factory અને Warp જેવી સ્ટાર્ટઅપ્સ સાથે નજીકથી કામ કરીને GPT‑5.1ની કોડિંગ વ્યક્તિત્વ, steerability અને કોડ ગુણવત્તામાં સુધારો કર્યો છે. સામાન્ય રીતે, GPT‑5.1 કોડિંગ માટે વધુ સ્વાભાવિક લાગે છે અને કાર્યો પૂર્ણ કરતી વખતે યુઝર-ફેસિંગ અપડેટ્સ સાથે વધુ સંવાદાત્મક છે.

અંતમાં, અમે GPT‑5.1 સાથે બે નવા ટૂલ્સ રજૂ કરી રહ્યા છીએ: કોડ વધુ વિશ્વસનીય રીતે સંપાદિત કરવા માટે રચાયેલ apply_patch ટૂલ અને મોડલને shell commands ચલાવવા દેતો shell ટૂલ.

GPT‑5.1 GPT‑5 શ્રેણીમાં આગળની પ્રગતિ છે, અને ડેવલપર્સને વિશ્વસનીય એજન્ટિક workflows બનાવવા મદદ કરવા માટે અમે વધુ બુદ્ધિશાળી અને સક્ષમ મોડલોમાં રોકાણ ચાલુ રાખવાની યોજના રાખીએ છીએ.

કાર્યોમાં કાર્યક્ષમ રિઝનિંગ

અનુકૂલક રિઝનિંગ

GPT‑5.1ને વધુ ઝડપી બનાવવા માટે, અમે તેને વિચારવા માટે કેવી રીતે તાલીમ આપવામાં આવી તે રીતમાં મોટો ફેરફાર કર્યો છે. સીધાસાદા કાર્યો પર, GPT‑5.1 વિચારવામાં ઓછા ટોકન ખર્ચે છે, જેથી વધુ ચપળ પ્રોડક્ટ અનુભવ અને ઓછા ટોકન બિલ્સ શક્ય બને છે. એવા મુશ્કેલ કાર્યો પર જ્યાં વધારાના વિચારોની જરૂર હોય, GPT‑5.1 સતત પ્રયત્નશીલ રહે છે, વિકલ્પો શોધે છે અને વિશ્વસનીયતા વધારવા માટે પોતાનું કામ ચકાસે છે.

Balyasny Asset Management(નવી વિન્ડોમાં ખૂલે છે) એ કહ્યું કે GPT‑5.1 “અમારા સંપૂર્ણ ડાયનેમિક મૂલ્યાંકન સ્યુટમાં GPT‑4.1 અને GPT‑5 બંનેને પાછળ મૂકી ગયું, અને GPT‑5 કરતાં 2-3x વધુ ઝડપથી ચાલ્યું.” તેમણે એ પણ કહ્યું કે તેમના ટૂલ-હેવી રિઝનિંગ કાર્યોમાં GPT‑5.1 “સમાન અથવા વધુ સારી ગુણવત્તા પર અગ્રણી સ્પર્ધકો કરતાં લગભગ અડધા જેટલા ટોકન સતત ઉપયોગ કરતું હતું.” તે જ રીતે, AI ઇન્સ્યોરન્સ BPO Pace(નવી વિન્ડોમાં ખૂલે છે) એ પણ મોડલનું પરીક્ષણ કર્યું અને કહ્યું કે તેમના એજન્ટ્સ “GPT‑5.1 પર 50% વધુ ઝડપથી ચાલે છે અને અમારી evalsમાં GPT‑5 તથા અન્ય અગ્રણી મોડલોથી વધુ ચોકસાઈ આપે છે.”

GPT‑5.1 તેનો વિચાર સમય GPT‑5 કરતાં વધુ ગતિશીલ રીતે બદલાવે છે. ChatGPT કાર્યોના પ્રતિનિધિ વિતરણમાં, GPT‑5.1 સરળ કાર્યો પર ઘણું વધુ ઝડપી છે, ઊંચા રિઝનિંગ પ્રયાસ પર પણ.

ઉદાહરણ તરીકે, જ્યારે “show an npm command to list globally installed packages” પૂછવામાં આવ્યું, ત્યારે GPT‑5.1 10 સેકંડના બદલે 2 સેકંડમાં જવાબ આપે છે.

GPT-5 (મધ્યમ) ~250 ટોકન લે છે (~10 સેકંડ)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (મધ્યમ) ~50 ટોકન લે છે (~2 સેકંડ)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

નવો “no reasoning” મોડ

ડેવલપર્સ હવે reasoning_effort ને 'none' પર સેટ કરીને GPT‑5.1ને રિઝનિંગ વિના ઉપયોગ કરી શકે છે. આથી મોડલ latency-sensitive ઉપયોગ કિસ્સાઓ માટે non-reasoning મોડલની જેમ વર્તે છે, જેમાં GPT‑5.1ની ઊંચી બુદ્ધિમત્તા અને performant tool-callingનો વધારાનો લાભ મળે છે. 'minimal' રિઝનિંગ સાથેના GPT‑5ની તુલનામાં, no reasoning ધરાવતું GPT‑5.1 parallel tool callingમાં વધુ સારું છે, જે end-to-end કાર્ય પૂર્ણ કરવાની ઝડપ વધારે છે, તેમજ કોડિંગ કાર્યો, સૂચનાઓનું પાલન, અને search toolsના ઉપયોગમાં પણ વધુ સારું છે—અને અમારા API પ્લેટફોર્મમાં web search(નવી વિન્ડોમાં ખૂલે છે) ને સપોર્ટ કરે છે. Sierra(નવી વિન્ડોમાં ખૂલે છે) એ શેર કર્યું કે “no reasoning” મોડમાં GPT‑5.1એ તેમના વાસ્તવિક evalsમાં “GPT‑5 minimal reasoningની તુલનામાં low-latency tool calling performanceમાં 20% સુધારો” દર્શાવ્યો.

reasoning_effortમાં 'none' ને value તરીકે રજૂ કરવામાં આવતા, ડેવલપર્સ પાસે હવે તેમના ઉપયોગ માટે ઝડપ, ખર્ચ અને બુદ્ધિમત્તા વચ્ચેનું સંતુલન નિયંત્રિત કરવા વધુ લવચીકતા અને નિયંત્રણ છે. GPT‑5.1 મૂળભૂત રીતે 'none' પર સેટ છે, જે latency-sensitive workloads માટે આદર્શ છે. અમે ડેવલપર્સને વધુ જટિલ કાર્યો માટે 'low' અથવા 'medium' અને જ્યાં ઝડપ કરતાં બુદ્ધિમત્તા અને વિશ્વસનીયતા વધુ મહત્વની હોય ત્યાં 'high' પસંદ કરવાની ભલામણ કરીએ છીએ.

વિસ્તૃત પ્રોમ્પ્ટ કેશિંગ

વિસ્તૃત કેશિંગ પ્રોમ્પ્ટને કેશમાં 24 કલાક સુધી સક્રિય રહેવા દેીને રિઝનિંગ કાર્યક્ષમતામાં સુધારો કરે છે, આજના થોડા મિનિટોના સપોર્ટની બદલે. લાંબી retention window સાથે, વધુ અનુગામી વિનંતીઓ cached context નો લાભ લઈ શકે છે—જેના પરિણામે ઓછી latency, ઓછો ખર્ચ અને multi-turn chat, coding sessions અથવા knowledge retrieval workflows જેવી લાંબા સમય સુધી ચાલતી ક્રિયાપ્રતિક્રિયાઓ માટે વધુ સરસ પ્રદર્શન મળે છે.

પ્રોમ્પ્ટ કેશ કિંમતમાં કોઈ ફેરફાર નથી, cached input tokens uncached tokens કરતાં 90% સસ્તા રહે છે, અને cache writes અથવા storage માટે કોઈ વધારાનો ચાર્જ નથી. GPT‑5.1 સાથે વિસ્તૃત કેશિંગ વાપરવા માટે, Responses અથવા Chat Completions API પર “prompt_cache_retention='24h'” પરિમાણ ઉમેરો. વધુ વિગતો માટે prompt caching docs(નવી વિન્ડોમાં ખૂલે છે) જુઓ.

કોડિંગ

GPT‑5.1, GPT‑5ની કોડિંગ ક્ષમતાઓ પર વધુ steerable coding personality, ઓછું વધુ વિચારવું, સુધારેલી કોડ ગુણવત્તા, tool callsની શ્રેણી દરમિયાન વધુ સારી user-targeted update messages (preambles), અને વધુ કાર્યક્ષમ frontend designs—ખાસ કરીને ઓછા રિઝનિંગ પ્રયત્ન પર—સાથે આગળ વધે છે.

ઝડપી કોડ સંપાદન જેવા સરળ કોડિંગ કાર્યો પર, GPT‑5.1ની વધુ ઝડપ પાછળ-આગળ iteration કરવું સરળ બનાવે છે. સરળ કાર્યો પર GPT‑5.1ની વધુ ઝડપ મુશ્કેલ કાર્યો પર પ્રદર્શન ઘટાડતી નથી. SWE-bench Verified પર, GPT‑5.1 GPT‑5 કરતાં પણ વધુ લાંબું કામ કરે છે અને 76.3% સુધી પહોંચે છે.

માં SWE-bench Verified⁠, મોડલને કોડ રિપોઝિટરી અને ઇશ્યૂ વર્ણન આપવામાં આવે છે, અને ઇશ્યૂ ઉકેલવા માટે પેચ જનરેટ કરવો પડે છે. લેબલ્સ રિઝનિંગ પ્રયત્ન દર્શાવે છે. ચોકસાઈ તમામ 500 સમસ્યાઓમાં સરેરાશ લેવાય છે. બધા મોડલોએ JSON-આધારિત apply_patch ટૂલ સાથે હાર્નેસનો ઉપયોગ કર્યો.

અમને કેટલીક કોડિંગ કંપનીઓ પાસેથી GPT‑5.1 વિશે પ્રારંભિક પ્રતિસાદ મળ્યો. અહીં તેમની છાપો છે:

  • Augment Code(નવી વિન્ડોમાં ખૂલે છે) એ GPT‑5.1ને “ઓછા બગાડાયેલા પગલાં સાથે વધુ વિચારપૂર્વકનું, વધુ કાર્યક્ષમ રિઝનિંગ ધરાવતું અને વધુ સારા task focusવાળું” કહ્યું અને તેઓ “વધુ ચોક્કસ ફેરફારો, વધુ સરળ পুল রিকোয়েস্ট, અને multi-file projectsમાં ઝડપી iteration” જોઈ રહ્યા છે.
  • Cline(નવી વિન્ડોમાં ખૂલે છે) એ શેર કર્યું કે તેમના evalsમાં “GPT‑5.1એ અમારા diff editing benchmark પર 7% સુધારા સાથે SOTA હાંસલ કર્યું, જે જટિલ કોડિંગ કાર્યો માટે અસાધારણ વિશ્વસનીયતા દર્શાવે છે.”
  • CodeRabbit(નવી વિન્ડોમાં ખૂલે છે) એ GPT‑5.1ને “PR reviews માટે તેની સૌથી પસંદગીનું મોડલ” કહ્યું.
  • Cognition(નવી વિન્ડોમાં ખૂલે છે) એ કહ્યું કે GPT‑5.1 “તમે શું માંગો છો તે સમજવામાં અને તેને પૂર્ણ કરવા માટે તમારી સાથે કામ કરવામાં નોંધપાત્ર રીતે વધુ સારું છે.”
  • Factory(નવી વિન્ડોમાં ખૂલે છે) એ કહ્યું કે “GPT‑5.1 નોંધપાત્ર રીતે વધુ ચપળ પ્રતિભાવો આપે છે અને પોતાના રિઝનિંગની ઊંડાઈને કાર્ય પ્રમાણે અનુકૂલિત કરે છે, વધુ વિચારવાનું ઘટાડે છે અને એકંદર ડેવલપર અનુભવ સુધારે છે.”
  • Warp(નવી વિન્ડોમાં ખૂલે છે) નવા યુઝર્સ માટે GPT‑5.1ને ડિફૉલ્ટ બનાવી રહ્યું છે, એમ કહીને કે તે “GPT‑5 શ્રેણી દ્વારા રજૂ કરાયેલા પ્રભાવશાળી બુદ્ધિમત્તા સુધારાઓ પર આધાર રાખે છે, સાથે ઘણી વધુ પ્રતિભાવક્ષમ મોડલ છે.”
“GPT 5.1 ફક્ત એક વધુ LLM નથી—તે ખરેખર એજન્ટિક છે, મેં ક્યારેય પરીક્ષણ કરેલું સૌથી સ્વાભાવિક રીતે સ્વાયત્ત મોડલ. તે તમારી જેમ લખે છે, તમારી જેમ કોડ કરે છે, જટિલ સૂચનાઓને સહેલાઈથી અનુસરે છે, અને ફ્રન્ટ-એન્ડ કાર્યોમાં શ્રેષ્ઠ છે, તમારા હાલના કોડબેઝમાં સરસ રીતે ફિટ થાય છે. તમે Responses APIમાં ખરેખર તેની સંપૂર્ણ ક્ષમતા અનલૉક કરી શકો છો અને અમને તેને અમારી IDEમાં ઓફર કરતાં ઉત્સાહ છે.”
—Denis Shiryaev, AI ડેવલપર ટૂલ્સ ઇકોસિસ્ટમના વડા, JetBrains

GPT‑5.1માં નવા ટૂલ્સ

અમે Responses APIમાં ડેવલપર્સને મોડલમાંથી વધુ મેળવવામાં મદદ કરવા GPT‑5.1 સાથે બે નવા ટૂલ્સ રજૂ કરી રહ્યા છીએ: JSON escapingની જરૂર વિના કોડ સંપાદનોને વધુ વિશ્વસનીય બનાવવા માટે freeform apply_patch ટૂલ, અને મોડલને તમારી સ્થાનિક મશીન પર ચલાવવા માટે commands લખવા દેતો shell ટૂલ.

Apply_patch tool

freeform apply_patch ટૂલ GPT‑5.1ને structured diffs નો ઉપયોગ કરીને codebaseમાં ફાઇલો બનાવવાની, અપડેટ કરવાની અને કાઢી નાખવાની પરવાનગી આપે છે. ફક્ત સંપાદન સૂચવવાની બદલે, મોડલ patch operations બહાર પાડે છે જેને એપ્લિકેશન લાગુ કરે છે અને જેના વિશે પાછું અહેવાલ આપે છે, જેથી પુનરાવર્તિત, બહુપગલાંવાળા code editing workflows શક્ય બને છે.

Responses APIમાં apply_patch ટૂલ વાપરવા માટે, tools arrayમાં તેને "tools": [{“type”: “apply_patch”}] સાથે સામેલ કરો અને અથવા તો તમારા inputમાં file content સામેલ કરો અથવા મોડલને તમારા file system સાથે ઇન્ટરેક્ટ કરવા માટે ટૂલ્સ આપો. મોડલ ફાઇલો બનાવવી, અપડેટ કરવી અથવા કાઢી નાખવા માટે apply_patch_call items જનરેટ કરશે, જેમાં એવા diffs હશે જેને તમે તમારા file system પર લાગુ કરશો. apply_patch ટૂલ સાથે કેવી રીતે ઇન્ટિગ્રેટ કરવું તેની વધુ માહિતી માટે, અમારી developer documentation(નવી વિન્ડોમાં ખૂલે છે) જુઓ.

Shell tool

shell ટૂલ મોડલને નિયંત્રિત command-line interface દ્વારા સ્થાનિક કમ્પ્યુટર સાથે ઇન્ટરેક્ટ કરવાની મંજૂરી આપે છે. મોડલ shell commands સૂચવે છે; ડેવલપરની integration તેમને ચલાવે છે અને outputs પરત આપે છે. આ એક સરળ plan-execute loop બનાવે છે જે મોડલોને સિસ્ટમ તપાસવા, utilities ચલાવવા અને તેઓ કાર્ય પૂર્ણ કરી શકે ત્યાં સુધી ડેટા એકત્ર કરવાની સગવડ આપે છે.

Responses APIમાં shell ટૂલ વાપરવા માટે, ડેવલપર્સ tools arrayમાં તેને "tools": [{“type”: “shell”}] સાથે સામેલ કરી શકે છે. API "shell_call" items જનરેટ કરશે જેમાં ચલાવવાના shell commands સામેલ હશે. ડેવલપર્સ સ્થાનિક environmentમાં commands ચલાવે છે અને પછીની API requestમાં "shell_call_output" itemમાં execution results પાછા મોકલે છે. વધુ માટે અમારી developer documentation(નવી વિન્ડોમાં ખૂલે છે) જુઓ.

કિંમત અને ઉપલબ્ધતા

GPT‑5.1 અને gpt-5.1-chat-latest APIમાં તમામ paid tiers પર ડેવલપર્સ માટે ઉપલબ્ધ છે. Pricing and rate limits(નવી વિન્ડોમાં ખૂલે છે) GPT‑5 જેવી જ છે. અમે APIમાં gpt-5.1-codex અને gpt-5.1-codex-mini પણ રિલીઝ કરી રહ્યા છીએ. જ્યારે GPT‑5.1 મોટાભાગના કોડિંગ કાર્યોમાં શ્રેષ્ઠ છે, ત્યારે gpt-5.1-codex મોડલો Codex અથવા Codex જેવા harnessesમાં લાંબા સમય સુધી ચાલતા એજન્ટિક કોડિંગ કાર્યો માટે ઑપ્ટિમાઇઝ થયેલા છે.

ડેવલપર્સ અમારી GPT‑5.1 developer documentation(નવી વિન્ડોમાં ખૂલે છે) અને model prompting guide(નવી વિન્ડોમાં ખૂલે છે) નો ઉપયોગ કરીને બનાવવાનું શરૂ કરી શકે છે. હાલમાં અમે APIમાં GPT‑5ને deprecate કરવાની યોજના નથી રાખતા અને જો અને જ્યારે અમે એવું કરવાનો નિર્ણય લઈએ ત્યારે ડેવલપર્સને પૂર્વ સૂચના આપશું.

આગળ શું

અમે વાસ્તવિક એજન્ટિક અને કોડિંગ કાર્ય માટે સૌથી સક્ષમ અને વિશ્વસનીય મોડલોને પુનરાવર્તિત રીતે તૈનાત કરવા પ્રતિબદ્ધ છીએ—એવા મોડલો કે જે કાર્યક્ષમ રીતે વિચારે, ઝડપથી iteration કરે, અને જટિલ કાર્યો હેન્ડલ કરે, જ્યારે ડેવલપર્સને flowમાં જ રાખે. અનુકૂલક રિઝનિંગ, મજબૂત કોડિંગ પ્રદર્શન, વધુ સ્પષ્ટ user-facing updates, અને apply_patch અને shell જેવા નવા ટૂલ્સ સાથે, GPT‑5.1 તમને ઓછા અવરોધ સાથે નિર્માણ કરવામાં મદદ કરવા માટે રચાયેલ છે. અને અમે અહીં ભારે રોકાણ ચાલુ રાખી રહ્યા છીએ: આવતા અઠવાડિયા અને મહિનાઓમાં તમે વધુ સક્ષમ એજન્ટિક અને કોડિંગ મોડલોની અપેક્ષા રાખી શકો છો.

પરિશિષ્ટ: મોડલ મૂલ્યાંકન

મૂલ્યાંકન

GPT‑5.1 (high)

GPT‑5 (high)

SWE-bench Verified
(બધી 500 સમસ્યાઓ)

76.3%

72.8%

GPQA Diamond
(કોઈ ટૂલ નથી)

88.1%

85.7%

AIME 2025
(કોઈ ટૂલ નથી)

94.0%

94.6%

FrontierMath
(Python tool સાથે)

26.7%

26.3%

MMMU

85.4%

84.2%

Tau2-bench Airline

67.0%

62.6%

Tau2-bench Telecom*

95.6%

96.7%

Tau2-bench Retail

77.9%

81.1%

BrowseComp Long Context 128k

90.0%

90.0%

* Tau2-bench Telecom માટે, અમે GPT‑5.1ને તેનું પ્રદર્શન સુધારવા માટે ટૂંકો, સામાન્ય રીતે સહાયક પ્રોમ્પ્ટ આપ્યો હતો.