ડેવલપર્સ માટે GPT‑5.1 પરિચય
આજે અમે API પ્લેટફોર્મમાં GPT‑5.1 રિલીઝ કરી રહ્યા છીએ, GPT‑5 શ્રેણીનું આગળનું મોડલ, જે વિવિધ એજન્ટિક અને કોડિંગ કાર્યો માટે બુદ્ધિમત્તા અને ઝડપનું સંતુલન જાળવે છે. GPT‑5.1 કાર્યની જટિલતા મુજબ વિચારોમાં કેટલો સમય ખર્ચવો તે ગતિશીલ રીતે અનુકૂલિત કરે છે, જેથી સરળ દૈનિક કાર્યો પર મોડલ નોંધપાત્ર રીતે વધુ ઝડપી અને વધુ ટોકન-કાર્યક્ષમ બને છે. મોડલમાં ઝડપી પ્રતિભાવ માટે “no reasoning” મોડ પણ છે, જે એવા કાર્યો માટે છે જ્યાં ઊંડા વિચારોની જરૂર નથી, અને સાથે GPT‑5.1ની અત્યાધુનિક બુદ્ધિમત્તા જાળવી રાખે છે.
GPT‑5.1ને વધુ કાર્યક્ષમ બનાવવા માટે, અમે 24 કલાક સુધી કેશ જાળવણી સાથે વિસ્તૃત પ્રોમ્પ્ટ કેશિંગ રિલીઝ કરી રહ્યા છીએ, જે અનુગામી પ્રશ્નો માટે ઓછા ખર્ચે વધુ ઝડપી પ્રતિભાવો આપે છે. અમારા Priority Processing(નવી વિન્ડોમાં ખૂલે છે) ગ્રાહકોને GPT‑5ની તુલનામાં GPT‑5.1 સાથે નોંધપાત્ર રીતે ઝડપી પ્રદર્શન પણ અનુભવાશે.
કોડિંગ માટે, અમે Cursor, Cognition, Augment Code, Factory અને Warp જેવી સ્ટાર્ટઅપ્સ સાથે નજીકથી કામ કરીને GPT‑5.1ની કોડિંગ વ્યક્તિત્વ, steerability અને કોડ ગુણવત્તામાં સુધારો કર્યો છે. સામાન્ય રીતે, GPT‑5.1 કોડિંગ માટે વધુ સ્વાભાવિક લાગે છે અને કાર્યો પૂર્ણ કરતી વખતે યુઝર-ફેસિંગ અપડેટ્સ સાથે વધુ સંવાદાત્મક છે.
અંતમાં, અમે GPT‑5.1 સાથે બે નવા ટૂલ્સ રજૂ કરી રહ્યા છીએ: કોડ વધુ વિશ્વસનીય રીતે સંપાદિત કરવા માટે રચાયેલ apply_patch ટૂલ અને મોડલને shell commands ચલાવવા દેતો shell ટૂલ.
GPT‑5.1 GPT‑5 શ્રેણીમાં આગળની પ્રગતિ છે, અને ડેવલપર્સને વિશ્વસનીય એજન્ટિક workflows બનાવવા મદદ કરવા માટે અમે વધુ બુદ્ધિશાળી અને સક્ષમ મોડલોમાં રોકાણ ચાલુ રાખવાની યોજના રાખીએ છીએ.
GPT‑5.1ને વધુ ઝડપી બનાવવા માટે, અમે તેને વિચારવા માટે કેવી રીતે તાલીમ આપવામાં આવી તે રીતમાં મોટો ફેરફાર કર્યો છે. સીધાસાદા કાર્યો પર, GPT‑5.1 વિચારવામાં ઓછા ટોકન ખર્ચે છે, જેથી વધુ ચપળ પ્રોડક્ટ અનુભવ અને ઓછા ટોકન બિલ્સ શક્ય બને છે. એવા મુશ્કેલ કાર્યો પર જ્યાં વધારાના વિચારોની જરૂર હોય, GPT‑5.1 સતત પ્રયત્નશીલ રહે છે, વિકલ્પો શોધે છે અને વિશ્વસનીયતા વધારવા માટે પોતાનું કામ ચકાસે છે.
Balyasny Asset Management(નવી વિન્ડોમાં ખૂલે છે) એ કહ્યું કે GPT‑5.1 “અમારા સંપૂર્ણ ડાયનેમિક મૂલ્યાંકન સ્યુટમાં GPT‑4.1 અને GPT‑5 બંનેને પાછળ મૂકી ગયું, અને GPT‑5 કરતાં 2-3x વધુ ઝડપથી ચાલ્યું.” તેમણે એ પણ કહ્યું કે તેમના ટૂલ-હેવી રિઝનિંગ કાર્યોમાં GPT‑5.1 “સમાન અથવા વધુ સારી ગુણવત્તા પર અગ્રણી સ્પર્ધકો કરતાં લગભગ અડધા જેટલા ટોકન સતત ઉપયોગ કરતું હતું.” તે જ રીતે, AI ઇન્સ્યોરન્સ BPO Pace(નવી વિન્ડોમાં ખૂલે છે) એ પણ મોડલનું પરીક્ષણ કર્યું અને કહ્યું કે તેમના એજન્ટ્સ “GPT‑5.1 પર 50% વધુ ઝડપથી ચાલે છે અને અમારી evalsમાં GPT‑5 તથા અન્ય અગ્રણી મોડલોથી વધુ ચોકસાઈ આપે છે.”
GPT‑5.1 તેનો વિચાર સમય GPT‑5 કરતાં વધુ ગતિશીલ રીતે બદલાવે છે. ChatGPT કાર્યોના પ્રતિનિધિ વિતરણમાં, GPT‑5.1 સરળ કાર્યો પર ઘણું વધુ ઝડપી છે, ઊંચા રિઝનિંગ પ્રયાસ પર પણ.
ઉદાહરણ તરીકે, જ્યારે “show an npm command to list globally installed packages” પૂછવામાં આવ્યું, ત્યારે GPT‑5.1 10 સેકંડના બદલે 2 સેકંડમાં જવાબ આપે છે.
GPT-5 (મધ્યમ) ~250 ટોકન લે છે (~10 સેકંડ)
GPT-5.1 (મધ્યમ) ~50 ટોકન લે છે (~2 સેકંડ)
ડેવલપર્સ હવે reasoning_effort ને 'none' પર સેટ કરીને GPT‑5.1ને રિઝનિંગ વિના ઉપયોગ કરી શકે છે. આથી મોડલ latency-sensitive ઉપયોગ કિસ્સાઓ માટે non-reasoning મોડલની જેમ વર્તે છે, જેમાં GPT‑5.1ની ઊંચી બુદ્ધિમત્તા અને performant tool-callingનો વધારાનો લાભ મળે છે. 'minimal' રિઝનિંગ સાથેના GPT‑5ની તુલનામાં, no reasoning ધરાવતું GPT‑5.1 parallel tool callingમાં વધુ સારું છે, જે end-to-end કાર્ય પૂર્ણ કરવાની ઝડપ વધારે છે, તેમજ કોડિંગ કાર્યો, સૂચનાઓનું પાલન, અને search toolsના ઉપયોગમાં પણ વધુ સારું છે—અને અમારા API પ્લેટફોર્મમાં web search(નવી વિન્ડોમાં ખૂલે છે) ને સપોર્ટ કરે છે. Sierra(નવી વિન્ડોમાં ખૂલે છે) એ શેર કર્યું કે “no reasoning” મોડમાં GPT‑5.1એ તેમના વાસ્તવિક evalsમાં “GPT‑5 minimal reasoningની તુલનામાં low-latency tool calling performanceમાં 20% સુધારો” દર્શાવ્યો.
reasoning_effortમાં 'none' ને value તરીકે રજૂ કરવામાં આવતા, ડેવલપર્સ પાસે હવે તેમના ઉપયોગ માટે ઝડપ, ખર્ચ અને બુદ્ધિમત્તા વચ્ચેનું સંતુલન નિયંત્રિત કરવા વધુ લવચીકતા અને નિયંત્રણ છે. GPT‑5.1 મૂળભૂત રીતે 'none' પર સેટ છે, જે latency-sensitive workloads માટે આદર્શ છે. અમે ડેવલપર્સને વધુ જટિલ કાર્યો માટે 'low' અથવા 'medium' અને જ્યાં ઝડપ કરતાં બુદ્ધિમત્તા અને વિશ્વસનીયતા વધુ મહત્વની હોય ત્યાં 'high' પસંદ કરવાની ભલામણ કરીએ છીએ.
વિસ્તૃત કેશિંગ પ્રોમ્પ્ટને કેશમાં 24 કલાક સુધી સક્રિય રહેવા દેીને રિઝનિંગ કાર્યક્ષમતામાં સુધારો કરે છે, આજના થોડા મિનિટોના સપોર્ટની બદલે. લાંબી retention window સાથે, વધુ અનુગામી વિનંતીઓ cached context નો લાભ લઈ શકે છે—જેના પરિણામે ઓછી latency, ઓછો ખર્ચ અને multi-turn chat, coding sessions અથવા knowledge retrieval workflows જેવી લાંબા સમય સુધી ચાલતી ક્રિયાપ્રતિક્રિયાઓ માટે વધુ સરસ પ્રદર્શન મળે છે.
પ્રોમ્પ્ટ કેશ કિંમતમાં કોઈ ફેરફાર નથી, cached input tokens uncached tokens કરતાં 90% સસ્તા રહે છે, અને cache writes અથવા storage માટે કોઈ વધારાનો ચાર્જ નથી. GPT‑5.1 સાથે વિસ્તૃત કેશિંગ વાપરવા માટે, Responses અથવા Chat Completions API પર “prompt_cache_retention='24h'” પરિમાણ ઉમેરો. વધુ વિગતો માટે prompt caching docs(નવી વિન્ડોમાં ખૂલે છે) જુઓ.
GPT‑5.1, GPT‑5ની કોડિંગ ક્ષમતાઓ પર વધુ steerable coding personality, ઓછું વધુ વિચારવું, સુધારેલી કોડ ગુણવત્તા, tool callsની શ્રેણી દરમિયાન વધુ સારી user-targeted update messages (preambles), અને વધુ કાર્યક્ષમ frontend designs—ખાસ કરીને ઓછા રિઝનિંગ પ્રયત્ન પર—સાથે આગળ વધે છે.
ઝડપી કોડ સંપાદન જેવા સરળ કોડિંગ કાર્યો પર, GPT‑5.1ની વધુ ઝડપ પાછળ-આગળ iteration કરવું સરળ બનાવે છે. સરળ કાર્યો પર GPT‑5.1ની વધુ ઝડપ મુશ્કેલ કાર્યો પર પ્રદર્શન ઘટાડતી નથી. SWE-bench Verified પર, GPT‑5.1 GPT‑5 કરતાં પણ વધુ લાંબું કામ કરે છે અને 76.3% સુધી પહોંચે છે.
માં SWE-bench Verified, મોડલને કોડ રિપોઝિટરી અને ઇશ્યૂ વર્ણન આપવામાં આવે છે, અને ઇશ્યૂ ઉકેલવા માટે પેચ જનરેટ કરવો પડે છે. લેબલ્સ રિઝનિંગ પ્રયત્ન દર્શાવે છે. ચોકસાઈ તમામ 500 સમસ્યાઓમાં સરેરાશ લેવાય છે. બધા મોડલોએ JSON-આધારિત apply_patch ટૂલ સાથે હાર્નેસનો ઉપયોગ કર્યો.
અમને કેટલીક કોડિંગ કંપનીઓ પાસેથી GPT‑5.1 વિશે પ્રારંભિક પ્રતિસાદ મળ્યો. અહીં તેમની છાપો છે:
- Augment Code(નવી વિન્ડોમાં ખૂલે છે) એ GPT‑5.1ને “ઓછા બગાડાયેલા પગલાં સાથે વધુ વિચારપૂર્વકનું, વધુ કાર્યક્ષમ રિઝનિંગ ધરાવતું અને વધુ સારા task focusવાળું” કહ્યું અને તેઓ “વધુ ચોક્કસ ફેરફારો, વધુ સરળ পুল রিকোয়েস্ট, અને multi-file projectsમાં ઝડપી iteration” જોઈ રહ્યા છે.
- Cline(નવી વિન્ડોમાં ખૂલે છે) એ શેર કર્યું કે તેમના evalsમાં “GPT‑5.1એ અમારા diff editing benchmark પર 7% સુધારા સાથે SOTA હાંસલ કર્યું, જે જટિલ કોડિંગ કાર્યો માટે અસાધારણ વિશ્વસનીયતા દર્શાવે છે.”
- CodeRabbit(નવી વિન્ડોમાં ખૂલે છે) એ GPT‑5.1ને “PR reviews માટે તેની સૌથી પસંદગીનું મોડલ” કહ્યું.
- Cognition(નવી વિન્ડોમાં ખૂલે છે) એ કહ્યું કે GPT‑5.1 “તમે શું માંગો છો તે સમજવામાં અને તેને પૂર્ણ કરવા માટે તમારી સાથે કામ કરવામાં નોંધપાત્ર રીતે વધુ સારું છે.”
- Factory(નવી વિન્ડોમાં ખૂલે છે) એ કહ્યું કે “GPT‑5.1 નોંધપાત્ર રીતે વધુ ચપળ પ્રતિભાવો આપે છે અને પોતાના રિઝનિંગની ઊંડાઈને કાર્ય પ્રમાણે અનુકૂલિત કરે છે, વધુ વિચારવાનું ઘટાડે છે અને એકંદર ડેવલપર અનુભવ સુધારે છે.”
- Warp(નવી વિન્ડોમાં ખૂલે છે) નવા યુઝર્સ માટે GPT‑5.1ને ડિફૉલ્ટ બનાવી રહ્યું છે, એમ કહીને કે તે “GPT‑5 શ્રેણી દ્વારા રજૂ કરાયેલા પ્રભાવશાળી બુદ્ધિમત્તા સુધારાઓ પર આધાર રાખે છે, સાથે ઘણી વધુ પ્રતિભાવક્ષમ મોડલ છે.”
“GPT 5.1 ફક્ત એક વધુ LLM નથી—તે ખરેખર એજન્ટિક છે, મેં ક્યારેય પરીક્ષણ કરેલું સૌથી સ્વાભાવિક રીતે સ્વાયત્ત મોડલ. તે તમારી જેમ લખે છે, તમારી જેમ કોડ કરે છે, જટિલ સૂચનાઓને સહેલાઈથી અનુસરે છે, અને ફ્રન્ટ-એન્ડ કાર્યોમાં શ્રેષ્ઠ છે, તમારા હાલના કોડબેઝમાં સરસ રીતે ફિટ થાય છે. તમે Responses APIમાં ખરેખર તેની સંપૂર્ણ ક્ષમતા અનલૉક કરી શકો છો અને અમને તેને અમારી IDEમાં ઓફર કરતાં ઉત્સાહ છે.”
અમે Responses APIમાં ડેવલપર્સને મોડલમાંથી વધુ મેળવવામાં મદદ કરવા GPT‑5.1 સાથે બે નવા ટૂલ્સ રજૂ કરી રહ્યા છીએ: JSON escapingની જરૂર વિના કોડ સંપાદનોને વધુ વિશ્વસનીય બનાવવા માટે freeform apply_patch ટૂલ, અને મોડલને તમારી સ્થાનિક મશીન પર ચલાવવા માટે commands લખવા દેતો shell ટૂલ.
freeform apply_patch ટૂલ GPT‑5.1ને structured diffs નો ઉપયોગ કરીને codebaseમાં ફાઇલો બનાવવાની, અપડેટ કરવાની અને કાઢી નાખવાની પરવાનગી આપે છે. ફક્ત સંપાદન સૂચવવાની બદલે, મોડલ patch operations બહાર પાડે છે જેને એપ્લિકેશન લાગુ કરે છે અને જેના વિશે પાછું અહેવાલ આપે છે, જેથી પુનરાવર્તિત, બહુપગલાંવાળા code editing workflows શક્ય બને છે.
Responses APIમાં apply_patch ટૂલ વાપરવા માટે, tools arrayમાં તેને "tools": [{“type”: “apply_patch”}] સાથે સામેલ કરો અને અથવા તો તમારા inputમાં file content સામેલ કરો અથવા મોડલને તમારા file system સાથે ઇન્ટરેક્ટ કરવા માટે ટૂલ્સ આપો. મોડલ ફાઇલો બનાવવી, અપડેટ કરવી અથવા કાઢી નાખવા માટે apply_patch_call items જનરેટ કરશે, જેમાં એવા diffs હશે જેને તમે તમારા file system પર લાગુ કરશો. apply_patch ટૂલ સાથે કેવી રીતે ઇન્ટિગ્રેટ કરવું તેની વધુ માહિતી માટે, અમારી developer documentation(નવી વિન્ડોમાં ખૂલે છે) જુઓ.
shell ટૂલ મોડલને નિયંત્રિત command-line interface દ્વારા સ્થાનિક કમ્પ્યુટર સાથે ઇન્ટરેક્ટ કરવાની મંજૂરી આપે છે. મોડલ shell commands સૂચવે છે; ડેવલપરની integration તેમને ચલાવે છે અને outputs પરત આપે છે. આ એક સરળ plan-execute loop બનાવે છે જે મોડલોને સિસ્ટમ તપાસવા, utilities ચલાવવા અને તેઓ કાર્ય પૂર્ણ કરી શકે ત્યાં સુધી ડેટા એકત્ર કરવાની સગવડ આપે છે.
Responses APIમાં shell ટૂલ વાપરવા માટે, ડેવલપર્સ tools arrayમાં તેને "tools": [{“type”: “shell”}] સાથે સામેલ કરી શકે છે. API "shell_call" items જનરેટ કરશે જેમાં ચલાવવાના shell commands સામેલ હશે. ડેવલપર્સ સ્થાનિક environmentમાં commands ચલાવે છે અને પછીની API requestમાં "shell_call_output" itemમાં execution results પાછા મોકલે છે. વધુ માટે અમારી developer documentation(નવી વિન્ડોમાં ખૂલે છે) જુઓ.
GPT‑5.1 અને gpt-5.1-chat-latest APIમાં તમામ paid tiers પર ડેવલપર્સ માટે ઉપલબ્ધ છે. Pricing and rate limits(નવી વિન્ડોમાં ખૂલે છે) GPT‑5 જેવી જ છે. અમે APIમાં gpt-5.1-codex અને gpt-5.1-codex-mini પણ રિલીઝ કરી રહ્યા છીએ. જ્યારે GPT‑5.1 મોટાભાગના કોડિંગ કાર્યોમાં શ્રેષ્ઠ છે, ત્યારે gpt-5.1-codex મોડલો Codex અથવા Codex જેવા harnessesમાં લાંબા સમય સુધી ચાલતા એજન્ટિક કોડિંગ કાર્યો માટે ઑપ્ટિમાઇઝ થયેલા છે.
ડેવલપર્સ અમારી GPT‑5.1 developer documentation(નવી વિન્ડોમાં ખૂલે છે) અને model prompting guide(નવી વિન્ડોમાં ખૂલે છે) નો ઉપયોગ કરીને બનાવવાનું શરૂ કરી શકે છે. હાલમાં અમે APIમાં GPT‑5ને deprecate કરવાની યોજના નથી રાખતા અને જો અને જ્યારે અમે એવું કરવાનો નિર્ણય લઈએ ત્યારે ડેવલપર્સને પૂર્વ સૂચના આપશું.
અમે વાસ્તવિક એજન્ટિક અને કોડિંગ કાર્ય માટે સૌથી સક્ષમ અને વિશ્વસનીય મોડલોને પુનરાવર્તિત રીતે તૈનાત કરવા પ્રતિબદ્ધ છીએ—એવા મોડલો કે જે કાર્યક્ષમ રીતે વિચારે, ઝડપથી iteration કરે, અને જટિલ કાર્યો હેન્ડલ કરે, જ્યારે ડેવલપર્સને flowમાં જ રાખે. અનુકૂલક રિઝનિંગ, મજબૂત કોડિંગ પ્રદર્શન, વધુ સ્પષ્ટ user-facing updates, અને apply_patch અને shell જેવા નવા ટૂલ્સ સાથે, GPT‑5.1 તમને ઓછા અવરોધ સાથે નિર્માણ કરવામાં મદદ કરવા માટે રચાયેલ છે. અને અમે અહીં ભારે રોકાણ ચાલુ રાખી રહ્યા છીએ: આવતા અઠવાડિયા અને મહિનાઓમાં તમે વધુ સક્ષમ એજન્ટિક અને કોડિંગ મોડલોની અપેક્ષા રાખી શકો છો.
મૂલ્યાંકન | GPT‑5.1 (high) | GPT‑5 (high) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Tau2-bench Telecom માટે, અમે GPT‑5.1ને તેનું પ્રદર્શન સુધારવા માટે ટૂંકો, સામાન્ય રીતે સહાયક પ્રોમ્પ્ટ આપ્યો હતો.


