GPT‑5.1 á thabhairt isteach d’fhorbróirí
Inniu táimid ag scaoileadh GPT‑5.1 san ardán API, an chéad tsamhail eile sa tsraith GPT‑5 a chothromaíonn intleacht agus luas do raon leathan tascanna gníomhacha agus códaithe. Oiriúnaíonn GPT‑5.1 go dinimiciúil an méid ama a chaitheann sé ag smaoineamh bunaithe ar chastacht an taisc, rud a fhágann go mbíonn an tsamhail i bhfad níos tapúla agus níos éifeachtúla ó thaobh téacschomharthaí de ar thascanna laethúla níos simplí. Tá mód “gan réasúnaíocht” sa tsamhail freisin chun freagairt níos tapúla ar thascanna nach dteastaíonn smaointeoireacht dhomhain uathu, agus intleacht teorainn GPT‑5.1 á coinneáil aici.
Chun GPT‑5.1 a dhéanamh níos éifeachtúla fós, táimid ag scaoileadh taisceadh leide fairsingithe le coinneáil taisce suas le 24 uair an chloig, rud a chuireann freagraí níos tapúla ar fáil do cheisteanna leantacha ar chostas níos ísle. Gheobhaidh ár gcustaiméirí Priority Processing(osclaíonn i bhfuinneog nua) feidhmíocht i bhfad níos tapúla freisin le GPT‑5.1 ná le GPT‑5.
Maidir le códú, d’oibríomar go dlúth le gnólachtaí nuathionscanta cosúil le Cursor, Cognition, Augment Code, Factory, agus Warp chun pearsantacht chódaithe, stiúrthacht, agus cáilíocht chóid GPT‑5.1 a fheabhsú. Go ginearálta, mothaíonn GPT‑5.1 níos iomasacha le húsáid don chódú agus níos cumarsáidí le nuashonruithe dírithe ar úsáideoirí agus é ag cur tascanna i gcrích.
Ar deireadh, tá dhá uirlis nua á dtabhairt isteach againn le GPT‑5.1: uirlis apply_patch atá deartha chun cód a chur in eagar níos iontaofa agus uirlis shell chun ligean don tsamhail orduithe shell a rith.
Is é GPT‑5.1 an chéad dul chun cinn eile sa tsraith GPT‑5, agus tá sé beartaithe againn leanúint d’infheistiú i samhlacha níos cliste agus níos cumasaí chun cabhrú le forbróirí sreafaí oibre gníomhacha iontaofa a thógáil.
Chun GPT‑5.1 a dhéanamh níos tapúla, rinneamar ollchóiriú ar an mbealach ar chuir muid oiliúint air chun smaoineamh. Ar thascanna simplí, caitheann GPT‑5.1 níos lú téacschomharthaí ag smaoineamh, rud a chuireann eispéiris táirge níos pras agus billí téacschomharthaí níos ísle ar fáil. Ar thascanna deacra a éilíonn smaointeoireacht bhreise, fanann GPT‑5.1 seasmhach, ag fiosrú roghanna agus ag seiceáil a chuid oibre chun iontaofacht a uasmhéadú.
Balyasny Asset Management(osclaíonn i bhfuinneog nua) dúirt go ndearna GPT‑5.1 "níos fearr ná GPT‑4.1 agus GPT‑5 araon inár sraith iomlán meastóireachta dhinimiciúil, agus é ag rith 2-3x níos tapúla ná GPT‑5." Dúirt siad freisin gur “úsáid GPT‑5.1 go seasta thart ar leath an oiread téacschomharthaí agus príomh-iomaitheoirí ar cháilíocht chomhchosúil nó níos fearr” ar a dtascanna réasúnaíochta lán d’uirlisí. Mar an gcéanna, rinne BPO árachais AI Pace(osclaíonn i bhfuinneog nua) an tsamhail a thástáil freisin agus dúirt siad go ritheann a ngníomhairí "50% níos tapúla ar GPT‑5.1 agus iad ag sárú chruinneas GPT‑5 agus samhlacha ceannródaíocha eile thar ár meastóireachtaí."
Athraíonn GPT‑5.1 a chuid ama smaointeoireachta ar bhealach níos dinimiciúla ná GPT‑5. Ar dháileadh ionadaíoch de thascanna ChatGPT, bíonn GPT‑5.1 i bhfad níos tapúla ar na tascanna níos éasca, fiú le hardiarracht réasúnaíochta.
Mar shampla, nuair a iarrtar air "taispeáin ordú npm chun pacáistí suiteáilte go domhanda a liostú", freagraíonn GPT‑5.1 i 2 shoicind in ionad 10 soicind.
Tógann GPT-5 (Meán) ~250 téacschomhartha (~10 soicind)
Tógann GPT-5.1 (Meán) ~50 téacschomhartha (~2 shoicind)
Is féidir le forbróirí GPT‑5.1 a úsáid anois gan réasúnaíocht trí reasoning_effort a shocrú ar 'none'. Cuireann sé seo ar an tsamhail iompú cosúil le samhail neamh-réasúnaíochta do chásanna úsáide atá íogair ó thaobh moille de, le hard-intleacht GPT‑5.1 agus buntáiste breise glao uirlisí ardfheidhmíochta. I gcoibhneas le GPT‑5 le réasúnaíocht 'minimal', tá GPT‑5.1 gan réasúnaíocht níos fearr ag glao comhthreomhar uirlisí (rud a mhéadaíonn luas chríochnú tasc ó cheann go ceann ann féin), tascanna códaithe, treoracha a leanúint, agus uirlisí cuardaigh a úsáid—agus tacaíonn sé le cuardach gréasáin(osclaíonn i bhfuinneog nua) inár n-ardán API. Roinn Sierra(osclaíonn i bhfuinneog nua) gur léirigh GPT‑5.1 sa mhód “gan réasúnaíocht” “feabhas 20% ar fheidhmíocht glaonna uirlisí íseal-mhoille i gcomparáid le réasúnaíocht íosta GPT‑5” ina measúnuithe fíorshaoil.
Le tabhairt isteach 'none' mar luach in reasoning_effort, tá fiú níos mó solúbthachta agus rialaithe anois ag forbróirí ar an gcothromaíocht idir luas, costas, agus intleacht dá gcás úsáide. Is é 'none' an réamhshocrú do GPT‑5.1, rud atá oiriúnach d’ualaí oibre atá íogair ó thaobh moille de. Molaimid d’fhorbróirí 'low' nó 'medium' a roghnú do thascanna níos casta agus 'high' nuair a bhíonn intleacht agus iontaofacht níos tábhachtaí ná luas.
Feabhsaíonn taisceadh fairsingithe éifeachtúlacht na réasúnaíochta trí ligean do leideanna fanacht gníomhach sa taisce ar feadh suas le 24 uair an chloig, seachas an cúpla nóiméad a dtacaítear leo inniu. Le fuinneog coinneála níos faide, is féidir le níos mó iarratas leantach leas a bhaint as comhthéacs taiscthe—rud a eascraíonn in aga moille níos ísle, costas laghdaithe, agus feidhmíocht níos rianúla d’idirghníomhaíochtaí fadreatha mar chomhrá ilchasta, seisiúin chódaithe, nó sreafaí oibre aisghabhála eolais.
Fanann praghsáil taisce leide gan athrú, le téacschomharthaí ionchuir taiscthe 90% níos saoire ná téacschomharthaí neamhthaiscthe, agus gan aon táille bhreise ar scríobhanna nó stóráil taisce. Chun taisceadh fairsingithe a úsáid le GPT‑5.1, cuir an paraiméadar “prompt_cache_retention='24h'” leis an API Responses nó Chat Completions. Féach na doiciméid faoi thaisceadh leide(osclaíonn i bhfuinneog nua) le haghaidh tuilleadh sonraí.
Tógann GPT‑5.1 ar chumais chódaithe GPT‑5 le pearsantacht chódaithe níos stiúrtha, níos lú ró-smaointeoireachta, cáilíocht chóid fheabhsaithe, teachtaireachtaí nuashonraithe níos fearr dírithe ar an úsáideoir (réamhráite) le linn sraitheanna de ghlaonna uirlisí, agus dearaí tosaigh níos feidhmiúla—go háirithe le hiarracht íseal réasúnaíochta.
Ar thascanna códaithe níos simplí cosúil le heagarthóireachtaí gasta cóid, déanann luasanna níos tapúla GPT‑5.1 é níos éasca atriall siar agus aniar a dhéanamh. Ní chuireann luasanna níos tapúla GPT‑5.1 ar thascanna simplí isteach ar fheidhmíocht ar thascanna deacra. Ar SWE-bench Verified, oibríonn GPT‑5.1 níos faide fós ná GPT‑5 agus sroicheann sé 76.3%.
I SWE-bench Verified, tugtar stór cód agus cur síos ar eisiúint do shamhail, agus caithfidh sí paiste a ghiniúint chun an eisiúint a réiteach. Léiríonn na lipéid an iarracht réasúnaíochta. Déantar an chruinneas a mheánú thar na 500 fadhb ar fad. Bhain gach samhail leas as úim le huirlis apply_patch bunaithe ar JSON.
Fuaireamar aiseolas luath ar GPT‑5.1 ó líon beag cuideachtaí códaithe. Seo a dtuairimí:
- Augment Code(osclaíonn i bhfuinneog nua) thug GPT‑5.1 “níos diongbháilte le níos lú gníomhartha amú, réasúnaíocht níos éifeachtúla, agus fócas níos fearr ar thascanna” air agus tá siad ag feiceáil “athruithe níos cruinne, iarratais ar tharraingt níos míne, agus atriall níos tapúla thar thionscadail ilchomhaid.”
- Cline(osclaíonn i bhfuinneog nua) roinn siad gur “bhain GPT‑5.1 SOTA amach ar ár mbinse tomhais eagarthóireachta diff le feabhas 7%, rud a léiríonn iontaofacht eisceachtúil do thascanna casta códaithe.”
- CodeRabbit(osclaíonn i bhfuinneog nua) thug GPT‑5.1 mar a “phríomhshamhail rogha d’athbhreithnithe PR.”
- Cognition(osclaíonn i bhfuinneog nua) dúirt gur “i bhfad níos fearr atá GPT‑5.1 ag tuiscint cad atá á iarraidh agat agus ag obair leat chun é a chur i gcrích.”
- Factory(osclaíonn i bhfuinneog nua) dúirt “Soláthraíonn GPT‑5.1 freagraí i bhfad níos sciobtha agus oiriúnaíonn sé doimhneacht a réasúnaíochta don tasc, ag laghdú ró-smaointeoireachta agus ag feabhsú eispéireas iomlán an fhorbróra.”
- Warp(osclaíonn i bhfuinneog nua) tá GPT‑5.1 á dhéanamh mar an réamhshocrú d’úsáideoirí nua, á rá go “dtógann sé ar na gnóthachain iontacha intleachta a thug an tsraith GPT‑5 isteach, agus ag an am céanna gur samhail i bhfad níos freagrúla é.”
“Ní gnáth-LLM eile é GPT 5.1—tá sé fíor-ghníomhach, an tsamhail is nádúrtha féinrialaithe a thástáil mé riamh. Scríobhann sé cosúil leat, códálann sé cosúil leat, leanann sé treoracha casta gan dua, agus sáraíonn sé i dtascanna tosaigh, ag luí go néata isteach i do chódchóras reatha. Is féidir leat a lánchumas a dhíghlasáil san API Responses agus táimid ar bís é a thairiscint inár IDE.”
Tá dhá uirlis nua á dtabhairt isteach againn le GPT‑5.1 chun cabhrú le forbróirí an leas is fearr a bhaint as an tsamhail san API Responses: uirlis shaorfhoirme apply_patch tool chun eagarthóireachtaí cóid a dhéanamh níos iontaofa fós gan gá le JSON escaping, agus uirlis shell tool a ligeann don tsamhail orduithe a scríobh le rith ar do mheaisín áitiúil.
Ligeann an uirlis shaorfhoirme apply_patch do GPT‑5.1 comhaid a chruthú, a nuashonrú, agus a scriosadh i gcódchóras ag úsáid diffanna struchtúrtha. In áit eagarthóireachtaí a mholadh amháin, astaíonn an tsamhail oibríochtaí paiste a chuireann feidhmchlár i bhfeidhm agus a thuairiscíonn ar ais fúthu, rud a chumasaíonn sreafaí oibre atriallacha ilchéime eagarthóireachta cóid.
Chun an uirlis apply_patch a úsáid san API Responses, cuir í san eagar tools le "tools": [{“type”: “apply_patch”}] agus cuir ábhar comhaid san ionchur agat nó tabhair uirlisí don tsamhail chun idirghníomhú le do chóras comhad. Ginfidh an tsamhail míreanna apply_patch_call chun comhaid a chruthú, a nuashonrú, nó a scriosadh a bhfuil diffanna iontu a chuireann tú i bhfeidhm ar do chóras comhad. Le haghaidh tuilleadh eolais ar conas comhtháthú leis an uirlis apply_patch, féach ar ár cáipéisíocht d’fhorbróirí(osclaíonn i bhfuinneog nua).
Ligeann an uirlis shell don tsamhail idirghníomhú le ríomhaire áitiúil trí chomhéadan líne ordaithe rialaithe. Molann an tsamhail orduithe shell; cuireann comhtháthú forbróra i bhfeidhm iad agus filleann sé na haschuir. Cruthaíonn sé seo lúb shimplí plean-forghníomhaithe a ligeann do shamhlacha an córas a iniúchadh, fóntais a rith, agus sonraí a bhailiú go dtí go mbeidh siad in ann an tasc a chríochnú.
Chun an uirlis shell a úsáid san API Responses, is féidir le forbróirí í a chur san eagar tools le "tools": [{“type”: “shell”}]. Ginfidh an API míreanna "shell_call" a chuimsíonn na horduithe shell le forghníomhú. Cuireann forbróirí na horduithe i bhfeidhm sa timpeallacht áitiúil agus cuireann siad torthaí an fhorghníomhaithe ar ais sa mhír "shell_call_output" sa chéad iarratas API eile. Foghlaim tuilleadh inár cáipéisíocht d’fhorbróirí(osclaíonn i bhfuinneog nua).
Tá GPT‑5.1 agus gpt-5.1-chat-latest ar fáil d’fhorbróirí ar gach leibhéal íoctha san API. Tá praghsáil agus teorainneacha ráta(osclaíonn i bhfuinneog nua) mar a chéile le GPT‑5. Táimid ag scaoileadh gpt-5.1-codex agus gpt-5.1-codex-mini san API freisin. Cé go sáraíonn GPT‑5.1 i bhformhór na dtascanna códaithe, tá samhlacha gpt-5.1-codex optamaithe do thascanna códaithe fada, gníomhacha in Codex nó i gcreataí cosúil le Codex.
Is féidir le forbróirí tosú ag tógáil ag úsáid ár gcáipéisíocht d’fhorbróirí(osclaíonn i bhfuinneog nua) GPT‑5.1 agus ár dtreoir leideanna samhla(osclaíonn i bhfuinneog nua). Níl sé beartaithe againn faoi láthair GPT‑5 a dhímheas san API agus tabharfaimid fógra roimh ré d’fhorbróirí má shocraímid é sin a dhéanamh am ar bith.
Táimid tiomanta na samhlacha is cumasaí agus is iontaofa a imscaradh go céimnitheach do obair fhíor-ghníomhach agus códaithe—samhlacha a smaoiníonn go héifeachtúil, a dhéanann atriall go tapa, agus a láimhseálann tascanna casta agus forbróirí á gcoinneáil sa sreabhadh. Le réasúnaíocht oiriúnaitheach, feidhmíocht chódaithe níos láidre, nuashonruithe níos soiléire dírithe ar úsáideoirí, agus uirlisí nua cosúil le apply_patch agus shell, tá GPT‑5.1 deartha chun cabhrú leat tógáil le níos lú frithchuimilte. Agus táimid ag leanúint de bheith ag infheistiú go mór anseo: is féidir leat a bheith ag súil le samhlacha gníomhacha agus códaithe níos cumasaí sna seachtainí agus sna míonna amach romhainn.
Meastóireacht | GPT‑5.1 (ard) | GPT‑5 (ard) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Do Tau2-bench Telecom, thugamar leid ghearr, chabhrach ghinearálta do GPT‑5.1 chun a fheidhmíocht a fheabhsú.


