Nintroduċu GPT‑5.1 għall-iżviluppaturi
Illum qed noħorġu GPT‑5.1 fil-pjattaforma tal-API, il-mudell li jmiss fis-serje GPT‑5 li jibbilanċja l-intelliġenza u l-veloċità għal firxa wiesgħa ta’ kompiti aġentiċi u ta’ kodifikazzjoni. GPT‑5.1 jadatta b’mod dinamiku kemm iqatta’ ħin jaħseb skont il-kumplessità tal-kompitu, u dan jagħmel il-mudell ferm aktar veloċi u aktar effiċjenti fit-tokens fuq kompiti aktar sempliċi ta’ kuljum. Il-mudell għandu wkoll modalità “mingħajr raġunament” biex iwieġeb aktar malajr fuq kompiti li ma jeħtiġux ħsieb profond, filwaqt li jżomm l-intelliġenza fruntiera ta’ GPT‑5.1.
Biex nagħmlu GPT‑5.1 saħansitra aktar effiċjenti, qed noħorġu prompt caching estiż sa 24 siegħa ta’ żamma fil-cache, li jwassal għal tweġibiet aktar veloċi għal mistoqsijiet ta’ segwitu bi spiża inqas. Il-klijenti tagħna ta’ Priority Processing(jinfetaħ f’tieqa ġdida) se jesperjenzaw ukoll prestazzjoni notevolment aktar mgħaġġla b’GPT‑5.1 meta mqabbel ma’ GPT‑5.
Fil-kodifikazzjoni, ħdimna mill-qrib ma’ startups bħal Cursor, Cognition, Augment Code, Factory, u Warp biex intejbu l-personalità ta’ kodifikazzjoni ta’ GPT‑5.1, l-isteerabbiltà, u l-kwalità tal-kodiċi. B’mod ġenerali, GPT‑5.1 jinħass aktar intuwittiv għall-użu fil-kodifikazzjoni u aktar komunikattiv b’aġġornamenti għall-utent hekk kif itemm il-kompiti.
Fl-aħħar, qed nintroduċu żewġ għodod ġodda ma’ GPT‑5.1: għodda apply_patch maħsuba biex teditja l-kodiċi b’mod aktar affidabbli u għodda shell li tħalli l-mudell iħaddem kmandi tas-shell.
GPT‑5.1 huwa l-avvanz li jmiss fis-serje GPT‑5, u qed nippjanaw li nkomplu ninvestu f’mudelli aktar intelliġenti u aktar kapaċi biex ngħinu lill-iżviluppaturi jibnu workflows aġentiċi affidabbli.
Biex nagħmlu GPT‑5.1 aktar veloċi, għamilna bidla kbira fil-mod kif ħarriġnieh biex jaħseb. Fuq kompiti diretti, GPT‑5.1 jonfoq inqas tokens fil-ħsieb, u dan jippermetti esperjenzi tal-prodott aktar pronti u kontijiet tat-tokens aktar baxxi. Fuq kompiti diffiċli li jeħtieġu ħsieb żejjed, GPT‑5.1 jibqa’ persistenti, jesplora l-għażliet u jiċċekkja xogħlu biex jimmassimizza l-affidabbiltà.
Balyasny Asset Management(jinfetaħ f’tieqa ġdida) qalet li GPT‑5.1 “qabeż kemm lil GPT‑4.1 kif ukoll lil GPT‑5 fil-ġabra sħiħa tagħna ta’ evalwazzjoni dinamika, filwaqt li kien qed jaħdem 2-3 darbiet aktar malajr minn GPT‑5.” Qalu wkoll li fil-kompiti tagħhom ta’ raġunament b’ħafna għodod, GPT‑5.1 “b’mod konsistenti uża madwar nofs in-numru ta’ tokens tal-kompetituri ewlenin b’kwalità simili jew aħjar.” Bl-istess mod, l-AI insurance BPO Pace(jinfetaħ f’tieqa ġdida) ittestjat ukoll il-mudell u qalet li l-aġenti tagħha jaħdmu “50% aktar malajr fuq GPT‑5.1 filwaqt li jaqbżu l-eżattezza ta’ GPT‑5 u mudelli ewlenin oħra fl-evals tagħna.”
GPT‑5.1 ivarja l-ħin tal-ħsieb tiegħu b’mod aktar dinamiku minn GPT‑5. Fuq distribuzzjoni rappreżentattiva ta’ kompiti ta’ ChatGPT, GPT‑5.1 huwa ħafna aktar veloċi fil-kompiti aktar faċli, anke b’sforz għoli ta’ raġunament.
Bħala eżempju, meta jintalab “uri kmand npm biex jelenka pakketti installati globalment”, GPT‑5.1 iwieġeb f’2 sekondi minflok f’10 sekondi.
GPT-5 (Medju) jieħu madwar 250 token (madwar 10 sekondi)
GPT-5.1 (Medju) jieħu madwar 50 token (madwar 2 sekondi)
L-iżviluppaturi issa jistgħu jużaw GPT‑5.1 mingħajr raġunament billi jissettjaw reasoning_effort għal 'none'. Dan jagħmel il-mudell iġib ruħu bħal mudell mingħajr raġunament għal każijiet ta’ użu sensittivi għall-latenza, bl-intelliġenza għolja ta’ GPT‑5.1 u l-vantaġġ miżjud ta’ tool-calling b’prestazzjoni tajba. Relattivament għal GPT‑5 b’raġunament 'minimal', GPT‑5.1 mingħajr raġunament huwa aħjar fil-parallel tool calling (li minnu nnifsu jżid il-veloċità tat-tlestija end-to-end tal-kompiti), fil-kompiti ta’ kodifikazzjoni, fis-segwitu tal-istruzzjonijiet, u fl-użu tal-għodod tat-tiftix—u jappoġġa web search(jinfetaħ f’tieqa ġdida) fil-pjattaforma tal-API tagħna. Sierra(jinfetaħ f’tieqa ġdida) qasmet li GPT‑5.1 fil-modalità “mingħajr raġunament” wera “titjib ta’ 20% fil-prestazzjoni tat-tool calling b’latenza baxxa meta mqabbel ma’ GPT‑5 minimal reasoning” fl-evals tagħhom fid-dinja reali.
Bl-introduzzjoni ta’ 'none' bħala valur f’reasoning_effort, l-iżviluppaturi issa għandhom saħansitra aktar flessibbiltà u kontroll fuq il-bilanċ bejn il-veloċità, l-ispiża, u l-intelliġenza għall-każ ta’ użu tagħhom. GPT‑5.1 awtomatikament juża 'none', li huwa ideali għal workloads sensittivi għall-latenza. Nirrakkomandaw li l-iżviluppaturi jagħżlu 'low' jew 'medium' għal kompiti ta’ kumplessità ogħla u 'high' meta l-intelliġenza u l-affidabbiltà jkunu aktar importanti mill-veloċità.
Il-caching estiż itejjeb l-effiċjenza tar-raġunament billi jippermetti li prompts jibqgħu attivi fil-cache sa 24 siegħa, minflok il-ftit minuti appoġġati llum. B’tieqa ta’ żamma itwal, aktar talbiet ta’ segwitu jistgħu jieħdu vantaġġ minn kuntest fil-cache—u b’hekk jinkisbu latenza aktar baxxa, spiża mnaqqsa, u prestazzjoni aktar bla xkiel għal interazzjonijiet li jdumu fit-tul bħal chat b’ħafna dawriet, sessjonijiet ta’ kodifikazzjoni, jew workflows ta’ rkupru tal-għarfien.
Il-prezzijiet tal-prompt cache jibqgħu l-istess, b’tokens ta’ input fil-cache 90% orħos minn tokens mhux fil-cache, u mingħajr ħlas addizzjonali għal kitbiet fil-cache jew ħażna. Biex tuża caching estiż ma’ GPT‑5.1, żid il-parametru “prompt_cache_retention='24h'” fuq ir-Responses jew l-API tat-tlestija taċ-chats. Ara d-dokumentazzjoni tal-prompt caching(jinfetaħ f’tieqa ġdida) għal aktar dettall.
GPT‑5.1 jibni fuq il-kapaċitajiet ta’ kodifikazzjoni ta’ GPT‑5 b’personalità ta’ kodifikazzjoni aktar steerable, inqas overthinking, kwalità tal-kodiċi mtejba, messaġġi ta’ aġġornament aħjar immirati lejn l-utent (preambles) waqt sekwenzi ta’ sejħiet ta’ għodod, u disinji frontend aktar funzjonali—speċjalment b’sforz baxx ta’ raġunament.
Fuq kompiti ta’ kodifikazzjoni aktar sempliċi bħal edits ta’ kodiċi ta’ malajr, il-veloċitajiet aktar mgħaġġla ta’ GPT‑5.1 jagħmluha aktar faċli biex terġa’ titerra ’l quddiem u lura. Il-veloċitajiet aktar mgħaġġla ta’ GPT‑5.1 fuq kompiti sempliċi ma jnaqqsux il-prestazzjoni fuq kompiti diffiċli. Fuq SWE-bench Verified, GPT‑5.1 jaħdem saħansitra aktar fit-tul minn GPT‑5 u jilħaq 76.3%.
F’SWE-bench Verified, mudell jingħata repożitorju tal-kodiċi u deskrizzjoni tal-issue, u jrid jiġġenera patch biex isolvi l-issue. It-tikketti jindikaw l-isforz tar-raġunament. L-eżattezza hija medja fuq il-500 problema kollha. Il-mudelli kollha użaw harness b’għodda apply_patch ibbażata fuq JSON.
Ksibna feedback bikri dwar GPT‑5.1 minn numru żgħir ta’ kumpaniji tal-kodifikazzjoni. Hawn huma l-impressjonijiet tagħhom:
- Augment Code(jinfetaħ f’tieqa ġdida) sejħet GPT‑5.1 “aktar deliberat b’inqas azzjonijiet moħlija, raġunament aktar effiċjenti, u fokus aħjar fuq il-kompitu” u qed jaraw “bidliet aktar preċiżi, talbiet ta' pull aktar bla xkiel, u iterazzjoni aktar mgħaġġla fuq proġetti b’ħafna fajls.”
- Cline(jinfetaħ f’tieqa ġdida) qasmet li fl-evals tagħhom, “GPT‑5.1 kiseb SOTA fuq il-benchmark tagħna tad-diff editing b’titjib ta’ 7%, u wera affidabbiltà eċċezzjonali għal kompiti kumplessi ta’ kodifikazzjoni.”
- CodeRabbit(jinfetaħ f’tieqa ġdida) sejħet GPT‑5.1 il-“mudell ewlieni preferut tagħha għal reviżjonijiet tal-PR.”
- Cognition(jinfetaħ f’tieqa ġdida) qalet li GPT‑5.1 huwa “notevolment aħjar biex jifhem x’int titlob u jaħdem miegħek biex jitwettaq.”
- Factory(jinfetaħ f’tieqa ġdida) qalet “GPT‑5.1 jagħti tweġibiet notevolment aktar pronti u jadatta l-fond tar-raġunament tiegħu għall-kompitu, u jnaqqas l-overthinking u jtejjeb l-esperjenza ġenerali tal-iżviluppatur.”
- Warp(jinfetaħ f’tieqa ġdida) qed tagħmel lil GPT‑5.1 l-għażla awtomatika għall-utenti ġodda, u tgħid li “jibni fuq il-qligħ impressjonanti fl-intelliġenza li introduċiet is-serje GPT‑5, filwaqt li huwa mudell ferm aktar reattiv.”
“GPT 5.1 mhuwiex sempliċement LLM ieħor—hu tassew aġentiku, l-aktar mudell awtonomu b’mod naturali li qatt ittestjajt. Jikteb bħalek, jikkodifika bħalek, isegwi bla sforz istruzzjonijiet kumplessi, u jeċċella f’kompiti tal-front-end, u joqgħod perfett fil-codebase eżistenti tiegħek. Tista’ tassew tiftaħ il-potenzjal sħiħ tiegħu fir-Responses API u aħna eċċitati li noffruh fl-IDE tagħna.”
Qed nintroduċu żewġ għodod ġodda ma’ GPT‑5.1 biex ngħinu lill-iżviluppaturi jieħdu l-aħjar mill-mudell fir-Responses API: għodda freeform apply_patch tool biex tagħmel edits fil-kodiċi saħansitra aktar affidabbli mingħajr il-ħtieġa ta’ JSON escaping, u shell tool li tħalli l-mudell jikteb kmandi biex jitħaddmu fuq il-magna lokali tiegħek.
L-għodda freeform apply_patch tippermetti lil GPT‑5.1 joħloq, jaġġorna, u jħassar fajls f’codebase billi juża diffs strutturati. Minflok sempliċement jissuġġerixxi edits, il-mudell joħroġ operazzjonijiet ta’ patch li applikazzjoni tapplika u tirrapporta lura dwarhom, u b’hekk tippermetti workflows iterattivi u b’ħafna passi għall-editjar tal-kodiċi.
Biex tuża l-għodda apply_patch fir-Responses API, inkludiha fl-array tools b’"tools": [{“type”: “apply_patch”}] u jew inkludi kontenut tal-fajl fl-input tiegħek jew agħti lill-mudell għodod biex jinteraġixxi mas-sistema tal-fajls tiegħek. Il-mudell jiġġenera elementi apply_patch_call għall-ħolqien, l-aġġornament, jew it-tħassir ta’ fajls li jkun fihom diffs li tapplika fuq is-sistema tal-fajls tiegħek. Għal aktar informazzjoni dwar kif tintegra mal-għodda apply_patch, ara d-dokumentazzjoni għall-iżviluppaturi(jinfetaħ f’tieqa ġdida).
L-għodda shell tippermetti lill-mudell jinteraġixxi ma’ kompjuter lokali permezz ta’ interface tal-linja tal-kmand ikkontrollat. Il-mudell jipproponi kmandi shell; integrazzjoni tal-iżviluppatur teżegwixxihom u tirritorna l-outputs. Dan joħloq ċiklu sempliċi ta’ ppjana-u-eżegwixxi li jħalli l-mudelli jispezzjonaw is-sistema, iħaddmu utilities, u jiġbru data sakemm ikunu jistgħu jlestu l-kompitu.
Biex tuża l-għodda shell fir-Responses API, l-iżviluppaturi jistgħu jinkluduha fl-array tools b’"tools": [{“type”: “shell”}]. L-API tiġġenera elementi "shell_call" li jinkludu l-kmandi shell biex jiġu eżegwiti. L-iżviluppaturi jeżegwixxu l-kmandi fl-ambjent lokali u jgħaddu lura r-riżultati tal-eżekuzzjoni fl-element "shell_call_output" fit-talba li jmiss tal-API. Tgħallem aktar fid-dokumentazzjoni għall-iżviluppaturi(jinfetaħ f’tieqa ġdida).
GPT‑5.1 u gpt-5.1-chat-latest huma disponibbli għall-iżviluppaturi fuq il-livelli kollha mħallsa fl-API. L-ipprezzar u l-limiti tar-rata(jinfetaħ f’tieqa ġdida) huma l-istess bħal GPT‑5. Qed noħorġu wkoll gpt-5.1-codex u gpt-5.1-codex-mini fl-API. Filwaqt li GPT‑5.1 jeċċella fil-biċċa l-kbira tal-kompiti ta’ kodifikazzjoni, il-mudelli gpt-5.1-codex huma ottimizzati għal kompiti ta’ kodifikazzjoni aġentiċi li jdumu fit-tul f’Codex jew harnesses bħal Codex.
L-iżviluppaturi jistgħu jibdew jibnu billi jużaw id-dokumentazzjoni għall-iżviluppaturi(jinfetaħ f’tieqa ġdida) tagħna dwar GPT‑5.1 u l-gwida għall-prompting tal-mudell(jinfetaħ f’tieqa ġdida). Bħalissa m’għandniex pjan li nneħħu GPT‑5 mill-API u nagħtu avviż minn qabel lill-iżviluppaturi jekk u meta niddeċiedu li nagħmlu dan.
Aħna impenjati li nedeplojaw b’mod iterattiv l-aktar mudelli kapaċi u affidabbli għal xogħol aġentiku u ta’ kodifikazzjoni reali—mudelli li jaħsbu b’mod effiċjenti, jiteraw malajr, u jimmaniġġjaw kompiti kumplessi filwaqt li jżommu lill-iżviluppaturi fil-flow. B’raġunament adattiv, prestazzjoni aktar b’saħħitha fil-kodifikazzjoni, aġġornamenti aktar ċari għall-utent, u għodod ġodda bħal apply_patch u shell, GPT‑5.1 huwa mfassal biex jgħinek tibni b’inqas frizzjoni. U qed inkomplu ninvestu ħafna hawnhekk: tista’ tistenna mudelli aġentiċi u ta’ kodifikazzjoni aktar kapaċi fil-ġimgħat u x-xhur li ġejjin.
Evalwazzjoni | GPT‑5.1 (għoli) | GPT‑5 (għoli) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Għal Tau2-bench Telecom, tajna lil GPT‑5.1 prompt qasir u ġeneralment utli biex intejbu l-prestazzjoni tiegħu.


