Ngenalaké GPT‑5.1 kanggo pengembang
Dina iki kita ngluncurake GPT‑5.1 ing platform API, model sabanjuré ing seri GPT‑5 sing ngimbangi kecerdasan lan kecepatan kanggo macem-macem tugas agenik lan ngoding. GPT‑5.1 nyetel kanthi dinamis sepira suwene wektu sing digunakake kanggo mikir adhedhasar kerumitan tugas, nggawe model iki luwih cepet lan luwih efisien token kanggo tugas saben dina sing luwih prasaja. Model iki uga nduweni mode “tanpa nalar” kanggo nanggapi luwih cepet ing tugas sing ora mbutuhake pikiran jero, nalika tetep njaga kecerdasan tercanggih saka GPT‑5.1.
Kanggo nggawe GPT‑5.1 luwih efisien maneh, kita ngluncurake caching prompt sing diperluas nganti retensi cache 24 jam, supaya respons kanggo pitakon tindak lanjut luwih cepet kanthi biaya luwih murah. Pelanggan Priority Processing(mbukak ing jendhela anyar) kita uga bakal ngrasakake kinerja sing katon luwih cepet nganggo GPT‑5.1 tinimbang GPT‑5.
Ing babagan ngoding, kita wis kerja bareng cedhak karo startup kaya Cursor, Cognition, Augment Code, Factory, lan Warp kanggo ningkatake kapribaden ngoding, steerability, lan kualitas kode GPT‑5.1. Umumé, GPT‑5.1 krasa luwih intuïtif kanggo digunakake ngoding lan luwih komunikatif liwat update sing katon pangguna nalika ngrampungake tugas.
Pungkasan, kita ngenalake loro alat anyar karo GPT‑5.1: alat apply_patch sing dirancang kanggo nyunting kode kanthi luwih andal lan alat shell supaya model bisa mbukak perintah shell.
GPT‑5.1 minangka kemajuan sabanjuré ing seri GPT‑5, lan kita ngrancang terus nandur modal ing model sing luwih cerdas lan luwih mumpuni kanggo mbantu pengembang mbangun alur kerja agenik sing andal.
Kanggo nggawe GPT‑5.1 luwih cepet, kita ndandani total cara nglatih model iki supaya mikir. Ing tugas sing langsung, GPT‑5.1 nggunakake token mikir luwih sithik, saéngga pengalaman produk luwih responsif lan tagihan token luwih murah. Ing tugas angel sing mbutuhake mikir ekstra, GPT‑5.1 tetep tekun, njelajah pilihan lan mriksa asil gaweyané supaya reliabilitas maksimal.
Balyasny Asset Management(mbukak ing jendhela anyar) ujar GPT‑5.1 "ngluwihi GPT‑4.1 lan GPT‑5 ing suite evaluasi dinamis lengkap kami, nalika mlaku 2-3x luwih cepet tinimbang GPT‑5." Dheweke uga ujar yen ing tugas nalar sing abot alat, GPT‑5.1 “kanthi konsisten nggunakake kira-kira setengah token dibandhing pesaing utama kanthi kualitas sing padha utawa luwih apik.” Semono uga, BPO asuransi AI Pace(mbukak ing jendhela anyar) uga nyoba model iki lan ujar agen-agené mlaku "50% luwih cepet ing GPT‑5.1 nalika ngluwihi akurasi GPT‑5 lan model utama liyane ing eval kami."
GPT‑5.1 ngowahi wektu mikiré luwih dinamis tinimbang GPT‑5. Ing distribusi tugas ChatGPT sing representatif, GPT‑5.1 luwih cepet kanggo tugas sing luwih gampang, sanajan ing tingkat upaya nalar sing dhuwur.
Minangka conto, nalika dijaluk "tuduhna perintah npm kanggo ndhaptar paket sing diinstal sacara global", GPT‑5.1 njawab sajrone 2 detik tinimbang 10 detik.
GPT-5 (Medium) butuh ~250 token (~10 detik)
GPT-5.1 (Medium) butuh ~50 token (~2 detik)
Saiki pengembang bisa nggunakake GPT‑5.1 tanpa nalar kanthi nyetel reasoning_effort dadi 'none'. Iki nggawe model tumindak kaya model non-nalar kanggo kasus panggunaan sing sensitif marang latensi, kanthi kecerdasan dhuwur GPT‑5.1 lan bonus tambahan kemampuan tool-calling sing apik. Dibandhingake GPT‑5 kanthi nalar 'minimal', GPT‑5.1 tanpa nalar luwih apik ing panggilan alat paralel (sing dhewe nambah kecepatan ngrampungake tugas end-to-end), tugas ngoding, ngetutake instruksi, lan nggunakake alat panelusuran—lan ndhukung panelusuran web(mbukak ing jendhela anyar) ing platform API kita. Sierra(mbukak ing jendhela anyar) nuduhake manawa GPT‑5.1 ing mode “tanpa nalar” nuduhake “perbaikan 20% ing kinerja tool calling latensi-rendah dibandhing GPT‑5 minimal reasoning” ing eval donya nyataé.
Kanthi ngenalaké 'none' minangka nilai ing reasoning_effort, pengembang saiki nduweni luwih akeh keluwesan lan kontrol marang keseimbangan antarane kecepatan, biaya, lan kecerdasan kanggo kasus panggunaané. GPT‑5.1 gawané nggunakake 'none', sing cocog kanggo workload sensitif latensi. Kita nyaranake pengembang milih 'low' utawa 'medium' kanggo tugas kanthi kerumitan luwih dhuwur lan 'high' nalika kecerdasan lan reliabilitas luwih penting tinimbang kecepatan.
Caching sing diperluas ningkatake efisiensi nalar kanthi ngidini prompt tetep aktif ing cache nganti 24 jam, dudu mung sawetara menit kaya sing didhukung saiki. Kanthi jendhela retensi luwih dawa, luwih akeh panjalukan tindak lanjut bisa nggunakake konteks sing dicache—asile latensi luwih murah, biaya suda, lan kinerja luwih alus kanggo interaksi sing lumaku suwe kayata chat multi-giliran, sesi ngoding, utawa alur kerja njupuk kawruh.
Rega cache prompt tetep ora owah, kanthi token input sing dicache 90% luwih murah tinimbang token sing ora dicache, lan ora ana biaya tambahan kanggo nulis utawa panyimpenan cache. Kanggo nggunakake caching sing diperluas karo GPT‑5.1, tambahna parameter “prompt_cache_retention='24h'” ing Responses utawa Chat Completions API. Delengen dokumen caching prompt(mbukak ing jendhela anyar) kanggo rincian luwih lanjut.
GPT‑5.1 mbangun saka kemampuan ngoding GPT‑5 kanthi kapribaden ngoding sing luwih bisa diarahake, overthinking sing luwih sithik, kualitas kode sing luwih apik, pesen update sing luwih becik kanggo pangguna (preamble) sajrone rangkaian panggilan alat, lan desain frontend sing luwih fungsional—utamane ing upaya nalar rendah.
Ing tugas ngoding sing luwih prasaja kaya suntingan kode cepet, kecepatan GPT‑5.1 sing luwih dhuwur nggawe iterasi bolak-balik luwih gampang. Kecepatan GPT‑5.1 sing luwih cepet ing tugas prasaja ora nurunake kinerja ing tugas angel. Ing SWE-bench Verified, GPT‑5.1 malah kerja luwih suwe tinimbang GPT‑5 lan tekan 76.3%.
Ing SWE-bench Verified, sawijining model diwenehi gudang kode lan deskripsi isu, lan kudu ngasilake patch kanggo ngrampungake isu kasebut. Label nuduhake upaya nalar. Akurasi dirata-ratakake ing kabeh 500 masalah. Kabeh model nggunakake harness kanthi alat apply_patch adhedhasar JSON.
Kita entuk umpan balik awal babagan GPT‑5.1 saka sawatara perusahaan ngoding. Iki kesan saka wong-wong kuwi:
- Augment Code(mbukak ing jendhela anyar) nyebut GPT‑5.1 “luwih disengaja kanthi tumindak mubazir luwih sithik, nalar luwih efisien, lan fokus tugas luwih apik” lan dheweke ndeleng “owahan luwih akurat, panyuwunan tarik luwih mulus, lan iterasi luwih cepet ing proyek multi-file.”
- Cline(mbukak ing jendhela anyar) nuduhake manawa ing eval-é, “GPT‑5.1 nggayuh SOTA ing benchmark panyuntingan diff kami kanthi peningkatan 7%, nuduhake reliabilitas luar biasa kanggo tugas ngoding rumit.”
- CodeRabbit(mbukak ing jendhela anyar) nyebut GPT‑5.1 dadi “model pilihan utama kanggo review PR.”
- Cognition(mbukak ing jendhela anyar) ujar GPT‑5.1 “katon luwih apik kanggo mangerteni apa sing sampeyan jaluk lan kerja bareng sampeyan kanggo ngrampungake.”
- Factory(mbukak ing jendhela anyar) ujar “GPT‑5.1 menehi respons sing katon luwih cekatan lan nyetel jeroné nalar marang tugas, nyuda overthinking lan ningkatake pengalaman pengembang sakabèhé.”
- Warp(mbukak ing jendhela anyar) nggawe GPT‑5.1 dadi gawan kanggo pangguna anyar, kanthi ujar model iki “mbangun saka lompatan kecerdasan sing nyengsemake sing digawa seri GPT‑5, nalika dadi model sing adoh luwih responsif.”
“GPT 5.1 dudu mung LLM liyane—iki tenan agenik, model sing otonom kanthi alami paling apik sing tau takuji. Nulisé kaya sampeyan, ngoding kaya sampeyan, gampang nuruti instruksi rumit, lan unggul ing tugas front-end, pas rapi karo codebase sing wis ana. Sampeyan tenan bisa mbukak potensi lengkapé ing Responses API lan kita bungah nawakaké ing IDE kita.”
Kita ngenalake loro alat anyar karo GPT‑5.1 kanggo mbantu pengembang njupuk manfaat maksimal saka model iki ing Responses API: apply_patch tool freeform supaya suntingan kode luwih andal tanpa perlu JSON escaping, lan shell tool sing ngidini model nulis perintah kanggo dijalanke ing mesin lokal sampeyan.
Alat apply_patch freeform ngidini GPT‑5.1 nggawe, nganyari, lan mbusak file ing codebase nganggo diff terstruktur. Tinimbang mung menehi saran suntingan, model ngasilake operasi patch sing ditrapake aplikasi lan dilaporake bali, saéngga bisa alur kerja panyuntingan kode iteratif multi-langkah.
Kanggo nggunakake alat apply_patch ing Responses API, lebokna ing array tools nganggo "tools": [{“type”: “apply_patch”}] lan lebokna isi file ing input sampeyan utawa wenehana model alat kanggo sesambungan karo sistem file sampeyan. Model bakal ngasilake item apply_patch_call kanggo nggawe, nganyari, utawa mbusak file sing ngemot diff kanggo sampeyan terapkan ing sistem file sampeyan. Kanggo informasi luwih lengkap babagan cara integrasi karo alat apply_patch, delengen dokumentasi pengembang(mbukak ing jendhela anyar) kita.
Alat shell ngidini model sesambungan karo komputer lokal liwat antarmuka command-line sing dikendhaleni. Model ngajokake perintah shell; integrasi pengembang ngeksekusi lan mbalekake outputé. Iki nggawe loop rencana-eksekusi sederhana sing ngidini model mriksa sistem, mbukak utilitas, lan ngumpulake data nganti bisa ngrampungake tugas.
Kanggo nggunakake alat shell ing Responses API, pengembang bisa nglebokaké ing array tools nganggo "tools": [{“type”: “shell”}]. API bakal ngasilake item "shell_call" sing ngemot perintah shell kanggo dieksekusi. Pengembang ngeksekusi perintah kasebut ing lingkungan lokal lan ngirim bali asil eksekusiné ing item "shell_call_output" ing panjalukan API sabanjuré. Sinau luwih lanjut ing dokumentasi pengembang(mbukak ing jendhela anyar) kita.
GPT‑5.1 lan gpt-5.1-chat-latest kasedhiya kanggo pengembang ing kabeh tier mbayar ing API. Rega lan wates rate(mbukak ing jendhela anyar) padha karo GPT‑5. Kita uga ngluncurake gpt-5.1-codex lan gpt-5.1-codex-mini ing API. Sanajan GPT‑5.1 unggul ing akèh tugas ngoding, model gpt-5.1-codex dioptimalake kanggo tugas ngoding agenik sing lumaku suwe ing Codex utawa harness sing mirip Codex.
Pengembang bisa miwiti mbangun nganggo dokumentasi pengembang(mbukak ing jendhela anyar) GPT‑5.1 lan pandhuan prompting model(mbukak ing jendhela anyar) kita. Saiki kita durung ngrancang kanggo ngedepresiasi GPT‑5 ing API lan bakal menehi kabar luwih dhisik marang pengembang yen lan nalika kita mutusaké nindakake kuwi.
Kita setya ngluncurake kanthi iteratif model sing paling mumpuni lan andal kanggo karya agenik lan ngoding nyata—model sing mikir kanthi efisien, iterasi kanthi cepet, lan nangani tugas rumit nalika njaga pengembang tetep ing alur. Kanthi nalar adaptif, kinerja ngoding sing luwih kuwat, update sing luwih cetha kanggo pangguna, lan alat anyar kaya apply_patch lan shell, GPT‑5.1 dirancang kanggo mbantu sampeyan mbangun kanthi gesekan luwih sithik. Lan kita terus nandur modal gedhe ing kéné: sampeyan bisa ngarepake model agenik lan ngoding sing luwih mumpuni ing minggu lan wulan ngarep.
Evaluasi | GPT‑5.1 (high) | GPT‑5 (high) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Kanggo Tau2-bench Telecom, kita menehi GPT‑5.1 prompt sing cekak lan migunani kanthi umum kanggo ningkatake kinerjané.


