17 Maret 2026

Ngenalake GPT‑5.4 mini lan nano

Model cepet lan efisien sing dioptimalake kanggo coding lan subagen

Lagi dimuat…

Dina iki kami ngrilis GPT‑5.4 mini lan nano, model cilik kami sing paling mumpuni nganti saiki. Model iki nggawa akeh kekuwatan GPT‑5.4 menyang model sing luwih cepet lan luwih efisien, dirancang kanggo beban kerja volume dhuwur.

GPT‑5.4 mini ningkat kanthi signifikan dibandhingake GPT‑5 mini ing coding, nalar, pangerten multimodal, lan panggunaan alat, nalika mlaku luwih saka 2x luwih cepet. Model iki uga nyedhaki kinerja model GPT‑5.4 sing luwih gedhe ing sawetara evaluasi, kalebu SWE-Bench Pro lan OSWorld-Verified.

GPT‑5.4 nano yaiku versi GPT‑5.4 sing paling cilik lan paling murah kanggo tugas sing luwih ngutamakake kecepatan lan biaya. Iki uga peningkatan gedhe saka GPT‑5 nano. Kami nyaranake kanggo klasifikasi, ekstraksi data, pemeringkatan, lan subagen coding sing nangani tugas pendukung sing luwih prasaja.

Model-model iki dibangun kanggo jinis beban kerja sing latensine langsung mbentuk pengalaman produk: asisten coding sing kudu krasa responsif, subagen sing cepet ngrampungake tugas pendukung, sistem panggunaan komputer sing njupuk lan napsirake screenshot, lan aplikasi multimodal sing bisa nalar saka gambar kanthi wektu nyata. Ing setelan kaya iki, model paling apik kerep dudu sing paling gedhe—nanging sing bisa nanggapi kanthi cepet, nggunakake alat kanthi andal, lan tetep tampil apik ing tugas profesional sing kompleks.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 reasoning_effort paling dhuwur sing kasedhiya kanggo GPT‑5 mini yaiku 'high'.}

Iki sing dipikirake para pelanggan kami sawise nguji GPT‑5.4 mini lan nano ing alur kerja dheweke:

“GPT-5.4 mini menehi kinerja end-to-end sing kuwat kanggo model ing kelas iki. Ing evaluasi kami model iki nyamai utawa ngluwihi model pesaing ing sawetara tugas output lan citation recall kanthi biaya sing luwih murah. Model iki uga nggayuh tingkat kelulusan end-to-end sing luwih dhuwur lan atribusi sumber sing luwih kuwat tinimbang model GPT-5.4 sing luwih gedhe.”

— Aabhas Sharma, CTO ing Hebbia

Coding

GPT‑5.4 mini lan nano utamane efektif ing alur kerja coding sing entuk manfaat saka iterasi cepet. Model-model iki nangani suntingan sing ditarget, navigasi codebase, generasi front-end, lan loop debugging kanthi latensi rendah, dadi cocog banget kanggo tugas coding sing kudu dirampungake kanthi luwih cepet lan biaya luwih murah.

Ing benchmark, GPT‑5.4 mini terus ngluwihi GPT‑5‑mini ing latensi sing padha lan nyedhaki tingkat kelulusan setara GPT‑5.4 nalika mlaku luwih cepet, menehi salah siji kompromi kinerja-per-latensi paling kuwat kanggo alur kerja coding.

Kami ngira latensi kanthi ndeleng prilaku produksi model-model kami, lan nyimulasi iki kanthi offline. Perkiraan latensi iki ngitung durasi tool call (wektu eksekusi kode), token sing disampel, lan token input. Latensi ing donya nyata bisa beda banget, lan gumantung ing akeh faktor sing ora kacathet ing simulasi kami. Semono uga, biaya diira adhedhasar rega API model-model iki nalika tulisan iki digawe. Biaya bisa owah ing mangsa ngarep. Upaya nalar disapu saka low nganti xhigh.

Subagen

GPT‑5.4 mini uga cocog banget kanggo sistem sing nggabungake model kanthi ukuran beda. Ing Codex, contone, model sing luwih gedhe kaya GPT‑5.4 bisa nangani perencanaan, koordinasi, lan penilaian pungkasan, nalika mendelegasikan marang subagen GPT‑5.4 mini sing nangani subtugas sing luwih sempit kanthi paralel—kayata nggoleki codebase, mriksa file gedhe, utawa ngolah dokumen pendukung. Sinau cara kerja subagen ing Codex ing dokumen⁠(mbukak ing jendhela anyar).

Pola iki dadi luwih migunani nalika model sing luwih cilik dadi luwih cepet lan luwih mumpuni. Tinimbang nggunakake siji model kanggo kabeh, para pangembang bisa nyusun sistem ing ngendi model gedhe mutusake apa sing kudu ditindakake lan model cilik ngeksekusi kanthi cepet ing skala gedhe. GPT‑5.4 mini yaiku model mini paling kuwat saka kami nganti saiki kanggo gaya alur kerja iki.

Panggunaan komputer

GPT‑5.4 mini uga kuwat kanggo tugas multimodal, utamane sing gegayutan karo panggunaan komputer. Model iki bisa cepet napsirake screenshot saka antarmuka pangguna sing padhet kanggo ngrampungake tugas panggunaan komputer kanthi cepet. Ing OSWorld-Verified, GPT‑5.4 mini nyedhaki GPT‑5.4 nalika ngluwihi GPT‑5 mini kanthi nyata.

Kasedhiyan & rega

GPT‑5.4 mini kasedhiya dina iki ing API, Codex, lan ChatGPT.

Ing API, GPT‑5.4 mini ndhukung input teks lan gambar, panggunaan alat, nelpon fungsi, web search, file search, panggunaan komputer, lan skills. Model iki nduweni jendhela konteks 400k lan regane $0.75 saben 1M token input lan $4.50 saben 1M token output.

Ing Codex, GPT‑5.4 mini kasedhiya ing app Codex, CLI, ekstensi IDE, lan web. Model iki mung nggunakake 30% saka kuota GPT‑5.4, supaya pangembang bisa cepet nangani tugas coding sing luwih prasaja ing Codex kanthi biaya kira-kira sepertelu. Codex uga bisa mendelegasikan menyang subagen GPT‑5.4 mini supaya pakaryan sing ora mbutuhake nalar intensif bisa mlaku ing model sing luwih murah.

Ing ChatGPT, GPT‑5.4 mini kasedhiya kanggo pangguna Free lan Go liwat fitur “Thinking” ing menu +. Kanggo kabeh pangguna liyane, GPT‑5.4 mini kasedhiya minangka fallback wates tarif kanggo GPT‑5.4 Thinking.

GPT‑5.4 nano mung kasedhiya ing API lan regane $0.20 saben 1M token input lan $1.25 saben 1M token output.

Kanggo informasi luwih lengkap babagan safeguard model-model iki, mangga delengen addendum Kertu Sistem ing Deployment Safety Hub⁠(mbukak ing jendhela anyar) kami.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 reasoning_effort paling dhuwur sing kasedhiya kanggo GPT‑5 mini yaiku 'high'.}

^{2 Overall Edit Distance. OmniDocBench dijalanke kanthi reasoning_effort disetel dadi 'none' kanggo nggambarake kinerja biaya rendah lan latensi rendah.}

2026

Pangarang

OpenAI

Terus maca

Deleng kabeh

Launching Health in ChatGPT

Produk23 Jul 2026

How news organizations are using AI > Card Image

Cara organisasi pawarta nganggo AI kanggo nguwatake misi wigati

Perusahaan22 Jul 2026

Ngenalaké OpenAI Presence

Produk22 Jul 2026