Illum qed noħorġu GPT‑5.4 mini u nano, l-aktar mudelli żgħar kapaċi tagħna s’issa. Iġibu ħafna mis-saħħiet ta’ GPT‑5.4 għal mudelli aktar veloċi u aktar effiċjenti mfassla għal workloads b’volum għoli.
GPT‑5.4 mini jtejjeb b’mod sinifikanti fuq GPT‑5 mini fil-kodifikazzjoni, ir-raġunament, il-fehim multimodali u l-użu tal-għodod, filwaqt li jaħdem aktar minn 2x aktar malajr. Jersaq ukoll lejn il-prestazzjoni tal-mudell akbar GPT‑5.4 f’diversi evalwazzjonijiet, inklużi SWE-Bench Pro u OSWorld-Verified.
GPT‑5.4 nano hija l-iżgħar u l-orħos verżjoni ta’ GPT‑5.4 għal kompiti fejn il-veloċità u l-ispiża jimpurtaw l-aktar. Hija wkoll titjib sinifikanti fuq GPT‑5 nano. Nirrakkomandawha għall-klassifikazzjoni, l-estrazzjoni tad-data, ir-rankjar, u subaġenti tal-kodifikazzjoni li jieħdu ħsieb kompiti ta’ appoġġ aktar sempliċi.
Dawn il-mudelli huma mibnija għat-tipi ta’ workloads fejn il-latenza tifforma direttament l-esperjenza tal-prodott: assistenti tal-kodifikazzjoni li jeħtieġ li jħossuhom reattivi, subaġenti li jlestu malajr kompiti ta’ appoġġ, sistemi li jużaw il-kompjuter li jaqbdu u jinterpretaw screenshots, u applikazzjonijiet multimodali li jistgħu jagħmlu raġunament fuq immaġnijiet f’ħin reali. F’dawn is-sitwazzjonijiet, l-aħjar mudell ħafna drabi ma jkunx l-akbar wieħed—ikun dak li jista’ jwieġeb malajr, juża l-għodod b’mod affidabbli, u xorta jagħti prestazzjoni tajba fuq kompiti professjonali kumplessi.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 L-ogħla reasoning_effort disponibbli għal GPT‑5 mini huwa 'high'.
Hawn x’jaħsbu l-klijenti tagħna wara li ttestjaw GPT‑5.4 mini u nano fil-workflows tagħhom:
“GPT-5.4 mini jagħti prestazzjoni qawwija end-to-end għal mudell f’din il-klassi. Fl-evalwazzjonijiet tagħna laħaq jew qabeż mudelli kompetittivi fuq diversi kompiti ta’ output u citation recall bi spiża ħafna aktar baxxa. Laħaq ukoll rati ta’ pass end-to-end ogħla u attribuzzjoni tas-sorsi aktar b’saħħitha mill-mudell akbar GPT-5.4.”
GPT‑5.4 mini u nano huma effettivi b’mod speċjali fi workflows tal-kodifikazzjoni li jibbenefikaw minn iterazzjoni rapida. Il-mudelli jimmaniġġjaw edits immirati, navigazzjoni fil-codebase, ġenerazzjoni front-end, u loops ta’ debugging b’latenza baxxa, u dan jagħmilhom adattati ħafna għal kompiti tal-kodifikazzjoni li jeħtieġu jitlestew b’veloċitajiet aktar mgħaġġla u bi spejjeż aktar baxxi.
Fil-benchmarks, GPT‑5.4 mini b’mod konsistenti jegħleb lil GPT‑5‑mini f’latenzi simili u jersaq lejn ir-rati ta’ pass ta’ livell GPT‑5.4 waqt li jaħdem ħafna aktar malajr, u jwassal wieħed mill-aqwa kompromessi bejn prestazzjoni u latenza għal workflows tal-kodifikazzjoni.
Aħna nistmaw il-latenza billi nħarsu lejn l-imġiba fil-produzzjoni tal-mudelli tagħna, u nissimulawha offline. L-istima tal-latenza tqis it-tul tas-sejħa tal-għodda (ħin tal-eżekuzzjoni tal-kodiċi), sampled tokens, u input tokens. Il-latenza fid-dinja reali tista’ tvarja sostanzjalment, u tiddependi fuq ħafna fatturi li mhumiex maqbudin fis-simulazzjoni tagħna. Bl-istess mod, l-ispejjeż huma stmati abbażi tal-prezzijiet tal-API ta’ dawn il-mudelli fil-ħin tal-kitba. L-ispejjeż jistgħu jinbidlu fil-futur. L-isforzi tar-raġunament ġew swept minn low sa xhigh.
GPT‑5.4 mini huwa wkoll adattat ħafna għal sistemi li jgħaqqdu mudelli ta’ daqsijiet differenti. F’Codex, pereżempju, mudell akbar bħal GPT‑5.4 jista’ jieħu ħsieb l-ippjanar, il-koordinazzjoni u l-ġudizzju finali, filwaqt li jiddelega lil subaġenti GPT‑5.4 mini li jieħdu ħsieb sottokompiti aktar ristretti b’mod parallel—bħat-tiftix f’codebase, ir-reviżjoni ta’ fajl kbir, jew l-ipproċessar ta’ dokumenti ta’ appoġġ. Tgħallem kif jaħdmu s-subaġenti f’Codex fid-docs(jinfetaħ f’tieqa ġdida).
Dan il-mudell isir aktar utli hekk kif mudelli iżgħar isiru aktar veloċi u aktar kapaċi. Minflok ma jintuża mudell wieħed għal kollox, l-iżviluppaturi jistgħu jikkomponu sistemi fejn mudelli akbar jiddeċiedu x’għandu jsir u mudelli iżgħar iwettqu malajr fuq skala kbira. GPT‑5.4 mini huwa l-aktar mini mudell b’saħħtu tagħna s’issa għal dak l-istil ta’ workflow.
GPT‑5.4 mini huwa wkoll qawwi fuq kompiti multimodali, partikolarment dawk relatati mal-użu tal-kompjuter. Il-mudell jista’ malajr jinterpreta screenshots ta’ interfaces tal-utent densi biex iwettaq kompiti ta’ użu tal-kompjuter bil-ħeffa. Fuq OSWorld-Verified, GPT‑5.4 mini jersaq lejn GPT‑5.4 filwaqt li jegħleb b’mod sostanzjali lil GPT‑5 mini.
GPT‑5.4 mini huwa disponibbli llum fl-API, Codex, u ChatGPT.
Fl-API, GPT‑5.4 mini jappoġġa inputs ta’ test u immaġni, użu tal-għodod, sejħa għall-funzjoni, tfittxija fuq il-web, tfittxija ta’ fajls, użu tal-kompjuter, u skills. Għandu tieqa ta’ kuntest ta’ 400k u jiswa $0.75 għal kull 1M input tokens u $4.50 għal kull 1M output tokens.
F’Codex, GPT‑5.4 mini huwa disponibbli fl-app Codex, CLI, estensjoni IDE u fuq il-web. Juża biss 30% tal-kwota GPT‑5.4, u jħalli lill-iżviluppaturi jieħdu ħsieb malajr kompiti tal-kodifikazzjoni aktar sempliċi f’Codex għal madwar terz tal-ispiża. Codex jista’ wkoll jiddelega lil subaġenti GPT‑5.4 mini sabiex xogħol li jeħtieġ inqas raġunament jitħaddem fuq il-mudell orħos.
F’ChatGPT, GPT‑5.4 mini huwa disponibbli għall-utenti Free u Go permezz tal-karatteristika “Thinking” fil-menu +. Għall-utenti l-oħra kollha, GPT‑5.4 mini huwa disponibbli bħala fallback tal-limitu tar-rata għal GPT‑5.4 Thinking.
GPT‑5.4 nano huwa disponibbli biss fl-API u jiswa $0.20 għal kull 1M input tokens u $1.25 għal kull 1M output tokens.
Għal aktar informazzjoni dwar is-salvagwardji tal-mudelli, jekk jogħġbok ara l-addendum tas-System Card fuq il-Deployment Safety Hub(jinfetaħ f’tieqa ġdida) tagħna.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 L-ogħla reasoning_effort disponibbli għal GPT‑5 mini huwa 'high'.
2 Distanza Ġenerali tal-Editjar. OmniDocBench tħaddem b’reasoning_effort issettjat għal 'none' biex tirrifletti prestazzjoni bi spejjeż baxxi u latenza baxxa.


