Aqbeż għall-kontenut prinċipali
OpenAI

17 ta’ Marzu 2026

KumpanijaProdott

Introduzzjoni ta’ GPT‑5.4 mini u nano

Mudelli veloċi u effiċjenti ottimizzati għall-kodifikazzjoni u s-subaġenti

Qed jillowdja…

Illum qed noħorġu GPT‑5.4 mini u nano, l-aktar mudelli żgħar kapaċi tagħna s’issa. Iġibu ħafna mis-saħħiet ta’ GPT‑5.4 għal mudelli aktar veloċi u aktar effiċjenti mfassla għal workloads b’volum għoli.

GPT‑5.4 mini jtejjeb b’mod sinifikanti fuq GPT‑5 mini fil-kodifikazzjoni, ir-raġunament, il-fehim multimodali u l-użu tal-għodod, filwaqt li jaħdem aktar minn 2x aktar malajr. Jersaq ukoll lejn il-prestazzjoni tal-mudell akbar GPT‑5.4 f’diversi evalwazzjonijiet, inklużi SWE-Bench Pro u OSWorld-Verified.

GPT‑5.4 nano hija l-iżgħar u l-orħos verżjoni ta’ GPT‑5.4 għal kompiti fejn il-veloċità u l-ispiża jimpurtaw l-aktar. Hija wkoll titjib sinifikanti fuq GPT‑5 nano. Nirrakkomandawha għall-klassifikazzjoni, l-estrazzjoni tad-data, ir-rankjar, u subaġenti tal-kodifikazzjoni li jieħdu ħsieb kompiti ta’ appoġġ aktar sempliċi.

Dawn il-mudelli huma mibnija għat-tipi ta’ workloads fejn il-latenza tifforma direttament l-esperjenza tal-prodott: assistenti tal-kodifikazzjoni li jeħtieġ li jħossuhom reattivi, subaġenti li jlestu malajr kompiti ta’ appoġġ, sistemi li jużaw il-kompjuter li jaqbdu u jinterpretaw screenshots, u applikazzjonijiet multimodali li jistgħu jagħmlu raġunament fuq immaġnijiet f’ħin reali. F’dawn is-sitwazzjonijiet, l-aħjar mudell ħafna drabi ma jkunx l-akbar wieħed—ikun dak li jista’ jwieġeb malajr, juża l-għodod b’mod affidabbli, u xorta jagħti prestazzjoni tajba fuq kompiti professjonali kumplessi.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 L-ogħla reasoning_effort disponibbli għal GPT‑5 mini huwa 'high'.

Hawn x’jaħsbu l-klijenti tagħna wara li ttestjaw GPT‑5.4 mini u nano fil-workflows tagħhom:

“GPT-5.4 mini jagħti prestazzjoni qawwija end-to-end għal mudell f’din il-klassi. Fl-evalwazzjonijiet tagħna laħaq jew qabeż mudelli kompetittivi fuq diversi kompiti ta’ output u citation recall bi spiża ħafna aktar baxxa. Laħaq ukoll rati ta’ pass end-to-end ogħla u attribuzzjoni tas-sorsi aktar b’saħħitha mill-mudell akbar GPT-5.4.”
— Aabhas Sharma, CTO f’Hebbia

Kodifikazzjoni

GPT‑5.4 mini u nano huma effettivi b’mod speċjali fi workflows tal-kodifikazzjoni li jibbenefikaw minn iterazzjoni rapida. Il-mudelli jimmaniġġjaw edits immirati, navigazzjoni fil-codebase, ġenerazzjoni front-end, u loops ta’ debugging b’latenza baxxa, u dan jagħmilhom adattati ħafna għal kompiti tal-kodifikazzjoni li jeħtieġu jitlestew b’veloċitajiet aktar mgħaġġla u bi spejjeż aktar baxxi.

Fil-benchmarks, GPT‑5.4 mini b’mod konsistenti jegħleb lil GPT‑5‑mini f’latenzi simili u jersaq lejn ir-rati ta’ pass ta’ livell GPT‑5.4 waqt li jaħdem ħafna aktar malajr, u jwassal wieħed mill-aqwa kompromessi bejn prestazzjoni u latenza għal workflows tal-kodifikazzjoni.

Aħna nistmaw il-latenza billi nħarsu lejn l-imġiba fil-produzzjoni tal-mudelli tagħna, u nissimulawha offline. L-istima tal-latenza tqis it-tul tas-sejħa tal-għodda (ħin tal-eżekuzzjoni tal-kodiċi), sampled tokens, u input tokens. Il-latenza fid-dinja reali tista’ tvarja sostanzjalment, u tiddependi fuq ħafna fatturi li mhumiex maqbudin fis-simulazzjoni tagħna. Bl-istess mod, l-ispejjeż huma stmati abbażi tal-prezzijiet tal-API ta’ dawn il-mudelli fil-ħin tal-kitba. L-ispejjeż jistgħu jinbidlu fil-futur. L-isforzi tar-raġunament ġew swept minn low sa xhigh.

Subaġenti

GPT‑5.4 mini huwa wkoll adattat ħafna għal sistemi li jgħaqqdu mudelli ta’ daqsijiet differenti. F’Codex, pereżempju, mudell akbar bħal GPT‑5.4 jista’ jieħu ħsieb l-ippjanar, il-koordinazzjoni u l-ġudizzju finali, filwaqt li jiddelega lil subaġenti GPT‑5.4 mini li jieħdu ħsieb sottokompiti aktar ristretti b’mod parallel—bħat-tiftix f’codebase, ir-reviżjoni ta’ fajl kbir, jew l-ipproċessar ta’ dokumenti ta’ appoġġ. Tgħallem kif jaħdmu s-subaġenti f’Codex fid-docs(jinfetaħ f’tieqa ġdida).

Dan il-mudell isir aktar utli hekk kif mudelli iżgħar isiru aktar veloċi u aktar kapaċi. Minflok ma jintuża mudell wieħed għal kollox, l-iżviluppaturi jistgħu jikkomponu sistemi fejn mudelli akbar jiddeċiedu x’għandu jsir u mudelli iżgħar iwettqu malajr fuq skala kbira. GPT‑5.4 mini huwa l-aktar mini mudell b’saħħtu tagħna s’issa għal dak l-istil ta’ workflow.

Użu tal-kompjuter

GPT‑5.4 mini huwa wkoll qawwi fuq kompiti multimodali, partikolarment dawk relatati mal-użu tal-kompjuter. Il-mudell jista’ malajr jinterpreta screenshots ta’ interfaces tal-utent densi biex iwettaq kompiti ta’ użu tal-kompjuter bil-ħeffa. Fuq OSWorld-Verified, GPT‑5.4 mini jersaq lejn GPT‑5.4 filwaqt li jegħleb b’mod sostanzjali lil GPT‑5 mini.

Disponibbiltà u prezzijiet

GPT‑5.4 mini huwa disponibbli llum fl-API, Codex, u ChatGPT.

Fl-API, GPT‑5.4 mini jappoġġa inputs ta’ test u immaġni, użu tal-għodod, sejħa għall-funzjoni, tfittxija fuq il-web, tfittxija ta’ fajls, użu tal-kompjuter, u skills. Għandu tieqa ta’ kuntest ta’ 400k u jiswa $0.75 għal kull 1M input tokens u $4.50 għal kull 1M output tokens.

F’Codex, GPT‑5.4 mini huwa disponibbli fl-app Codex, CLI, estensjoni IDE u fuq il-web. Juża biss 30% tal-kwota GPT‑5.4, u jħalli lill-iżviluppaturi jieħdu ħsieb malajr kompiti tal-kodifikazzjoni aktar sempliċi f’Codex għal madwar terz tal-ispiża. Codex jista’ wkoll jiddelega lil subaġenti GPT‑5.4 mini sabiex xogħol li jeħtieġ inqas raġunament jitħaddem fuq il-mudell orħos.

F’ChatGPT, GPT‑5.4 mini huwa disponibbli għall-utenti Free u Go permezz tal-karatteristika “Thinking” fil-menu +. Għall-utenti l-oħra kollha, GPT‑5.4 mini huwa disponibbli bħala fallback tal-limitu tar-rata għal GPT‑5.4 Thinking.

GPT‑5.4 nano huwa disponibbli biss fl-API u jiswa $0.20 għal kull 1M input tokens u $1.25 għal kull 1M output tokens.

Għal aktar informazzjoni dwar is-salvagwardji tal-mudelli, jekk jogħġbok ara l-addendum tas-System Card fuq il-Deployment Safety Hub(jinfetaħ f’tieqa ġdida) tagħna.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 L-ogħla reasoning_effort disponibbli għal GPT‑5 mini huwa 'high'.

2 Distanza Ġenerali tal-Editjar. OmniDocBench tħaddem b’reasoning_effort issettjat għal 'none' biex tirrifletti prestazzjoni bi spejjeż baxxi u latenza baxxa.

Awtur

OpenAI