Preskočite na glavni sadržaj
OpenAI

17. mart 2026.

KompanijaProduct

Predstavljamo GPT‑5.4 mini i nano

Brzi i efikasni modeli optimizirani za kodiranje i subagente

Učitavanje…

Danas objavljujemo GPT‑5.4 mini i nano, naše najsposobnije male modele do sada. Donose mnoge prednosti GPT‑5.4 u brže i efikasnije modele, dizajnirane za radna opterećenja velikog obima.

GPT‑5.4 mini značajno poboljšava u odnosu na GPT‑5 mini u programiranju, rezonovanju, multimodalnom razumijevanju i korištenju alata, uz to što radi više od 2x brže. Također se približava performansama većeg GPT‑5.4 modela na nekoliko evaluacija, uključujući SWE-Bench Pro i OSWorld-Verified.

GPT‑5.4 nano je najmanja i najjeftinija verzija GPT‑5.4 za zadatke gdje su brzina i trošak najvažniji. Ovo je također značajno poboljšanje u odnosu na GPT‑5 nano. Preporučujemo ga za klasifikaciju, izdvajanje podataka, rangiranje i podagente za kodiranje koji obavljaju jednostavnije pomoćne zadatke.

Ovi modeli su napravljeni za tipove radnih opterećenja u kojima latencija direktno oblikuje doživljaj proizvoda: asistente za kodiranje koji moraju biti odzivni, podagente koji brzo završavaju pomoćne zadatke, sisteme koji koriste računar i snimaju, te tumače snimke ekrana, te višemodalne aplikacije koje mogu rezonovati na osnovu slika u realnom vremenu. U ovim postavkama, najbolji model često nije najveći — to je onaj koji može brzo odgovoriti, pouzdano koristiti alate i i dalje dobro obavljati složene profesionalne zadatke.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 Najviši napor razmišljanja dostupan za GPT‑5 mini je 'visok'.

Evo šta naši korisnici misle nakon testiranja GPT‑5.4 mini i nano u svojim radnim tokovima:

„GPT-5.4 mini pruža snažne end-to-end performanse za model u ovoj klasi. U našim evaluacijama se po rezultatima na nekoliko izlaznih zadataka i prisjećanju citata podudarao s konkurentskim modelima ili ih je nadmašio, uz znatno niži trošak. Također je postigao veću stopu prolaznosti od početka do kraja i snažniju atribuciju izvora nego veći GPT-5.4 model.
— Aabhas Sharma, glavni tehnički direktor u Hebbia

Kodiranje

GPT‑5.4 mini i nano su posebno dobri u procesima kodiranja gdje je brza iteracija važna. Modeli omogućavaju ciljane izmjene, snalaženje u kodu, generisanje front-enda i debagovanje petlji uz nisku latenciju, što ih čini odličnim izborom za zadatke kodiranja koje treba završiti brže i uz niže troškove.

U testovima performansi, GPT‑5.4 mini dosljedno nadmašuje GPT‑5‑mini pri sličnim latencijama i približava se nivou GPT‑5.4 stope prolaznosti uz mnogo brži rad, pružajući jedan od najjačih omjera performansi i latencije za tokove rada kodiranja.

Procjenjujemo latenciju posmatrajući ponašanje naših modela u produkciji i simulirajući to offline. Procjena latencije uzima u obzir trajanje poziva alata (vrijeme izvršavanja koda), uzorkovane tokene i ulazne tokene. Latencija u stvarnom svijetu može značajno varirati i zavisi od mnogih faktora koji nisu obuhvaćeni našom simulacijom. Slično tome, troškovi se procjenjuju na osnovu API cijena ovih modela u vrijeme pisanja. Troškovi se u budućnosti mogu promijeniti. Napori rezonovanja su povećani sa low na xhigh.

Subagenti

GPT‑5.4 mini je također snažan izbor za sisteme koji kombinuju modele različitih veličina. U Codex, na primjer, veći model poput GPT‑5.4 može obavljati planiranje, koordinaciju i konačnu prosudbu, dok delegira GPT‑5.4 mini podagentima koji paralelno obavljaju uže podzadatke—poput pretraživanja baze koda, pregleda velike datoteke ili obrade pratećih dokumenata. Saznaj kako subagenti funkcionišu u Codexu u dokumentaciji(otvara se u novom prozoru).

Ovaj obrazac postaje korisniji kako manji modeli postaju brži i sposobniji. Umjesto da koriste jedan model za sve, programeri mogu sastavljati sisteme gdje veći modeli odlučuju šta će raditi, a manji modeli brzo izvršavaju na velikoj skali. GPT‑5.4 mini je naš najjači mini model do sada za takav radni tok.

Upotreba računara

GPT‑5.4 mini je također snažan u multimodalnim zadacima, posebno onima povezanim s korištenjem računara. Model može brzo interpretirati snimke ekrana gustih korisničkih interfejsa kako bi s brzinom obavio zadatke korištenja računara. Na OSWorld-Verified, GPT‑5.4 mini se približava GPT‑5.4, dok istovremeno znatno nadmašuje GPT‑5 mini.

Dostupnost i cijene

GPT‑5.4 mini je dostupan već danas u API-ju, Codex-u i ChatGPT‑u.

U API-ju, GPT‑5.4 mini podržava unos teksta i slika, korištenje alata, pozivanje funkcija, web-pretragu, pretragu datoteka, korištenje računara i vještina. Ima kontekstni prozor od 400k i košta 0,75 USD po 1M ulaznih tokena i 4,50 USD po 1M izlaznih tokena.

U Codex, GPT‑5.4 mini je dostupan u Codex aplikaciji, CLI-ju, IDE ekstenziji i na webu. Koristi samo 30% GPT‑5.4 kvota, omogućavajući programerima da brzo rješavaju jednostavnije zadatke kodiranja u Codex za otprilike jednu trećinu troška. Codex može također delegirati na GPT‑5.4 mini podagente kako bi se rad koji zahtijeva manje rezonovanja pokretao na jeftinijem modelu.

U ChatGPT‑u, GPT‑5.4 mini je dostupan korisnicima Free and Go verzije putem funkcije „Thinking“ u meniju +. Za sve ostale korisnike, GPT‑5.4 mini je dostupan kao rezervna opcija pri ograničenju brzine za GPT‑5.4 Thinking.

GPT‑5.4 nano je dostupan samo u API-ju i košta 0,20 USD po 1M ulaznih tokena i 1,25 USD po 1M izlaznih tokena.

Za više informacija o zaštitnim mjerama modela, pogledaj dodatak kartici sistema na našem Deployment Safety Hubu(otvara se u novom prozoru).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 Najviši napor razmišljanja dostupan za GPT‑5 mini je 'visok'.

2 Ukupna udaljenost uređivanja. OmniDocBench je pokrenut s parametrom reasoning_effort postavljenim na 'none', kako bi odražavao performanse niskih troškova i niske latentnosti.

Autor

OpenAI