17. mart 2026.

Predstavljamo GPT‑5.4 mini i nano

Brzi i efikasni modeli optimizirani za kodiranje i subagente

Učitavanje…

Danas objavljujemo GPT‑5.4 mini i nano, naše najsposobnije male modele do sada. Donose mnoge prednosti GPT‑5.4 u brže i efikasnije modele, dizajnirane za radna opterećenja velikog obima.

GPT‑5.4 mini značajno poboljšava u odnosu na GPT‑5 mini u programiranju, rezonovanju, multimodalnom razumijevanju i korištenju alata, uz to što radi više od 2x brže. Također se približava performansama većeg GPT‑5.4 modela na nekoliko evaluacija, uključujući SWE-Bench Pro i OSWorld-Verified.

GPT‑5.4 nano je najmanja i najjeftinija verzija GPT‑5.4 za zadatke gdje su brzina i trošak najvažniji. Ovo je također značajno poboljšanje u odnosu na GPT‑5 nano. Preporučujemo ga za klasifikaciju, izdvajanje podataka, rangiranje i podagente za kodiranje koji obavljaju jednostavnije pomoćne zadatke.

Ovi modeli su napravljeni za tipove radnih opterećenja u kojima latencija direktno oblikuje doživljaj proizvoda: asistente za kodiranje koji moraju biti odzivni, podagente koji brzo završavaju pomoćne zadatke, sisteme koji koriste računar i snimaju, te tumače snimke ekrana, te višemodalne aplikacije koje mogu rezonovati na osnovu slika u realnom vremenu. U ovim postavkama, najbolji model često nije najveći — to je onaj koji može brzo odgovoriti, pouzdano koristiti alate i i dalje dobro obavljati složene profesionalne zadatke.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Najviši napor razmišljanja dostupan za GPT‑5 mini je 'visok'.}

Evo šta naši korisnici misle nakon testiranja GPT‑5.4 mini i nano u svojim radnim tokovima:

„GPT-5.4 mini pruža snažne end-to-end performanse za model u ovoj klasi. U našim evaluacijama se po rezultatima na nekoliko izlaznih zadataka i prisjećanju citata podudarao s konkurentskim modelima ili ih je nadmašio, uz znatno niži trošak. Također je postigao veću stopu prolaznosti od početka do kraja i snažniju atribuciju izvora nego veći GPT-5.4 model.

— Aabhas Sharma, glavni tehnički direktor u Hebbia

Kodiranje

GPT‑5.4 mini i nano su posebno dobri u procesima kodiranja gdje je brza iteracija važna. Modeli omogućavaju ciljane izmjene, snalaženje u kodu, generisanje front-enda i debagovanje petlji uz nisku latenciju, što ih čini odličnim izborom za zadatke kodiranja koje treba završiti brže i uz niže troškove.

U testovima performansi, GPT‑5.4 mini dosljedno nadmašuje GPT‑5‑mini pri sličnim latencijama i približava se nivou GPT‑5.4 stope prolaznosti uz mnogo brži rad, pružajući jedan od najjačih omjera performansi i latencije za tokove rada kodiranja.

Procjenjujemo latenciju posmatrajući ponašanje naših modela u produkciji i simulirajući to offline. Procjena latencije uzima u obzir trajanje poziva alata (vrijeme izvršavanja koda), uzorkovane tokene i ulazne tokene. Latencija u stvarnom svijetu može značajno varirati i zavisi od mnogih faktora koji nisu obuhvaćeni našom simulacijom. Slično tome, troškovi se procjenjuju na osnovu API cijena ovih modela u vrijeme pisanja. Troškovi se u budućnosti mogu promijeniti. Napori rezonovanja su povećani sa low na xhigh.

Subagenti

GPT‑5.4 mini je također snažan izbor za sisteme koji kombinuju modele različitih veličina. U Codex, na primjer, veći model poput GPT‑5.4 može obavljati planiranje, koordinaciju i konačnu prosudbu, dok delegira GPT‑5.4 mini podagentima koji paralelno obavljaju uže podzadatke—poput pretraživanja baze koda, pregleda velike datoteke ili obrade pratećih dokumenata. Saznaj kako subagenti funkcionišu u Codexu u dokumentaciji⁠(otvara se u novom prozoru).

Ovaj obrazac postaje korisniji kako manji modeli postaju brži i sposobniji. Umjesto da koriste jedan model za sve, programeri mogu sastavljati sisteme gdje veći modeli odlučuju šta će raditi, a manji modeli brzo izvršavaju na velikoj skali. GPT‑5.4 mini je naš najjači mini model do sada za takav radni tok.

Upotreba računara

GPT‑5.4 mini je također snažan u multimodalnim zadacima, posebno onima povezanim s korištenjem računara. Model može brzo interpretirati snimke ekrana gustih korisničkih interfejsa kako bi s brzinom obavio zadatke korištenja računara. Na OSWorld-Verified, GPT‑5.4 mini se približava GPT‑5.4, dok istovremeno znatno nadmašuje GPT‑5 mini.

Dostupnost i cijene

GPT‑5.4 mini je dostupan već danas u API-ju, Codex-u i ChatGPT‑u.

U API-ju, GPT‑5.4 mini podržava unos teksta i slika, korištenje alata, pozivanje funkcija, web-pretragu, pretragu datoteka, korištenje računara i vještina. Ima kontekstni prozor od 400k i košta 0,75 USD po 1M ulaznih tokena i 4,50 USD po 1M izlaznih tokena.

U Codex, GPT‑5.4 mini je dostupan u Codex aplikaciji, CLI-ju, IDE ekstenziji i na webu. Koristi samo 30% GPT‑5.4 kvota, omogućavajući programerima da brzo rješavaju jednostavnije zadatke kodiranja u Codex za otprilike jednu trećinu troška. Codex može također delegirati na GPT‑5.4 mini podagente kako bi se rad koji zahtijeva manje rezonovanja pokretao na jeftinijem modelu.

U ChatGPT‑u, GPT‑5.4 mini je dostupan korisnicima Free and Go verzije putem funkcije „Thinking“ u meniju +. Za sve ostale korisnike, GPT‑5.4 mini je dostupan kao rezervna opcija pri ograničenju brzine za GPT‑5.4 Thinking.

GPT‑5.4 nano je dostupan samo u API-ju i košta 0,20 USD po 1M ulaznih tokena i 1,25 USD po 1M izlaznih tokena.

Za više informacija o zaštitnim mjerama modela, pogledaj dodatak kartici sistema na našem Deployment Safety Hubu⁠(otvara se u novom prozoru).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Najviši napor razmišljanja dostupan za GPT‑5 mini je 'visok'.}

^{2 Ukupna udaljenost uređivanja. OmniDocBench je pokrenut s parametrom reasoning_effort postavljenim na 'none', kako bi odražavao performanse niskih troškova i niske latentnosti.}

2026

Autor

OpenAI

Nastavite čitati

Prikažite sve

Predstavljanje zdravlja u ChatGPT-u

Product23. jul 2026.

How news organizations are using AI > Card Image

Kako novinske organizacije koriste AI za važne misije

Kompanija22. jul 2026.

Predstavljamo OpenAI Presence

Product22. jul 2026.