Danas objavljujemo GPT‑5.4 mini i nano, naše najsposobnije male modele do sada. Donose mnoge prednosti GPT‑5.4 u brže i efikasnije modele, dizajnirane za radna opterećenja velikog obima.
GPT‑5.4 mini značajno poboljšava u odnosu na GPT‑5 mini u programiranju, rezonovanju, multimodalnom razumijevanju i korištenju alata, uz to što radi više od 2x brže. Također se približava performansama većeg GPT‑5.4 modela na nekoliko evaluacija, uključujući SWE-Bench Pro i OSWorld-Verified.
GPT‑5.4 nano je najmanja i najjeftinija verzija GPT‑5.4 za zadatke gdje su brzina i trošak najvažniji. Ovo je također značajno poboljšanje u odnosu na GPT‑5 nano. Preporučujemo ga za klasifikaciju, izdvajanje podataka, rangiranje i podagente za kodiranje koji obavljaju jednostavnije pomoćne zadatke.
Ovi modeli su napravljeni za tipove radnih opterećenja u kojima latencija direktno oblikuje doživljaj proizvoda: asistente za kodiranje koji moraju biti odzivni, podagente koji brzo završavaju pomoćne zadatke, sisteme koji koriste računar i snimaju, te tumače snimke ekrana, te višemodalne aplikacije koje mogu rezonovati na osnovu slika u realnom vremenu. U ovim postavkama, najbolji model često nije najveći — to je onaj koji može brzo odgovoriti, pouzdano koristiti alate i i dalje dobro obavljati složene profesionalne zadatke.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 Najviši napor razmišljanja dostupan za GPT‑5 mini je 'visok'.
Evo šta naši korisnici misle nakon testiranja GPT‑5.4 mini i nano u svojim radnim tokovima:
„GPT-5.4 mini pruža snažne end-to-end performanse za model u ovoj klasi. U našim evaluacijama se po rezultatima na nekoliko izlaznih zadataka i prisjećanju citata podudarao s konkurentskim modelima ili ih je nadmašio, uz znatno niži trošak. Također je postigao veću stopu prolaznosti od početka do kraja i snažniju atribuciju izvora nego veći GPT-5.4 model.
GPT‑5.4 mini i nano su posebno dobri u procesima kodiranja gdje je brza iteracija važna. Modeli omogućavaju ciljane izmjene, snalaženje u kodu, generisanje front-enda i debagovanje petlji uz nisku latenciju, što ih čini odličnim izborom za zadatke kodiranja koje treba završiti brže i uz niže troškove.
U testovima performansi, GPT‑5.4 mini dosljedno nadmašuje GPT‑5‑mini pri sličnim latencijama i približava se nivou GPT‑5.4 stope prolaznosti uz mnogo brži rad, pružajući jedan od najjačih omjera performansi i latencije za tokove rada kodiranja.
Procjenjujemo latenciju posmatrajući ponašanje naših modela u produkciji i simulirajući to offline. Procjena latencije uzima u obzir trajanje poziva alata (vrijeme izvršavanja koda), uzorkovane tokene i ulazne tokene. Latencija u stvarnom svijetu može značajno varirati i zavisi od mnogih faktora koji nisu obuhvaćeni našom simulacijom. Slično tome, troškovi se procjenjuju na osnovu API cijena ovih modela u vrijeme pisanja. Troškovi se u budućnosti mogu promijeniti. Napori rezonovanja su povećani sa low na xhigh.
GPT‑5.4 mini je također snažan izbor za sisteme koji kombinuju modele različitih veličina. U Codex, na primjer, veći model poput GPT‑5.4 može obavljati planiranje, koordinaciju i konačnu prosudbu, dok delegira GPT‑5.4 mini podagentima koji paralelno obavljaju uže podzadatke—poput pretraživanja baze koda, pregleda velike datoteke ili obrade pratećih dokumenata. Saznaj kako subagenti funkcionišu u Codexu u dokumentaciji(otvara se u novom prozoru).
Ovaj obrazac postaje korisniji kako manji modeli postaju brži i sposobniji. Umjesto da koriste jedan model za sve, programeri mogu sastavljati sisteme gdje veći modeli odlučuju šta će raditi, a manji modeli brzo izvršavaju na velikoj skali. GPT‑5.4 mini je naš najjači mini model do sada za takav radni tok.
GPT‑5.4 mini je također snažan u multimodalnim zadacima, posebno onima povezanim s korištenjem računara. Model može brzo interpretirati snimke ekrana gustih korisničkih interfejsa kako bi s brzinom obavio zadatke korištenja računara. Na OSWorld-Verified, GPT‑5.4 mini se približava GPT‑5.4, dok istovremeno znatno nadmašuje GPT‑5 mini.
GPT‑5.4 mini je dostupan već danas u API-ju, Codex-u i ChatGPT‑u.
U API-ju, GPT‑5.4 mini podržava unos teksta i slika, korištenje alata, pozivanje funkcija, web-pretragu, pretragu datoteka, korištenje računara i vještina. Ima kontekstni prozor od 400k i košta 0,75 USD po 1M ulaznih tokena i 4,50 USD po 1M izlaznih tokena.
U Codex, GPT‑5.4 mini je dostupan u Codex aplikaciji, CLI-ju, IDE ekstenziji i na webu. Koristi samo 30% GPT‑5.4 kvota, omogućavajući programerima da brzo rješavaju jednostavnije zadatke kodiranja u Codex za otprilike jednu trećinu troška. Codex može također delegirati na GPT‑5.4 mini podagente kako bi se rad koji zahtijeva manje rezonovanja pokretao na jeftinijem modelu.
U ChatGPT‑u, GPT‑5.4 mini je dostupan korisnicima Free and Go verzije putem funkcije „Thinking“ u meniju +. Za sve ostale korisnike, GPT‑5.4 mini je dostupan kao rezervna opcija pri ograničenju brzine za GPT‑5.4 Thinking.
GPT‑5.4 nano je dostupan samo u API-ju i košta 0,20 USD po 1M ulaznih tokena i 1,25 USD po 1M izlaznih tokena.
Za više informacija o zaštitnim mjerama modela, pogledaj dodatak kartici sistema na našem Deployment Safety Hubu(otvara se u novom prozoru).
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 Najviši napor razmišljanja dostupan za GPT‑5 mini je 'visok'.
2 Ukupna udaljenost uređivanja. OmniDocBench je pokrenut s parametrom reasoning_effort postavljenim na 'none', kako bi odražavao performanse niskih troškova i niske latentnosti.


