Pāriet uz galveno saturu
OpenAI

2026. gada 17. marts

UzņēmumsProdukts

Iepazīstinām ar GPT‑5.4 mini un nano

Ātri un efektīvi modeļi, kas optimizēti programmēšanai un apakšaģentiem

Notiek ielāde…

Šodien mēs izlaižam GPT‑5.4 mini un nano, mūsu līdz šim spējīgākos mazos modeļus. Tie ļauj izmantot daudzas GPT‑5.4 priekšrocības ātrākos un efektīvākos modeļos, kas paredzēti liela apjoma darba slodzēm.

GPT‑5.4 mini būtiski uzlabo sniegumu salīdzinājumā ar GPT‑5 mini programmēšanā, spriestspējā, multimodālajā izpratnē un rīku lietošanā, vienlaikus darbojoties vairāk nekā 2x ātrāk. Tas arī vairākos vērtējumos ir tuvs lielā GPT‑5.4 modeļa veiktspējai, tostarp etalonos SWE-Bench Pro un OSWorld-Verified.

GPT‑5.4 nano ir mazākā un lētākā GPT‑5.4 versija uzdevumiem, kuros ātrumam un izmaksām ir vislielākā nozīme. Tas ir arī nozīmīgs uzlabojums salīdzinājumā ar GPT‑5 nano. Mēs to iesakām klasifikācijai, datu izgūšanai, rindošanai un programmēšanas apakšaģentiem, kuri veic vienkāršākus atbalsta uzdevumus.

Šie modeļi ir veidoti tādām darba slodzēm, kurās latentums tieši ietekmē produkta pieredzi: programmēšanas asistentiem, kuriem jāšķiet atsaucīgiem; apakšaģentiem, kas ātri veic palīguzdevumus; datora lietošanas sistēmām, kas uzņem un interpretē ekrānuzņēmumus; un multimodālām lietojumprogrammām, kas spēj analizēt attēlus reāllaikā. Šādos apstākļos labākais modelis bieži vien nav lielākais – labākais ir modelis, kas spēj ātri reaģēt, uzticami izmantot rīkus un joprojām labi veikt sarežģītus profesionālus uzdevumus.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini augstākā pieejamā reasoning_effort vērtība ir “high”.

Lūk, ko mūsu klienti domā pēc GPT‑5.4 mini un nano testēšanas savās darbplūsmās:

“GPT-5.4 mini nodrošina spēcīgu pilna cikla veiktspēju šīs klases modelim. Mūsu novērtējumos tas pielīdzinājās konkurējošiem modeļiem vai pārspēja tos vairākos izvades uzdevumos un avotu atsaukšanā par daudz zemākām izmaksām. Tas arī sasniedza augstākus pilna cikla caurlaidības rādītājus un precīzāku avotu atribūciju nekā lielais GPT-5.4 modelis."
— Ābhass Šarma, Hebbia tehniskais direktors

Programmēšana

GPT‑5.4 mini un nano ir īpaši efektīvi programmēšanas darbplūsmās, kurās noder ātra iterācija. Modeļi veic mērķtiecīgu rediģēšanu, koda bāzes navigāciju, front-end ģenerēšanu un atkļūdošanas cilpas ar zemu latentumu, tāpēc tie ir piemēroti programmēšanas uzdevumiem, kas jāveic ātrāk un ar zemākām izmaksām.

Salīdzinošajos testos GPT‑5.4 mini konsekventi pārspēj GPT‑5‑mini ar līdzīgu latentumu un tuvojas GPT‑5.4 līmeņa rādītājiem, vienlaikus darbojoties daudz ātrāk, nodrošinot vienu no labākajiem veiktspējas un latentuma kompromisiem programmēšanas darbplūsmām.

Mēs novērtējam latentumu, aplūkojot savu modeļu uzvedību ražošanas vidē un to simulējot bezsaistē. Latentuma novērtējumā ir ņemts vērā rīka izsaukuma ilgums (koda izpildes laiks), ģenerētās tekstvienības un ievades tekstvienības. Reālās pasaules latentums var būtiski atšķirties un ir atkarīgs no daudziem faktoriem, kas nav ietverti mūsu simulācijā. Līdzīgi arī izmaksas tiek aprēķinātas, pamatojoties uz šo modeļu API izcenojumu rakstīšanas brīdī. Izmaksas nākotnē var mainīties. Spriestspējas piepūle tika variēta no zemas (low) līdz ļoti augstai (xhigh).

Apakšagenti

GPT‑5.4 mini ir arī lieliski piemērots sistēmām, kas apvieno dažāda lieluma modeļus. Codex platformā, piemēram, tāds lielāks modelis kā GPT‑5.4 var tikt galā ar plānošanu, koordinēšanu un galīgo spriedumu, vienlaikus deleģējot GPT‑5.4 mini apakšaģentiem, kas paralēli veic šaurākus apakšuzdevumus – piemēram, koda bāzes pārmeklēšanu, liela faila pārskatīšanu vai atbalsta dokumentu apstrādi. Uzzini dokumentācijā(atveras jaunā logā), kā Codex platformā darbojas apakšagenti.

Šī pieeja kļūst noderīgāka, mazākiem modeļiem kļūstot arvien ātrākiem un spējīgākiem. Tā vietā, lai visam izmantotu vienu modeli, izstrādātāji var veidot sistēmas, kurās lielāki modeļi izlemj, ko darīt, bet mazāki modeļi ātri izpilda uzdevumus lielā mērogā. GPT‑5.4 mini ir mūsu līdz šim spēcīgākais mini modelis šāda veida darbplūsmai.

Datora lietošana

GPT‑5.4 mini ir arī spēcīgs multimodālajos uzdevumos, īpaši tajos, kas saistīti ar datora lietošanu. Modelis spēj ātri interpretēt blīvu lietotāja interfeisu ekrānuzņēmumus, lai ātri paveiktu datora lietošanas uzdevumus. OSWorld-Verified vērtējumā GPT‑5.4 mini pietuvojas GPT‑5.4 un būtiski pārspēj GPT‑5 mini.

Pieejamība un izcenojums

GPT‑5.4 mini ir pieejams jau šodien API, Codex un ChatGPT platformās.

API ietvaros GPT‑5.4 mini atbalsta teksta un attēlu ievadi, rīku lietošanu, funkciju izsaukšanu, tīmekļa meklēšanu, failu meklēšanu, datora izmantošanu un prasmes. Tam ir 400k konteksta logs, un tas maksā 0,75 USD par 1M ievades tekstvienību un 4,50 USD par 1M izvades tekstvienību.

Codex platformā GPT‑5.4 mini ir pieejams Codex lietotnē, CLI, IDE paplašinājumā un tīmeklī. Tas izmanto tikai 30% no GPT‑5.4 kvotas, ļaujot izstrādātājiem Codex vidē ātri veikt vienkāršākus programmēšanas uzdevumus par aptuveni vienu trešdaļu no izmaksām. Codex var arī deleģēt GPT‑5.4 mini apakšaģentiem, lai mazāk spriestspēju prasošs darbs tiktu veikts izmaksu ziņā lētākajā modelī.

Platformā ChatGPT modelis GPT‑5.4 mini ir pieejams bezmaksas un Go lietotājiem, izmantojot + izvēlnes funkciju “Thinking”. Visiem pārējiem lietotājiem GPT‑5.4 mini ir pieejams kā rezerves variants ātruma ierobežojuma gadījumā modelim GPT‑5.4 Thinking.

GPT‑5.4 nano ir pieejams tikai API un maksā 0,20 USD par 1M ievades tekstvienību un 1,25 USD par 1M izvades tekstvienību.

Lai uzzinātu vairāk par modeļu drošības pasākumiem, apskati sistēmas kartes pielikumu mūsu Izvietošanas drošības centrā(atveras jaunā logā).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini augstākā pieejamā reasoning_effort vērtība ir “high”.

2 Kopējais rediģēšanas attālums. OmniDocBench tika darbināts ar spriestspējas piepūli “none“, lai atspoguļotu zemu izmaksu un zema latentuma veiktspēju.

Autors

OpenAI