17. marca 2026

Predstavujeme GPT‑5.4 mini a nano

Rýchle a efektívne modely optimalizované pre kódovanie a subagentov

Načítava sa…

Dnes uvádzame na trh GPT‑5.4 mini a nano, naše doteraz najvýkonnejšie malé modely. Prinášajú mnoho silných stránok GPT‑5.4 do rýchlejších a efektívnejších modelov určených pre vysokoobjemové pracovné zaťaženie.

GPT‑5.4 mini sa oproti GPT‑5 mini výrazne zlepšuje v kódovaní, uvažovaní, multimodálnom porozumení a používaní nástrojov a zároveň beží viac ako 2-krát rýchlejšie. V niekoľkých testoch, vrátane SWE-Bench Pro a OSWorld-Verified, sa tiež blíži k výkonu väčšieho modelu GPT‑5.4.

GPT‑5.4 nano je najmenšia a najlacnejšia verzia GPT‑5.4 pre úlohy, pri ktorých je najdôležitejšia rýchlosť a náklady. Je to tiež významný upgrade oproti GPT‑5 nano. Odporúčame ho na klasifikáciu, extrakciu údajov, hodnotenie a programovacích subagentov, ktorí spracúvajú jednoduchšie podporné úlohy.

Tieto modely sú vytvorené pre typy pracovných zaťažení, kde latencia priamo ovplyvňuje zážitok z používania produktu: programátorskí asistenti, ktorí musia byť pohotoví, subagenti, ktorí rýchlo dokončujú podporné úlohy, počítačové systémy, ktoré zachytávajú a interpretujú snímky obrazovky, a multimodálne aplikácie, ktoré dokážu v reálnom čase analyzovať obrázky. V týchto prostrediach najlepší model často nie je ten najväčší, ale ten, ktorý dokáže rýchlo reagovať, spoľahlivo používať nástroje a stále dobre zvládať zložité profesionálne úlohy.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Najvyššia dostupná hodnota reasoning_effort pre GPT‑5 mini je „vysoká“.}

Tu je názor našich zákazníkov po testovaní GPT‑5.4 mini a nano vo svojich pracovných postupoch:

„GPT-5.4 mini poskytuje silný a komplexný výkon pre model v tejto triede." V našich hodnoteniach sa vyrovnal alebo prekonal konkurenčné modely v niekoľkých výstupných úlohách a v oblasti citovania pri oveľa nižších nákladoch. Dosiahol tiež vyššiu mieru úspešnosti pri komplexných testoch a silnejšie uvádzanie zdrojov než väčší model GPT-5.4."

– Aabhas Sharma, technický riaditeľ v spoločnosti Hebbia

Programovanie

GPT‑5.4 mini a nano sú obzvlášť efektívne v kódovacích pracovných postupoch, ktoré využívajú rýchlu iteráciu. Modely zvládajú cielené úpravy, navigáciu v kódovej základni, generovanie front-endu a cykly ladenia s nízkou latenciou, vďaka čomu sú vhodné pre kódovacie úlohy, ktoré je potrebné dokončiť rýchlejšie a s nižšími nákladmi.

V benchmarkoch GPT‑5.4 mini konzistentne prekonáva GPT‑5‑mini pri podobných latenciách a približuje sa úspešnosti GPT‑5.4, pričom beží oveľa rýchlejšie, čo prináša jeden z najlepších kompromisov medzi výkonom a latenciou pre kódovacie pracovné postupy.

Latenciu odhadujeme tak, že sa pozeráme na produkčné správanie našich modelov a simulujeme to offline. Odhad latencie zohľadňuje trvanie volania nástroja (čas vykonávania kódu), vzorkované tokeny a vstupné tokeny. Latencia v reálnom svete sa môže výrazne líšiť a závisí od mnohých faktorov, ktoré naša simulácia nezachytáva. Podobne sa náklady odhadujú na základe cien API týchto modelov v čase písania. Náklady sa môžu v budúcnosti zmeniť. Úsilie o uvažovanie bolo zvýšené z minimálneho na mimoriadne vysoké (xhigh).

Subagenti

GPT‑5.4 mini je tiež skvelou voľbou pre systémy, ktoré kombinujú modely rôznych veľkostí. Napríklad v Codexe dokáže väčší model, ako je GPT‑5.4, zvládnuť plánovanie, koordináciu a konečné rozhodnutie, pričom deleguje úlohy na subagentov GPT‑5.4 mini, ktorí paralelne spracovávajú užšie podúlohy, ako je vyhľadávanie v kódovej základni, kontrola veľkého súboru alebo spracovanie podporných dokumentov. Ako fungujú subagenti v Codexe sa dozvieš v dokumentácii⁠(otvorí sa v novom okne).

Tento vzorec sa stáva užitočnejším, keďže menšie modely sú rýchlejšie a výkonnejšie. Namiesto používania jedného modelu pre všetko môžu vývojári zostavovať systémy, kde väčšie modely rozhodujú o tom, čo majú robiť, a menšie modely to rýchlo vykonávajú vo veľkom meradle. GPT‑5.4 mini je náš doteraz najsilnejší mini model pre tento štýl pracovného postupu.

Používanie počítača

GPT‑5.4 mini je silný aj v multimodálnych úlohách, najmä v tých, ktoré súvisia s používaním počítača. Model dokáže rýchlo interpretovať snímky obrazovky hustých používateľských rozhraní, aby s rýchlosťou dokončil úlohy používania počítača. V OSWorld-Verified sa GPT‑5.4 mini približuje k GPT‑5.4 a zároveň výrazne prekonáva GPT‑5 mini.

Dostupnosť a ceny

GPT‑5.4 mini je dnes k dispozícii v API, Codex a ChatGPT.

V rozhraní API podporuje GPT‑5.4 mini textové a obrazové vstupy, používanie nástrojov, volanie funkcie, vyhľadávanie na webe, vyhľadávanie súborov, používanie počítača a zručnosti. Má kontextové okno 400k a stojí $0,75 za 1M vstupných token a $4,50 za 1M výstupných tokenov.

V Codex je GPT‑5.4 mini dostupný v aplikácii Codex, rozhraní CLI, rozšírení IDE a na webe. Používa iba 30 % kvóty GPT‑5.4, čo umožňuje vývojárom rýchlo zvládnuť jednoduchšie kódovacie úlohy v Codexe za približne tretinovú cenu. Codex môže tiež delegovať úlohy na subagentov GPT‑5.4 mini, aby menej náročná práca na uvažovanie bežala na lacnejšom modeli.

V ChatGPT je GPT‑5.4 mini dostupný pre používateľov Free and Go prostredníctvom funkcie „Thinking“ v ponuke +. Pre všetkých ostatných používateľov je GPT‑5.4 mini k dispozícii ako záložná možnosť pri prekročení limitu rýchlosti pre GPT‑5.4 Thinking.

GPT‑5.4 nano je k dispozícii iba v rozhraní API a stojí 0,20 USD za 1 milión vstupných tokenov a 1,25 USD za 1 milión výstupných tokenov.

Viac informácií o ochranných opatreniach modelov nájdete v dodatku k systémovej karte⁠(otvorí sa v novom okne) v našom centre Deployment Safety Hub.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Najvyššia dostupná hodnota reasoning_effort pre GPT‑5 mini je „vysoká“.}

^{2 Celková editačná vzdialenosť. OmniDocBench bol spustený s reasoning_effort nastaveným na „žiadne“, aby odrážal nízkonákladový výkon s nízkou latenciou.}

2026

Autor

OpenAI

Pokračovať v čítaní

Zobraziť všetko

Launching Health in ChatGPT

Produkt23. 7. 2026

How news organizations are using AI > Card Image

Ako médiá využívajú AI na podporu svojich kľúčových misií

Spoločnosť22. 7. 2026

Predstavujeme OpenAI Presence

Produkt22. 7. 2026