17. března 2026

Představujeme GPT‑5.4 mini a nano

Rychlé a efektivní modely optimalizované pro programování a podřízené agenty

Načítání…

Dnes vydáváme GPT‑5.4 mini a nano, naše dosud nejschopnější malé modely. Přenášejí mnoho silných výhod GPT‑5.4 do rychlejších a efektivnějších modelů navržených pro rozsáhlé úlohy.

GPT‑5.4 mini se výrazně zlepšuje oproti GPT‑5 mini v oblasti programování, uvažování, multimodálního porozumění a používání nástrojů. Přitom běží více než 2x rychleji. V několika hodnoceních, včetně SWE-Bench Pro a OSWorld-Verified, se také blíží výkonu většího modelu GPT‑5.4.

GPT‑5.4 nano je nejmenší a nejlevnější verze GPT‑5.4 pro úkoly, kde je nejdůležitější rychlost a cena. Představuje také výrazné zlepšení oproti GPT‑5 nano. Doporučujeme ho pro třídění, extrakci dat, řazení a podřízené agenty, zvládající jednodušší podpůrné úkoly.

Tyto model jsou navrženy pro typy úloh, kde latence přímo ovlivňuje zážitek z produktu: asistenti pro programování, kteří musí rychle reagovat, podřízení agenti, kteří rychle plní podpůrné úkoly, počítače využívající systémy, které zachycují a interpretují snímky obrazovky, a multimodální aplikace, které dokáží v reálném čase uvažovat nad obrázky. V těchto podmínkách není nejlepším modelem často ten největší: je to ten, který dokáže rychle reagovat, spolehlivě používat nástroje a přesto dobře zvládat složité profesionální úkoly.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Nejvyšší dostupná hodnota hloubky uvažování pro GPT‑5 mini je „high“.}

Naši zákazníci si po otestování modelů GPT‑5.4 mini a nano ve svých pracovních postupech myslí toto:

„GPT-5.4 mini poskytuje na model této třídy silný komplexní výkon. V našich srovnáních byl v rámci několika výstupních úkolů a při vybavování si citací, a to s mnohem nižšími náklady. Oproti většímu modelu GPT-5.4 dosáhl vyšší úspěšnosti při komplexním end-to-end hodnocení a lepší atribuce zdrojů.

– Aabhas Sharma, technický ředitel ve společnosti Hebbia

Programování

GPT‑5.4 mini a nano jsou obzvlášť efektivní při pracovních programovacích krocích, které těží z rychlé iterace. Modely zvládají cílené úpravy, orientaci v kódové základně, generování front-endu a smyčky ladění s nízkou latencí. Díky tomu představují skvělou volbu pro úlohy programování, které je potřeba dokončit rychleji a s nižšími náklady.

Ve srovnáních model GPT‑5.4 mini při podobných latencích konzistentně překonává GPT‑5‑mini a blíží se míře úspěšnosti modelu GPT‑5.4 a současně výrazně rychleji běží a poskytuje jeden z nejlepších kompromisů mezi výkonem a latencí pro pracovní postupy programování.

Latenci odhadujeme na základě chování našich modelů v produkčním prostředí a jeho simulací offline. Odhad latence zohledňuje dobu trvání volání nástroje (doba provádění kódu), vzorkované tokeny a vstupní tokeny. Latence v reálném světě se může výrazně lišit a závisí na mnoha faktorech, které naše simulace nezachycuje. Podobně jsou náklady odhadovány na základě stanovení cen API těchto modelů v době psaní. Náklady se mohou v budoucnu změnit. Hloubka uvažování byla zvýšena z low na xhigh.

Podřízené agenty

GPT‑5.4 mini je také skvělou volbou pro systémy, které kombinují modely různých velikostí. Například v Codexu může větší model, jako je GPT‑5.4, zvládat plánování, koordinaci a konečné rozhodování a delegovat na podřízené agenty GPT‑5.4 mini, kteří paralelně zpracovávají úžeji vymezené dílčí úkoly, například prohledávání kódové základny, kontrolu velkého souboru nebo zpracování podpůrných dokumentů. Podívej se na dokumenty⁠(otevře se v novém okně), jak v Codexu fungují podřízení agenti.

Tento vzorec se stává užitečnějším, protože menší modely jsou rychlejší a schopnější. Namísto používání jednoho modelu na všechno mohou vývojáři skládat systémy, kde větší modely rozhodují, co dělat, a menší modely rychle vykonávají rozsáhlé úlohy. GPT‑5.4 mini je náš dosud nejsilnější mini model určený pro tento styl pracovního postupu.

Používání počítače

Model GPT‑5.4 mini je také silný v multimodálních úlohách, zejména v těch souvisejících s používáním počítače. Model dokáže rychle interpretovat snímky obrazovky složitých uživatelských rozhraní, aby dokázal rychle plnit úkoly při používání počítače. Ve srovnání OSWorld-Verified se GPT‑5.4 mini přibližuje modelu GPT‑5.4 a zároveň výrazně překonává GPT‑5 mini.

Dostupnost a stanovení cen

GPT‑5.4 mini je dnes k dispozici v rozhraní API, Codexu a ChatGPT.

V rozhraní API podporuje model GPT‑5.4 mini textové a obrazové zadávání, používání nástrojů, volání funkcí, vyhledávání na webu, vyhledávání souborů, práci s počítačem a dovednosti. Má kontextové okno 400 000 a stojí 0,75 USD za 1 milion vstupních tokenů a 4,50 $ za 1 milion výstupních tokenů.

V Codexu je model GPT‑5.4 mini k dispozici v aplikaci Codex, CLI, rozšíření IDE a na webu. Používá pouze 30 % kvóty modelu GPT‑5.4, což vývojářům umožňuje rychle řešit jednodušší programovací úkoly v Codexu za přibližně třetinové náklady. Codex může také delegovat na podřízené agenty GPT‑5.4 mini, takže práce méně náročná na uvažování budou probíhat na levnějším modelu.

V ChatGPT je GPT‑5.4 mini k dispozici uživatelům verzí Free a Go prostřednictvím volby „Thinking“ v nabídce +. Všem ostatním uživatelům je model GPT‑5.4 mini k dispozici jako záložní možnost při překročení limitu požadavků na GPT‑5.4. Thinking.

Model GPT‑5.4 nano je dostupný pouze v rozhraní API a stojí 0,20 USD za milion vstupních tokenů a 1,25 USD za milion výstupních tokenů.

Další informace o ochranných opatřeních modelů najdete v dodatku ke kartě systému v našem Centru bezpečnosti nasazení⁠(otevře se v novém okně).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Nejvyšší dostupná hodnota hloubky uvažování pro GPT‑5 mini je „high“.}

^{2 Celková editační vzdálenost. OmniDocBench byl spuštěn s hloubkou uvažování nastavenou na none tak, aby odrážel nízkonákladový výkon s nízkou latencí.}

2026

Autor

OpenAI

Pokračuj ve čtení

Zobrazit vše

Launching Health in ChatGPT

Produkt23. 7. 2026

How news organizations are using AI > Card Image

Jak média využívají AI k naplňování svého důležitého poslání

Společnost22. 7. 2026

Představujeme OpenAI Presence

Produkt22. 7. 2026