Přeskoč na hlavní obsah
OpenAI

17. března 2026

SpolečnostProdukt

Představujeme GPT‑5.4 mini a nano

Rychlé a efektivní modely optimalizované pro programování a podřízené agenty

Načítání…

Dnes vydáváme GPT‑5.4 mini a nano, naše dosud nejschopnější malé modely. Přenášejí mnoho silných výhod GPT‑5.4 do rychlejších a efektivnějších modelů navržených pro rozsáhlé úlohy.

GPT‑5.4 mini se výrazně zlepšuje oproti GPT‑5 mini v oblasti programování, uvažování, multimodálního porozumění a používání nástrojů. Přitom běží více než 2x rychleji. V několika hodnoceních, včetně SWE-Bench Pro a OSWorld-Verified, se také blíží výkonu většího modelu GPT‑5.4.

GPT‑5.4 nano je nejmenší a nejlevnější verze GPT‑5.4 pro úkoly, kde je nejdůležitější rychlost a cena. Představuje také výrazné zlepšení oproti GPT‑5 nano. Doporučujeme ho pro třídění, extrakci dat, řazení a podřízené agenty, zvládající jednodušší podpůrné úkoly.

Tyto model jsou navrženy pro typy úloh, kde latence přímo ovlivňuje zážitek z produktu: asistenti pro programování, kteří musí rychle reagovat, podřízení agenti, kteří rychle plní podpůrné úkoly, počítače využívající systémy, které zachycují a interpretují snímky obrazovky, a multimodální aplikace, které dokáží v reálném čase uvažovat nad obrázky. V těchto podmínkách není nejlepším modelem často ten největší: je to ten, který dokáže rychle reagovat, spolehlivě používat nástroje a přesto dobře zvládat složité profesionální úkoly.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 Nejvyšší dostupná hodnota hloubky uvažování pro GPT‑5 mini je „high“.

Naši zákazníci si po otestování modelů GPT‑5.4 mini a nano ve svých pracovních postupech myslí toto:

„GPT-5.4 mini poskytuje na model této třídy silný komplexní výkon. V našich srovnáních byl v rámci několika výstupních úkolů a při vybavování si citací, a to s mnohem nižšími náklady. Oproti většímu modelu GPT-5.4 dosáhl vyšší úspěšnosti při komplexním end-to-end hodnocení a lepší atribuce zdrojů.
– Aabhas Sharma, technický ředitel ve společnosti Hebbia

Programování

GPT‑5.4 mini a nano jsou obzvlášť efektivní při pracovních programovacích krocích, které těží z rychlé iterace. Modely zvládají cílené úpravy, orientaci v kódové základně, generování front-endu a smyčky ladění s nízkou latencí. Díky tomu představují skvělou volbu pro úlohy programování, které je potřeba dokončit rychleji a s nižšími náklady.

Ve srovnáních model GPT‑5.4 mini při podobných latencích konzistentně překonává GPT‑5‑mini a blíží se míře úspěšnosti modelu GPT‑5.4 a současně výrazně rychleji běží a poskytuje jeden z nejlepších kompromisů mezi výkonem a latencí pro pracovní postupy programování.

Latenci odhadujeme na základě chování našich modelů v produkčním prostředí a jeho simulací offline. Odhad latence zohledňuje dobu trvání volání nástroje (doba provádění kódu), vzorkované tokeny a vstupní tokeny. Latence v reálném světě se může výrazně lišit a závisí na mnoha faktorech, které naše simulace nezachycuje. Podobně jsou náklady odhadovány na základě stanovení cen API těchto modelů v době psaní. Náklady se mohou v budoucnu změnit. Hloubka uvažování byla zvýšena z low na xhigh.

Podřízené agenty

GPT‑5.4 mini je také skvělou volbou pro systémy, které kombinují modely různých velikostí. Například v Codexu může větší model, jako je GPT‑5.4, zvládat plánování, koordinaci a konečné rozhodování a delegovat na podřízené agenty GPT‑5.4 mini, kteří paralelně zpracovávají úžeji vymezené dílčí úkoly, například prohledávání kódové základny, kontrolu velkého souboru nebo zpracování podpůrných dokumentů. Podívej se na dokumenty(otevře se v novém okně), jak v Codexu fungují podřízení agenti.

Tento vzorec se stává užitečnějším, protože menší modely jsou rychlejší a schopnější. Namísto používání jednoho modelu na všechno mohou vývojáři skládat systémy, kde větší modely rozhodují, co dělat, a menší modely rychle vykonávají rozsáhlé úlohy. GPT‑5.4 mini je náš dosud nejsilnější mini model určený pro tento styl pracovního postupu.

Používání počítače

Model GPT‑5.4 mini je také silný v multimodálních úlohách, zejména v těch souvisejících s používáním počítače. Model dokáže rychle interpretovat snímky obrazovky složitých uživatelských rozhraní, aby dokázal rychle plnit úkoly při používání počítače. Ve srovnání OSWorld-Verified se GPT‑5.4 mini přibližuje modelu GPT‑5.4 a zároveň výrazně překonává GPT‑5 mini.

Dostupnost a stanovení cen

GPT‑5.4 mini je dnes k dispozici v rozhraní API, Codexu a ChatGPT.

V rozhraní API podporuje model GPT‑5.4 mini textové a obrazové zadávání, používání nástrojů, volání funkcí, vyhledávání na webu, vyhledávání souborů, práci s počítačem a dovednosti. Má kontextové okno 400 000 a stojí 0,75 USD za 1 milion vstupních tokenů a 4,50 $ za 1 milion výstupních tokenů.

V Codexu je model GPT‑5.4 mini k dispozici v aplikaci Codex, CLI, rozšíření IDE a na webu. Používá pouze 30 % kvóty modelu GPT‑5.4, což vývojářům umožňuje rychle řešit jednodušší programovací úkoly v Codexu za přibližně třetinové náklady. Codex může také delegovat na podřízené agenty GPT‑5.4 mini, takže práce méně náročná na uvažování budou probíhat na levnějším modelu.

V ChatGPT je GPT‑5.4 mini k dispozici uživatelům verzí Free a Go prostřednictvím volby „Thinking“ v nabídce +. Všem ostatním uživatelům je model GPT‑5.4 mini k dispozici jako záložní možnost při překročení limitu požadavků na GPT‑5.4. Thinking.

Model GPT‑5.4 nano je dostupný pouze v rozhraní API a stojí 0,20 USD za milion vstupních tokenů a 1,25 USD za milion výstupních tokenů.

Další informace o ochranných opatřeních modelů najdete v dodatku ke kartě systému v našem Centru bezpečnosti nasazení(otevře se v novém okně).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 Nejvyšší dostupná hodnota hloubky uvažování pro GPT‑5 mini je „high“.

2 Celková editační vzdálenost. OmniDocBench byl spuštěn s hloubkou uvažování nastavenou na none tak, aby odrážel nízkonákladový výkon s nízkou latencí.

Autor

OpenAI