Představujeme GPT‑5.4 mini a nano
Rychlé a efektivní modely optimalizované pro programování a podřízené agenty
Dnes vydáváme GPT‑5.4 mini a nano, naše dosud nejschopnější malé modely. Přenášejí mnoho silných výhod GPT‑5.4 do rychlejších a efektivnějších modelů navržených pro rozsáhlé úlohy.
GPT‑5.4 mini se výrazně zlepšuje oproti GPT‑5 mini v oblasti programování, uvažování, multimodálního porozumění a používání nástrojů. Přitom běží více než 2x rychleji. V několika hodnoceních, včetně SWE-Bench Pro a OSWorld-Verified, se také blíží výkonu většího modelu GPT‑5.4.
GPT‑5.4 nano je nejmenší a nejlevnější verze GPT‑5.4 pro úkoly, kde je nejdůležitější rychlost a cena. Představuje také výrazné zlepšení oproti GPT‑5 nano. Doporučujeme ho pro třídění, extrakci dat, řazení a podřízené agenty, zvládající jednodušší podpůrné úkoly.
Tyto model jsou navrženy pro typy úloh, kde latence přímo ovlivňuje zážitek z produktu: asistenti pro programování, kteří musí rychle reagovat, podřízení agenti, kteří rychle plní podpůrné úkoly, počítače využívající systémy, které zachycují a interpretují snímky obrazovky, a multimodální aplikace, které dokáží v reálném čase uvažovat nad obrázky. V těchto podmínkách není nejlepším modelem často ten největší: je to ten, který dokáže rychle reagovat, spolehlivě používat nástroje a přesto dobře zvládat složité profesionální úkoly.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 Nejvyšší dostupná hodnota hloubky uvažování pro GPT‑5 mini je „high“.
Naši zákazníci si po otestování modelů GPT‑5.4 mini a nano ve svých pracovních postupech myslí toto:
„GPT-5.4 mini poskytuje na model této třídy silný komplexní výkon. V našich srovnáních byl v rámci několika výstupních úkolů a při vybavování si citací, a to s mnohem nižšími náklady. Oproti většímu modelu GPT-5.4 dosáhl vyšší úspěšnosti při komplexním end-to-end hodnocení a lepší atribuce zdrojů.
GPT‑5.4 mini a nano jsou obzvlášť efektivní při pracovních programovacích krocích, které těží z rychlé iterace. Modely zvládají cílené úpravy, orientaci v kódové základně, generování front-endu a smyčky ladění s nízkou latencí. Díky tomu představují skvělou volbu pro úlohy programování, které je potřeba dokončit rychleji a s nižšími náklady.
Ve srovnáních model GPT‑5.4 mini při podobných latencích konzistentně překonává GPT‑5‑mini a blíží se míře úspěšnosti modelu GPT‑5.4 a současně výrazně rychleji běží a poskytuje jeden z nejlepších kompromisů mezi výkonem a latencí pro pracovní postupy programování.
Latenci odhadujeme na základě chování našich modelů v produkčním prostředí a jeho simulací offline. Odhad latence zohledňuje dobu trvání volání nástroje (doba provádění kódu), vzorkované tokeny a vstupní tokeny. Latence v reálném světě se může výrazně lišit a závisí na mnoha faktorech, které naše simulace nezachycuje. Podobně jsou náklady odhadovány na základě stanovení cen API těchto modelů v době psaní. Náklady se mohou v budoucnu změnit. Hloubka uvažování byla zvýšena z low na xhigh.
GPT‑5.4 mini je také skvělou volbou pro systémy, které kombinují modely různých velikostí. Například v Codexu může větší model, jako je GPT‑5.4, zvládat plánování, koordinaci a konečné rozhodování a delegovat na podřízené agenty GPT‑5.4 mini, kteří paralelně zpracovávají úžeji vymezené dílčí úkoly, například prohledávání kódové základny, kontrolu velkého souboru nebo zpracování podpůrných dokumentů. Podívej se na dokumenty(otevře se v novém okně), jak v Codexu fungují podřízení agenti.
Tento vzorec se stává užitečnějším, protože menší modely jsou rychlejší a schopnější. Namísto používání jednoho modelu na všechno mohou vývojáři skládat systémy, kde větší modely rozhodují, co dělat, a menší modely rychle vykonávají rozsáhlé úlohy. GPT‑5.4 mini je náš dosud nejsilnější mini model určený pro tento styl pracovního postupu.
Model GPT‑5.4 mini je také silný v multimodálních úlohách, zejména v těch souvisejících s používáním počítače. Model dokáže rychle interpretovat snímky obrazovky složitých uživatelských rozhraní, aby dokázal rychle plnit úkoly při používání počítače. Ve srovnání OSWorld-Verified se GPT‑5.4 mini přibližuje modelu GPT‑5.4 a zároveň výrazně překonává GPT‑5 mini.
GPT‑5.4 mini je dnes k dispozici v rozhraní API, Codexu a ChatGPT.
V rozhraní API podporuje model GPT‑5.4 mini textové a obrazové zadávání, používání nástrojů, volání funkcí, vyhledávání na webu, vyhledávání souborů, práci s počítačem a dovednosti. Má kontextové okno 400 000 a stojí 0,75 USD za 1 milion vstupních tokenů a 4,50 $ za 1 milion výstupních tokenů.
V Codexu je model GPT‑5.4 mini k dispozici v aplikaci Codex, CLI, rozšíření IDE a na webu. Používá pouze 30 % kvóty modelu GPT‑5.4, což vývojářům umožňuje rychle řešit jednodušší programovací úkoly v Codexu za přibližně třetinové náklady. Codex může také delegovat na podřízené agenty GPT‑5.4 mini, takže práce méně náročná na uvažování budou probíhat na levnějším modelu.
V ChatGPT je GPT‑5.4 mini k dispozici uživatelům verzí Free a Go prostřednictvím volby „Thinking“ v nabídce +. Všem ostatním uživatelům je model GPT‑5.4 mini k dispozici jako záložní možnost při překročení limitu požadavků na GPT‑5.4. Thinking.
Model GPT‑5.4 nano je dostupný pouze v rozhraní API a stojí 0,20 USD za milion vstupních tokenů a 1,25 USD za milion výstupních tokenů.
Další informace o ochranných opatřeních modelů najdete v dodatku ke kartě systému v našem Centru bezpečnosti nasazení(otevře se v novém okně).
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 Nejvyšší dostupná hodnota hloubky uvažování pro GPT‑5 mini je „high“.
2 Celková editační vzdálenost. OmniDocBench byl spuštěn s hloubkou uvažování nastavenou na none tak, aby odrážel nízkonákladový výkon s nízkou latencí.


