Днес пускаме GPT‑5.4 mini и nano, нашите най-способни малки модели досега. Те пренасят много от силните страни на GPT‑5.4 към по-бързи, по-ефективни модели, проектирани за натоварвания с голям обем.
GPT‑5.4 mini е значително подобрение спрямо GPT‑5 mini в областта на програмирането, логическото разсъждаване, мултимодалното разбиране и използването на инструменти, като същевременно работи с над 2 пъти по-висока скорост. Той също така се доближава до производителността на по-големия GPT‑5.4 модел при няколко оценки, включително SWE-Bench Pro и OSWorld-Verified.
GPT‑5.4 nano е най-малката и най-евтината версия на GPT‑5.4 за задачи, при които скоростта и цената са от най-голямо значение. Това е значително подобрение спрямо GPT‑5 nano. Препоръчваме го за класификация, извличане на данни, класиране и подагенти, които изпълняват по-прости подпомагащи задачи.
Тези модели са създадени за натоварвания, при които забавянето директно определя продуктовото изживяване: програмиращи асистенти, които трябва да бъдат отзивчиви; подпомагащи агенти, които бързо изпълняват поддържащи задачи; системи за работа с компютър, които заснемат и интерпретират екранни снимки; и мултимодални приложения, които могат да правят изводи върху изображения в реално време. В тези настройки най-добрият модел често не е най-големият – той е този, който може да отговаря бързо, да използва инструменти надеждно и въпреки това да се справя добре със сложни професионални задачи.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 Най-високото налично ниво на reasoning_effort за GPT‑5 mini е „high“.
Ето какво мислят нашите клиенти след като тестваха GPT‑5.4 mini и nano в своите работни процеси:
„GPT-5.4 mini предоставя силна цялостна производителност за модел в този клас. В нашите оценки той беше или наравно с, или надминаваше конкурентните модели при няколко задачи за генериране на резултати и припомняне на цитирания при много по-ниска цена. Също така постигна по-високи крайни нива на успешно преминаване на задачите и по-силно определяне на източниците в сравнение с по-големия модел GPT-5.4.“
GPT‑5.4 mini и nano са особено ефективни в работни процеси за програмиране, които се нуждаят от бърза итерация. Моделите се справят с целенасочени редакции, навигация в кодовата база, генериране на фронтенд и цикли за отстраняване на грешки с ниско забавяне, което ги прави много подходящи за задачи за кодиране, които трябва да бъдат изпълнени с по-висока скорост и по-ниски разходи.
В еталоните GPT‑5.4 mini последователно превъзхожда GPT‑5‑mini при сходни забавяния и се доближава до процента на успеваемост на GPT‑5.4‑level, като същевременно работи много по-бързо, осигурявайки един от най-силните компромиси между производителност и закъснение за работни потоци за писане на код.
Оценяваме забавянето, като разглеждаме поведението на нашите модели в производствена среда и го симулираме офлайн. Оценката за забавянето отчита продължителността на заявката на инструмента (време за изпълнение на кода), подбраните и входящите токени. Забавянето в реални случаи може да варира значително и зависи от много фактори, които не са обхванати в нашата симулация. По подобен начин разходите се оценяват въз основа на ценообразуването на API за тези модели към момента на писане. Разходите може да се променят в бъдеще. Усилията за структурирано анализиране бяха повишени от ниски (low) до свръхвисоки (xhigh).
GPT‑5.4 mini също така е много подходящ за системи, които комбинират модели с различни размери. В Codex, например, по-голям модел като GPT‑5.4 може да се справя с планиране, координация и окончателна преценка, като същевременно възлага задачи към мини подагенти на GPT‑5.4, които обработват по-тесни подзадачи паралелно – като търсене в кодовата база, преглед на голям файл или обработка на придружаващи документи. Научете как работят подагентите в Codex в документите(отваря се в нов прозорец).
Този модел става по-полезен, тъй като по-малките модели стават по-бързи и по-способни. Вместо да използват един модел за всичко, разработчиците могат да съставят системи, при които по-големите модели решават какво да се прави, а по-малките модели изпълняват бързо в мащаб. GPT‑5.4 mini е нашият най-мощен мини модел досега за този тип работен процес.
GPT‑5.4 mini е също така силен при мултимодални задачи, особено тези, свързани с използване на компютър. Моделът може бързо да интерпретира екранни снимки на плътни потребителски интерфейси, за да изпълнява задачи за използване на компютър с висока скорост. В OSWorld-Verified GPT‑5.4 mini се доближава до GPT‑5.4, като същевременно значително превъзхожда GPT‑5 mini.
GPT‑5.4 mini е наличен днес в API, Codex и ChatGPT.
В API GPT‑5.4 mini поддържа въвеждане на текст и изображения, използване на инструменти, извикване на функции, уеб търсене, търсене във файлове, работа с компютър и умения. Има контекстен прозорец от 400 000 и струва 0,75 $ на 1 мил. входни токени и 4,50 $ на 1 мил. изходни токени.
В Codex GPT‑5.4 mini е наличен в приложението Codex, CLI, разширението за IDE и уеб. Използва само 30% от квотата на GPT‑5.4, което позволява на разработчиците бързо да се справят с по-прости задачи по кодиране в Codex за около една трета от цената. Codex може също така да възлага задачи към мини подагенти на GPT‑5.4, така че работа, изискваща по-малко структурирано анализиране, да се изпълнява от по-евтиния модел.
В ChatGPT, GPT‑5.4 mini е наличен за потребителите на Free и Go чрез функцията „Thinking“ в + менюто. За всички останали потребители GPT‑5.4 mini е наличен като резервен вариант при достигане на лимита на заявките за GPT‑5.4 Thinking.
GPT‑5.4 nano е наличен само в API и струва $0,20 на 1 мил. входящи токени и $1,25 на 1 мил. изходящи токени.
За повече информация относно мерките за безопасност на моделите, моля, разгледайте допълнението към системната карта в нашия Център за безопасност при внедряване(отваря се в нов прозорец).
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 Най-високото налично ниво на reasoning_effort за GPT‑5 mini е „high“.
2 Общо разстояние за редактиране. OmniDocBench беше изпълнено с reasoning_effort, зададено на „none“, за да отрази нискобюджетна и нисколатентна производителност.


