Преминаване към основното съдържание
OpenAI

17 март 2026 г.

КомпанияПродукт

Представяме Ви GPT‑5.4 mini и nano

Бързи и ефективни модели, оптимизирани за кодиране и подагенти

Зареждане…

Днес пускаме GPT‑5.4 mini и nano, нашите най-способни малки модели досега. Те пренасят много от силните страни на GPT‑5.4 към по-бързи, по-ефективни модели, проектирани за натоварвания с голям обем.

GPT‑5.4 mini е значително подобрение спрямо GPT‑5 mini в областта на програмирането, логическото разсъждаване, мултимодалното разбиране и използването на инструменти, като същевременно работи с над 2 пъти по-висока скорост. Той също така се доближава до производителността на по-големия GPT‑5.4 модел при няколко оценки, включително SWE-Bench Pro и OSWorld-Verified.

GPT‑5.4 nano е най-малката и най-евтината версия на GPT‑5.4 за задачи, при които скоростта и цената са от най-голямо значение. Това е значително подобрение спрямо GPT‑5 nano. Препоръчваме го за класификация, извличане на данни, класиране и подагенти, които изпълняват по-прости подпомагащи задачи.

Тези модели са създадени за натоварвания, при които забавянето директно определя продуктовото изживяване: програмиращи асистенти, които трябва да бъдат отзивчиви; подпомагащи агенти, които бързо изпълняват поддържащи задачи; системи за работа с компютър, които заснемат и интерпретират екранни снимки; и мултимодални приложения, които могат да правят изводи върху изображения в реално време. В тези настройки най-добрият модел често не е най-големият – той е този, който може да отговаря бързо, да използва инструменти надеждно и въпреки това да се справя добре със сложни професионални задачи.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 Най-високото налично ниво на reasoning_effort за GPT‑5 mini е „high“.

Ето какво мислят нашите клиенти след като тестваха GPT‑5.4 mini и nano в своите работни процеси:

„GPT-5.4 mini предоставя силна цялостна производителност за модел в този клас. В нашите оценки той беше или наравно с, или надминаваше конкурентните модели при няколко задачи за генериране на резултати и припомняне на цитирания при много по-ниска цена. Също така постигна по-високи крайни нива на успешно преминаване на задачите и по-силно определяне на източниците в сравнение с по-големия модел GPT-5.4.“
— Аабхас Шарма, главен технологичен директор в Hebbia

Кодиране

GPT‑5.4 mini и nano са особено ефективни в работни процеси за програмиране, които се нуждаят от бърза итерация. Моделите се справят с целенасочени редакции, навигация в кодовата база, генериране на фронтенд и цикли за отстраняване на грешки с ниско забавяне, което ги прави много подходящи за задачи за кодиране, които трябва да бъдат изпълнени с по-висока скорост и по-ниски разходи.

В еталоните GPT‑5.4 mini последователно превъзхожда GPT‑5‑mini при сходни забавяния и се доближава до процента на успеваемост на GPT‑5.4‑level, като същевременно работи много по-бързо, осигурявайки един от най-силните компромиси между производителност и закъснение за работни потоци за писане на код.

Оценяваме забавянето, като разглеждаме поведението на нашите модели в производствена среда и го симулираме офлайн. Оценката за забавянето отчита продължителността на заявката на инструмента (време за изпълнение на кода), подбраните и входящите токени. Забавянето в реални случаи може да варира значително и зависи от много фактори, които не са обхванати в нашата симулация. По подобен начин разходите се оценяват въз основа на ценообразуването на API за тези модели към момента на писане. Разходите може да се променят в бъдеще. Усилията за структурирано анализиране бяха повишени от ниски (low) до свръхвисоки (xhigh).

Подагенти

GPT‑5.4 mini също така е много подходящ за системи, които комбинират модели с различни размери. В Codex, например, по-голям модел като GPT‑5.4 може да се справя с планиране, координация и окончателна преценка, като същевременно възлага задачи към мини подагенти на GPT‑5.4, които обработват по-тесни подзадачи паралелно – като търсене в кодовата база, преглед на голям файл или обработка на придружаващи документи. Научете как работят подагентите в Codex в документите(отваря се в нов прозорец).

Този модел става по-полезен, тъй като по-малките модели стават по-бързи и по-способни. Вместо да използват един модел за всичко, разработчиците могат да съставят системи, при които по-големите модели решават какво да се прави, а по-малките модели изпълняват бързо в мащаб. GPT‑5.4 mini е нашият най-мощен мини модел досега за този тип работен процес.

Използване на компютър

GPT‑5.4 mini е също така силен при мултимодални задачи, особено тези, свързани с използване на компютър. Моделът може бързо да интерпретира екранни снимки на плътни потребителски интерфейси, за да изпълнява задачи за използване на компютър с висока скорост. В OSWorld-Verified GPT‑5.4 mini се доближава до GPT‑5.4, като същевременно значително превъзхожда GPT‑5 mini.

Наличност & ценообразуване

GPT‑5.4 mini е наличен днес в API, Codex и ChatGPT.

В API GPT‑5.4 mini поддържа въвеждане на текст и изображения, използване на инструменти, извикване на функции, уеб търсене, търсене във файлове, работа с компютър и умения. Има контекстен прозорец от 400 000 и струва 0,75 $ на 1 мил. входни токени и 4,50 $ на 1 мил. изходни токени.

В Codex GPT‑5.4 mini е наличен в приложението Codex, CLI, разширението за IDE и уеб. Използва само 30% от квотата на GPT‑5.4, което позволява на разработчиците бързо да се справят с по-прости задачи по кодиране в Codex за около една трета от цената. Codex може също така да възлага задачи към мини подагенти на GPT‑5.4, така че работа, изискваща по-малко структурирано анализиране, да се изпълнява от по-евтиния модел.

В ChatGPT, GPT‑5.4 mini е наличен за потребителите на Free и Go чрез функцията „Thinking“ в + менюто. За всички останали потребители GPT‑5.4 mini е наличен като резервен вариант при достигане на лимита на заявките за GPT‑5.4 Thinking.

GPT‑5.4 nano е наличен само в API и струва $0,20 на 1 мил. входящи токени и $1,25 на 1 мил. изходящи токени.

За повече информация относно мерките за безопасност на моделите, моля, разгледайте допълнението към системната карта в нашия Център за безопасност при внедряване(отваря се в нов прозорец).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 Най-високото налично ниво на reasoning_effort за GPT‑5 mini е „high“.

2 Общо разстояние за редактиране. OmniDocBench беше изпълнено с reasoning_effort, зададено на „none“, за да отрази нискобюджетна и нисколатентна производителност.

Автор

OpenAI