17 март 2026 г.

Представяме Ви GPT‑5.4 mini и nano

Бързи и ефективни модели, оптимизирани за кодиране и подагенти

Зареждане…

Днес пускаме GPT‑5.4 mini и nano, нашите най-способни малки модели досега. Те пренасят много от силните страни на GPT‑5.4 към по-бързи, по-ефективни модели, проектирани за натоварвания с голям обем.

GPT‑5.4 mini е значително подобрение спрямо GPT‑5 mini в областта на програмирането, логическото разсъждаване, мултимодалното разбиране и използването на инструменти, като същевременно работи с над 2 пъти по-висока скорост. Той също така се доближава до производителността на по-големия GPT‑5.4 модел при няколко оценки, включително SWE-Bench Pro и OSWorld-Verified.

GPT‑5.4 nano е най-малката и най-евтината версия на GPT‑5.4 за задачи, при които скоростта и цената са от най-голямо значение. Това е значително подобрение спрямо GPT‑5 nano. Препоръчваме го за класификация, извличане на данни, класиране и подагенти, които изпълняват по-прости подпомагащи задачи.

Тези модели са създадени за натоварвания, при които забавянето директно определя продуктовото изживяване: програмиращи асистенти, които трябва да бъдат отзивчиви; подпомагащи агенти, които бързо изпълняват поддържащи задачи; системи за работа с компютър, които заснемат и интерпретират екранни снимки; и мултимодални приложения, които могат да правят изводи върху изображения в реално време. В тези настройки най-добрият модел често не е най-големият – той е този, който може да отговаря бързо, да използва инструменти надеждно и въпреки това да се справя добре със сложни професионални задачи.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Най-високото налично ниво на reasoning_effort за GPT‑5 mini е „high“.}

Ето какво мислят нашите клиенти след като тестваха GPT‑5.4 mini и nano в своите работни процеси:

„GPT-5.4 mini предоставя силна цялостна производителност за модел в този клас. В нашите оценки той беше или наравно с, или надминаваше конкурентните модели при няколко задачи за генериране на резултати и припомняне на цитирания при много по-ниска цена. Също така постигна по-високи крайни нива на успешно преминаване на задачите и по-силно определяне на източниците в сравнение с по-големия модел GPT-5.4.“

— Аабхас Шарма, главен технологичен директор в Hebbia

Кодиране

GPT‑5.4 mini и nano са особено ефективни в работни процеси за програмиране, които се нуждаят от бърза итерация. Моделите се справят с целенасочени редакции, навигация в кодовата база, генериране на фронтенд и цикли за отстраняване на грешки с ниско забавяне, което ги прави много подходящи за задачи за кодиране, които трябва да бъдат изпълнени с по-висока скорост и по-ниски разходи.

В еталоните GPT‑5.4 mini последователно превъзхожда GPT‑5‑mini при сходни забавяния и се доближава до процента на успеваемост на GPT‑5.4‑level, като същевременно работи много по-бързо, осигурявайки един от най-силните компромиси между производителност и закъснение за работни потоци за писане на код.

Оценяваме забавянето, като разглеждаме поведението на нашите модели в производствена среда и го симулираме офлайн. Оценката за забавянето отчита продължителността на заявката на инструмента (време за изпълнение на кода), подбраните и входящите токени. Забавянето в реални случаи може да варира значително и зависи от много фактори, които не са обхванати в нашата симулация. По подобен начин разходите се оценяват въз основа на ценообразуването на API за тези модели към момента на писане. Разходите може да се променят в бъдеще. Усилията за структурирано анализиране бяха повишени от ниски (low) до свръхвисоки (xhigh).

Подагенти

GPT‑5.4 mini също така е много подходящ за системи, които комбинират модели с различни размери. В Codex, например, по-голям модел като GPT‑5.4 може да се справя с планиране, координация и окончателна преценка, като същевременно възлага задачи към мини подагенти на GPT‑5.4, които обработват по-тесни подзадачи паралелно – като търсене в кодовата база, преглед на голям файл или обработка на придружаващи документи. Научете как работят подагентите в Codex в документите⁠(отваря се в нов прозорец).

Този модел става по-полезен, тъй като по-малките модели стават по-бързи и по-способни. Вместо да използват един модел за всичко, разработчиците могат да съставят системи, при които по-големите модели решават какво да се прави, а по-малките модели изпълняват бързо в мащаб. GPT‑5.4 mini е нашият най-мощен мини модел досега за този тип работен процес.

Използване на компютър

GPT‑5.4 mini е също така силен при мултимодални задачи, особено тези, свързани с използване на компютър. Моделът може бързо да интерпретира екранни снимки на плътни потребителски интерфейси, за да изпълнява задачи за използване на компютър с висока скорост. В OSWorld-Verified GPT‑5.4 mini се доближава до GPT‑5.4, като същевременно значително превъзхожда GPT‑5 mini.

Наличност & ценообразуване

GPT‑5.4 mini е наличен днес в API, Codex и ChatGPT.

В API GPT‑5.4 mini поддържа въвеждане на текст и изображения, използване на инструменти, извикване на функции, уеб търсене, търсене във файлове, работа с компютър и умения. Има контекстен прозорец от 400 000 и струва 0,75 $ на 1 мил. входни токени и 4,50 $ на 1 мил. изходни токени.

В Codex GPT‑5.4 mini е наличен в приложението Codex, CLI, разширението за IDE и уеб. Използва само 30% от квотата на GPT‑5.4, което позволява на разработчиците бързо да се справят с по-прости задачи по кодиране в Codex за около една трета от цената. Codex може също така да възлага задачи към мини подагенти на GPT‑5.4, така че работа, изискваща по-малко структурирано анализиране, да се изпълнява от по-евтиния модел.

В ChatGPT, GPT‑5.4 mini е наличен за потребителите на Free и Go чрез функцията „Thinking“ в + менюто. За всички останали потребители GPT‑5.4 mini е наличен като резервен вариант при достигане на лимита на заявките за GPT‑5.4 Thinking.

GPT‑5.4 nano е наличен само в API и струва $0,20 на 1 мил. входящи токени и $1,25 на 1 мил. изходящи токени.

За повече информация относно мерките за безопасност на моделите, моля, разгледайте допълнението към системната карта в нашия Център за безопасност при внедряване⁠(отваря се в нов прозорец).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Най-високото налично ниво на reasoning_effort за GPT‑5 mini е „high“.}

^{2 Общо разстояние за редактиране. OmniDocBench беше изпълнено с reasoning_effort, зададено на „none“, за да отрази нискобюджетна и нисколатентна производителност.}

2026 г.

Автор

OpenAI

Продължавайте да четете

Вижте всички

Launching Health in ChatGPT

Продукт23.07.2026 г.

How news organizations are using AI > Card Image

Как новинарските организации използват ИИ за важните си мисии

Компания22.07.2026 г.

Представяме OpenAI Presence

Продукт22.07.2026 г.