17. март 2026.

Представљамо GPT‑5.4 mini и nano

Брзи и ефикасни модели оптимизовани за кодирање и подагенте

Учитавање…

Данас објављујемо GPT‑5.4 mini и nano, наше до сада најспособније мале моделе. Они доносе многе снаге GPT‑5.4 у брже, ефикасније моделе осмишљене за оптерећења великог обима.

GPT‑5.4 mini значајно унапређује GPT‑5 mini у кодирању, резоновању, мултимодалном разумевању и употреби алата, а ради више од 2x брже. Такође се на више евалуација, укључујући SWE-Bench Pro и OSWorld-Verified, приближава перформансама већег модела GPT‑5.4.

GPT‑5.4 nano је најмања, најјефтинија верзија GPT‑5.4 за задатке у којима су брзина и цена најважнији. То је и значајно унапређење у односу на GPT‑5 nano. Препоручујемо га за класификацију, издвајање података, рангирање и подагенте за кодирање који обрађују једноставније пратеће задатке.

Ови модели су направљени за врсте оптерећења код којих латенција директно обликује доживљај производа: асистенти за кодирање који морају да делују одзивно, подагенти који брзо завршавају пратеће задатке, системи за коришћење рачунара који снимају и тумаче снимке екрана и мултимодалне апликације које могу да резонују над сликама у реалном времену. У овим поставкама најбољи модел често није највећи — већ онај који може брзо да одговори, поуздано користи алате и и даље добро ради на сложеним професионалним задацима.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Највиши reasoning_effort доступан за GPT‑5 mini је 'high'.}

Ево шта наши корисници мисле након тестирања GPT‑5.4 mini и nano у својим токовима рада:

„GPT-5.4 mini пружа снажне end-to-end перформансе за модел ове класе. У нашим евалуацијама достигао је или надмашио конкурентске моделе у више задатака излаза и опозиву цитата уз много нижу цену. Такође је остварио веће end-to-end стопе пролазности и јаче приписивање извора од већег модела GPT-5.4.“

— Aabhas Sharma, CTO у Hebbia-и

Кодирање

GPT‑5.4 mini и nano су посебно ефикасни у токовима рада кодирања који имају користи од брзе итерације. Модели уз ниску латенцију обављају циљане измене, навигацију кроз базу кода, генерисање фронтенда и петље отклањања грешака, што их чини добрим избором за задатке кодирања који треба да се заврше брже и по нижој цени.

У бенчмарцима GPT‑5.4 mini доследно надмашује GPT‑5‑mini при сличним латенцијама и приближава се стопама пролазности на нивоу GPT‑5.4, док ради знатно брже, доносећи један од најбољих односа перформанси и латенције за токове рада кодирања.

Латенцију процењујемо тако што посматрамо продукционо понашање наших модела и то симулирамо офлајн. Процена латенције обухвата трајање позива алата (време извршавања кода), узорковане токене и улазне токене. Латенција у стварном свету може знатно да варира и зависи од многих фактора који нису обухваћени нашом симулацијом. Слично томе, трошкови су процењени на основу API цена ових модела у тренутку писања. Трошкови се у будућности могу променити. Нивои резоновања су варирали од low до xhigh.

Подагенти

GPT‑5.4 mini је такође добар избор за системе који комбинују моделе различитих величина. У Codex-у, на пример, већи модел као што је GPT‑5.4 може да обавља планирање, координацију и коначну процену, док паралелно делегира уже подзадатке GPT‑5.4 mini подагентима — као што су претрага базе кода, преглед великог фајла или обрада пратећих докумената. Сазнајте како подагенти раде у Codex-у у документацији⁠(отвара се у новом прозору).

Овај образац постаје кориснији како мањи модели постају бржи и способнији. Уместо да користе један модел за све, програмери могу да састављају системе у којима већи модели одлучују шта треба радити, а мањи модели брзо извршавају задатке у великом обиму. GPT‑5.4 mini је наш до сада најјачи mini модел за такав стил тока рада.

Употреба рачунара

GPT‑5.4 mini је такође снажан у мултимодалним задацима, посебно онима повезаним са употребом рачунара. Модел може брзо да тумачи снимке екрана густих корисничких интерфејса како би брзо обавио задатке употребе рачунара. На OSWorld-Verified, GPT‑5.4 mini се приближава GPT‑5.4, док знатно надмашује GPT‑5 mini.

Доступност и цене

GPT‑5.4 mini је од данас доступан у API-ју, Codex-у и ChatGPT‑у.

У API-ју, GPT‑5.4 mini подржава уносе текста и слика, употребу алата, позивање функције, веб претрагу, претрагу фајлова, употребу рачунара и skills. Има контекстни прозор од 400k и кошта $0.75 за 1M улазних токена и $4.50 за 1M излазних токена.

У Codex-у, GPT‑5.4 mini је доступан у апликацији Codex, CLI-ју, IDE екстензији и на вебу. Користи само 30% квоте GPT‑5.4, што омогућава програмерима да у Codex-у брзо обављају једноставније задатке кодирања за отприлике трећину цене. Codex такође може да делегира GPT‑5.4 mini подагентима како би се мање резоновањем интензиван рад извршавао на јефтинијем моделу.

У ChatGPT‑у, GPT‑5.4 mini је доступан Free и Go корисницима преко функције „Thinking“ у менију +. За све остале кориснике, GPT‑5.4 mini је доступан као резервна опција при ограничењу стопе за GPT‑5.4 Thinking.

GPT‑5.4 nano је доступан само у API-ју и кошта $0.20 за 1M улазних токена и $1.25 за 1M излазних токена.

За више информација о заштитним мерама модела, погледајте додатак System Card на нашем Deployment Safety Hub-у⁠(отвара се у новом прозору).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Највиши reasoning_effort доступан за GPT‑5 mini је 'high'.}

^{2 Overall Edit Distance. OmniDocBench је покренут са reasoning_effort подешеним на 'none' да би одражавао перформансе ниске цене и ниске латенције.}

2026.

Аутор

OpenAI

Наставите са читањем

Прикажи све

Launching Health in ChatGPT

Производ23. јул 2026.

How news organizations are using AI > Card Image

Како новинске организације користе AI за своје кључне мисије

Компанија22. јул 2026.

Представљамо OpenAI Presence

Производ22. јул 2026.