Пређите на главни садржај
OpenAI

Представљамо GPT‑5.4 mini и nano

Брзи и ефикасни модели оптимизовани за кодирање и подагенте

Учитавање…

Данас објављујемо GPT‑5.4 mini и nano, наше до сада најспособније мале моделе. Они доносе многе снаге GPT‑5.4 у брже, ефикасније моделе осмишљене за оптерећења великог обима.

GPT‑5.4 mini значајно унапређује GPT‑5 mini у кодирању, резоновању, мултимодалном разумевању и употреби алата, а ради више од 2x брже. Такође се на више евалуација, укључујући SWE-Bench Pro и OSWorld-Verified, приближава перформансама већег модела GPT‑5.4.

GPT‑5.4 nano је најмања, најјефтинија верзија GPT‑5.4 за задатке у којима су брзина и цена најважнији. То је и значајно унапређење у односу на GPT‑5 nano. Препоручујемо га за класификацију, издвајање података, рангирање и подагенте за кодирање који обрађују једноставније пратеће задатке.

Ови модели су направљени за врсте оптерећења код којих латенција директно обликује доживљај производа: асистенти за кодирање који морају да делују одзивно, подагенти који брзо завршавају пратеће задатке, системи за коришћење рачунара који снимају и тумаче снимке екрана и мултимодалне апликације које могу да резонују над сликама у реалном времену. У овим поставкама најбољи модел често није највећи — већ онај који може брзо да одговори, поуздано користи алате и и даље добро ради на сложеним професионалним задацима.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 Највиши reasoning_effort доступан за GPT‑5 mini је 'high'.

Ево шта наши корисници мисле након тестирања GPT‑5.4 mini и nano у својим токовима рада:

„GPT-5.4 mini пружа снажне end-to-end перформансе за модел ове класе. У нашим евалуацијама достигао је или надмашио конкурентске моделе у више задатака излаза и опозиву цитата уз много нижу цену. Такође је остварио веће end-to-end стопе пролазности и јаче приписивање извора од већег модела GPT-5.4.“
— Aabhas Sharma, CTO у Hebbia-и

Кодирање

GPT‑5.4 mini и nano су посебно ефикасни у токовима рада кодирања који имају користи од брзе итерације. Модели уз ниску латенцију обављају циљане измене, навигацију кроз базу кода, генерисање фронтенда и петље отклањања грешака, што их чини добрим избором за задатке кодирања који треба да се заврше брже и по нижој цени.

У бенчмарцима GPT‑5.4 mini доследно надмашује GPT‑5‑mini при сличним латенцијама и приближава се стопама пролазности на нивоу GPT‑5.4, док ради знатно брже, доносећи један од најбољих односа перформанси и латенције за токове рада кодирања.

Латенцију процењујемо тако што посматрамо продукционо понашање наших модела и то симулирамо офлајн. Процена латенције обухвата трајање позива алата (време извршавања кода), узорковане токене и улазне токене. Латенција у стварном свету може знатно да варира и зависи од многих фактора који нису обухваћени нашом симулацијом. Слично томе, трошкови су процењени на основу API цена ових модела у тренутку писања. Трошкови се у будућности могу променити. Нивои резоновања су варирали од low до xhigh.

Подагенти

GPT‑5.4 mini је такође добар избор за системе који комбинују моделе различитих величина. У Codex-у, на пример, већи модел као што је GPT‑5.4 може да обавља планирање, координацију и коначну процену, док паралелно делегира уже подзадатке GPT‑5.4 mini подагентима — као што су претрага базе кода, преглед великог фајла или обрада пратећих докумената. Сазнајте како подагенти раде у Codex-у у документацији(отвара се у новом прозору).

Овај образац постаје кориснији како мањи модели постају бржи и способнији. Уместо да користе један модел за све, програмери могу да састављају системе у којима већи модели одлучују шта треба радити, а мањи модели брзо извршавају задатке у великом обиму. GPT‑5.4 mini је наш до сада најјачи mini модел за такав стил тока рада.

Употреба рачунара

GPT‑5.4 mini је такође снажан у мултимодалним задацима, посебно онима повезаним са употребом рачунара. Модел може брзо да тумачи снимке екрана густих корисничких интерфејса како би брзо обавио задатке употребе рачунара. На OSWorld-Verified, GPT‑5.4 mini се приближава GPT‑5.4, док знатно надмашује GPT‑5 mini.

Доступност и цене

GPT‑5.4 mini је од данас доступан у API-ју, Codex-у и ChatGPT‑у.

У API-ју, GPT‑5.4 mini подржава уносе текста и слика, употребу алата, позивање функције, веб претрагу, претрагу фајлова, употребу рачунара и skills. Има контекстни прозор од 400k и кошта $0.75 за 1M улазних токена и $4.50 за 1M излазних токена.

У Codex-у, GPT‑5.4 mini је доступан у апликацији Codex, CLI-ју, IDE екстензији и на вебу. Користи само 30% квоте GPT‑5.4, што омогућава програмерима да у Codex-у брзо обављају једноставније задатке кодирања за отприлике трећину цене. Codex такође може да делегира GPT‑5.4 mini подагентима како би се мање резоновањем интензиван рад извршавао на јефтинијем моделу.

У ChatGPT‑у, GPT‑5.4 mini је доступан Free и Go корисницима преко функције „Thinking“ у менију +. За све остале кориснике, GPT‑5.4 mini је доступан као резервна опција при ограничењу стопе за GPT‑5.4 Thinking.

GPT‑5.4 nano је доступан само у API-ју и кошта $0.20 за 1M улазних токена и $1.25 за 1M излазних токена.

За више информација о заштитним мерама модела, погледајте додатак System Card на нашем Deployment Safety Hub-у(отвара се у новом прозору).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 Највиши reasoning_effort доступан за GPT‑5 mini је 'high'.

2 Overall Edit Distance. OmniDocBench је покренут са reasoning_effort подешеним на 'none' да би одражавао перформансе ниске цене и ниске латенције.

Аутор

OpenAI