Данас објављујемо GPT‑5.4 mini и nano, наше до сада најспособније мале моделе. Они доносе многе снаге GPT‑5.4 у брже, ефикасније моделе осмишљене за оптерећења великог обима.
GPT‑5.4 mini значајно унапређује GPT‑5 mini у кодирању, резоновању, мултимодалном разумевању и употреби алата, а ради више од 2x брже. Такође се на више евалуација, укључујући SWE-Bench Pro и OSWorld-Verified, приближава перформансама већег модела GPT‑5.4.
GPT‑5.4 nano је најмања, најјефтинија верзија GPT‑5.4 за задатке у којима су брзина и цена најважнији. То је и значајно унапређење у односу на GPT‑5 nano. Препоручујемо га за класификацију, издвајање података, рангирање и подагенте за кодирање који обрађују једноставније пратеће задатке.
Ови модели су направљени за врсте оптерећења код којих латенција директно обликује доживљај производа: асистенти за кодирање који морају да делују одзивно, подагенти који брзо завршавају пратеће задатке, системи за коришћење рачунара који снимају и тумаче снимке екрана и мултимодалне апликације које могу да резонују над сликама у реалном времену. У овим поставкама најбољи модел често није највећи — већ онај који може брзо да одговори, поуздано користи алате и и даље добро ради на сложеним професионалним задацима.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 Највиши reasoning_effort доступан за GPT‑5 mini је 'high'.
Ево шта наши корисници мисле након тестирања GPT‑5.4 mini и nano у својим токовима рада:
„GPT-5.4 mini пружа снажне end-to-end перформансе за модел ове класе. У нашим евалуацијама достигао је или надмашио конкурентске моделе у више задатака излаза и опозиву цитата уз много нижу цену. Такође је остварио веће end-to-end стопе пролазности и јаче приписивање извора од већег модела GPT-5.4.“
GPT‑5.4 mini и nano су посебно ефикасни у токовима рада кодирања који имају користи од брзе итерације. Модели уз ниску латенцију обављају циљане измене, навигацију кроз базу кода, генерисање фронтенда и петље отклањања грешака, што их чини добрим избором за задатке кодирања који треба да се заврше брже и по нижој цени.
У бенчмарцима GPT‑5.4 mini доследно надмашује GPT‑5‑mini при сличним латенцијама и приближава се стопама пролазности на нивоу GPT‑5.4, док ради знатно брже, доносећи један од најбољих односа перформанси и латенције за токове рада кодирања.
Латенцију процењујемо тако што посматрамо продукционо понашање наших модела и то симулирамо офлајн. Процена латенције обухвата трајање позива алата (време извршавања кода), узорковане токене и улазне токене. Латенција у стварном свету може знатно да варира и зависи од многих фактора који нису обухваћени нашом симулацијом. Слично томе, трошкови су процењени на основу API цена ових модела у тренутку писања. Трошкови се у будућности могу променити. Нивои резоновања су варирали од low до xhigh.
GPT‑5.4 mini је такође добар избор за системе који комбинују моделе различитих величина. У Codex-у, на пример, већи модел као што је GPT‑5.4 може да обавља планирање, координацију и коначну процену, док паралелно делегира уже подзадатке GPT‑5.4 mini подагентима — као што су претрага базе кода, преглед великог фајла или обрада пратећих докумената. Сазнајте како подагенти раде у Codex-у у документацији(отвара се у новом прозору).
Овај образац постаје кориснији како мањи модели постају бржи и способнији. Уместо да користе један модел за све, програмери могу да састављају системе у којима већи модели одлучују шта треба радити, а мањи модели брзо извршавају задатке у великом обиму. GPT‑5.4 mini је наш до сада најјачи mini модел за такав стил тока рада.
GPT‑5.4 mini је такође снажан у мултимодалним задацима, посебно онима повезаним са употребом рачунара. Модел може брзо да тумачи снимке екрана густих корисничких интерфејса како би брзо обавио задатке употребе рачунара. На OSWorld-Verified, GPT‑5.4 mini се приближава GPT‑5.4, док знатно надмашује GPT‑5 mini.
GPT‑5.4 mini је од данас доступан у API-ју, Codex-у и ChatGPT‑у.
У API-ју, GPT‑5.4 mini подржава уносе текста и слика, употребу алата, позивање функције, веб претрагу, претрагу фајлова, употребу рачунара и skills. Има контекстни прозор од 400k и кошта $0.75 за 1M улазних токена и $4.50 за 1M излазних токена.
У Codex-у, GPT‑5.4 mini је доступан у апликацији Codex, CLI-ју, IDE екстензији и на вебу. Користи само 30% квоте GPT‑5.4, што омогућава програмерима да у Codex-у брзо обављају једноставније задатке кодирања за отприлике трећину цене. Codex такође може да делегира GPT‑5.4 mini подагентима како би се мање резоновањем интензиван рад извршавао на јефтинијем моделу.
У ChatGPT‑у, GPT‑5.4 mini је доступан Free и Go корисницима преко функције „Thinking“ у менију +. За све остале кориснике, GPT‑5.4 mini је доступан као резервна опција при ограничењу стопе за GPT‑5.4 Thinking.
GPT‑5.4 nano је доступан само у API-ју и кошта $0.20 за 1M улазних токена и $1.25 за 1M излазних токена.
За више информација о заштитним мерама модела, погледајте додатак System Card на нашем Deployment Safety Hub-у(отвара се у новом прозору).
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 Највиши reasoning_effort доступан за GPT‑5 mini је 'high'.
2 Overall Edit Distance. OmniDocBench је покренут са reasoning_effort подешеним на 'none' да би одражавао перформансе ниске цене и ниске латенције.


