Прескокни до главната содржина
OpenAI

Претставување на GPT‑5.4 mini и nano

Брзи и ефикасни модели оптимизирани за кодирање и подагенти

Се вчитува...

Денес го објавуваме GPT‑5.4 mini и nano, нашите најспособни мали модели досега. Тие носат многу од силните страни на GPT‑5.4 во побрзи и поефикасни модели дизајнирани за работни оптоварувања со голем обем.

GPT‑5.4 mini значително се подобрува во однос на GPT‑5 mini во кодирање, расудување, мултимодално разбирање и користење алатки, додека работи повеќе од 2x побрзо. Исто така, се приближува до перформансите на поголемиот модел GPT‑5.4 на неколку евалуации, вклучувајќи ги SWE-Bench Pro и OSWorld-Verified.

GPT‑5.4 nano е најмалата, најевтината верзија на GPT‑5.4 за задачи каде што брзината и цената се најважни. Ова е исто така значајна надградба во однос на GPT‑5 nano. Го препорачуваме за класификација, извлекување податоци, рангирање и подагенти за кодирање кои се справуваат со поедноставни задачи за поддршка.

Овие модели се создадени за работни оптоварувања каде што латенцијата директно го обликува искуството со производот: асистенти за кодирање што треба да бидат брзи и одзивни, подагенти што брзо ги завршуваат придружните задачи, системи што снимаат и толкуваат слики од екранот, и мултимодални апликации што можат да расудуваат врз основа на слики во реално време. Во овие поставки, најдобриот модел често не е најголемиот - тоа е оној што може брзо да одговори, сигурно да користи алатки и сепак да се покажува добро во сложени професионални задачи.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 Највисокото достапно ниво на размислување за GPT‑5 mini е „високо“.

Еве што мислат нашите клиенти по тестирањето на GPT‑5.4 mini и nano во нивните работни процеси:

"GPT-5.4 mini обезбедува силни перформанси од крај до крај за модел во оваа класа. Во нашите евалуации се совпаѓаше или го надминуваше конкурентските модели на неколку задачи за излез и присетување на цитати по значително пониска цена. Исто така постигна повисоки стапки на успешност од крај до крај и посилна атрибуција на изворите од поголемиот модел GPT-5.4 модел."
- Абхас Шарма, технички директор во Hebbia

Coding

GPT‑5.4 mini и nano се особено ефикасни во работни текови за кодирање каде што брзата итерација е предност. Моделите се справуваат со насочени уредувања, навигација низ кодна база, генерирање на кориснички интерфејс и циклуси на дебагирање со ниска латенција, што ги прави одличен избор за задачи за кодирање што треба да се завршат побрзо и со помали трошоци.

Во репери, GPT‑5.4 mini доследно го надминува GPT‑5‑mini при слични латенции и се приближува до стапките на успех на нивото на GPT‑5.4 додека работи многу побрзо, испорачувајќи еден од најсилните компромиси перформанси во однос на латенција за работни текови за кодирање.

Ја проценуваме латенцијата со тоа што го разгледуваме продукциското однесување на нашите модели и го симулираме ова офлајн. Проценката на латенцијата го зема предвид времетраењето на повикот на алатката (време на извршување на кодот), семплираните токени и влезните токени. Латенцијата во реалноста може значително да варира и зависи од многу фактори што не се опфатени во нашата симулација. Слично на тоа, трошоците се проценуваат врз основа на цените на API за овие модели во моментот на пишување. Трошоците може да се променат во иднина. Напорите за расудување беа префрлени од ниско на високо.

Подагенти

GPT‑5.4 mini е исто така одличен избор за системи што комбинираат модели со различни големини. Во Codex, на пример, поголем модел како GPT‑5.4 може да се справи со планирање, координација и конечна проценка, додека делегирајќи им на мини подагентите GPT‑5.4 да се справуваат со потесни подзадачи паралелно - како пребарување низ codebase, прегледување голема датотека или обработка на придружни документи. Научи како функционираат подагентите во Codex во документацијата(се отвора во нов прозорец).

Овој образец станува покорисен како што помалите модели стануваат побрзи и поспособни. Наместо да користат еден модел за сè, развивачите можат да составуваат системи каде што поголемите модели одлучуваат што да се направи, а помалите модели брзо извршуваат во голем обем. GPT‑5.4 mini е нашиот најсилен мини модел досега за тој стил на работен тек.

Користење компјутер

GPT‑5.4 mini е исто така силен во мултимодални задачи, особено оние поврзани со користење компјутер. Моделот може брзо да толкува снимки од екранот на густи кориснички интерфејси за брзо да заврши задачи за користење на компјутер. На OSWorld-Verified, GPT‑5.4 mini се приближува до GPT‑5.4, додека значително го надминува GPT‑5 mini.

Достапност и цени

GPT‑5.4 mini е достапен денес во API, Codex и ChatGPT.

Во API-то, GPT‑5.4 mini поддржува внесувања текст и слики, користење алатки, повикување на функција, веб пребарување, пребарување датотеки, користење компјутер и вештини. Има контекстен прозорец од 400k и чини $0,75 за 1M токени за внесување и $4,50 за 1M токени за резултат.

Во Codex, GPT‑5.4 mini е достапен во апликацијата Codex, CLI, IDE екстензијата и веб. Користи само 30 % од квотата на GPT‑5.4, овозможувајќи им на програмерите брзо да се справат со поедноставни задачи за кодирање во Codex за околу една третина од трошокот. Codex може исто така да делегира на подагенти GPT‑5.4 mini, така што работа што е помалку интензивна во однос на расудување да работи на поевтиниот модел.

Во ChatGPT, GPT‑5.4 mini е достапен за корисниците на Free и Go преку функцијата „Thinking“ во + менито. За сите други корисници, GPT‑5.4 mini е достапен како резервна опција поради ограничувањето на стапката за GPT‑5.4 Thinking.

GPT‑5.4 nano е достапен само во API и чини 0,20 $ по 1M влезни токени и 1,25 $ по 1M излезни токени.

За повеќе информации за заштитните мерки на моделите, погледнете го додатокот на системската картичка на нашиот Центар за безбедност при имплементација(се отвора во нов прозорец).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 Највисокото достапно ниво на размислување за GPT‑5 mini е „високо“.

2 Севкупно растојание на уредување. OmniDocBench беше извршен со „reasoning_effort“ поставен на „none“, за да се одразат перформанси со ниска цена и ниска латенција.

Автор

OpenAI