17 березня 2026 р.

Представляємо GPT‑5.4 mini та nano

Швидкі ефективні моделі, оптимізовані під програмування та субагентів

Завантаження…

Сьогодні ми випускаємо GPT‑5.4 mini і nano — наразі наші найпотужніші компактні моделі. Вони поєднують багато сильних сторін GPT‑5.4 зі швидшими, ефективнішими моделями, розробленими для значних робочих навантажень.

GPT‑5.4 mini значно перевершує GPT‑5 mini у програмуванні, міркуваннях, мультимодальному розумінні та використанні інструментів, і працює при цьому більш ніж удвічі швидше. Більш того, згідно з результатами кількох тестів, зокрема SWE-Bench Pro та OSWorld-Verified, за продуктивністю модель наближається до своєї «більшої» версії, GPT‑5.4.

GPT‑5.4 nano — найменша та найвигідніша версія GPT‑5.4 для завдань, де найбільше значення мають швидкість і вартість. Ця модель демонструє суттєве покращення порівняно з GPT‑5 nano. Ми рекомендуємо обрати її, якщо вам потрібна класифікація, екстракція чи упорядкування даних, а також для використання в субагентах програмування, що виконують простіші допоміжні завдання.

Ці моделі створені для таких робочих навантажень, де затримка безпосередньо формує досвід користування продуктом: помічники для програмування, які мають реагувати оперативно, субагенти, що швидко виконують допоміжні завдання, комп'ютерні системи, які захоплюють та інтерпретують знімки екрана, а також мультимодальні застосунки, здатні міркувати над зображеннями в реальному часі. У таких умовах найбільша модель — не завжди найкраща: вона має в першу чергу швидко відповідати, надійно використовувати інструменти й водночас добре виконувати складні професійні завдання.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Найвищий доступний рівень reasoning_effort для GPT‑5 mini — «high».}

Ось що думають наші клієнти після тестування GPT‑5.4 mini та nano у своїх робочих процесах:

«GPT-5.4 mini забезпечує високу наскрізну продуктивність як для моделі цього класу. У наших оцінюваннях вона досягала або перевищувала рівень конкурентних моделей у кількох завданнях з вихідними даними та відтворенні цитувань за значно нижчої вартості. Вона також забезпечила вищі показники наскрізного проходження та більш точну атрибуцію джерел, ніж більша модель GPT-5.4.»

— Аабхас Шарма (Aabhas Sharma), технічний директор у Hebbia

Програмування

GPT‑5.4 mini та nano особливо ефективні в процесах програмування, які потребують швидких ітерацій. Моделі виконують цільове редагування, навігацію кодовою базою, генерацію інтерфейсу та цикли налагодження з низькою затримкою, що робить їх чудовим вибором для завдань програмування, які потрібно виконувати швидше та з меншими витратами.

У тестах GPT‑5.4 mini стабільно перевершує GPT‑5‑mini за подібних затримок, наближаючись до рівня GPT‑5.4 за показниками успішності, водночас працюючи набагато швидше, та забезпечує один із найкращих компромісів між продуктивністю та затримкою для робочих процесів програмування.

Ми оцінюємо затримку відповіді, аналізуючи поведінку наших моделей у виробничому середовищі, і моделюючи це офлайн. Оцінка затримки враховує тривалість виклику інструмента (час виконання коду), токени вибірки та вхідні токени. Затримка відповіді в реальних умовах може суттєво відрізнятися та залежить від багатьох чинників, не врахованих у нашій симуляції. Так само вартість оцінюється на основі цінової політики для API цих моделей на момент написання. У майбутньому вартість може змінитися. Зусилля міркування було підвищено з low до xhigh.

Субагенти

GPT‑5.4 mini також добре підходить для систем, що поєднують моделі різних розмірів. Наприклад, у Codex більша модель на кшталт GPT‑5.4 може виконувати планування, координацію та ухвалення остаточного рішення, водночас делегуючи завдання мінісубагентам GPT‑5.4, які паралельно виконують вужчі підзадачі, як-от пошук у кодовій базі, перегляд великого файлу чи обробка супровідних документів. Дізнатися більше про те, як працюють субагенти в Codex, ви можете в нашій документації⁠(відкривається у новому вікні).

Цей патерн стає кориснішим у міру того, як менші моделі стають швидшими та потужнішими. Замість того, щоб використовувати одну модель для всього, розробники можуть створювати системи, де більші моделі визначають, що робити, а менші моделі швидко виконують завдання у великому масштабі. GPT‑5.4 mini — це наша найпотужніша мінімодель на сьогодні для такого типу робочих процесів.

Використання комп'ютера

GPT‑5.4 mini також добре виконує мультимодальні завдання, особливо ті, що стосуються використання комп’ютерного обладнання. Модель може швидко інтерпретувати скріншоти складних користувацьких інтерфейсів, щоб оперативно виконувати завдання, пов’язані з використанням комп’ютера. За результатами тесту OSWorld-Verified модель GPT‑5.4 mini майже зрівнялася з GPT‑5.4, водночас суттєво перевершивши GPT‑5 mini.

Доступ та ціни

GPT‑5.4 mini буде доступна відсьогодні в API, Codex та ChatGPT.

В API GPT‑5.4 mini підтримує введення тексту та зображень, використання інструментів, виклик функцій, веб-пошук, пошук файлів, використання комп’ютера та навички. Модель має контекстне вікно на 400k; вартість складає 0,75 дол. США за 1 млн вхідних токенів та 4,50 дол. США за 1 млн вихідних токенів.

У Codex GPT‑5.4 mini доступний у застосунку Codex, CLI, розширенні IDE та на вебсайті. Він використовує лише 30% квоти GPT‑5.4, що дає розробникам змогу швидко виконувати простіші завдання з програмування в Codex приблизно за третину вартості. Codex також може делегувати завдання мінісубагентам GPT‑5.4, щоб робота, що потребує менш інтенсивних міркувань, виконувалася на дешевшій моделі.

У ChatGPT GPT‑5.4 mini доступна для користувачів Free і Go через опцію «Thinking» у меню +. Для всіх інших користувачів GPT‑5.4 mini доступна як резервний варіант за лімітом швидкості для GPT‑5.4 Thinking.

GPT‑5.4 nano доступна лише в API; вартість складає 0,20 дол. США за 1 млн вхідних токенів та 1,25 дол. США за 1 млн вихідних токенів.

Щоб дізнатися більше про заходи безпеки моделей, ознайомтеся з додатком до картки системи в нашому Центрі безпеки розгортання⁠(відкривається у новому вікні).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%