2026 ж. 17 наурыз

GPT‑5.4 mini және nano таныстыру

Код жазуға және қосалқы агенттерге оңтайландырылған жылдам әрі тиімді модельдер

Жүктелуде…

Бүгін біз GPT‑5.4 mini және nano нұсқаларын шығарамыз — әзірге ең қабілетті шағын модельдеріміз. Олар GPT‑5.4‑тің көптеген артықшылықтарын жоғары көлемді жүктемелерге арналған жылдамырақ, тиімдірек модельдерге әкеледі.

GPT‑5.4 mini код жазу, ой қорыту, мультимодальды түсіну және құралдарды пайдалану бойынша GPT‑5 mini-ден едәуір озады, сонымен бірге 2 еседен де жылдам жұмыс істейді. Ол SWE-Bench Pro және OSWorld-Verified қоса алғанда, бірнеше бағалауда ірірек GPT‑5.4 моделінің өнімділігіне де жақындайды.

GPT‑5.4 nano — жылдамдық пен баға ең маңызды болатын тапсырмаларға арналған GPT‑5.4‑тің ең шағын, ең арзан нұсқасы. Бұл сондай-ақ GPT‑5 nano-мен салыстырғанда елеулі жаңарту. Біз оны классификация, дерек шығару, ранжирлеу және қарапайымдау қосалқы міндеттерді орындайтын код жазу қосалқы агенттері үшін ұсынамыз.

Бұл модельдер кідіріс өнім тәжірибесін тікелей айқындайтын жүктемелерге арналған: жауап беруі жедел сезілуі тиіс код жазу көмекшілері, қолдаушы тапсырмаларды тез аяқтайтын қосалқы агенттер, скриншоттарды түсіріп, түсіндіретін компьютерді пайдаланатын жүйелер және суреттер бойынша нақты уақытта ой қорыта алатын мультимодальды қолданбалар. Мұндай жағдайларда ең жақсы модель көбіне ең үлкені емес — ол тез жауап бере алатын, құралдарды сенімді қолданатын және сонымен бірге күрделі кәсіби тапсырмаларда жақсы нәтиже көрсететін модель.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini үшін қолжетімді ең жоғары reasoning_effort — 'high'.}

Міне, GPT‑5.4 mini мен nano-ны өз жұмыс ағындарында сынағаннан кейін клиенттеріміз не дейді:

«GPT-5.4 mini осы санаттағы модель үшін мықты end-to-end өнімділік береді. Біздің бағалауларда ол әлдеқайда төмен құнда бірнеше шығыс тапсырмасы мен дәйексөзді еске түсіру көрсеткіші бойынша бәсекелес модельдермен тең түсті немесе асып түсті. Сондай-ақ ол ірірек GPT-5.4 моделіне қарағанда жоғарырақ end-to-end pass rate және қайнаркөзге сілтеудің мықтырақ сапасын көрсетті.»

— Aabhas Sharma, Hebbia-дағы CTO

Код жазу

GPT‑5.4 mini және nano әсіресе жылдам итерациядан пайда көретін код жазу жұмыс ағындарында тиімді. Модельдер мақсатты түзетулерді, код базасы бойынша навигацияны, фронтенд генерациясын және жөндеу циклдерін төмен кідіріспен орындайды, сондықтан олар жоғарырақ жылдамдықпен және төменірек шығынмен аяқталуы тиіс код жазу тапсырмаларына өте сай келеді.

Бенчмарктерде GPT‑5.4 mini ұқсас кідірістерде GPT‑5‑mini моделінен тұрақты түрде озып, әлдеқайда жылдам жұмыс істей отырып GPT‑5.4 деңгейіндегі pass rate көрсеткіштеріне жақындайды, осылайша код жазу жұмыс ағындары үшін өнімділік пен кідіріс арасындағы ең мықты тепе-теңдіктердің бірін ұсынады.

Біз кідірісті модельдеріміздің өндірістегі мінез-құлқына қарап және оны офлайн түрде модельдеу арқылы бағалаймыз. Кідіріс бағасына құрал шақыру ұзақтығы (код орындалу уақыты), таңдалған токендер және кіріс токендері кіреді. Нақты ортадағы кідіріс едәуір өзгеше болуы мүмкін және біздің модельдеуде ескерілмеген көптеген факторларға байланысты. Сол сияқты, құн да жазу сәтіндегі осы модельдердің API бағасына сүйеніп бағаланады. Бағалар болашақта өзгеруі мүмкін. Ой қорыту деңгейлері low-дан xhigh-қа дейін қамтылды.

Қосалқы агенттер

GPT‑5.4 mini әртүрлі өлшемдегі модельдерді біріктіретін жүйелерге де өте сай келеді. Мысалы, Codex ішінде GPT‑5.4 сияқты ірірек модель жоспарлауды, үйлестіруді және соңғы бағалауды атқара алады, ал сонымен қатар код базасын іздеу, үлкен файлды шолу немесе қолдаушы құжаттарды өңдеу сияқты тарлау қосалқы міндеттерді параллель орындайтын GPT‑5.4 mini қосалқы агенттеріне тапсырады. Codex-тегі қосалқы агенттердің қалай жұмыс істейтінін құжаттамадан⁠(жаңа терезеде ашылады) біліңіз.

Шағын модельдер жылдамырақ әрі қабілеттірек болған сайын бұл үлгі пайдалырақ бола түседі. Барлығына бір модельді қолданудың орнына, әзірлеушілер ірі модельдер не істеу керегін шешетін, ал шағын модельдер оны ауқымды түрде тез орындайтын жүйелерді құрастыра алады. GPT‑5.4 mini — осындай жұмыс ағыны стиліне арналған әзірге ең мықты mini моделіміз.

Компьютерді пайдалану

GPT‑5.4 mini мультимодальды тапсырмаларда да, әсіресе компьютерді пайдалануға қатысты міндеттерде де мықты. Модель компьютерді пайдалану тапсырмаларын жылдам орындау үшін күрделі пайдаланушы интерфейстерінің скриншоттарын тез түсіндіре алады. OSWorld-Verified жүйесінде GPT‑5.4 mini GPT‑5.4 деңгейіне жақындайды және GPT‑5 mini-ден айтарлықтай озады.

Қолжетімділік және баға

GPT‑5.4 mini бүгіннен бастап API, Codex және ChatGPT ішінде қолжетімді.

API ішінде GPT‑5.4 mini мәтін және сурет кірістерін, құралдарды пайдалануды, функция шақыруды, веб-іздеуді, файл іздеуді, компьютерді пайдалануды және дағдыларды қолдайды. Оның 400k контекст терезесі бар және 1M кіріс токеніне $0.75, ал 1M шығыс токеніне $4.50 тұрады.

Codex ішінде GPT‑5.4 mini Codex қолданбасында, CLI, IDE кеңейтімінде және вебте қолжетімді. Ол GPT‑5.4 квотасының тек 30%-ын пайдаланады, бұл әзірлеушілерге Codex ішінде қарапайымдау код жазу тапсырмаларын құнның шамамен үштен біріне тез орындауға мүмкіндік береді. Codex сондай-ақ GPT‑5.4 mini қосалқы агенттеріне тапсыра алады, сондықтан ой қорытуы азырақ қажет жұмыс арзанырақ модельде орындалады.

ChatGPT ішінде GPT‑5.4 mini Free және Go пайдаланушыларына + мәзіріндегі «Thinking» мүмкіндігі арқылы қолжетімді. Қалған барлық пайдаланушылар үшін GPT‑5.4 mini GPT‑5.4 Thinking-ке арналған rate limit fallback ретінде қолжетімді.

GPT‑5.4 nano тек API ішінде қолжетімді және 1M кіріс токеніне $0.20, ал 1M шығыс токеніне $1.25 тұрады.

Модельдердің қорғаныс шаралары туралы қосымша ақпарат алу үшін Deployment Safety Hub⁠(жаңа терезеде ашылады) ішіндегі System Card қосымшасын қараңыз.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%