2026 m. kovo 17 d.

Pristatome „GPT‑5.4 mini“ ir „nano“

Greiti ir efektyvūs modeliai, optimizuoti programavimui ir antriniams agentams

Įkeliama...

Šiandien išleidžiame „GPT‑5.4 mini“ ir „nano“ – kol kas pajėgiausius mūsų mažuosius modelius. Juose daugelis GPT‑5.4 pranašumų pritaikyti greitesniuose, efektyvesniuose modeliuose, skirtuose didelės apimties darbo eigoms.

„GPT‑5.4 mini“ gerokai pranoksta „GPT‑5 mini“ programavimo, protavimo, daugiarūšio supratimo ir įrankių naudojimo srityse, o veikia daugiau nei dukart greičiau. Be to, jis priartėja prie didesnio modelio GPT‑5.4 našumo keliuose vertinimuose, įskaitant „SWE-Bench Pro“ ir „OSWorld-Verified“.

„GPT‑5.4 nano“ – mažiausia, pigiausia GPT‑5.4 versija, skirta užduotims, kur greitis ir kaina yra svarbiausi. Tai taip pat reikšmingas atnaujinimas, palyginti su „GPT‑5 nano“. Rekomenduojame jį klasifikavimui, duomenų išgavimui, reitingavimui ir antriniams programavimo agentams, tvarkantiems paprastesnes pagalbines užduotis.

Šie modeliai sukurti tokioms darbo eigoms, kuriose vėlavimas tiesiogiai lemia produkto patirtį: programavimo padėjėjams, kurie turi reaguoti žaibiškai, antriniams agentams, kurie greitai atlieka pagalbines užduotis, kompiuterį naudojančioms sistemoms, kurios fiksuoja ir interpretuoja ekrano kopijas, ir daugiarūšėms programoms, kurios gali analizuoti vaizdus realiuoju laiku. Tokioje aplinkoje geriausias modelis dažnai yra ne didžiausias, o tas, kuris gali greitai reaguoti, patikimai naudoti įrankius ir vis tiek gerai atlikti sudėtingas profesines užduotis.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Aukščiausias „GPT‑5 mini“ galimas „reasoning_effort“ lygis yra „high“.}

Štai ką mano mūsų klientai, išbandę „GPT‑5.4 mini“ ir „nano“ savo darbo eigose:

„GPT-5.4 mini“ užtikrina stiprų visapusišką našumą savo klasės modeliui. Mūsų vertinimuose jis prilygo arba pranoko konkuruojančius modelius atliekant kelias išvesties užduotis ir citatų atgaminimą kur kas mažesnėmis išlaidomis. Jis taip pat pasiekė aukštesnius visapusiško išlaikymo rodiklius ir stipresnį šaltinio priskyrimą nei didesnis GPT-5.4 modelis.“

– Aabhas Sharma, „Hebbia“ technologijų padalinio vadovas

Programavimas

„GPT‑5.4 mini“ ir „nano“ ypač efektyvūs programavimo darbo eigose, kur naudingas greitas iteravimas. Modeliai mažai vėluodami apdoroja tikslinius redagavimus, naršymą kodų bazėje, sąsajos generavimą ir derinimo ciklus, todėl puikiai tinka programavimo užduotims, kurias reikia atlikti greičiau ir mažesnėmis išlaidomis.

Lyginamuosiuose testuose „GPT‑5.4 mini“ nuolat pranoksta „GPT‑5‑mini“ esant panašiam vėlavimui ir priartėja prie GPT‑5.4 lygio išlaikymo rodiklių, tačiau veikia daug greičiau, užtikrindamas vieną geriausių našumo ir vėlavimo santykių programavimo darbo eigose.

Vėlavimą įvertiname nagrinėdami mūsų modelių veikimą realiomis sąlygomis ir modeliuodami tai neprisijungę prie tinklo. Apskaičiuojant vėlavimą, atsižvelgiama į įrankio iškvietimo trukmę (kodo vykdymo laiką), atrinktus žetonus ir įvesties žetonus. Realus vėlavimas gali gerokai skirtis ir priklauso nuo daugelio veiksnių, neįtrauktų į mūsų modeliavimą. Taip pat išlaidos numatomos pagal šių modelių API kainodarą rašymo metu. Ateityje kainos gali keistis. Protavimo pastangos buvo keičiamos nuo žemo iki labai aukšto („xhigh“) lygio

Antriniai agentai

„GPT‑5.4 mini“ taip pat puikiai tinka sistemoms, derinančioms skirtingo dydžio modelius. Pavyzdžiui, programoje „Codex“ didesnis modelis, pvz., GPT‑5.4, gali rūpintis planavimu, koordinavimu ir galutiniu vertinimu, o siauresnes antrines užduotis lygiagrečiai perduoti „GPT‑5.4 mini“ antriniams agentams – pvz., atlikti paiešką kodų bazėje, peržiūrėti didelį failą arba apdoroti patvirtinamuosius dokumentus. Dokumentacijoje⁠(atsidaro naujame lange) sužinokite, kaip „Codex“ veikia antriniai agentai.

Šis modelis tampa naudingesnis, kai mažesni modeliai darosi greitesni ir pajėgesni. Užuot naudoję vieną modelį viskam, kūrėjai gali sukurti sistemas, kuriose didesni modeliai nusprendžia, ką daryti, o mažesni greitai atlieka darbus dideliu mastu. „GPT‑5.4 mini“ – kol kas stipriausias mūsų „mini“ modelis tokio stiliaus darbo eigai.

Kompiuterio naudojimas

„GPT‑5.4 mini“ taip pat stiprus atliekant daugiarūšes užduotis, ypač susijusias su kompiuterio naudojimu. Modelis gali greitai interpretuoti tankių naudotojo sąsajų ekrano kopijas ir sparčiai atlikti kompiuterio naudojimo užduotis. Testuojant su „OSWorld-Verified“, „GPT‑5.4 mini“ priartėja prie GPT‑5.4, gerokai lenkdamas „GPT‑5 mini“.

Prieinamumas ir kainos

„GPT‑5.4 mini“ nuo šiandien prieinamas API, programoje „Codex“ ir „ChatGPT“.

API aplinkoje „GPT‑5.4 mini“ palaiko teksto ir vaizdų įvestis, įrankių naudojimą, funkcijų kvietimą, paiešką saityne, failų paiešką, kompiuterio naudojimą ir įgūdžius. Jis turi 400 tūkst. žetonų konteksto langą ir kainuoja 0,75 USD už 1 mln. įvesties žetonų bei 4,50 USD už 1 mln. išvesties žetonų.

„Codex“ aplinkoje „GPT‑5.4 mini“ prieinamas visoje „Codex“ programoje, CLI, IDE plėtinyje ir saityne. Jis naudoja tik 30 proc. GPT‑5.4 kvotos, leisdamas kūrėjams greitai atlikti paprastesnes programavimo užduotis programoje „Codex“ už maždaug trečdalį kainos. „Codex“ taip pat gali perduoti užduotis „GPT‑5.4 mini“ antriniams agentams, kad mažiau protavimo reikalaujantis darbas būtų atliekamas pigesniu modeliu.

„ChatGPT“ aplinkoje „GPT‑5.4 mini“ prieinamas „ChatGPT Free“ ir „ChatGPT Go“ naudotojams per funkciją „Thinking“ (Mąstymas), esančią + meniu. Visiems kitiems naudotojams „GPT‑5.4 mini“ prieinamas kaip atsarginis variantas pasiekus „GPT‑5.4 Thinking“ limitą.

„GPT‑5.4 nano“ prieinamas tik API ir kainuoja 0,20 USD už 1 mln. įvesties žetonų bei 1,25 USD už 1 mln. išvesties žetonų.

Daugiau informacijos apie modelių apsaugos priemones rasite sistemos kortelės priede, esančiame mūsų Diegimo saugos centre⁠(atsidaro naujame lange).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Aukščiausias „GPT‑5 mini“ galimas „reasoning_effort“ lygis yra „high“.}

^{2 Bendras redagavimo atstumas. „OmniDocBench“ buvo atliktas nustačius protavimo pastangas kaip nulinę vertę („none“), siekiant atspindėti mažų išlaidų ir mažo vėlavimo našumą.}

2026 m.

Autorius

OpenAI

Skaityti toliau

Peržiūrėti viską

Launching Health in ChatGPT

Produktas2026-07-23

How news organizations are using AI > Card Image

Kaip naujienų organizacijos DI stiprina svarbias misijas

Bendrovė2026-07-22

Pristatome OpenAI Presence

Produktas2026-07-22