17. märts 2026

Tutvustame mudeleid GPT‑5.4 mini ja nano

Kiired ja tõhusad mudelid, mis on optimeeritud kodeerimise ja alamagentide jaoks

Laadimine…

Täna toome turule GPT‑5.4 mini ja nano, mis on meie seni kõige võimekamad väikesed mudelid. Need toovad paljud GPT‑5.4 tugevused üle kiirematesse ja tõhusamatesse mudelitesse, mis on loodud suure mahuga töökoormuste jaoks.

GPT‑5.4 mini pakub võrreldes mudeliga GPT‑5 mini märkimisväärset edasiminekut kodeerimises, arutlemises, multimodaalses mõistmises ja tööriistade kasutamises, töötades samal ajal üle kahe korra kiiremini. Mitmetes hindamistes, sealhulgas SWE-Bench Pro ja OSWorld-Verified testis, läheneb see oma jõudluselt ka suuremale mudelile GPT‑5.4.

GPT‑5.4 nano on mudeli GPT‑5.4 kõige väiksem ja odavaim versioon ülesannete jaoks, kus kiirus ja hind on kõige olulisemad. Samuti on see märkimisväärne edasiminek võrreldes mudeliga GPT‑5 nano. Soovitame seda klassifitseerimiseks, andmete eraldamiseks, järjestamiseks ja kodeerimise alamagentidele, mis tegelevad lihtsamate toetavate ülesannetega.

Need mudelid on loodud selliste töökoormuste jaoks, kus latentsus kujundab otseselt tootekogemust: programmeerimisassistendid, mis peavad tunduma reageerimisaltid, alamagendid, mis täidavad kiiresti toetavaid ülesandeid, arvuteid kasutavad süsteemid, mis salvestavad ja tõlgendavad ekraanipilte, ning multimodaalsed rakendused, mis suudavad piltide üle reaalajas arutleda. Sellistes keskkondades ei ole parim mudel sageli mitte kõige suurem—see on hoopis see, mis suudab kiiresti reageerida, kasutada tööriistu usaldusväärselt ja tulla sellegipoolest hästi toime keerukate professionaalsete ülesannetega.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Kõrgeim saadaolev reasoning_effort (arutlemise pingutus) mudeli GPT‑5 mini jaoks on 'high' (kõrge).}

Siin on see, mida meie kliendid arvavad pärast GPT‑5.4 mini ja nano testimist oma töövoogudes:

„GPT-5.4 mini pakub oma klassi mudeli kohta tugevat otsast lõpuni (end-to-end) jõudlust. Meie hindamistes saavutas see mitmetes väljundülesannetes ja viidete meenutamises (citation recall) konkurentide mudelitega võrdse või parema tulemuse, olles sealjuures palju soodsam. Samuti saavutas see kõrgemad otsast lõpuni läbimismäärad ja tugevama algallikatele viitamise (source attribution) kui suurem mudel GPT-5.4.“

— Abhas Sharma, Hebbia tehnoloogiajuht

Kodeerimine

GPT‑5.4 mini ja nano on eriti tõhusad kodeerimise töövoogudes, mis saavad kasu kiirest itereerimisest. Mudelid tegelevad sihipäraste muudatuste, koodibaasis navigeerimise, kasutajaliidese (front-end) genereerimise ja silumistsüklitega madala latentsusega, muutes need suurepäraseks valikuks programmeerimisülesannete jaoks, mis tuleb lõpule viia kiiremini ja madalamate kuludega.

Jõudlustestides edestab GPT‑5.4 mini sarnase latentsuse juures järjepidevalt mudelit GPT‑5‑mini ja läheneb GPT‑5.4 tasemega läbimismääradele, töötades samal ajal palju kiiremini, pakkudes kodeerimise töövoogude jaoks üht tugevaimat jõudluse ja latentsuse suhet.

Hindame latentsust, vaadates meie mudelite käitumist tootmiskeskkonnas, ja simuleerides seda võrguühenduseta. Latentsi hinnang võtab arvesse tööriistakutse kestust (koodi käivitusaega), proovivõetud tokenite ja sisendtokenite. Reaalse maailma latentsus võib oluliselt varieeruda ja sõltub paljudest teguritest, mida meie simulatsioon ei hõlma. Samamoodi on kulud arvutatud nende mudelite API-hindade alusel, mis kehtisid kirjutamise ajal. Kulud võivad tulevikus muutuda. Arutlus viidi tasemelt madal tasemele väga kõrge.

Alamagendid

GPT‑5.4 mini on samuti suurepärane valik süsteemidele, mis kombineerivad erineva suurusega mudeleid. Näiteks Codexis võib suurem mudel nagu GPT‑5.4 tegeleda planeerimise, koordineerimise ja lõpliku otsustamisega, delegeerides samal ajal kitsamad alamülesanded paralleelselt GPT‑5.4 mini alamagentidele—näiteks koodibaasi otsimine, suure faili ülevaatamine või toetavate dokumentide töötlemine. Uuri dokumentatsioonist⁠(avaneb uues aknas), kuidas alamagendid Codexis töötavad.

See muster muutub kasulikumaks sedamööda, kuidas väiksemad mudelid muutuvad kiiremaks ja võimekamaks. Selle asemel, et kasutada ühte mudelit kõige jaoks, saavad arendajad koostada süsteeme, kus suuremad mudelid otsustavad, mida teha, ja väiksemad mudelid viivad selle suures mahus kiiresti täide. GPT‑5.4 mini on sellises stiilis töövoo jaoks meie seni tugevaim mini-mudel.

Arvuti kasutamine

GPT‑5.4 mini on tugev ka multimodaalsetes ülesannetes, eriti neis, mis on seotud arvuti kasutamisega. Mudel suudab kiiresti tõlgendada tihedate kasutajaliideste ekraanipilte, et viia arvutikasutuse ülesanded kiiresti lõpule. OSWorld-Verified testis läheneb GPT‑5.4 mini mudelile GPT‑5.4, edestades samal ajal märkimisväärselt mudelit GPT‑5 mini.

Saadavus ja hinnastamine

GPT‑5.4 mini on tänasest saadaval API-s, Codexis ja ChatGPT‑s.

API-s toetab GPT‑5.4 mini teksti ja piltide sisendit, tööriistade kasutamist, funktsioonide väljakutsumist (function calling), veebiotsingut, failiotsingut, arvuti kasutamist ja oskusi. Sellel on 400k kontekstiaken ja see maksab 0,75 dollarit 1 miljoni sisendtokeni kohta ning 4,50 dollarit 1 miljoni väljundtokeni kohta.

Codexis on GPT‑5.4 mini saadaval nii Codexi rakenduses, käsurealiideses (CLI), IDE laienduses kui ka veebis. See kasutab vaid 30% mudeli GPT‑5.4 kvoodist, võimaldades arendajatel lahendada lihtsamaid kodeerimisülesandeid Codexis kiiresti umbes kolmandiku hinnaga. Codex võib ülesandeid delegeerida ka GPT‑5.4 mini-alamagentidele, nii et vähem arutlusvõimet nõudvad ülesanded täidetakse odavama mudeli abil.

ChatGPT‑s on GPT‑5.4 mini kättesaadav tasuta ja Go kasutajatele menüüs + asuva funktsiooni „Thinking“ kaudu. Kõigi teiste kasutajate jaoks on GPT‑5.4 mini saadaval kiirusepiirangu varuvariandina mudeli GPT‑5.4 Thinking jaoks.

GPT‑5.4 nano on saadaval ainult API-s ja maksab 0,20 dollarit 1 miljoni sisendtookeni kohta ning 1,25 dollarit 1 miljoni väljundtookeni kohta.

Mudelite kaitsemeetmete kohta lisateabe saamiseks tutvu palun meie juurutamise ohutuse keskuses⁠(avaneb uues aknas) oleva süsteemikaardi lisaga.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Kõrgeim saadaolev reasoning_effort (arutlemise pingutus) mudeli GPT‑5 mini jaoks on 'high' (kõrge).}

^{2 Üldine redigeerimiskaugus. OmniDocBench viidi läbi ilma arutluspingutuseta „none“ (puudub), et kajastada madalaid kulusid ja madala latentsusega jõudlust.}

2026

Autor

OpenAI

Jätka lugemist

Vaata kõiki

Healthi toomine ChatGPT-sse

Toode23. juuli 2026

How news organizations are using AI > Card Image

Kuidas uudisteorganisatsioonid AI-ga missioone edendavad

Ettevõte22. juuli 2026

Tutvustame OpenAI Presence’it

Toode22. juuli 2026