Täna toome turule GPT‑5.4 mini ja nano, mis on meie seni kõige võimekamad väikesed mudelid. Need toovad paljud GPT‑5.4 tugevused üle kiirematesse ja tõhusamatesse mudelitesse, mis on loodud suure mahuga töökoormuste jaoks.
GPT‑5.4 mini pakub võrreldes mudeliga GPT‑5 mini märkimisväärset edasiminekut kodeerimises, arutlemises, multimodaalses mõistmises ja tööriistade kasutamises, töötades samal ajal üle kahe korra kiiremini. Mitmetes hindamistes, sealhulgas SWE-Bench Pro ja OSWorld-Verified testis, läheneb see oma jõudluselt ka suuremale mudelile GPT‑5.4.
GPT‑5.4 nano on mudeli GPT‑5.4 kõige väiksem ja odavaim versioon ülesannete jaoks, kus kiirus ja hind on kõige olulisemad. Samuti on see märkimisväärne edasiminek võrreldes mudeliga GPT‑5 nano. Soovitame seda klassifitseerimiseks, andmete eraldamiseks, järjestamiseks ja kodeerimise alamagentidele, mis tegelevad lihtsamate toetavate ülesannetega.
Need mudelid on loodud selliste töökoormuste jaoks, kus latentsus kujundab otseselt tootekogemust: programmeerimisassistendid, mis peavad tunduma reageerimisaltid, alamagendid, mis täidavad kiiresti toetavaid ülesandeid, arvuteid kasutavad süsteemid, mis salvestavad ja tõlgendavad ekraanipilte, ning multimodaalsed rakendused, mis suudavad piltide üle reaalajas arutleda. Sellistes keskkondades ei ole parim mudel sageli mitte kõige suurem—see on hoopis see, mis suudab kiiresti reageerida, kasutada tööriistu usaldusväärselt ja tulla sellegipoolest hästi toime keerukate professionaalsete ülesannetega.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 Kõrgeim saadaolev reasoning_effort (arutlemise pingutus) mudeli GPT‑5 mini jaoks on 'high' (kõrge).
Siin on see, mida meie kliendid arvavad pärast GPT‑5.4 mini ja nano testimist oma töövoogudes:
„GPT-5.4 mini pakub oma klassi mudeli kohta tugevat otsast lõpuni (end-to-end) jõudlust. Meie hindamistes saavutas see mitmetes väljundülesannetes ja viidete meenutamises (citation recall) konkurentide mudelitega võrdse või parema tulemuse, olles sealjuures palju soodsam. Samuti saavutas see kõrgemad otsast lõpuni läbimismäärad ja tugevama algallikatele viitamise (source attribution) kui suurem mudel GPT-5.4.“
GPT‑5.4 mini ja nano on eriti tõhusad kodeerimise töövoogudes, mis saavad kasu kiirest itereerimisest. Mudelid tegelevad sihipäraste muudatuste, koodibaasis navigeerimise, kasutajaliidese (front-end) genereerimise ja silumistsüklitega madala latentsusega, muutes need suurepäraseks valikuks programmeerimisülesannete jaoks, mis tuleb lõpule viia kiiremini ja madalamate kuludega.
Jõudlustestides edestab GPT‑5.4 mini sarnase latentsuse juures järjepidevalt mudelit GPT‑5‑mini ja läheneb GPT‑5.4 tasemega läbimismääradele, töötades samal ajal palju kiiremini, pakkudes kodeerimise töövoogude jaoks üht tugevaimat jõudluse ja latentsuse suhet.
Hindame latentsust, vaadates meie mudelite käitumist tootmiskeskkonnas, ja simuleerides seda võrguühenduseta. Latentsi hinnang võtab arvesse tööriistakutse kestust (koodi käivitusaega), proovivõetud tokenite ja sisendtokenite. Reaalse maailma latentsus võib oluliselt varieeruda ja sõltub paljudest teguritest, mida meie simulatsioon ei hõlma. Samamoodi on kulud arvutatud nende mudelite API-hindade alusel, mis kehtisid kirjutamise ajal. Kulud võivad tulevikus muutuda. Arutlus viidi tasemelt madal tasemele väga kõrge.
GPT‑5.4 mini on samuti suurepärane valik süsteemidele, mis kombineerivad erineva suurusega mudeleid. Näiteks Codexis võib suurem mudel nagu GPT‑5.4 tegeleda planeerimise, koordineerimise ja lõpliku otsustamisega, delegeerides samal ajal kitsamad alamülesanded paralleelselt GPT‑5.4 mini alamagentidele—näiteks koodibaasi otsimine, suure faili ülevaatamine või toetavate dokumentide töötlemine. Uuri dokumentatsioonist(avaneb uues aknas), kuidas alamagendid Codexis töötavad.
See muster muutub kasulikumaks sedamööda, kuidas väiksemad mudelid muutuvad kiiremaks ja võimekamaks. Selle asemel, et kasutada ühte mudelit kõige jaoks, saavad arendajad koostada süsteeme, kus suuremad mudelid otsustavad, mida teha, ja väiksemad mudelid viivad selle suures mahus kiiresti täide. GPT‑5.4 mini on sellises stiilis töövoo jaoks meie seni tugevaim mini-mudel.
GPT‑5.4 mini on tugev ka multimodaalsetes ülesannetes, eriti neis, mis on seotud arvuti kasutamisega. Mudel suudab kiiresti tõlgendada tihedate kasutajaliideste ekraanipilte, et viia arvutikasutuse ülesanded kiiresti lõpule. OSWorld-Verified testis läheneb GPT‑5.4 mini mudelile GPT‑5.4, edestades samal ajal märkimisväärselt mudelit GPT‑5 mini.
GPT‑5.4 mini on tänasest saadaval API-s, Codexis ja ChatGPT‑s.
API-s toetab GPT‑5.4 mini teksti ja piltide sisendit, tööriistade kasutamist, funktsioonide väljakutsumist (function calling), veebiotsingut, failiotsingut, arvuti kasutamist ja oskusi. Sellel on 400k kontekstiaken ja see maksab 0,75 dollarit 1 miljoni sisendtokeni kohta ning 4,50 dollarit 1 miljoni väljundtokeni kohta.
Codexis on GPT‑5.4 mini saadaval nii Codexi rakenduses, käsurealiideses (CLI), IDE laienduses kui ka veebis. See kasutab vaid 30% mudeli GPT‑5.4 kvoodist, võimaldades arendajatel lahendada lihtsamaid kodeerimisülesandeid Codexis kiiresti umbes kolmandiku hinnaga. Codex võib ülesandeid delegeerida ka GPT‑5.4 mini-alamagentidele, nii et vähem arutlusvõimet nõudvad ülesanded täidetakse odavama mudeli abil.
ChatGPT‑s on GPT‑5.4 mini kättesaadav tasuta ja Go kasutajatele menüüs + asuva funktsiooni „Thinking“ kaudu. Kõigi teiste kasutajate jaoks on GPT‑5.4 mini saadaval kiirusepiirangu varuvariandina mudeli GPT‑5.4 Thinking jaoks.
GPT‑5.4 nano on saadaval ainult API-s ja maksab 0,20 dollarit 1 miljoni sisendtookeni kohta ning 1,25 dollarit 1 miljoni väljundtookeni kohta.
Mudelite kaitsemeetmete kohta lisateabe saamiseks tutvu palun meie juurutamise ohutuse keskuses(avaneb uues aknas) oleva süsteemikaardi lisaga.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 Kõrgeim saadaolev reasoning_effort (arutlemise pingutus) mudeli GPT‑5 mini jaoks on 'high' (kõrge).
2 Üldine redigeerimiskaugus. OmniDocBench viidi läbi ilma arutluspingutuseta „none“ (puudub), et kajastada madalaid kulusid ja madala latentsusega jõudlust.


