Ma kiadásra kerül a GPT‑5.4 mini és nano modell, az eddigi legfejlettebb kis modelljeink. A GPT‑5.4 erősségeinek nagy részét átültették ezekbe a gyorsabb, hatékonyabb, nagy volumenű munkaterhelésekre tervezett modellekbe.
A GPT‑5.4 mini jelentős előrelépést jelent a GPT‑5 minihez képest a kódolás, az érvelés, a multimodális értelmezés és az eszközhasználat terén, miközben több mint 2x gyorsabban fut. Számos értékelésen igazolódott, hogy megközelíti a nagyobb GPT‑5.4 modell teljesítményét, többek között a SWE-Bench Pro és az OSWorld-Verified értékelésén is bizonyított.
A GPT‑5.4 nano a GPT‑5.4 legkisebb és legolcsóbb verziója azokhoz a feladatokhoz, ahol a sebesség és a költség a legfontosabb tényezők. Emellett jelentős fejlesztés a GPT‑5 nanohoz képest. Osztályozáshoz, adatkinyeréshez, rangsoroláshoz, valamint az egyszerűbb támogató feladatokat kezelő kódolási alügynökökhöz ajánljuk.
Ezek a modellek olyan munkaterhelésekhez készültek, ahol a késleltetés közvetlenül befolyásolja a termékélményt: kódolási asszisztensekhez, amelyeknek reszponzívnak kell lenniük, gyorsan támogató feladatokat végrehajtó alügynökökhöz, képernyőképeket rögzítő és értelmező számítógépes rendszerekhez, valamint multimodális alkalmazásokhoz, amelyek valós időben képesek képeken érvelni. Ezekben a beállításokban a gyakran nem a legnagyobb modell a legjobb, hanem az, amelyik gyorsan tud válaszolni, megbízhatóan használ eszközöket, és még így is jól teljesít összetett professzionális feladatokban.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 A GPT‑5 minihez elérhető legmagasabb reasoning_effort érték a „high”.
Íme, mit gondolnak ügyfeleink a GPT‑5.4 mini és nano változat munkafolyamatokban történő tesztelése után:
„A GPT-5.4 mini erős, végponttól végpontig tartó teljesítményt nyújt ahhoz viszonyítva, hogy ebbe az osztályba tartozó modell. Értékeléseink során több kimeneti feladatban és a hivatkozások felidézésében felvette a versenyt a versenytárs modellekkel, vagy túl is szárnyalta azokat, jóval alacsonyabb költség mellett. Emellett magasabb végponttól végpontig tartó sikerességi arányt és erősebb forrásattribúciót ért el, mint a nagyobb GPT-5.4 modell.”
A GPT‑5.4 mini és nano különösen hatékonyak a gyors iterációt igénylő kódolási munkafolyamatokban. A modellek alacsony késleltetéssel kezelik a célzott szerkesztéseket, a kódbázisban való navigációt, a front-end generálást és a hibakeresési ciklusokat, így erős választást jelentenek olyan kódolási feladatokhoz, amelyeket nagyobb sebességgel és alacsonyabb költséggel kell elvégezni.
A benchmarkokban a GPT‑5.4 mini következetesen felülmúlja a GPT‑5‑mini teljesítményét hasonló késleltetéssel, és megközelíti a GPT‑5.4‑level átmenési arányok, miközben sokkal gyorsabban fut, és a kódolási munkafolyamatokhoz a teljesítmény és a késleltetés közötti egyik legerősebb kompromisszumot nyújtja.
A késleltetést úgy becsüljük meg, hogy megnézzük a modelljeink éles környezetben mutatott működését, majd ezt offline szimuláljuk. A késleltetés becslése során figyelembe vesszük az eszközhívások időtartamát (kódfuttatási idő), a mintavételezett tokeneket és a bemeneti tokeneket. A valós környezetben tapasztalt késleltetés jelentősen eltérhet, és számos olyan tényezőtől függ, amelyeket a szimulációnk nem vesz figyelembe. Hasonlóképpen, a költségek az ezen modell API-árképzése alapján kerültek becslésre a cikk írásának időpontjában. A költségek a jövőben változhatnak. Az érvelési erőfeszítéseket alacsonyról xhigh-ra emeltük.
A GPT‑5.4 mini szintén jól illik az olyan rendszerekhez, amelyek különböző méretű modelleket kombinálnak. A Codexben például egy nagyobb modell, például a GPT‑5.4, el tudja látni a tervezést, a koordinációt és a végső döntést, miközben a szűkebb részfeladatokat párhuzamosan végző GPT‑5.4 mini alügynököknek delegál feladatokat—például egy kódbázis átvizsgálását, egy nagy fájl áttekintését vagy a kiegészítő dokumentumok feldolgozását. Tudd meg, hogyan működnek az alügynökök a Codexben a dokumentációban(új ablakban nyílik meg).
Ez a minta egyre hasznosabbá válik, ahogy a kisebb modellek gyorsabbak és erősebbek lesznek. Ahelyett, hogy mindent egyetlen modelllel oldanának meg, a fejlesztők olyan rendszereket állíthatnak össze, amelyekben a nagyobb modellek döntik el, mit kell tenni, a kisebb modellek pedig gyorsan, nagy léptékben hajtják azt végre. A GPT‑5.4 mini az eddigi legerősebb mini modellünk az ilyen jellegű munkafolyamatokhoz.
A GPT‑5.4 mini a multimodális feladatokban is erős, különösen a számítógép-használathoz kapcsolódókban. A modell gyorsan képes értelmezni a sűrű felhasználói felületekről készült képernyőképeket, hogy nagy sebességgel teljesítse a számítógép-használati feladatokat. Az OSWorld-Verified szerint a GPT‑5.4 mini megközelíti a GPT‑5.4‑et, miközben jelentősen felülmúlja a GPT‑5 minit.
A GPT‑5.4 mini mától érhető el az API-ban, a Codexben és a ChatGPT‑ben.
Az API-ban a GPT‑5.4 mini támogatja a szöveges és képi bemeneteket, az eszközhasználatot, a funkcióhívást, a webes keresést, a fájlkeresést, a számítógép-használatot és a készségeket. 400k kontextusablakkal rendelkezik, és 1M beviteli tokenenként $0,75, illetve 1M kimeneti tokenenként $4,50 a költsége.
A Codexben a GPT‑5.4 mini elérhető a Codex alkalmazásban, a CLI-ben, az IDE-bővítményben és a weben. A GPT‑5.4 kvótának csak 30%-át használja, lehetővé téve a fejlesztők számára, hogy a Codexben gyorsan kezeljék az egyszerűbb kódolási feladatokat, nagyjából egyharmadáért a költségnek. A Codex szintén delegálhat a GPT‑5.4 mini alügynököknek, hogy a kevésbé érvelésintenzív munka az olcsóbb modellen fusson.
A ChatGPT‑ben a GPT‑5.4 mini a + menüben található „Thinking” funkción keresztül érhető el az ingyenes és a Go felhasználók számára. Minden más felhasználó számára a GPT‑5.4 mini elérhető tartalék opcióként a GPT‑5.4 Thinking sebességhatárt.
A GPT‑5.4 nano csak az API-ban érhető el, és 1M beviteli tokenenként $0,20-ba, valamint 1M kimeneti tokenenként $1,25-be kerül.
A modellek védelmi funkcióiról további információt a Deployment Safety Hubon(új ablakban nyílik meg) található rendszerkártya-kiegészítésben olvashatsz.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 A GPT‑5 minihez elérhető legmagasabb reasoning_effort érték a „high”.
2 Összesített szerkesztési távolság. Az OmniDocBench-et a reasoning_effort értékét "none"-ra állítva futtatták, hogy az alacsony költségű és alacsony késleltetésű teljesítményt tükrözze.


