Ugrás a fő tartalomra
OpenAI

2026. március 17.

VállalatTermék

Bemutatkozik a GPT‑5.4 mini és nano verziója

Gyors és hatékony modellek, kódolásra és alügynökökre optimalizálva

Betöltés…

Ma kiadásra kerül a GPT‑5.4 mini és nano modell, az eddigi legfejlettebb kis modelljeink. A GPT‑5.4 erősségeinek nagy részét átültették ezekbe a gyorsabb, hatékonyabb, nagy volumenű munkaterhelésekre tervezett modellekbe.

A GPT‑5.4 mini jelentős előrelépést jelent a GPT‑5 minihez képest a kódolás, az érvelés, a multimodális értelmezés és az eszközhasználat terén, miközben több mint 2x gyorsabban fut. Számos értékelésen igazolódott, hogy megközelíti a nagyobb GPT‑5.4 modell teljesítményét, többek között a SWE-Bench Pro és az OSWorld-Verified értékelésén is bizonyított.

A GPT‑5.4 nano a GPT‑5.4 legkisebb és legolcsóbb verziója azokhoz a feladatokhoz, ahol a sebesség és a költség a legfontosabb tényezők. Emellett jelentős fejlesztés a GPT‑5 nanohoz képest. Osztályozáshoz, adatkinyeréshez, rangsoroláshoz, valamint az egyszerűbb támogató feladatokat kezelő kódolási alügynökökhöz ajánljuk.

Ezek a modellek olyan munkaterhelésekhez készültek, ahol a késleltetés közvetlenül befolyásolja a termékélményt: kódolási asszisztensekhez, amelyeknek reszponzívnak kell lenniük, gyorsan támogató feladatokat végrehajtó alügynökökhöz, képernyőképeket rögzítő és értelmező számítógépes rendszerekhez, valamint multimodális alkalmazásokhoz, amelyek valós időben képesek képeken érvelni. Ezekben a beállításokban a gyakran nem a legnagyobb modell a legjobb, hanem az, amelyik gyorsan tud válaszolni, megbízhatóan használ eszközöket, és még így is jól teljesít összetett professzionális feladatokban.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 A GPT‑5 minihez elérhető legmagasabb reasoning_effort érték a „high”.

Íme, mit gondolnak ügyfeleink a GPT‑5.4 mini és nano változat munkafolyamatokban történő tesztelése után:

„A GPT-5.4 mini erős, végponttól végpontig tartó teljesítményt nyújt ahhoz viszonyítva, hogy ebbe az osztályba tartozó modell. Értékeléseink során több kimeneti feladatban és a hivatkozások felidézésében felvette a versenyt a versenytárs modellekkel, vagy túl is szárnyalta azokat, jóval alacsonyabb költség mellett. Emellett magasabb végponttól végpontig tartó sikerességi arányt és erősebb forrásattribúciót ért el, mint a nagyobb GPT-5.4 modell.”
— Aabhas Sharma, a Hebbia műszaki igazgatója

Kódolás

A GPT‑5.4 mini és nano különösen hatékonyak a gyors iterációt igénylő kódolási munkafolyamatokban. A modellek alacsony késleltetéssel kezelik a célzott szerkesztéseket, a kódbázisban való navigációt, a front-end generálást és a hibakeresési ciklusokat, így erős választást jelentenek olyan kódolási feladatokhoz, amelyeket nagyobb sebességgel és alacsonyabb költséggel kell elvégezni.

A benchmarkokban a GPT‑5.4 mini következetesen felülmúlja a GPT‑5‑mini teljesítményét hasonló késleltetéssel, és megközelíti a GPT‑5.4‑level átmenési arányok, miközben sokkal gyorsabban fut, és a kódolási munkafolyamatokhoz a teljesítmény és a késleltetés közötti egyik legerősebb kompromisszumot nyújtja.

A késleltetést úgy becsüljük meg, hogy megnézzük a modelljeink éles környezetben mutatott működését, majd ezt offline szimuláljuk. A késleltetés becslése során figyelembe vesszük az eszközhívások időtartamát (kódfuttatási idő), a mintavételezett tokeneket és a bemeneti tokeneket. A valós környezetben tapasztalt késleltetés jelentősen eltérhet, és számos olyan tényezőtől függ, amelyeket a szimulációnk nem vesz figyelembe. Hasonlóképpen, a költségek az ezen modell API-árképzése alapján kerültek becslésre a cikk írásának időpontjában. A költségek a jövőben változhatnak. Az érvelési erőfeszítéseket alacsonyról xhigh-ra emeltük.

Alügynökök

A GPT‑5.4 mini szintén jól illik az olyan rendszerekhez, amelyek különböző méretű modelleket kombinálnak. A Codexben például egy nagyobb modell, például a GPT‑5.4, el tudja látni a tervezést, a koordinációt és a végső döntést, miközben a szűkebb részfeladatokat párhuzamosan végző GPT‑5.4 mini alügynököknek delegál feladatokat—például egy kódbázis átvizsgálását, egy nagy fájl áttekintését vagy a kiegészítő dokumentumok feldolgozását. Tudd meg, hogyan működnek az alügynökök a Codexben a dokumentációban(új ablakban nyílik meg).

Ez a minta egyre hasznosabbá válik, ahogy a kisebb modellek gyorsabbak és erősebbek lesznek. Ahelyett, hogy mindent egyetlen modelllel oldanának meg, a fejlesztők olyan rendszereket állíthatnak össze, amelyekben a nagyobb modellek döntik el, mit kell tenni, a kisebb modellek pedig gyorsan, nagy léptékben hajtják azt végre. A GPT‑5.4 mini az eddigi legerősebb mini modellünk az ilyen jellegű munkafolyamatokhoz.

Számítógép-használat

A GPT‑5.4 mini a multimodális feladatokban is erős, különösen a számítógép-használathoz kapcsolódókban. A modell gyorsan képes értelmezni a sűrű felhasználói felületekről készült képernyőképeket, hogy nagy sebességgel teljesítse a számítógép-használati feladatokat. Az OSWorld-Verified szerint a GPT‑5.4 mini megközelíti a GPT‑5.4‑et, miközben jelentősen felülmúlja a GPT‑5 minit.

Elérhetőség és árak

A GPT‑5.4 mini mától érhető el az API-ban, a Codexben és a ChatGPT‑ben.

Az API-ban a GPT‑5.4 mini támogatja a szöveges és képi bemeneteket, az eszközhasználatot, a funkcióhívást, a webes keresést, a fájlkeresést, a számítógép-használatot és a készségeket. 400k kontextusablakkal rendelkezik, és 1M beviteli tokenenként $0,75, illetve 1M kimeneti tokenenként $4,50 a költsége.

A Codexben a GPT‑5.4 mini elérhető a Codex alkalmazásban, a CLI-ben, az IDE-bővítményben és a weben. A GPT‑5.4 kvótának csak 30%-át használja, lehetővé téve a fejlesztők számára, hogy a Codexben gyorsan kezeljék az egyszerűbb kódolási feladatokat, nagyjából egyharmadáért a költségnek. A Codex szintén delegálhat a GPT‑5.4 mini alügynököknek, hogy a kevésbé érvelésintenzív munka az olcsóbb modellen fusson.

A ChatGPT‑ben a GPT‑5.4 mini a + menüben található „Thinking” funkción keresztül érhető el az ingyenes és a Go felhasználók számára. Minden más felhasználó számára a GPT‑5.4 mini elérhető tartalék opcióként a GPT‑5.4 Thinking sebességhatárt.

A GPT‑5.4 nano csak az API-ban érhető el, és 1M beviteli tokenenként $0,20-ba, valamint 1M kimeneti tokenenként $1,25-be kerül.

A modellek védelmi funkcióiról további információt a Deployment Safety Hubon(új ablakban nyílik meg) található rendszerkártya-kiegészítésben olvashatsz.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 A GPT‑5 minihez elérhető legmagasabb reasoning_effort érték a „high”.

2 Összesített szerkesztési távolság. Az OmniDocBench-et a reasoning_effort értékét "none"-ra állítva futtatták, hogy az alacsony költségű és alacsony késleltetésű teljesítményt tükrözze.

Szerző

OpenAI