17 mars 2026

Vi presenterar GPT‑5.4 mini och nano

Snabba och effektiva modeller optimerade för kodning och underagenter

Laddar …

I dag släpper vi GPT‑5.4 mini och nano, våra mest kapabla mindre modeller hittills. De överför många av styrkorna i GPT‑5.4 till snabbare och mer effektiva modeller utformade för arbetsbelastningar med hög volym.

GPT‑5.4 mini innebär en betydande förbättring jämfört med GPT‑5 mini inom kodning, resonemang, multimodal förståelse och verktygsanvändning, samtidigt som den körs dubbelt så snabbt. Den närmar sig också prestandan hos den större GPT‑5.4‑modellen i flera utvärderingar, inklusive SWE-Bench Pro och OSWorld-Verified.

GPT‑5.4 nano är den minsta och billigaste versionen av GPT‑5.4 för uppgifter där hastighet och kostnad är viktigast. Det är också en betydande uppgradering jämfört med GPT‑5 nano. Vi rekommenderar den för klassificering, dataextrahering, rankning och kodningsunderagenter som hanterar enklare stöduppgifter.

Dessa modeller är byggda för den typen av arbetsbelastningar där latens direkt formar produktupplevelsen: kodassistenter som behöver kännas responsiva, underagenter som snabbt slutför stöduppgifter, datoranvändande system som registrerar och tolkar skärmdumpar och multimodala applikationer som kan resonera över bilder i realtid. I dessa miljöer är den bästa modellen ofta inte den största – det är den som kan reagera snabbt, använda verktyg tillförlitligt och ändå prestera bra på komplexa professionella uppgifter.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Den högsta tillgängliga reasoning_effort för GPT‑5 mini är ”high”.}

Så här tycker våra kunder efter att ha testat GPT‑5.4 mini and nano i sina arbetsflöden:

”GPT-5.4 mini levererar stark prestanda från början till slut för en modell i den här klassen. I våra utvärderingar matchade eller överträffade den konkurrerande modeller i flera uppgifter för utdata och återgivning av källor till en betydligt lägre kostnad. Den uppnådde också högre genomslagsfrekvens från början till slut och starkare källhänvisning än den större GPT-5.4-modellen.

– Aabhas Sharma, CTO på Hebbia

Kodning

GPT‑5.4 mini och nano är särskilt effektiva i kodningsarbetsflöden som gynnas av snabb iteration. Modellerna hanterar riktade redigeringar, navigering i kodbasen, front-end-generering och felsökningsloopar med låg latens, vilket gör dem väl lämpade för kodningsuppgifter som behöver slutföras snabbare och till lägre kostnader.

I riktmärkestester presterar GPT‑5.4 mini konsekvent bättre än GPT‑5‑mini vid liknande latenser och närmar sig GPT‑5.4‑nivåns godkännandefrekvenser samtidigt som den körs mycket snabbare, vilket ger en av de starkaste prestanda-per-latens-avvägningarna för kodningsarbetsflöden.

Vi uppskattar latensen genom att titta på våra modellers produktionsbeteende och simulera detta offline. Latensuppskattningen tar hänsyn till verktygsanropens längd (körningstid för kod), samplade token och indatatoken. Latens kan i själva verket variera avsevärt och beror på många faktorer som inte registreras i vår simulering. På samma sätt beräknas kostnaderna utifrån API-priserna för dessa modeller då detta skrivs. Kostnaderna kan komma att ändras i framtiden. Resonemangsinsatsen höjdes från ingen till mycket hög.

Underagenter

GPT‑5.4 mini passar också bra för system som kombinerar modeller av olika storlekar.I Codex kan till exempel en större modell som GPT‑5.4 hantera planering, samordning och slutligt omdöme, samtidigt som den delegerar underagenter till GPT‑5.4 mini som hanterar snävare deluppgifter parallellt – som att söka i en kodbas, granska en stor fil eller bearbeta stöddokument. Ta reda på hur underagenter fungerar i Codex i dokumentationen⁠(öppnas i ett nytt fönster).

Det här mönstret blir mer användbart i takt med att mindre modeller blir snabbare och mer kapabla. I stället för att använda en modell till allt kan utvecklare komponera system där större modeller avgör vad som ska göras och mindre modeller kör snabbt i stor skala. GPT‑5.4 mini är vår starkaste mini-modell hittills för den typen av arbetsflöde.

Datoranvändning

GPT‑5.4 mini presterar också bra på multimodala uppgifter, särskilt de som rör datoranvändning. Modellen kan snabbt tolka skärmdumpar av rika användargränssnitt för att slutföra datoranvändningsuppgifter med hög hastighet. På OSWorld-Verified närmar sig GPT‑5.4 mini GPT‑5.4 samtidigt som den presterar avsevärt bättre än GPT‑5 mini.

Tillgänglighet och priser

GPT‑5.4 mini är tillgängligt från och med idag i API:et, Codex och ChatGPT.

I API:et har GPT‑5.4 mini stöd för text- och bildindata, verktygsanvändning, funktionsanrop, webbsökning, filsökning, datoranvändning och färdigheter. Den har ett kontextfönster på 400 000 och kostar 0,75 USD per en miljon indatatokens och 4,50 USD per en miljon utdatokens.

I Codex är GPT‑5.4 mini tillgänglig via Codex-appen, CLI, IDE-tillägget och webben. Den använder bara 30 % av GPT‑5.4:s kvot, vilket gör att utvecklare snabbt kan hantera enklare kodningsuppgifter i Codex för ungefär en tredjedel av kostnaden. Codex kan också delegera till underagenter i GPT‑5.4 mini så att arbete som kräver mindre resonemang körs på den billigare modellen.

I ChatGPT är GPT‑5.4 mini tillgänglig för Free- och Go-användare via funktionen “Thinking” i +-menyn. För alla andra användare är GPT‑5.4 mini tillgängligt som en reserv vid hastighetsbegränsning för GPT‑5.4 Thinking.

GPT‑5.4 nano är endast tillgänglig i API:t och kostar 0,20 USD per en miljon indatatoken och 1,25 USD per en miljon utdatatoken.

Läs mer om modellernas skyddsåtgärder i systemkortstillägget på vårt center för driftsäkerhet⁠(öppnas i ett nytt fönster).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Den högsta tillgängliga reasoning_effort för GPT‑5 mini är ”high”.}

^{2 övergripande redigeringsavstånd. OmniDocBench kördes med resonemangsinsatsen inställd på ”none” för att återspegla prestanda med låg kostnad och låg latens.}

2026

Författare

OpenAI

Fortsätt läsa

Visa alla

Launching Health in ChatGPT

Produkt23 juli 2026

How news organizations are using AI > Card Image

Så använder nyhetsorganisationer AI för sina viktiga uppdrag

Företag22 juli 2026

Vi presenterar OpenAI Presence

Produkt22 juli 2026