17. marts 2026

Vi introducerer GPT‑5.4 mini og nano

Hurtige og effektive model, der er optimeret til kodning og underagenter

Indlæser ...

I dag lancerer vi GPT‑5.4 mini og nano, vores hidtil mest funktionelle små modeller. De bringer mange af styrkerne ved GPT‑5.4 til hurtigere og mere effektive modeller, der er designet til arbejdsbelastninger med høj volumen.

GPT‑5.4 mini er markant forbedret i forhold til GPT‑5 mini inden for kodning, ræsonnering, multimodal forståelse og værktøjsbrug, samtidig med at den kører over dobbelt så hurtigt. Den nærmer sig også ydeevnen for den større GPT‑5.4‑model på flere evalueringer, herunder SWE-Bench Pro og OSWorld-Verified.

GPT‑5.4 nano er den mindste og billigste version af GPT‑5.4 til opgaver, hvor hastighed og omkostninger betyder mest. Det er også en betydelig opgradering i forhold til GPT‑5 nano. Vi anbefaler den til klassificering, dataudtræk, rangordning og kodende underagenter, der håndterer enklere understøttende opgaver.

Disse modeller er udviklet til arbejdsbelastninger, hvor latenstid direkte påvirker produktoplevelsen: kodningsassistenter, der skal være responsive, underagenter, der hurtigt udfører understøttende opgaver, computersystemer, der registrerer og fortolker skærmbilleder samt multimodale applikationer, der kan analysere billeder i realtid. I disse situationer er den bedste model ofte ikke den største – det er den, der kan reagere hurtigt, bruge værktøjer pålideligt og stadig klare komplekse, professionelle opgaver godt.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 Den højeste beregningsindsats, der er tilgængelig for GPT‑5 mini, er 'high'.}

Her er, hvad vores kunder mener efter at have testet GPT‑5.4 mini og nano i deres arbejdsgange:

“GPT-5.4 mini leverer stærk end-to-end-ydeevne for en model i denne klasse. I vores evalueringer matchede eller overgik den konkurrerende modeller på flere outputopgaver og citeringsgenkaldelse til en meget lavere pris. Den opnåede også højere end-to-end-godkendelsesrater og stærkere kildetilskrivning end den større GPT-5.4-model."

— Aabhas Sharma, CTO hos Hebbia

Kodning

GPT‑5.4 mini og nano er særligt effektive i kodningsworkflows, der drager fordel af hurtig iteration. Modellerne håndterer målrettede redigeringer, kodebasenavigation, frontend-generering og debugging-loops med lav latenstid, hvilket gør dem velegnede til kodningsopgaver, der skal udføres hurtigere og til lavere omkostninger.

I benchmark-tests klarer GPT‑5.4 mini sig konsekvent bedre end GPT‑5‑mini ved tilsvarende ventetider og nærmer sig GPT‑5.4‑niveauet for korrekthedsprocent, samtidig med at den kører betydeligt hurtigere, hvilket giver et af de bedste forhold mellem ydeevne og ventetid til kodningsarbejdsgange.

Vi estimerer latenstid ved at se på vores modellers adfærd i produktion og simulere dette offline. Latensestimatet tager højde for varigheden af værktøjskald (kodekørselstid), samplede tokens og input tokens. Latens i den virkelige verden kan variere meget og afhænger af mange faktorer, som ikke indgår i vores simulering. Tilsvarende estimeres omkostninger baseret på API-priser for disse model på tidspunktet for skrivning. Omkostningerne kan ændre sig i fremtiden. Ræsonnering blev ændret fra lav til xhigh.

Underagenter

GPT‑5.4 mini er også et stærkt valg for systemer, der kombinerer model af forskellige størrelser. I Codex kan en større model såsom GPT‑5.4 for eksempel håndtere planlægning, koordinering og endelig vurdering, mens den delegerer til GPT‑5.4 mini-underagenter, der håndterer mere specifikke underopgaver parallelt såsom at søge i en kodebase, gennemgå en stor fil eller behandle støttedokumenter. Se, hvordan underagenter fungerer i Codex i dokumentationen⁠(åbner i et nyt vindue).

Dette mønster bliver mere nyttigt, efterhånden som mindre modeller bliver hurtigere og mere kapable. I stedet for at bruge én model til alting kan udviklere sammensætte systemer, hvor større modeller beslutter, hvad der skal gøres, og mindre modeller udfører det hurtigt i stor skala. GPT‑5.4 mini er vores hidtil stærkeste mini-model til den type arbejdsproces.

Computerbrug

GPT‑5.4 mini er også stærk til multimodale opgaver, især dem relateret til computerbrug. Modellen kan hurtigt fortolke skærmbilleder af tætte brugergrænseflader for hurtigt at fuldføre opgaver relateret til computerbrug. På OSWorld-Verified nærmer GPT‑5.4 mini sig GPT‑5.4, samtidig med at den præsterer markant bedre end GPT‑5 mini.

Tilgængelighed og priser

GPT‑5.4 mini er tilgængelig i dag i API'en, Codex og ChatGPT.

I API'en understøtter GPT‑5.4 mini tekst- og billedinput, værktøjsbrug, funktionskald, internetsøgning, filsøgning, computerbrug og færdigheder. Den har et kontekstvindue på 400k og koster 0,75 USD pr. 1M inputtoken og 4,50 USD pr. 1M outputtoken.

I Codex er GPT‑5.4 mini tilgængelig på tværs af Codex-appen, CLI, IDE-udvidelsen og web. Den bruger kun 30 % af GPT‑5.4‑ kvoten, så udviklere hurtigt kan håndtere enklere kodningsopgaver i Codex til omkring en tredjedel af prisen. Codex kan også delegere til GPT‑5.4 mini-underagenter, så mindre ræsonneringstungt arbejde kører på den billigere model.

I ChatGPT er GPT‑5.4 mini tilgængelig for Free- og Go-brugere via funktionen “Thinking” i + menuen. For alle andre brugere er GPT‑5.4 mini tilgængelig som en reserve ved hastighedsbegrænsning for GPT‑5.4 Thinking.

GPT‑5.4 nano er kun tilgængelig i API'et og koster 0,20 USD pr. 1M input-token og 1,25 USD pr. 1M output-token.

Du kan finde flere oplysninger om modellernes sikkerhedsforanstaltninger i Deployment Safety Hub⁠(åbner i et nyt vindue) under tillægget til systemkortet.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 Den højeste beregningsindsats, der er tilgængelig for GPT‑5 mini, er 'high'.}

^{2 Samlet redigeringsafstand. OmniDocBench blev kørt med reasoning_effort sat til 'none' for at afspejle ydeevne med lave omkostninger og lav latenstid.}

2026

Skrevet af

OpenAI

Læs videre

Se alle

Lancering af Health i ChatGPT

Produkt23. jul. 2026

How news organizations are using AI > Card Image

Sådan bruger nyhedsmedier AI til vigtige missioner

Virksomhed22. jul. 2026

Vi præsenterer OpenAI Presence

Produkt22. jul. 2026