17 maart 2026

Maak kennis met GPT‑5.4 mini en nano

Snelle en efficiënte modellen geoptimaliseerd voor programmeren en subagents

Bezig met laden...

Vandaag lanceren we GPT‑5.4 mini en nano, onze meest capabele kleine modellen tot nu toe. Ze brengen veel van de sterke punten van GPT‑5.4 naar snellere, efficiëntere modellen die zijn ontworpen voor grootschalige workloads.

GPT‑5.4 mini is aanzienlijk beter dan GPT‑5 mini op het gebied van programmeren, redeneren, multimodaal begrip en toolgebruik, terwijl het meer dan 2x sneller draait. Het benadert ook de prestaties van het grotere GPT‑5.4 model op verschillende evaluaties, waaronder SWE-Bench Pro en OSWorld-Verified.

GPT‑5.4 nano is de kleinste, goedkoopste versie van GPT‑5.4 voor taken waarbij snelheid en kosten het belangrijkst zijn. Het is ook een aanzienlijke upgrade ten opzichte van GPT‑5 nano. We raden het aan voor classificatie, data-extractie, ranking en programmerende subagenten die eenvoudigere ondersteunende taken afhandelen.

Deze modellen zijn gebouwd voor het type workloads waarbij latentie direct de productervaring bepaalt: programmeerassistenten die responsief moeten aanvoelen, subagents die snel ondersteunende taken afronden, computergebruikende systemen die schermafbeeldingen vastleggen en interpreteren, en multimodale applicaties die in real-time over afbeeldingen kunnen redeneren. In deze instellingen is het beste model vaak niet het grootste model, maar het model dat snel kan reageren, tools betrouwbaar kan gebruiken en toch goed presteert bij complexe professionele taken.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 De hoogste redeneerinspanning die beschikbaar is voor GPT‑5 mini is 'high'.}

Dit is wat onze klanten ervan vinden nadat ze GPT‑5.4 mini en nano in hun workflows hebben getest:

"GPT-5.4 mini levert sterke end-to-end prestaties voor een model in deze klasse. In onze evaluaties evenaarde of overtrof het concurrerende modellen op verschillende outputtaken en het herinneren van citaten, tegen veel lagere kosten. Het behaalde ook hogere end-to-end slagingspercentages en sterkere bronvermelding dan het grotere GPT-5.4 model."

— Aabhas Sharma, CTO bij Hebbia

Programmeren

GPT‑5.4 mini en nano zijn vooral effectief in programmeerworkflows die baat hebben bij snelle iteratie. De modellen kunnen gerichte bewerkingen aan, codebase-navigatie, front-end generatie en debugloops met een lage latentie, waardoor ze bijzonder geschikt zijn voor programmeertaken die sneller en tegen lagere kosten moeten worden uitgevoerd.

In benchmarks presteert GPT‑5.4 mini consequent beter dan GPT‑5‑mini met vergelijkbare latentie. Het benadert de slagingspercentages van GPT‑5.4, terwijl het veel sneller is. Daarmee biedt het een van de sterkste combinaties van prestaties en latentie voor programmeerworkflows.

We schatten de latentie door te kijken naar het productiegedrag van onze modellen en dit offline te simuleren. De latentieschatting houdt rekening met de duur van toolaanroepen (code-uitvoeringstijd), gesamplede tokens en invoertokens. De latentie in de praktijk kan aanzienlijk variëren en is afhankelijk van veel factoren die niet in onze simulatie zijn vastgelegd. Evenzo worden de kosten geraamd op basis van de API-prijzen van deze modellen op het moment van schrijven. Kosten kunnen in de toekomst veranderen. De redeneringsinspanning werd opgeschaald van 'low' naar 'xhigh'.

Subagents

GPT‑5.4 mini is ook heel geschikt voor systemen die modellen van verschillende groottes combineren. In Codex kan een groter model zoals GPT‑5.4 bijvoorbeeld de planning, coördinatie en het eindoordeel afhandelen, terwijl het delegeert aan GPT‑5.4 mini-subagents die parallel kleinere subtaken afhandelen, zoals het doorzoeken van een codebase, het beoordelen van een groot bestand of het verwerken van ondersteunende documenten. Lees in de documentatie⁠(opent in een nieuw venster) hoe subagents werken in Codex.

Dit patroon wordt nuttiger naarmate kleinere modellen sneller en capabeler worden. In plaats van één model voor alles te gebruiken, kunnen ontwikkelaars systemen samenstellen waarbij grotere modellen beslissen wat ze moeten doen en kleinere modellen snel op schaal uitvoeren. GPT‑5.4 mini is ons sterkste mini-model tot nu toe voor zulke workflows.

Computergebruik

GPT‑5.4 mini levert ook sterke prestaties op multimodale taken, met name die computergebruik vereisen. Het model kan snel screenshots van complexe gebruikersinterfaces interpreteren om computertaken snel uit te voeren. Op OSWorld-Verified benadert GPT‑5.4 mini GPT‑5.4, terwijl het GPT‑5 mini aanzienlijk overtreft.

Beschikbaarheid & prijzen

GPT‑5.4 mini is vanaf vandaag beschikbaar in de API, Codex en ChatGPT.

In de API ondersteunt GPT‑5.4 mini tekst- en afbeeldinginvoer, toolgebruik, functieaanroepen, zoeken op internet, zoeken in bestanden, computergebruik en skills. Het heeft een contextvenster van 400k en kost $ 0,75 per miljoen invoertokens en $ 4,50 per miljoen uitvoertokens.

In Codex is GPT‑5.4 mini beschikbaar in de Codex-app, CLI, IDE-extensie en web. Het gebruikt slechts 30% van het GPT‑5.4 quotum, waardoor ontwikkelaars eenvoudigere programmeertaken snel kunnen afhandelen in Codex voor ongeveer een derde van de kosten. Codex kan ook delegeren aan GPT‑5.4 mini-subagents, zodat minder redeneringsintensief werk op het goedkopere model kan draaien.

In ChatGPT is GPT‑5.4 mini beschikbaar voor Free- en Go-gebruikers via de functie 'Thinking' in het + menu. Voor alle andere gebruikers is GPT‑5.4 mini beschikbaar als fallback wanneer de volumelimiet is bereikt voor GPT‑5.4 Thinking.

GPT‑5.4 nano is alleen beschikbaar via de API en kost $ 0,20 per miljoen invoertokens en $ 1,25 per miljoen uitvoertokens.

Bekijk voor meer informatie over de veiligheidsmaatregelen van deze modellen, het addendum op de systeemkaart op onze Deployment Safety Hub⁠(opent in een nieuw venster).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 De hoogste redeneerinspanning die beschikbaar is voor GPT‑5 mini is 'high'.}

^{2 Totale bewerkingsafstand. OmniDocBench werd uitgevoerd met reasoning_effort ingesteld op 'none' om prestaties met lage kosten en lage latentie te weerspiegelen.}

2026

Auteur

OpenAI

Andere interessante artikelen

Alles weergeven

Launching Health in ChatGPT

Product23 jul 2026

How news organizations are using AI > Card Image

Hoe nieuwsorganisaties AI inzetten voor hun vitale missies

Over OpenAI22 jul 2026

Introductie van OpenAI Presence

Product22 jul 2026