Overslaan naar hoofdinhoud
OpenAI

13 november 2025

Product

Introductie van GPT‑5.1 voor ontwikkelaars

Bezig met laden...

Vandaag lanceren we GPT‑5.1 op het API-platform, het volgende model in de GPT‑5‑serie dat intelligentie en snelheid in balans brengt voor een breed scala aan agentic- en programmeertaken. GPT‑5.1 past zich dynamisch aan hoeveel tijd het besteedt aan nadenken op basis van de complexiteit van de taak, waardoor het model aanzienlijk sneller en efficiënter met tokens is bij eenvoudigere alledaagse taken. Het model heeft ook een 'zonder redenering'-modus om sneller te reageren op taken die geen diepgaande analyse vereisen, terwijl het de grensverleggende intelligentie van GPT‑5.1 behoudt.

Om GPT‑5.1 nog efficiënter te maken, introduceren we uitgebreide prompt caching met een cache-retentie tot 24 uur, zodat je sneller antwoord krijgt op vervolgvragen tegen lagere kosten. Onze klanten met prioriteitsverwerking(opent in een nieuw venster) zullen ook merkbaar snellere prestaties ervaren met GPT‑5.1 ten opzichte van GPT‑5.

Op het gebied van programmeren hebben we nauw samengewerkt met startups zoals Cursor, Cognition, Augment Code, Factory en Warp om GPT‑5.1's programmeerpersoonlijkheid, stuurbaarheid en codekwaliteit te verbeteren. Over het algemeen voelt GPT‑5.1 intuïtiever aan voor programmeertalen en is het communicatiever met updates voor de gebruiker bij het voltooien van taken.

Tot slot introduceren we met GPT‑5.1 twee nieuwe tools: een apply_patch-tool om code betrouwbaarder aan te passen en een shell-tool om het model shell-commando's te laten uitvoeren.

GPT‑5.1 is de volgende stap in de GPT‑5‑serie, en we zijn van plan om door te gaan met investeren in intelligentere en capabelere modellen om ontwikkelaars te helpen met het bouwen van betrouwbare agentic workflows.

Efficiënt redeneren tussen verschillende taken

Adaptief redeneren

Om GPT‑5.1 sneller te maken, hebben we de manier waarop we het hebben getraind om na te denken herzien. Bij eenvoudige taken gebruikt GPT‑5.1 minder tokens voor denkwerk, wat zorgt voor snellere productervaringen en lagere tokenkosten. Bij moeilijke taken die extra denkwerk vereisen, blijft GPT‑5.1 volhardend, onderzoekt het opties en controleert het zijn werk om de betrouwbaarheid te maximaliseren.

Volgens Balyasny Asset Management(opent in een nieuw venster) presteerde GPT‑5.1 "beter dan zowel GPT‑4.1 als GPT‑5 in onze volledige dynamische evaluatiesuite, terwijl het 2 tot 3 keer sneller was dan GPT‑5." Ze zeiden ook dat GPT‑5.1 bij tool-intensieve redeneringstaken "consequent ongeveer de helft minder tokens gebruikte dan toonaangevende concurrenten met vergelijkbare of betere kwaliteit". Ook heeft AI-verzekerings-BPO Pace(opent in een nieuw venster) het model getest en verklaard dat hun agents "50% sneller werken op GPT‑5.1, terwijl ze de nauwkeurigheid van GPT‑5 en andere toonaangevende modellen in onze evaluaties overtreffen."

GPT‑5.1 varieert zijn denktijd dynamischer dan GPT‑5. Bij een representatieve verdeling van ChatGPT‑taken is GPT‑5.1 veel sneller bij de eenvoudigere taken, zelfs bij hoge redeneerinspanning.

Bijvoorbeeld voor de prompt "toon een npm-commando om wereldwijd geïnstalleerde packages weer te geven", antwoordt GPT‑5.1 in 2 seconden in plaats van 10 seconden.

GPT-5 (Medium) verwerkt ~250 tokens (~10 seconden)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) verwerkt ~50 tokens (~2 seconden)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

Nieuwe modus 'zonder redeneren'

Ontwikkelaars kunnen GPT‑5.1 nu zonder redenering gebruiken door 'reasoning_effort' op 'none' te zetten. Hierdoor gedraagt het model zich als een niet-redenerend model voor latentiegevoelige toepassingen, met de hoge intelligentie van GPT‑5.1 en de extra bonus van efficiënte tool-calling. Vergeleken met GPT‑5 met 'minimale redenering', is GPT‑5.1 zonder redenering beter in het parallel aanroepen van tools (wat op zichzelf de snelheid van het voltooien van taken verhoogt), het uitvoeren van programmeertaken, het opvolgen van instructies en het gebruik van zoektools. Bovendien ondersteunt het web search(opent in een nieuw venster) in ons API-platform. Sierra(opent in een nieuw venster) deelde dat GPT‑5.1 in de modus 'zonder redeneren' een "20% verbetering in de prestaties van tool-calls met lage latentie toonde vergeleken met GPT‑5 met 'minimaal redeneren' in hun praktijktests.

Met de introductie van 'none' als waarde in reasoning_effort hebben ontwikkelaars nu nog meer flexibiliteit en controle over de balans tussen snelheid, kosten en intelligentie voor hun toepassing. GPT‑5.1 staat standaard op 'none', wat ideaal is voor latentiegevoelige workloads. We raden ontwikkelaars aan om 'laag' of 'gemiddeld' te kiezen voor taken met een hogere complexiteit en 'hoog' wanneer intelligentie en betrouwbaarheid belangrijker zijn dan snelheid.

Uitgebreide prompt-caching

Uitgebreide caching verbetert de efficiëntie van het redeneren door prompts tot 24 uur actief te houden in de cache, in plaats van de paar minuten die momenteel worden ondersteund. Met een langer retentievenster kunnen meer vervolgverzoeken gebruikmaken van de gecachte context, wat resulteert in lagere latentie, lagere kosten en soepelere prestaties voor langlopende interacties zoals multi-turn chat, programmeersessies of workflows waarin kennis moet worden opgehaald.

De prijzen voor de prompt-cache blijven ongewijzigd, waarbij invoertokens in de cache 90% goedkoper zijn dan niet-gecacheerde tokens en er geen extra kosten zijn voor cache-schrijvingen of opslag. Om uitgebreide caching te gebruiken met GPT‑5.1, voeg je de parameter "prompt_cache_retention='24h'" toe aan de Responses or Chat Completions-API. Bekijk de prompt caching-documentatie(opent in een nieuw venster) voor meer informatie.

Programmeren

GPT‑5.1 bouwt voort op de programmeermogelijkheden van GPT‑5 met een beter stuurbare programmeerpersoonlijkheid, minder overdenken, verbeterde codekwaliteit, betere gebruikersgerichte updateberichten (preambules) tijdens reeksen van tool-aanroepen en functionelere frontend-ontwerpen, vooral bij lagere redeneerinspanning.

Bij eenvoudigere taken zoals snelle codebewerkingen, maakt de hogere snelheid van GPT5.1 het makkelijker om terug en weer te itereren. GPT‑5.1’s hogere snelheden bij eenvoudige taken verminderen de prestaties bij moeilijke taken niet. Op de SWE-bench 'Verified' werkt GPT‑5.1 zelfs langer dan GPT‑5 en bereikt een score van 76,3%.

In SWE-bench Verified krijgt een model een code repository en een probleemomschrijving en moet een patch genereren om het probleem op te lossen. Labels geven de redeneringsinspanning aan. De nauwkeurigheid wordt gemiddeld over alle 500 problemen. Alle modellen gebruikten een harnas met een op JSON gebaseerde apply_patch-tool.

We hebben vroege feedback op GPT‑5.1 ontvangen van een aantal programmeerbedrijven. Hier zijn hun indrukken:

  • Augment Code(opent in een nieuw venster) noemde GPT‑5.1 "doelbewuster, met minder verspilde handelingen, efficiëntere redenering en betere taakgerichtheid" en ze zien "nauwkeurigere wijzigingen, soepelere pull requests en snellere iteratie in projecten met meerdere bestanden."
  • Cline(opent in een nieuw venster) deelde mee dat in hun evaluaties, "GPT‑5.1 SOTA (state of the art) behaalde op onze diff editing benchmark met een verbetering van 7%, wat uitzonderlijke betrouwbaarheid aantoont voor complexe programmeertaken."
  • CodeRabbit(opent in een nieuw venster) noemde GPT‑5.1 zijn "topmodel van keuze voor PR-beoordelingen".
  • Volgens Cognition(opent in een nieuw venster) is GPT‑5.1 "aanzienlijk beter in staat om te begrijpen wat je vraagt en met je samen te werken om het gedaan te krijgen."
  • Factory(opent in een nieuw venster) zei: "GPT‑5.1 levert merkbaar snellere reacties en past de redeneerdiepte aan de taak aan, waardoor overdenken wordt verminderd en de algehele ontwikkelaarservaring wordt verbeterd."
  • Warp(opent in een nieuw venster) maakt GPT‑5.1 de standaard voor nieuwe gebruikers en zegt dat het voortbouwt op de indrukwekkende intelligentiewinsten die de GPT‑5‑serie introduceerde, terwijl het een veel responsiever model is.
"GPT 5.1 is niet zomaar een LLM; het is echt agentic, het meest natuurlijk autonome model dat ik ooit heb getest. Het schrijft zoals jij, programmeert zoals jij, volgt moeiteloos complexe instructies en blinkt uit in front-end taken, en werkt naadloos in je bestaande codebase. Je kunt daadwerkelijk het volledige potentieel ervan benutten in de Responses API en we zijn enthousiast om het in onze IDE aan te bieden."
—Denis Shiryaev, Hoofd van het AI DevTools Ecosystem bij JetBrains

Nieuwe tools in GPT‑5.1

We introduceren twee nieuwe tools met GPT‑5.1 om ontwikkelaars te helpen het meeste uit het model in de Responses API te halen: een freeform apply_patch- tool om codebewerkingen nog betrouwbaarder te maken zonder dat JSON-escaping nodig is, en een shell-tool waarmee het model commando's kan schrijven die op je lokale machine kunnen worden uitgevoerd.

apply_patch-tool

Met de freeform apply_patch-tool kan GPT‑5.1 bestanden in een codebase maken, bijwerken en verwijderen met gestructureerde diffs. In plaats van alleen maar bewerkingen voor te stellen, genereert het model patchbewerkingen die een toepassing toepast en waarover het terugrapporteert, waardoor iteratieve, meerstaps-workflows voor het bewerken van code mogelijk worden.

Om de tool apply_patch in de Responses API te gebruiken, neem je deze op in de tools-array met "tools": [{"type": "apply_patch"}] en neem je ofwel bestanden op in je invoer of geef je het model tools voor interactie met je bestandssysteem. Het model genereert apply_patch_call-items om bestanden te maken, bij te werken of te verwijderen, die diffs bevatten die je op je bestandssysteem toepast. Bekijk onze documentatie voor ontwikkelaars voor meer informatie over de integratie met de apply_patch-tool.(opent in een nieuw venster)

Shell-tool

Met de shell-tool kan het model communiceren met een lokale computer via een gecontroleerde command-line interface. Het model stelt shellcommando's voor en de integratie van een ontwikkelaar voert ze uit en retourneert de uitvoer. Dit maakt een eenvoudige plan-uitvoer lus waarmee modellen het systeem kunnen inspecteren, hulpprogramma's kunnen uitvoeren en gegevens kunnen verzamelen totdat ze de taak kunnen voltooien.

Om de shell-tool in de Responses API te gebruiken, kunnen ontwikkelaars deze opnemen in de tools-array met "tools": [{"type": "shell"}]. De API genereert dan "shell_call"-items die de shellcommando's bevatten om uit te voeren. Ontwikkelaars voeren de commando's uit in de lokale omgeving en sturen de uitvoeringsresultaten terug in het "shell_call_output"-item in de volgende API-request. Meer informatie vind je in onze documentatie voor ontwikkelaars(opent in een nieuw venster).

Prijzen en beschikbaarheid

GPT‑5.1 en gpt-5.1-chat-latest zijn beschikbaar voor ontwikkelaars op alle betaalde niveaus in de API. Prijzen en limieten(opent in een nieuw venster) zijn hetzelfde als bij GPT‑5. We lanceren ook gpt-5.1-codex. en gpt-5.1-codex-mini in de API. Alhoewel GPT‑5.1 uitblinkt in de meeste programmeertaken, zijn gpt-5.1-codex modellen geoptimaliseerd voor langlopende, agentic programmeertaken in Codex of Codex-achtige omgevingen.

Ontwikkelaars kunnen beginnen met bouwen met onze GPT‑5.1 ontwikkelaarsdocumentatie(opent in een nieuw venster) en modelpromptinggids(opent in een nieuw venster). We zijn momenteel niet van plan om GPT‑5 in de API te verwijderen en zullen ontwikkelaars van tevoren op de hoogte stellen als en wanneer we besluiten dit te doen.

Wat volgt er?

We zetten ons in om iteratief de meest capabele en betrouwbare modellen uit te rollen voor agentic- en programmeertaken. Ons doel is dat onze modellen efficiënt nadenken, snel itereren en complexe taken afhandelen terwijl ontwikkelaars in hun flow blijven. Met adaptieve redenering, betere programmeerprestaties, duidelijkere updates voor eindgebruikers en nieuwe tools zoals apply_patch en shell zorgt GPT‑5.1 voor een veel soepelere workflow. En we gaan flink door met investeren: je kunt de komende weken en maanden meer capabele agentic- en programmeermodellen verwachten.

Bijlage: modelbeoordelingen

Evaluatie

GPT‑5.1 (high)

GPT‑5 (high)

SWE-bench Verified
(alle 500 problemen)

76,3%

72,8%

GPQA Diamond
(geen tools)

88,1%

85,7%

AIME 2025
(geen tools)

94,0%

94,6%

FrontierMath
(met Python-tool)

26,7%

26,3%

MMMU

85,4%

84,2%

Tau2-bench Luchtvaart

67,0%

62,6%

Tau2-bench Telecom*

95,6%

96,7%

Tau2-bench Detailhandel

77,9%

81,1%

BrowseComp Lange Context 128k

90,0%

90,0%

* Voor Tau2-bench Telecom gaven we GPT‑5.1 een korte, generiek nuttige prompt om de prestaties te verbeteren.

Auteur

OpenAI