De volgende evolutie van de Agents SDK
De vernieuwde Agents SDK helpt ontwikkelaars agents te bouwen die bestanden kunnen analyseren, opdrachten uitvoeren, code bewerken en langdurige taken aankunnen binnen sandbox-omgevingen.
We introduceren nieuwe mogelijkheden in de Agents SDK die ontwikkelaars een gestandaardiseerde infrastructuur geven waarmee ze snel aan de slag kunnen, en die goed aansluit op OpenAI-modellen: een model-native harness waarmee agents met bestanden en tools op een computer kunnen werken, plus native sandbox execution om dat werk veilig uit te voeren.
Ontwikkelaars kunnen een agent bijvoorbeeld een gecontroleerde werkruimte, expliciete instructies en de tools geven die deze nodig heeft om bewijsmateriaal te onderzoeken:
Ontwikkelaars hebben meer nodig dan alleen de beste modellen om bruikbare agents te bouwen: ze hebben systemen nodig die ondersteunen hoe agents bestanden inspecteren, opdrachten uitvoeren, code schrijven en over veel stappen heen blijven werken.
De systemen die vandaag de dag bestaan, brengen afwegingen met zich mee wanneer teams van prototypes naar productie gaan. Modelagnostische frameworks zijn flexibel, maar benutten de mogelijkheden van grensverleggende modellen niet volledig; SDK’s van modelaanbieders kunnen dichter bij het model staan, maar bieden vaak niet genoeg inzicht in de harness; en beheerde agent-API’s kunnen implementatie vereenvoudigen, maar beperken waar agents worden uitgevoerd en hoe ze toegang krijgen tot gevoelige gegevens.
Dit is wat enkele van de klanten die samen met ons de nieuwe SDK hebben getest, te zeggen hadden:
“GPT-5.4 legt de lat hoger voor documentintensief juridisch werk. Op onze BigLaw Bench-evaluatie behaalde het 91%. Vergeleken met andere modellen is GPT-5.4 momenteel beter in het structureren van complexe transactionele analyses, het behouden van nauwkeurigheid in lange contracten en het leveren van het hoge detailniveau dat juridische professionals nodig hebben.”
Met de release van vandaag wordt de Agents SDK harness krachtiger voor agents die werken met documenten, bestanden en systemen. Nieuw zijn onder meer configureerbaar geheugen, sandbox-aware orchestration, filesystem-tools vergelijkbaar met Codex en gestandaardiseerde integraties met primitives die steeds vaker voorkomen in geavanceerde agentsystemen.
Deze primitives omvatten het gebruik van tools via MCP(opent in een nieuw venster), progressive disclosure via skills(opent in een nieuw venster) en aangepaste instructies via AGENTS.md(opent in een nieuw venster), code-uitvoering met de shell(opent in een nieuw venster)-tool, bestandsbewerkingen met de apply patch(opent in een nieuw venster)-tool, en meer. Het harness blijft in de loop van de tijd nieuwe agentic patronen en primitives toevoegen, zodat ontwikkelaars minder tijd kwijt zijn aan updates van de kerninfrastructuur en zich meer kunnen richten op de domeinspecifieke logica die hun agents waardevol maakt.
Het harnas helpt ontwikkelaars ook om meer van de mogelijkheden van een frontier-model te benutten door de uitvoering af te stemmen op de manier waarop die modellen het best presteren. Dat houdt agents dichter bij de natuurlijke werkwijze van het model, wat de betrouwbaarheid en prestaties bij complexe taken verbetert, vooral wanneer werk lang loopt of gecoördineerd wordt over een diverse set tools en systemen.
Daarnaast beseffen we dat elk product uniek is en zelden netjes in een vast stramien past. We hebben de Agents SDK ontworpen om deze diversiteit te ondersteunen. Ontwikkelaars krijgen een harness dat direct inzetbaar en toch flexibel is, waardoor ze het eenvoudig kunnen aanpassen aan hun eigen stack, waaronder toolgebruik, geheugen en sandboxomgevingen.
De bijgewerkte Agents SDK ondersteunt sandboxuitvoering standaard, zodat agents kunnen draaien in gecontroleerde computeromgevingen met de bestanden, tools en afhankelijkheden die ze nodig hebben voor een taak.
Veel nuttige agents hebben een werkruimte nodig waarin ze bestanden kunnen lezen en schrijven, dependency's kunnen installeren, code kunnen uitvoeren en tools veilig kunnen gebruiken. Ingebouwde sandboxondersteuning geeft ontwikkelaars die uitvoeringslaag standaard, in plaats van hen te dwingen die zelf samen te stellen.
Ontwikkelaars kunnen hun eigen sandbox benutten of ingebouwde ondersteuning gebruiken voor Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop en Vercel.
Om die omgevingen overdraagbaar te maken tussen providers, introduceert de SDK ook een manifest voor het beschrijven van de werkruimte van de agent. Ontwikkelaars kunnen lokale bestanden koppelen, uitvoermappen definiëren en gegevens ophalen uit opslagproviders, waaronder AWS S3, Google Cloud Storage, Azure Blob Storage en Cloudflare R2.
Dit biedt ontwikkelaars een consistente manier om de omgeving van de agent vorm te geven, van lokaal prototype tot productie-implementatie. Het biedt het model ook een voorspelbare werkruimte: waar het invoer kan vinden, waar het uitvoer kan schrijven en hoe het werk georganiseerd kan blijven tijdens een langdurige taak.

Agentsystemen moeten worden ontworpen in de veronderstelling dat pogingen tot prompt-injectie en exfiltratie zullen plaatsvinden. Door het harness en compute te scheiden, blijven inloggegevens buiten omgevingen waarin door het model gegenereerde code wordt uitgevoerd.
Het maakt ook duurzame uitvoering mogelijk. Wanneer de toestand van de agent geëxternaliseerd is, betekent het verliezen van een sandbox-container niet dat je de uitvoering verliest. Met ingebouwde snapshotting en rehydration kan de Agents SDK de status van de agent herstellen in een nieuwe container en doorgaan vanaf het laatste checkpoint als de oorspronkelijke omgeving uitvalt of verloopt.
Tot slot maakt het agents beter schaalbaar. Agent-runs kunnen één of meerdere sandboxes gebruiken, sandboxes alleen activeren wanneer nodig, subagents routeren naar geïsoleerde omgevingen en workloads parallel over containers verdelen voor snellere uitvoering.
Deze nieuwe mogelijkheden van de Agents SDK zijn algemeen beschikbaar voor alle klanten via de API en maken gebruik van de standaard API-prijzen, op basis van tokens en toolgebruik.
Terwijl we de Agents SDK verder ontwikkelen, breiden we continu uit wat ontwikkelaars ermee kunnen bouwen. Zo wordt het eenvoudiger om krachtigere agents in productie te brengen met minder maatwerk in de infrastructuur, zonder in te leveren op de flexibiliteit en controle die nodig zijn om agents in bestaande omgevingen te integreren.
De nieuwe mogelijkheden rond harness en sandbox zijn eerst beschikbaar in Python; ondersteuning voor TypeScript volgt in een latere release. We werken er ook aan om extra agentmogelijkheden, zoals code mode en subagents, beschikbaar te maken voor zowel Python als TypeScript.
Daarnaast willen we in de loop van de tijd helpen om het bredere agent-ecosysteem samen te brengen, met ondersteuning voor meer sandboxproviders, meer integraties en meer manieren voor ontwikkelaars om de SDK te integreren in de tools en systemen die ze al gebruiken.


