Neste trinn i utviklingen av Agents SDK
Den oppdaterte Agents SDK hjelper utviklere med å bygge agenter som kan inspisere filer, kjøre kommandoer, redigere kode og jobbe med langsiktige oppgaver i kontrollerte sandkassemiljøer.
Vi introduserer nye egenskaper i Agents SDK som gir utviklere standardisert infrastruktur som er enkel å komme i gang med og er bygget riktig for OpenAI-modeller: en modell-nativ ramme som lar agenter jobbe på tvers av filer og verktøy på en datamaskin, samt innebygd sandkassekjøring for å utføre dette arbeidet på en trygg måte.
Utviklere kan for eksempel gi en agent et kontrollert arbeidsområde, uttrykkelige instruksjoner og verktøyene den trenger for å undersøke bevismateriale:
Utviklere trenger mer enn de beste modellene for å bygge nyttige agenter–de trenger systemer som støtter hvordan agenter inspiserer filer, kjører kommandoer, skriver kode og fortsetter å arbeide gjennom mange trinn.
Systemene som finnes i dag, innebærer avveininger når team går fra prototyper til produksjon. Modellagnostiske rammeverk er fleksible, men utnytter ikke fullt ut de banebrytende modellenes funksjoner; SDK-er fra modellleverandører kan ligge nærmere modellen, men mangler ofte tilstrekkelig innsyn i integrasjonen; og administrerte agent-API-er kan forenkle distribusjon, men begrenser hvor agenter kjører og hvordan de får tilgang til sensitive data.
Her er hva noen av kundene som testet den nye SDK-en sammen med oss, hadde å si:
«GPT-5.4 setter en ny standard for dokumenttungt juridisk arbeid. I vår BigLaw Bench-evaluering fikk den 91 %. Sammenlignet med andre modeller er GPT-5.4 for øyeblikket bedre til å strukturere kompleks transaksjonsanalyse, opprettholde nøyaktighet på tvers av omfattende kontrakter og levere det høye detaljnivået juridiske fagfolk krever.»
Med dagens lansering blir Agents SDK-rammeverket mer kapabelt for agenter som arbeider med dokumenter, filer og systemer. Den legger nå til konfigurerbart minne, sandkassebevisst orkestrering, Codex-lignende filsystemverktøy og standardiserte integrasjoner med primitiver som blir stadig vanligere i banebrytende agentsystemer.
Disse primitivene inkluderer bruk av verktøy via MCP(åpnes i et nytt vindu), gradvis avdekking via ferdigheter(åpnes i et nytt vindu), egendefinerte instruksjoner via AGENTS.md(åpnes i et nytt vindu), kodekjøring ved hjelp av skall-verktøyet(åpnes i et nytt vindu), filredigering ved hjelp av apply patch-verktøyet(åpnes i et nytt vindu) og mer. Rammeverket vil fortsette å innlemme nye mønstre og primitiver over tid, slik at utviklere kan bruke mindre tid på oppdateringer av kjerneinfrastrukturen og mer tid på logikken som gjør agentene nyttige.
Rammeverket hjelper også utviklere med å få ut mer av kapasiteten til en banebrytende modell ved å tilpasse kjøringen til måten disse modellene yter best på. Det holder agenter nærmere modellens naturlige driftsmønster, noe som forbedrer pålitelighet og ytelse i komplekse oppgaver–særlig når arbeidet er langvarig eller koordinert på tvers av et mangfoldig sett med verktøy og systemer.
I tillegg innser vi at hvert produkt er unikt og sjelden passer helt inn i en fast mal. Vi utviklet Agents SDK for å støtte dette mangfoldet. Utviklere får et rammeverk som er klart til bruk, men samtidig fleksibelt–slik at det er enkelt å tilpasse det til sin egen stack–inkludert verktøybruk, minne og sandkassemiljø.
Den oppdaterte Agents SDK støtter sandkassekjøring innebygd, slik at agenter kan kjøre i kontrollerte datamiljøer med filene, verktøyene og avhengighetene de trenger for en oppgave.
Mange nyttige agenter trenger et arbeidsområde der de kan lese og skrive filer, installere avhengigheter, kjøre kode og bruke verktøy på en trygg måte. Innebygd støtte for sandkasse-miljøer gir utviklere dette kjøringslaget ferdig på plass, i stedet for å tvinge dem til å sette det sammen selv.
Utviklere kan ta med sin egen sandkasse eller bruke innebygd støtte for Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop og Vercel.
For å gjøre disse miljøene portable på tvers av leverandører introduserer SDK-en også en manifest-abstraksjon for å beskrive agentens arbeidsområde. Utviklere kan montere lokale filer, definere utdatakataloger og hente inn data fra lagringsleverandører, inkludert AWS S3, Google Cloud Storage, Azure Blob Storage og Cloudflare R2.
Dette gir utviklere en enhetlig måte å forme agentens miljø på, fra lokal prototype til produksjonsdistribusjon. Det gir også modellen et forutsigbart arbeidsområde: hvor den finner inndata, hvor den skal skrive utdata, og hvordan arbeidet holdes organisert gjennom en langvarig oppgave.

Agentsystemer bør utformes med antakelsen om promptinjeksjon og forsøk på eksfiltrering. Skille rammeverk og datakraft bidrar til å holde påloggingsinformasjon ute av miljøer der modellgenerert kode kjører.
Dette muliggjør også varig utførelse. Når agentens tilstand er eksternalisert, betyr det å miste en sandkasse-container ikke at kjøringen går tapt. Med innebygd øyeblikksbilde og rehydrering kan Agents SDK gjenopprette agentens tilstand i en ny container, og fortsette fra det siste kontrollpunktet hvis det opprinnelige miljøet svikter eller utløper.
Til slutt gjør det agenter mer skalerbare. Agentkjøringer kan bruke én sandkasse eller mange, bare bruke sandkasser ved behov, rute underagenter til isolerte miljøer og parallellisere arbeid på tvers av containere for raskere kjøring.
Disse nye funksjonene i Agents SDK er allment tilgjengelige for dere via API, og bruker standard API-priser, basert på tokens og bruk av verktøy.
Etter hvert som vi fortsetter å utvikle Agents SDK, vil vi også fortsette å utvide hva utviklere kan bygge med det, slik at det blir enklere å ta i bruk mer kapable agenter i produksjon med mindre tilpasset infrastruktur, samtidig som vi bevarer fleksibiliteten og kontrollen du trenger for å tilpasse agenter til ditt eget miljø.
De nye rammeverk- og sandkasse-funksjonene lanseres først i Python, med støtte for TypeScript planlagt for en fremtidig utgivelse. Vi jobber også med å bringe flere agentfunksjoner, inkludert kodemodus og underagenter, til både Python og TypeScript.
I tillegg ønsker vi å bidra til å samle det bredere agentøkosystemet over tid, med støtte for flere sandkasse-leverandører, flere integrasjoner og flere måter for utviklere for å koble SDK-en til verktøyene og systemene de allerede bruker.


