Nästa utvecklingsfas av Agents SDK
Det uppdaterade Agents SDK hjälper utvecklare att skapa agenter som kan granska filer, köra kommandon, redigera kod och utföra långsiktiga uppgifter inom kontrollerade sandlådemiljöer.
Vi introducerar nya funktioner i Agents SDK som ger utvecklare en standardiserad infrastruktur som är enkel att komma igång med och som är korrekt utformad för OpenAI-modeller: ett modellintegrerat ramverk som gör det möjligt för agenter att arbeta med olika filer och verktyg på en dator, samt inbyggd sandbox-körning för att utföra detta arbete på ett säkert sätt.
Utvecklare kan till exempel förse en agent med en kontrollerad arbetsyta, tydliga instruktioner och de verktyg som behövs för att granska bevismaterial:
Utvecklare behöver mer än bara de bästa modellerna för att bygga användbara agenter – de behöver system som stöder hur agenterna granskar filer, kör kommandon, skriver kod och fortsätter att fungera genom många olika steg.
De system som finns idag innebär kompromisser när team går från prototyper till produktion. Modelloberoende ramverk är flexibla men utnyttjar inte fullt ut de banbrytande modellernas kapacitet. SDK:er från modelleverantörer kan ligga närmare modellen men saknar ofta tillräcklig insyn i ramverket, och API:er för hanterade agenter kan förenkla distributionen men begränsar var agenterna körs och hur de får åtkomst till känslig data.
Här är vad några av de kunder som testade det nya SDK:t tillsammans med oss hade att säga:
“GPT-5.4 sätter en ny standard för dokumenttungt juridiskt arbete. På vår BigLaw Bench eval fick det 91 %. Jämfört med andra modeller är GPT-5.4 för närvarande bättre på att strukturera komplex transaktionsanalys, bibehålla noggrannhet i långa avtal och leverera den höga detaljnivå som jurister kräver.”
Med dagens lansering utökas Agents SDK-ramverket för agenter som arbetar med dokument, filer och system. Nu tillkommer konfigurerbart minne, sandlådeanpassad orkestrering, filsystemverktyg av Codex-typ samt standardiserade integrationer med byggblock som blir allt vanligare i banbrytande agentsystem.
Dessa byggblock omfattar verktygsanvändning via MCP(öppnas i ett nytt fönster), stegvis informationsvisning via skills(öppnas i ett nytt fönster) samt anpassade instruktioner via AGENTS.md(öppnas i ett nytt fönster), kodkörning med shell(öppnas i ett nytt fönster)-verktyget, redigering av filer med apply patch(öppnas i ett nytt fönster)-verktyget och mycket mer. Ramverket kommer successivt att inkludera nya agentbaserade mönster och byggblock, så att utvecklare kan lägga mindre tid på uppdateringar av kärninfrastrukturen och mer på den domänspecifika logik som gör deras agenter användbara.
Ramverket hjälper också utvecklare att frigöra mer av en banbrytande modells kapacitet genom att anpassa körningen efter hur dessa modeller presterar som bäst. Detta gör att agenterna bättre följer modellens naturliga funktionsmönster, vilket förbättrar tillförlitligheten och prestandan vid komplexa uppgifter – särskilt när arbetet pågår under lång tid eller samordnas mellan en rad olika verktyg och system.
Dessutom inser vi att varje produkt är unik och sällan passar perfekt in i en mall. Vi utformade Agents SDK för att stödja denna mångfald. Utvecklare får ett ramverk som är nyckelfärdigt men ändå flexibelt – vilket gör det enkelt att anpassa det till sin egen stack, inklusive verktygsanvändning, minne och sandlådemiljö.
Det uppdaterade Agents SDK stöder sandbox-körning direkt, vilket innebär att agenter kan köras i kontrollerade datormiljöer med de filer, verktyg och beroenden som krävs för en uppgift.
Många användbara program behöver en arbetsyta där de kan läsa och skriva filer, installera beroenden, köra kod och använda verktyg på ett säkert sätt. Inbyggt stöd för sandboxmiljö ger utvecklare det exekveringslagret direkt, i stället för att tvinga dem att själva sammanställa det.
Utvecklare kan ta med sin egen sandbox eller använda inbyggt stöd för Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop och Vercel.
SDK:t introducerar också en Manifest-abstraktion för att beskriva agentens arbetsyta och därmed göra dessa miljöer portabla mellan olika leverantörer. Utvecklare kan montera lokala filer, ange utdatakataloger och hämta data från lagringsleverantörer som AWS S3, Google Cloud Storage, Azure Blob Storage och Cloudflare R2.
Detta ger utvecklare ett enhetligt sätt att utforma agentens miljö från lokal prototyp till produktionsdriftsättning. Det ger också modellen en förutsägbar arbetsyta: var indata finns, var utdata ska skrivas och hur arbetet hålls organiserat under en långvarig uppgift.

Agentsystem bör utformas med antagandet att promptinjektioner och exfiltrationsförsök förekommer. Att separera styrning och beräkning hjälper till att hålla autentiseringsuppgifter borta från miljöer där modellgenererad kod körs.
Det möjliggör också varaktig exekvering. När agentens tillstånd externaliseras innebär det inte att en körning går förlorad om en sandbox-container försvinner. Tack vare inbyggda funktioner för ögonblicksbilder och återställning kan Agents SDK återställa agentens tillstånd i en ny container och fortsätta från den senaste kontrollpunkten om den ursprungliga miljön slutar fungera eller upphör att gälla.
Slutligen gör det agenter mer skalbara. Agentkörningar kan använda en eller flera sandlådor, aktivera dem vid behov, dirigera subagenter till isolerade miljöer och parallellisera arbetet över containrar för snabbare körning.
Dessa nya funktioner i Agents SDK är allmänt tillgängliga för alla kunder via API:et och prissätts enligt standardpriser för API:et, baserat på antal token och verktygsanvändning.
I takt med att vi fortsätter att utveckla Agents SDK kommer vi att utöka möjligheterna för utvecklare att bygga nya lösningar med verktyget. Detta gör det enklare att sätta mer avancerade agenter i drift med mindre anpassad infrastruktur, samtidigt som vi bevarar den flexibilitet och kontroll som utvecklare behöver för att anpassa agenterna till sina egna miljöer.
De nya funktionerna för ramverk och sandbox lanseras först i Python, och stöd för TypeScript planeras till en kommande version. Vi arbetar också med att introducera ytterligare agentfunktioner, inklusive kodläge och underagenter, för både Python och TypeScript.
Dessutom vill vi på sikt bidra till att sammanföra det bredare ekosystemet för agenter, genom att stödja fler sandbox-leverantörer, fler integrationer och fler sätt för utvecklare att integrera SDK:t i de verktyg och system de redan använder.


