15 april 2026

Nästa utvecklingsfas av Agents SDK

Det uppdaterade Agents SDK hjälper utvecklare att skapa agenter som kan granska filer, köra kommandon, redigera kod och utföra långsiktiga uppgifter inom kontrollerade sandlådemiljöer.

Laddar …

Vi introducerar nya funktioner i Agents SDK som ger utvecklare en standardiserad infrastruktur som är enkel att komma igång med och som är korrekt utformad för OpenAI-modeller: ett modellintegrerat ramverk som gör det möjligt för agenter att arbeta med olika filer och verktyg på en dator, samt inbyggd sandbox-körning för att utföra detta arbete på ett säkert sätt.

Utvecklare kan till exempel förse en agent med en kontrollerad arbetsyta, tydliga instruktioner och de verktyg som behövs för att granska bevismaterial:

Python

1# pip install "openai-agents>=0.14.0"
2
3import asyncio
4import tempfile
5from pathlib import Path
6
7from agents import Runner
8from agents.run import RunConfig
9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10from agents.sandbox.entries import LocalDir
11from agents.sandbox.sandboxes import UnixLocalSandboxClient
12
13
14async def main() -> None:
15    with tempfile.TemporaryDirectory() as tmp:
16        dataroom = Path(tmp) / "dataroom"
17        dataroom.mkdir()
18        (dataroom / "metrics.md").write_text(
19            """# Annual metrics
20
21| Year | Revenue | Operating income | Operating cash flow |
22| --- | ---: | ---: | ---: |
23| FY2025 | $124.3M | $18.6M | $24.1M |
24| FY2024 | $98.7M | $12.4M | $17.9M |
25""",
26            encoding="utf-8",
27        )
28
29        agent = SandboxAgent(
30            name="Dataroom Analyst",
31            model="gpt-5.4",
32            instructions="Answer using only files in data/. Cite source filenames.",
33            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34        )
35
36        result = await Runner.run(
37            agent,
38            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39            run_config=RunConfig(
40                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41            ),
42        )
43        print(result.final_output)
44
45
46if __name__ == "__main__":
47    asyncio.run(main())
48

Utvecklare behöver mer än bara de bästa modellerna för att bygga användbara agenter – de behöver system som stöder hur agenterna granskar filer, kör kommandon, skriver kod och fortsätter att fungera genom många olika steg.

De system som finns idag innebär kompromisser när team går från prototyper till produktion. Modelloberoende ramverk är flexibla men utnyttjar inte fullt ut de banbrytande modellernas kapacitet. SDK:er från modelleverantörer kan ligga närmare modellen men saknar ofta tillräcklig insyn i ramverket, och API:er för hanterade agenter kan förenkla distributionen men begränsar var agenterna körs och hur de får åtkomst till känslig data.

Här är vad några av de kunder som testade det nya SDK:t tillsammans med oss hade att säga:

“GPT-5.4 sätter en ny standard för dokumenttungt juridiskt arbete. På vår BigLaw Bench eval fick det 91 %. Jämfört med andra modeller är GPT-5.4 för närvarande bättre på att strukturera komplex transaktionsanalys, bibehålla noggrannhet i långa avtal och leverera den höga detaljnivå som jurister kräver.”

– Niko Grupen, Head of Applied Research på Harvey

Ett mer kraftfullt ramverk för agentloopen

Med dagens lansering utökas Agents SDK-ramverket för agenter som arbetar med dokument, filer och system. Nu tillkommer konfigurerbart minne, sandlådeanpassad orkestrering, filsystemverktyg av Codex-typ samt standardiserade integrationer med byggblock som blir allt vanligare i banbrytande agentsystem.

Dessa byggblock omfattar verktygsanvändning via MCP⁠(öppnas i ett nytt fönster), stegvis informationsvisning via skills⁠(öppnas i ett nytt fönster) samt anpassade instruktioner via AGENTS.md⁠(öppnas i ett nytt fönster), kodkörning med shell⁠(öppnas i ett nytt fönster)-verktyget, redigering av filer med apply patch⁠(öppnas i ett nytt fönster)-verktyget och mycket mer. Ramverket kommer successivt att inkludera nya agentbaserade mönster och byggblock, så att utvecklare kan lägga mindre tid på uppdateringar av kärninfrastrukturen och mer på den domänspecifika logik som gör deras agenter användbara.

Diagram som visar hur Agent SDK kopplar samman användarinmatning, modeller och verktyg för att bygga AI-agenter.

Diagram som visar hur man bygger AI-agenter med Agent SDK med modeller, verktyg och orkestrering.

Ramverket hjälper också utvecklare att frigöra mer av en banbrytande modells kapacitet genom att anpassa körningen efter hur dessa modeller presterar som bäst. Detta gör att agenterna bättre följer modellens naturliga funktionsmönster, vilket förbättrar tillförlitligheten och prestandan vid komplexa uppgifter – särskilt när arbetet pågår under lång tid eller samordnas mellan en rad olika verktyg och system.

Dessutom inser vi att varje produkt är unik och sällan passar perfekt in i en mall. Vi utformade Agents SDK för att stödja denna mångfald. Utvecklare får ett ramverk som är nyckelfärdigt men ändå flexibelt – vilket gör det enkelt att anpassa det till sin egen stack, inklusive verktygsanvändning, minne och sandlådemiljö.

Inbyggd sandbox-körning

Det uppdaterade Agents SDK stöder sandbox-körning direkt, vilket innebär att agenter kan köras i kontrollerade datormiljöer med de filer, verktyg och beroenden som krävs för en uppgift.

Många användbara program behöver en arbetsyta där de kan läsa och skriva filer, installera beroenden, köra kod och använda verktyg på ett säkert sätt. Inbyggt stöd för sandboxmiljö ger utvecklare det exekveringslagret direkt, i stället för att tvinga dem att själva sammanställa det.

Utvecklare kan ta med sin egen sandbox eller använda inbyggt stöd för Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop och Vercel.

SDK:t introducerar också en Manifest-abstraktion för att beskriva agentens arbetsyta och därmed göra dessa miljöer portabla mellan olika leverantörer. Utvecklare kan montera lokala filer, ange utdatakataloger och hämta data från lagringsleverantörer som AWS S3, Google Cloud Storage, Azure Blob Storage och Cloudflare R2.

Detta ger utvecklare ett enhetligt sätt att utforma agentens miljö från lokal prototyp till produktionsdriftsättning. Det ger också modellen en förutsägbar arbetsyta: var indata finns, var utdata ska skrivas och hur arbetet hålls organiserat under en långvarig uppgift.

Logotyper från Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel och Runloop

Separera hanteringssystemet från beräkningsresurserna för säkerhet, hållbarhet och skalbarhet

Agentsystem bör utformas med antagandet att promptinjektioner och exfiltrationsförsök förekommer. Att separera styrning och beräkning hjälper till att hålla autentiseringsuppgifter borta från miljöer där modellgenererad kod körs.

Det möjliggör också varaktig exekvering. När agentens tillstånd externaliseras innebär det inte att en körning går förlorad om en sandbox-container försvinner. Tack vare inbyggda funktioner för ögonblicksbilder och återställning kan Agents SDK återställa agentens tillstånd i en ny container och fortsätta från den senaste kontrollpunkten om den ursprungliga miljön slutar fungera eller upphör att gälla.

Slutligen gör det agenter mer skalbara. Agentkörningar kan använda en eller flera sandlådor, aktivera dem vid behov, dirigera subagenter till isolerade miljöer och parallellisera arbetet över containrar för snabbare körning.

Ett flödesschema som visar hur Agent SDK gör det möjligt för AI-agenter att använda ytterligare beräkningsresurser för mer komplexa uppgifter.

Diagram som visar hur AI-agenter som skapats med Agent SDK kan samordna separata datorsystem, vilket gör det möjligt för arbetsbelastningar att köras självständigt samtidigt som mer avancerade uppgifter stöds.

Priser och tillgänglighet

Dessa nya funktioner i Agents SDK är allmänt tillgängliga för alla kunder via API:et och prissätts enligt standardpriser för API:et, baserat på antal token och verktygsanvändning.

Vad händer härnäst?

I takt med att vi fortsätter att utveckla Agents SDK kommer vi att utöka möjligheterna för utvecklare att bygga nya lösningar med verktyget. Detta gör det enklare att sätta mer avancerade agenter i drift med mindre anpassad infrastruktur, samtidigt som vi bevarar den flexibilitet och kontroll som utvecklare behöver för att anpassa agenterna till sina egna miljöer.

De nya funktionerna för ramverk och sandbox lanseras först i Python, och stöd för TypeScript planeras till en kommande version. Vi arbetar också med att introducera ytterligare agentfunktioner, inklusive kodläge och underagenter, för både Python och TypeScript.

Dessutom vill vi på sikt bidra till att sammanföra det bredare ekosystemet för agenter, genom att stödja fler sandbox-leverantörer, fler integrationer och fler sätt för utvecklare att integrera SDK:t i de verktyg och system de redan använder.

Författare

OpenAI

Fortsätt läsa

Visa alla

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 är nu den föredragna modellen i Microsoft 365 Copilot

Produkt9 juli 2026

ChatGPT är nu en partner för ditt mest ambitiösa arbete

Produkt9 juli 2026

GPT-5.6: Banbrytande intelligens som skalar med dina ambitioner

Produkt9 juli 2026