15. april 2026

Neste trinn i utviklingen av Agents SDK

Den oppdaterte Agents SDK hjelper utviklere med å bygge agenter som kan inspisere filer, kjøre kommandoer, redigere kode og jobbe med langsiktige oppgaver i kontrollerte sandkassemiljøer.

Laster inn …

Vi introduserer nye egenskaper i Agents SDK som gir utviklere standardisert infrastruktur som er enkel å komme i gang med og er bygget riktig for OpenAI-modeller: en modell-nativ ramme som lar agenter jobbe på tvers av filer og verktøy på en datamaskin, samt innebygd sandkassekjøring for å utføre dette arbeidet på en trygg måte.

Utviklere kan for eksempel gi en agent et kontrollert arbeidsområde, uttrykkelige instruksjoner og verktøyene den trenger for å undersøke bevismateriale:

Python

1# pip install "openai-agents>=0.14.0"
2
3import asyncio
4import tempfile
5from pathlib import Path
6
7from agents import Runner
8from agents.run import RunConfig
9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10from agents.sandbox.entries import LocalDir
11from agents.sandbox.sandboxes import UnixLocalSandboxClient
12
13
14async def main() -> None:
15    with tempfile.TemporaryDirectory() as tmp:
16        dataroom = Path(tmp) / "dataroom"
17        dataroom.mkdir()
18        (dataroom / "metrics.md").write_text(
19            """# Annual metrics
20
21| Year | Revenue | Operating income | Operating cash flow |
22| --- | ---: | ---: | ---: |
23| FY2025 | $124.3M | $18.6M | $24.1M |
24| FY2024 | $98.7M | $12.4M | $17.9M |
25""",
26            encoding="utf-8",
27        )
28
29        agent = SandboxAgent(
30            name="Dataroom Analyst",
31            model="gpt-5.4",
32            instructions="Answer using only files in data/. Cite source filenames.",
33            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34        )
35
36        result = await Runner.run(
37            agent,
38            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39            run_config=RunConfig(
40                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41            ),
42        )
43        print(result.final_output)
44
45
46if __name__ == "__main__":
47    asyncio.run(main())
48

Utviklere trenger mer enn de beste modellene for å bygge nyttige agenter–de trenger systemer som støtter hvordan agenter inspiserer filer, kjører kommandoer, skriver kode og fortsetter å arbeide gjennom mange trinn.

Systemene som finnes i dag, innebærer avveininger når team går fra prototyper til produksjon. Modellagnostiske rammeverk er fleksible, men utnytter ikke fullt ut de banebrytende modellenes funksjoner; SDK-er fra modellleverandører kan ligge nærmere modellen, men mangler ofte tilstrekkelig innsyn i integrasjonen; og administrerte agent-API-er kan forenkle distribusjon, men begrenser hvor agenter kjører og hvordan de får tilgang til sensitive data.

Her er hva noen av kundene som testet den nye SDK-en sammen med oss, hadde å si:

«GPT-5.4 setter en ny standard for dokumenttungt juridisk arbeid. I vår BigLaw Bench-evaluering fikk den 91 %. Sammenlignet med andre modeller er GPT-5.4 for øyeblikket bedre til å strukturere kompleks transaksjonsanalyse, opprettholde nøyaktighet på tvers av omfattende kontrakter og levere det høye detaljnivået juridiske fagfolk krever.»

— Niko Grupen, Head of Applied Research hos Harvey

Et mer kapabelt rammeverk for agent-løkken

Med dagens lansering blir Agents SDK-rammeverket mer kapabelt for agenter som arbeider med dokumenter, filer og systemer. Den legger nå til konfigurerbart minne, sandkassebevisst orkestrering, Codex-lignende filsystemverktøy og standardiserte integrasjoner med primitiver som blir stadig vanligere i banebrytende agentsystemer.

Disse primitivene inkluderer bruk av verktøy via MCP⁠(åpnes i et nytt vindu), gradvis avdekking via ferdigheter⁠(åpnes i et nytt vindu), egendefinerte instruksjoner via AGENTS.md⁠(åpnes i et nytt vindu), kodekjøring ved hjelp av skall-verktøyet⁠(åpnes i et nytt vindu), filredigering ved hjelp av apply patch-verktøyet⁠(åpnes i et nytt vindu) og mer. Rammeverket vil fortsette å innlemme nye mønstre og primitiver over tid, slik at utviklere kan bruke mindre tid på oppdateringer av kjerneinfrastrukturen og mer tid på logikken som gjør agentene nyttige.

Diagram som viser hvordan Agent SDK kobler brukerinndata, modeller og verktøy for å bygge AI-agenter.

Diagram som viser hvordan man bygger AI-agenter ved hjelp av Agent SDK med modell, verktøy og orkestrering.

Rammeverket hjelper også utviklere med å få ut mer av kapasiteten til en banebrytende modell ved å tilpasse kjøringen til måten disse modellene yter best på. Det holder agenter nærmere modellens naturlige driftsmønster, noe som forbedrer pålitelighet og ytelse i komplekse oppgaver–særlig når arbeidet er langvarig eller koordinert på tvers av et mangfoldig sett med verktøy og systemer.

I tillegg innser vi at hvert produkt er unikt og sjelden passer helt inn i en fast mal. Vi utviklet Agents SDK for å støtte dette mangfoldet. Utviklere får et rammeverk som er klart til bruk, men samtidig fleksibelt–slik at det er enkelt å tilpasse det til sin egen stack–inkludert verktøybruk, minne og sandkassemiljø.

Naturlig sandkassekjøring

Den oppdaterte Agents SDK støtter sandkassekjøring innebygd, slik at agenter kan kjøre i kontrollerte datamiljøer med filene, verktøyene og avhengighetene de trenger for en oppgave.

Mange nyttige agenter trenger et arbeidsområde der de kan lese og skrive filer, installere avhengigheter, kjøre kode og bruke verktøy på en trygg måte. Innebygd støtte for sandkasse-miljøer gir utviklere dette kjøringslaget ferdig på plass, i stedet for å tvinge dem til å sette det sammen selv.

Utviklere kan ta med sin egen sandkasse eller bruke innebygd støtte for Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop og Vercel.

For å gjøre disse miljøene portable på tvers av leverandører introduserer SDK-en også en manifest-abstraksjon for å beskrive agentens arbeidsområde. Utviklere kan montere lokale filer, definere utdatakataloger og hente inn data fra lagringsleverandører, inkludert AWS S3, Google Cloud Storage, Azure Blob Storage og Cloudflare R2.

Dette gir utviklere en enhetlig måte å forme agentens miljø på, fra lokal prototype til produksjonsdistribusjon. Det gir også modellen et forutsigbart arbeidsområde: hvor den finner inndata, hvor den skal skrive utdata, og hvordan arbeidet holdes organisert gjennom en langvarig oppgave.

Logoer for Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel og Runloop

Skille rammeverket fra datakraften for sikkerhet, holdbarhet og skalerbarhet

Agentsystemer bør utformes med antakelsen om promptinjeksjon og forsøk på eksfiltrering. Skille rammeverk og datakraft bidrar til å holde påloggingsinformasjon ute av miljøer der modellgenerert kode kjører.

Dette muliggjør også varig utførelse. Når agentens tilstand er eksternalisert, betyr det å miste en sandkasse-container ikke at kjøringen går tapt. Med innebygd øyeblikksbilde og rehydrering kan Agents SDK gjenopprette agentens tilstand i en ny container, og fortsette fra det siste kontrollpunktet hvis det opprinnelige miljøet svikter eller utløper.

Til slutt gjør det agenter mer skalerbare. Agentkjøringer kan bruke én sandkasse eller mange, bare bruke sandkasser ved behov, rute underagenter til isolerte miljøer og parallellisere arbeid på tvers av containere for raskere kjøring.

Flytdiagram som viser hvordan Agent SDK lar KI-agenter bruke mer datakraft til mer avanserte oppgaver.

Diagram som viser hvordan AI-agenter laget med Agent SDK kan styre separate datasystemer, slik at arbeidsbelastninger kan kjøre selvstendig og samtidig støtte mer avanserte oppgaver.

Pris og tilgjengelighet

Disse nye funksjonene i Agents SDK er allment tilgjengelige for dere via API, og bruker standard API-priser, basert på tokens og bruk av verktøy.

Hva skjer videre?

Etter hvert som vi fortsetter å utvikle Agents SDK, vil vi også fortsette å utvide hva utviklere kan bygge med det, slik at det blir enklere å ta i bruk mer kapable agenter i produksjon med mindre tilpasset infrastruktur, samtidig som vi bevarer fleksibiliteten og kontrollen du trenger for å tilpasse agenter til ditt eget miljø.

De nye rammeverk- og sandkasse-funksjonene lanseres først i Python, med støtte for TypeScript planlagt for en fremtidig utgivelse. Vi jobber også med å bringe flere agentfunksjoner, inkludert kodemodus og underagenter, til både Python og TypeScript.

I tillegg ønsker vi å bidra til å samle det bredere agentøkosystemet over tid, med støtte for flere sandkasse-leverandører, flere integrasjoner og flere måter for utviklere for å koble SDK-en til verktøyene og systemene de allerede bruker.

Forfatter

OpenAI

Les videre

Se alle

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 er nå foretrukket modell i Microsoft 365 Copilot

Produkt9. juli 2026

ChatGPT er nå en partner for det mest ambisiøse arbeidet ditt

Produkt9. juli 2026

GPT-5.6: Banebrytende intelligens som skalerer med ambisjonene dine

Produkt9. juli 2026