Den næste udvikling inden for Agents SDK
Den opdaterede Agents SDK hjælper udviklere med at udvikle agenter, der kan gennemgå filer, udføre kommandoer, redigere kode og arbejde på langsigtede opgaver i kontrollerede sandkasse-miljøer.
Vi introducerer nye funktioner i Agents SDK, som giver udviklere en standardiseret infrastruktur, der er nem at komme i gang med, og som er bygget korrekt til OpenAI-modeller: en model-native ramme, der lader agenter arbejde på tværs af filer og værktøjer på en computer, samt indbygget sandbox-kørsel, så arbejdet kan udføres sikkert.
Udviklere kan f.eks. give agenter et kontrolleret arbejdsområde, utvetydige instruktioner og de værktøjer, der er nødvendige for at undersøge bevismateriale:
Udviklere skal bruge mere end de bedste modeller for at kunne udvikle nyttige agenter – de har brug for systemer, der understøtter agenternes evne til at gennemgå filer, udføre kommandoer, skrive kode og fortsætte arbejdet gennem mange trin.
De systemer, der findes i dag, indebærer kompromiser, når teams går fra prototyper til produktion. Modeluafhængige rammer er fleksible, men udnytter ikke fuldt ud de avancerede modellers muligheder; SDK'er fra modeludbydere kan være tættere på modellen, men mangler ofte tilstrækkelig indsigt i infrastrukturen; og API'er til administrerede agenter kan forenkle implementeringen, men begrænser, hvor agenterne kører, og hvordan de får adgang til følsomme data.
Her er, hvad nogle af de kunder, der testede det nye SDK sammen med os, havde at sige:
“GPT-5.4 sætter en ny standard for dokumenttungt juridisk arbejde. På vores BigLaw Bench-evaluering scorede den 91 %. Sammenlignet med andre modeller er GPT-5.4 i øjeblikket bedre til at strukturere komplekse transaktionsanalyser, opretholde nøjagtighed i lange kontrakter og levere det høje detaljeringsniveau, som jurister kræver.
Med dagens udgivelse bliver Agents SDK-platformen mere kompetent for agenter, der arbejder med dokumenter, filer og systemer. Den tilføjer nu konfigurerbar hukommelse, sandkassebaseret orkestrering, Codex-lignende filsystemværktøjer samt standardiserede integrationer med grundlæggende komponenter, der bliver stadig mere udbredte i banebrydende agentsystemer.
Disse grundlæggende funktioner omfatter brug af værktøjer via MCP(åbner i et nyt vindue), gradvis afsløring via skills(åbner i et nyt vindue), brugerdefinerede instruktioner via AGENTS.md(åbner i et nyt vindue), kodeeksekvering ved hjælp af shell(åbner i et nyt vindue)-værktøjet, filredigering ved hjælp af apply patch(åbner i et nyt vindue)-værktøjet og meget mere. Rammen vil løbende inkorporere nye agentmønstre og grundlæggende funktioner, så udviklere kan bruge mindre tid på opdateringer af kerneinfrastrukturen og mere tid på den domænespecifikke logik, der gør deres agenter nyttige.
Rammen hjælper også udviklere med at frigøre mere af en banebrydende models kapacitet ved at tilpasse udførelsen til den måde, modellerne præsterer bedst på. Den holder agenter tættere på modellens naturlige arbejdsmønster, hvilket forbedrer pålideligheden og ydeevnen i komplekse opgaver – især når arbejdet er langvarigt eller koordineres på tværs af mange forskellige værktøjer og systemer.
Derudover er vi klar over, at hvert produkt er unikt og sjældent passer pænt ind i en fast skabelon. Vi designede Agents SDK til at understøtte denne mangfoldighed. Udviklere får en færdiglavet, men fleksibel ramme – hvilket gør det nemt at tilpasse den til deres egen stack – herunder værktøjsbrug, hukommelse og sandkassemiljø.
Den opdaterede Agents SDK understøtter sandkassekørsel som en integreret del af systemet, så agenter kan køre i kontrollerede computermiljøer med de filer, værktøjer og afhængigheder, de har brug for til en opgave.
Mange nyttige agenter har brug for et arbejdsområde, hvor de kan læse og skrive filer, installere afhængigheder, køre kode og bruge værktøjer sikkert. Indbygget sandkasseunderstøttelse giver udviklere dette eksekveringslag fra starten i stedet for at tvinge dem til selv at sammensætte det.
Udviklere kan medbringe deres egen sandkasse eller bruge den indbyggede understøttelse af Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop og Vercel.
For at gøre disse miljøer portable på tværs af udbydere introducerer SDK'et også en manifest til at beskrive agentens arbejdsområde. Udviklere kan indlæse lokale filer, definere udskriftsmapper og hente data fra lagringsudbydere som f.eks. AWS S3, Google Cloud Storage, Azure Blob Storage og Cloudflare R2.
Dette giver udviklere en ensartet metode til at tilpasse agentens miljø fra den lokale prototype til produktionsimplementering. Det giver også modellen et forudsigeligt arbejdsområde: hvor den finder input, hvor den skriver output, og hvordan arbejdet holdes organiseret i en langvarig opgave.

Agentsystemer bør udformes under forudsætning af, at der vil blive gjort forsøg på hurtig indsættelse og dataudtræk. Ved at adskille datahåndtering og beregninger undgår man, at der kommer adgangskoder ind i de miljøer, hvor den modelgenererede kode kører.
Det muliggør desuden en stabil kørsel. Når agentens tilstand er eksternaliseret, betyder tabet af en sandkasse-container ikke, at kørslen går tabt. Med indbygget snapshotting og rehydrering kan Agents SDK gendanne agentens tilstand i en ny container og fortsætte fra det sidste checkpoint, hvis det oprindelige miljø svigter eller udløber.
Endelig gør det agenterne mere skalerbare. Agentkørsler kan benytte én eller flere sandkasser, kun aktivere sandkasser, når det er nødvendigt, dirigere underagenter til isolerede miljøer og fordele arbejdet parallelt på tværs af containere for at opnå hurtigere udførelse.
Disse nye funktioner i Agents SDK er nu tilgængelige for alle kunder via API'et, og der gælder standardpriser for API'et, der er baseret på antallet af tokens og brugen af værktøjer.
I takt med at vi fortsætter med at udvikle Agents SDK, vil vi løbende udvide de muligheder, udviklere har for at udnytte det, så det bliver nemmere at sætte mere avancerede agenter i produktion med mindre behov for tilpasset infrastruktur, samtidig med at vi bevarer den fleksibilitet og kontrol, som udviklere har brug for til at integrere agenterne i deres egne miljøer.
De nye ramme- og sandkassefunktioner lanceres først i Python, og der er planlagt TypeScript-understøttelse i en fremtidig udgivelse. Vi arbejder også på at tilføje yderligere agentfunktioner, herunder kodetilstand og underagenter, til både Python og TypeScript.
Derudover ønsker vi med tiden at bidrage til at samle det bredere agent-økosystem ved at understøtte flere sandkasseudbydere, flere integrationer og flere måder, hvorpå udviklere kan integrere SDK'en i de værktøjer og systemer, de allerede bruger.


