Gå til hovedindhold
OpenAI

15. april 2026

Produkt

Den næste udvikling inden for Agents SDK

Den opdaterede Agents SDK hjælper udviklere med at udvikle agenter, der kan gennemgå filer, udføre kommandoer, redigere kode og arbejde på langsigtede opgaver i kontrollerede sandkasse-miljøer.

Indlæser ...

Vi introducerer nye funktioner i Agents SDK, som giver udviklere en standardiseret infrastruktur, der er nem at komme i gang med, og som er bygget korrekt til OpenAI-modeller: en model-native ramme, der lader agenter arbejde på tværs af filer og værktøjer på en computer, samt indbygget sandbox-kørsel, så arbejdet kan udføres sikkert.

Udviklere kan f.eks. give agenter et kontrolleret arbejdsområde, utvetydige instruktioner og de værktøjer, der er nødvendige for at undersøge bevismateriale:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Udviklere skal bruge mere end de bedste modeller for at kunne udvikle nyttige agenter – de har brug for systemer, der understøtter agenternes evne til at gennemgå filer, udføre kommandoer, skrive kode og fortsætte arbejdet gennem mange trin.

De systemer, der findes i dag, indebærer kompromiser, når teams går fra prototyper til produktion. Modeluafhængige rammer er fleksible, men udnytter ikke fuldt ud de avancerede modellers muligheder; SDK'er fra modeludbydere kan være tættere på modellen, men mangler ofte tilstrækkelig indsigt i infrastrukturen; og API'er til administrerede agenter kan forenkle implementeringen, men begrænser, hvor agenterne kører, og hvordan de får adgang til følsomme data.

Her er, hvad nogle af de kunder, der testede det nye SDK sammen med os, havde at sige:

“GPT-5.4 sætter en ny standard for dokumenttungt juridisk arbejde. På vores BigLaw Bench-evaluering scorede den 91 %. Sammenlignet med andre modeller er GPT-5.4 i øjeblikket bedre til at strukturere komplekse transaktionsanalyser, opretholde nøjagtighed i lange kontrakter og levere det høje detaljeringsniveau, som jurister kræver.
Niko Grupen, chef for Applied Research hos Harvey

En mere kompetent ramme til agent-loopet

Med dagens udgivelse bliver Agents SDK-platformen mere kompetent for agenter, der arbejder med dokumenter, filer og systemer. Den tilføjer nu konfigurerbar hukommelse, sandkassebaseret orkestrering, Codex-lignende filsystemværktøjer samt standardiserede integrationer med grundlæggende komponenter, der bliver stadig mere udbredte i banebrydende agentsystemer.

Disse grundlæggende funktioner omfatter brug af værktøjer via MCP(åbner i et nyt vindue), gradvis afsløring via skills(åbner i et nyt vindue), brugerdefinerede instruktioner via AGENTS.md(åbner i et nyt vindue), kodeeksekvering ved hjælp af shell(åbner i et nyt vindue)-værktøjet, filredigering ved hjælp af apply patch(åbner i et nyt vindue)-værktøjet og meget mere. Rammen vil løbende inkorporere nye agentmønstre og grundlæggende funktioner, så udviklere kan bruge mindre tid på opdateringer af kerneinfrastrukturen og mere tid på den domænespecifikke logik, der gør deres agenter nyttige.

Diagram, der viser, hvordan Agent SDK forbinder brugerinput, model og værktøjer til at bygge AI-agenter.
Diagram, der viser, hvordan man bygger AI-agenter ved hjælp af Agent SDK med model, værktøjer og koordinering.

Rammen hjælper også udviklere med at frigøre mere af en banebrydende models kapacitet ved at tilpasse udførelsen til den måde, modellerne præsterer bedst på. Den holder agenter tættere på modellens naturlige arbejdsmønster, hvilket forbedrer pålideligheden og ydeevnen i komplekse opgaver – især når arbejdet er langvarigt eller koordineres på tværs af mange forskellige værktøjer og systemer.

Derudover er vi klar over, at hvert produkt er unikt og sjældent passer pænt ind i en fast skabelon. Vi designede Agents SDK til at understøtte denne mangfoldighed. Udviklere får en færdiglavet, men fleksibel ramme – hvilket gør det nemt at tilpasse den til deres egen stack – herunder værktøjsbrug, hukommelse og sandkassemiljø.

Kørsel i indbygget sandkasse

Den opdaterede Agents SDK understøtter sandkassekørsel som en integreret del af systemet, så agenter kan køre i kontrollerede computermiljøer med de filer, værktøjer og afhængigheder, de har brug for til en opgave.

Mange nyttige agenter har brug for et arbejdsområde, hvor de kan læse og skrive filer, installere afhængigheder, køre kode og bruge værktøjer sikkert. Indbygget sandkasseunderstøttelse giver udviklere dette eksekveringslag fra starten i stedet for at tvinge dem til selv at sammensætte det.

Udviklere kan medbringe deres egen sandkasse eller bruge den indbyggede understøttelse af Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop og Vercel.

For at gøre disse miljøer portable på tværs af udbydere introducerer SDK'et også en manifest til at beskrive agentens arbejdsområde. Udviklere kan indlæse lokale filer, definere udskriftsmapper og hente data fra lagringsudbydere som f.eks. AWS S3, Google Cloud Storage, Azure Blob Storage og Cloudflare R2.

Dette giver udviklere en ensartet metode til at tilpasse agentens miljø fra den lokale prototype til produktionsimplementering. Det giver også modellen et forudsigeligt arbejdsområde: hvor den finder input, hvor den skriver output, og hvordan arbejdet holdes organiseret i en langvarig opgave.

Logoer for Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Adskillelse af rammen fra beregningskapaciteten for sikkerhed, robusthed og skalerbarhed

Agentsystemer bør udformes under forudsætning af, at der vil blive gjort forsøg på hurtig indsættelse og dataudtræk. Ved at adskille datahåndtering og beregninger undgår man, at der kommer adgangskoder ind i de miljøer, hvor den modelgenererede kode kører.

Det muliggør desuden en stabil kørsel. Når agentens tilstand er eksternaliseret, betyder tabet af en sandkasse-container ikke, at kørslen går tabt. Med indbygget snapshotting og rehydrering kan Agents SDK gendanne agentens tilstand i en ny container og fortsætte fra det sidste checkpoint, hvis det oprindelige miljø svigter eller udløber.

Endelig gør det agenterne mere skalerbare. Agentkørsler kan benytte én eller flere sandkasser, kun aktivere sandkasser, når det er nødvendigt, dirigere underagenter til isolerede miljøer og fordele arbejdet parallelt på tværs af containere for at opnå hurtigere udførelse.

Flowdiagram, der illustrerer, hvordan Agent SDK gør det muligt for AI-agenter at bruge yderligere computerressourcer til mere komplekse opgaver.
Diagram, der viser, hvordan AI-agenter udviklet med Agent SDK kan koordinere separate computersystemer, så arbejdsopgaver kan køre uafhængigt af hinanden, samtidig med at der understøttes mere avancerede opgaver.

Priser og tilgængelighed

Disse nye funktioner i Agents SDK er nu tilgængelige for alle kunder via API'et, og der gælder standardpriser for API'et, der er baseret på antallet af tokens og brugen af værktøjer.

Kommende tiltag

I takt med at vi fortsætter med at udvikle Agents SDK, vil vi løbende udvide de muligheder, udviklere har for at udnytte det, så det bliver nemmere at sætte mere avancerede agenter i produktion med mindre behov for tilpasset infrastruktur, samtidig med at vi bevarer den fleksibilitet og kontrol, som udviklere har brug for til at integrere agenterne i deres egne miljøer.

De nye ramme- og sandkassefunktioner lanceres først i Python, og der er planlagt TypeScript-understøttelse i en fremtidig udgivelse. Vi arbejder også på at tilføje yderligere agentfunktioner, herunder kodetilstand og underagenter, til både Python og TypeScript.

Derudover ønsker vi med tiden at bidrage til at samle det bredere agent-økosystem ved at understøtte flere sandkasseudbydere, flere integrationer og flere måder, hvorpå udviklere kan integrere SDK'en i de værktøjer og systemer, de allerede bruger.

Skrevet af

OpenAI