Preskočite na glavno vsebino
OpenAI

15. april 2026

Izdelek

Naslednji korak v razvoju Agents SDK

Posodobljeni Agents SDK razvijalcem omogoča ustvarjanje agentov, ki lahko pregledujejo datoteke, izvajajo ukaze, urejajo kodo in delajo na dolgoročnih nalogah v nadzorovanih izoliranih okoljih.

Nalaganje …

V Agents SDK uvajamo nove zmogljivosti, ki razvijalcem zagotavljajo standardizirano infrastrukturo za enostaven začetek in pravilno zasnovo za modele OpenAI: izvorno ogrodje modela, ki agentom omogoča delo z datotekami in orodji na računalniku, ter izvorno izvajanje v peskovniku za varno izvajanje nalog.

Razvijalci lahko na primer agentu zagotovijo nadzorovan delovni prostor, jasna navodila in orodja, ki jih potrebuje za pregled dokazov:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Razvijalci za gradnjo uporabnih agentov potrebujejo več kot le najboljše modele – potrebujejo sisteme, ki omogočajo agentom pregledovanje datotek, izvajanje ukazov, pisanje kode in delovanje skozi številne korake.

Današnji sistemi prinašajo kompromise, ko ekipe prehajajo od prototipov do produkcije. Okviri, neodvisni od modela, so prilagodljivi, vendar ne izkoriščajo v celoti zmogljivosti prelomno modelov; kompleti za razvoj programske opreme ponudnikov modelov so lahko bližje modelu, vendar pogosto ne omogočajo zadostne vidljivosti v izvajalno okolje; upravljani vmesniki API za agente pa lahko poenostavijo uvajanje, vendar omejujejo, kje agenti delujejo in kako dostopajo do občutljivih podatkov.

Tukaj je nekaj odzivov strank, ki so z nami preizkusile nov komplet za razvoj programske opreme:

»GPT-5.4 postavlja nov standard za pravno delo z veliko dokumentacije. Na naši evalvaciji BigLaw Bench je dosegel 91%. V primerjavi z drugimi modeli je GPT-5.4 trenutno boljši pri strukturiranju kompleksne transakcijske analize, ohranjanju natančnosti v obsežnih pogodbah in zagotavljanju visoke ravni podrobnosti, ki jo pravni strokovnjaki zahtevajo.«
— Niko Grupen, vodja uporabnih raziskav pri družbi Harvey

Zmogljivejše ogrodje za zanko agenta

Z današnjo izdajo postaja ogrodje Agents SDK zmogljivejše za agente, ki delajo z dokumenti, datotekami in sistemi. Zdaj omogoča nastavljiv pomnilnik, orkestracijo, prilagojeno peskovniškemu okolju, orodja za datotečni sistem, podobna Codexu, in standardizirane integracije z osnovnimi gradniki, ki postajajo pogosti v prelomnih agent sistemih.

Ti osnovni gradniki vključujejo uporabo orodij prek MCP(odpre se v novem oknu), postopno razkrivanje prek veščin(odpre se v novem oknu), navodila po meri prek AGENTS.md(odpre se v novem oknu), izvajanje kode z orodjem shell(odpre se v novem oknu), urejanje datotek z orodjem apply patch(odpre se v novem oknu) in še več. Ogrodje bo sčasoma še naprej vključevalo nove agentske vzorce in primitive, tako da bodo razvijalci lahko porabili manj časa za posodobitve osnovne infrastrukture in več časa za logiko, specifično za domeno, zaradi katere so njihovi agenti uporabni.

Diagram, ki prikazuje, kako Agent SDK povezuje uporabnikov vnos, modele in orodja za gradnjo agentov umetne inteligence.
Diagram, ki prikazuje, kako z Agent SDK ustvariti agente AI z modeli, orodji in orkestracijo.

Ogrodje razvijalcem pomaga izkoristiti več zmogljivosti prelomnega modela, saj usklajuje izvajanje z načinom, kako ti modeli najbolje delujejo. To agente ohranja bližje naravnemu načinu delovanja modela, kar izboljšuje zanesljivost in učinkovitost pri zahtevnih nalogah – še posebej, kadar delo poteka dlje časa ali je usklajeno prek raznolikega nabora orodij in sistemov.

Poleg tega se zavedamo, da je vsak izdelek edinstven in da se le redko povsem prilega kalupu. Agents SDK smo zasnovali tako, da podpira to raznolikost. Razvijalci dobijo ogrodje, ki je pripravljeno za takojšnjo uporabo, a hkrati prilagodljivo, zato ga zlahka prilagodijo svojemu skladu tehnologij, vključno z uporabo orodij, pomnilnikom in peskovniškim okoljem.

Izvorno izvajanje v peskovniku

Posodobljeni Agents SDK izvorno podpira izvajanje v peskovniku, zato lahko agenti delujejo v nadzorovanih računalniških okoljih z datotekami, orodji in odvisnostmi, ki jih potrebujejo za nalogo.

Mnogi uporabni agenti potrebujejo delovni prostor, kjer lahko berejo in zapisujejo datoteke, nameščajo odvisnosti, izvajajo kodo in varno uporabljajo orodja. Vgrajena podpora za peskovnik razvijalcem zagotavlja to izvedbeno plast že privzeto, namesto da bi jo morali sestaviti sami.

Razvijalci lahko uporabijo svoj peskovnik ali vgrajeno podporo za Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop in Vercel.

Da bi bila ta okolja prenosljiva med ponudniki, komplet za razvoj programske opreme uvaja tudi abstrakcijo Manifest za opisovanje delovnega prostora agenta. Razvijalci lahko priklopijo lokalne datoteke, določijo izhodne imenike in vključijo podatke od ponudnikov shrambe, vključno z AWS S3, Google Cloud Storage, Azure Blob Storage in Cloudflare R2.

To razvijalcem omogoča dosleden način za oblikovanje agentovega okolja od lokalnega prototipa do produkcijske uvedbe. Modelu zagotavlja tudi predvidljiv delovni prostor: kje najde vhode, kam zapiše izhode in kako ohranjati delo organizirano med dolgotrajno nalogo.

Logotipi za Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Ločevanje ogrodja od računske zmogljivosti zaradi varnosti, trajnosti in obsega

Sisteme agentov je treba načrtovati ob predpostavki poskusov vstavljanja zavajajočega poziva in eksfiltracije podatkov. Ločevanje ogrodja in računskih virov pomaga ohraniti poverilnice zunaj okolij, v katerih se izvaja koda, ki jo ustvari model.

Prav tako omogoča trajnostno izvajanje. Ko je stanje agenta zunanje shranjeno, izguba vsebnika peskovnika ne pomeni izgube izvajanja. Z vgrajenim ustvarjanjem posnetkov stanja in ponovno vzpostavitvijo stanja lahko Agents SDK obnovi stanje agenta v novem vsebniku in nadaljuje od zadnje kontrolne točke, če izvirno okolje odpove ali poteče.

Nazadnje omogoča večjo razširljivost agentov. Izvajanja agentov lahko uporabljajo en peskovnik ali več njih, peskovnike prikličejo le po potrebi, podagente usmerijo v izolirana okolja in delo porazdelijo vzporedno med vsebnike za hitrejše izvajanje.

Diagram poteka, ki prikazuje, kako Agent SDK omogoča agentom AI uporabo dodatnih računskih virov za zahtevnejše naloge.
Diagram, ki prikazuje, kako lahko agenti umetne inteligence, zgrajeni z Agent SDK, orkestrirajo ločene računske sisteme, kar omogoča, da se delovne obremenitve izvajajo neodvisno, hkrati pa podpirajo zahtevnejše naloge.

Cenik in razpoložljivost

Te nove zmogljivosti Agents SDK so prek vmesnika API na voljo vsem strankam in uporabljajo standardno cenitev API-ja, ki temelji na žetonih in uporabi orodij.

Kaj naprej

Ko bomo še naprej razvijali Agents SDK, bomo širili tudi to, kaj lahko razvijalci z njim zgradijo, ter olajšali uvajanje zmogljivejših agentov v produkcijo z manj infrastrukture po meri, hkrati pa ohranili prilagodljivost in nadzor, ki ju razvijalci potrebujejo za vključitev agentov v lastna okolja.

Nove zmožnosti ogrodja in peskovnika bodo najprej na voljo v Pythonu, podporo za TypeScript pa načrtujemo v eni od prihodnjih izdaj. Prizadevamo si tudi uvesti dodatne zmogljivosti agenta, vključno z načinom za kodo in podagenti, tako v Pythonu kot v TypeScriptu.

Poleg tega želimo sčasoma pomagati povezati širši ekosistem agentov, s podporo za več ponudnikov peskovnikov, več integracij in več načinov, da razvijalci vključijo komplet za razvoj programske opreme v orodja in sisteme, ki jih že uporabljajo.