Preskočiť na hlavný obsah
OpenAI

15. apríla 2026

Produkt

Ďalší vývojový stupeň nástroja Agents SDK

Aktualizovaný nástroj Agents SDK pomáha vývojárom vytvárať agentov, ktorí môžu kontrolovať súbory, spúšťať príkazy, upravovať kód a pracovať na dlhodobých úlohách v kontrolovaných sandboxových prostrediach.

Načítava sa…

Predstavujeme nové funkcie v Agents SDK, ktoré vývojárom poskytujú štandardizovanú infraštruktúru, s ktorou sa dá ľahko začať, a ktorá je správne navrhnutá pre modely OpenAI: natívny rámec, ktorý umožňuje agentom pracovať so súbormi a nástrojmi na počítači, a natívne spúšťanie v sandboxe na bezpečné vykonávanie tejto práce.

Vývojári napríklad môžu poskytnúť agentovi kontrolovaný pracovný priestor, jasné pokyny a nástroje, ktoré potrebuje na preskúmanie dôkazov:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Vývojári potrebujú viac než len tie najlepšie modely na vytváranie užitočných agentov – potrebujú systémy, ktoré podporujú spôsob, ktorým agenti kontrolujú súbory, spúšťajú príkazy, píšu kód a pokračujú v práci cez viacero krokov.

Systémy, ktoré dnes existujú, prinášajú kompromisy, keď tímy prechádzajú od prototypov k produkcii. Pracovné rámce, nezávislé od modelu, sú flexibilné, ale nevyužívajú naplno možnosti prelomových modelov. SDK poskytovateľov modelov môžu byť bližšie k modelu, ale často neposkytujú dostatočný prehľad o riadiacom prostredí. A spravované agentové API môžu zjednodušiť nasadenie, ale obmedzujú, kde agenti bežia a ako pristupujú k citlivým údajom.

Tu sú názory niektorých zákazníkov, ktorí s nami testovali nový nástroj SDK:

„GPT-5.4 nastavuje novú latku pre právnu prácu s veľkým objemom dokumentov. V našom hodnotení BigLaw Bench dosiahol 91 %. V porovnaní s inými modelmi je GPT-5.4 v súčasnosti lepší v štruktúrovaní komplexnej transakčnej analýzy, udržiavaní presnosti naprieč rozsiahlymi zmluvami a poskytovaní vysokej úrovne detailu, ktorú právni odborníci vyžadujú.”
– Niko Grupen, vedúci aplikovaného výskumu, spoločnosť Harvey

Výkonnejšie prepojenie agentov pre agentský cyklus

S dnešným vydaním sa nástroj Agents SDK stáva schopnejším pre agentov, ktorí pracujú s dokumentmi, súbormi a systémami. Teraz pridáva konfigurovateľnú pamäť, orchestráciu zohľadňujúcu sandbox, nástroje súborového systému podobné nástroju Codex a štandardizované integrácie so základnými stavebnými prvkami, ktoré sa stávajú bežnými v prelomových systémoch agentov.

Tieto základné prvky zahŕňajú používanie nástrojov cez MCP(otvorí sa v novom okne), postupné odhaľovanie cez zručnosti(otvorí sa v novom okne),vlastné pokyny cez AGENTS.md(otvorí sa v novom okne), vykonávanie kódu cez nástroj shell(otvorí sa v novom okne), úpravy súborov cez nástroj apply patch(otvorí sa v novom okne) a ďalšie možnosti. Nástroj bude naďalej zahŕňať nové agentické vzory a stavebné prvky, aby vývojári mohli tráviť menej času aktualizáciami základnej infraštruktúry a viac času logike špecifickej pre danú doménu, ktorá robí ich agentov užitočnými.

Diagram znázorňujúci to, ako nástroj Agents SDK prepája vstup používateľa, modely a nástroje na vytváranie agentov AI.
Diagram zobrazujúci spôsob vytvárania AI agentov pomocou nástroja Agents SDK s modelmi, nástrojmi a orchestráciou.

Tento pracovný rámec pomáha vývojárom odomknúť viac schopností prelomového modelu tým, že zosúlaďuje vykonávanie so spôsobom, akým tieto modely dosahujú najlepšie výsledky. To udržiava agentov bližšie k prirodzenému prevádzkovému vzorcu modelu, čím sa zlepšuje spoľahlivosť a výkon pri zložitých úlohách, najmä keď je práca dlhodobá alebo koordinovaná naprieč v rozmanitom súbore nástrojov a systémov.

Okrem toho si uvedomujeme, že každý produkt je jedinečný a len zriedka presne zapadá do nejakej šablóny. Navrhli sme nástroj Agents SDK tak, aby podporoval túto rozmanitosť. Vývojári získajú nástroj, ktorý je hotový na okamžité použitie, no je zároveň flexibilný, takže ho možno jednoducho prispôsobiť vlastnému stacku, vrátane používania nástrojov, pamäte aj sandboxového prostredia.

Natívne spustenie sandboxu

Aktualizovaný nástroj Agents SDK natívne podporuje spúšťanie v sandboxe, takže agenti môžu bežať v kontrolovaných počítačových prostrediach so súbormi, nástrojmi a závislosťami, ktoré potrebujú na splnenie úlohy.

Mnohí užitoční agenti potrebujú pracovný priestor, v ktorom môžu čítať a zapisovať súbory, inštalovať závislosti, spúšťať kód a bezpečne používať nástroje. Natívna podpora sandboxu poskytuje vývojárom túto vrstvu na vykonávanie hneď od začiatku namiesto toho, aby si ju museli skladať sami.

Vývojári si môžu priniesť vlastný sandbox alebo využiť vstavanú podporu pre Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop a Vercel.

Aby boli tieto prostredia prenosné medzi poskytovateľmi, SDK tiež zavádza abstrakciu Manifestu na opis pracovného priestoru agenta. Vývojári môžu pripojiť lokálne súbory, definovať výstupné adresáre a načítať údaje od poskytovateľov úložiska vrátane AWS S3, Google Cloud Storage, Azure Blob Storage a Cloudflare R2.

To vývojárom poskytuje konzistentný spôsob formovania prostredia agenta od lokálneho prototypu až po produkčné nasadenie. Modelu tiež poskytuje predvídateľný pracovný priestor: kde nájsť vstupy, kam zapisovať výstupy a ako udržať prácu organizovanú počas dlhodobej úlohy.

Logá pre Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Oddelenie riadiaceho harnessu od výpočtovej vrstvy pre bezpečnosť, odolnosť a škálovanie

Agentové systémy by mali byť navrhnuté s predpokladom vkladania falošných príkazov a pokusov o exfiltráciu údajov. Oddelenie riadiacej vrstvy a výpočtových zdrojov pomáha zabrániť tomu, aby sa prihlasovacie údaje dostali do prostredí, kde sa vykonáva kód generovaný modelom.

Umožňuje tiež trvalé vykonávanie. Keď je stav agenta externalizovaný, strata sandboxového kontajnera neznamená stratu behu. Vďaka vstavanému vytváraniu snímok a rehydratácii dokáže nástroj Agents SDK obnoviť stav agenta v novom kontajneri a pokračovať od posledného kontrolného bodu, ak pôvodné prostredie zlyhá alebo uplynie.

A nakoniec, agentov umožňuje lepšie škálovať. Spustenia agenta môžu používať jeden alebo viacero sandboxov. Sandboxy sa vyvolajú len vtedy, keď sú potrebné. Subagenti sa smerujú do izolovaných prostredí a práca sa paralelizuje naprieč kontajnermi na rýchlejšie vykonávanie.

Vývojový diagram znázorňujúci, ako nástroj Agents SDK umožňuje agentom AI využívať dodatočné výpočtové zdroje na zložitejšie úlohy.
Diagram znázorňujúci to, ako môžu agenti vytvorení pomocou nástroja Agents SDK orchestrovať samostatné výpočtové systémy, čo umožňuje pracovným záťažiam bežať nezávisle, a zároveň podporuje vykonávanie pokročilejších úloh.

Ceny a dostupnosť

Tieto nové schopnosti nástroja Agents SDK sú dostupné pre všetkých zákazníkov cez API a účtujú sa podľa štandardného cenníka API na základe tokenov a používania nástrojov.

Čo bude ďalej

Pri pokračovaní vo vývoji nástroja Agents SDK budeme rozširovať to, čo s ním dokážu vývojári vybudovať. Zjednodušíme tak nasadzovanie schopnejších agentov do produkcie s menšou mierou vlastnej infraštruktúry, pričom zachováme flexibilitu a kontrolu, ktoré vývojári potrebujú, aby agentov prispôsobili vlastným prostrediam.

Nové funkcie harness a sandbox sa najprv spúšťajú v jazyku Python, pričom podpora TypeScriptu je plánovaná na jedno z budúcich vydaní. Pracujeme aj na tom, aby sme do Pythonu aj TypeScriptu priniesli ďalšie schopnosti agenta, vrátane režimu kódu a subagentov.

Okrem toho chceme časom zjednotiť širší ekosystém agentov prostredníctvom podporovania väčšieho počtu poskytovateľov sandboxov, väčšieho počtu integrácií a viacerých spôsobov, ktorými môžu vývojári prepojiť SDK s nástrojmi a systémami, ktoré už používajú.