Ďalší vývojový stupeň nástroja Agents SDK
Aktualizovaný nástroj Agents SDK pomáha vývojárom vytvárať agentov, ktorí môžu kontrolovať súbory, spúšťať príkazy, upravovať kód a pracovať na dlhodobých úlohách v kontrolovaných sandboxových prostrediach.
Predstavujeme nové funkcie v Agents SDK, ktoré vývojárom poskytujú štandardizovanú infraštruktúru, s ktorou sa dá ľahko začať, a ktorá je správne navrhnutá pre modely OpenAI: natívny rámec, ktorý umožňuje agentom pracovať so súbormi a nástrojmi na počítači, a natívne spúšťanie v sandboxe na bezpečné vykonávanie tejto práce.
Vývojári napríklad môžu poskytnúť agentovi kontrolovaný pracovný priestor, jasné pokyny a nástroje, ktoré potrebuje na preskúmanie dôkazov:
Vývojári potrebujú viac než len tie najlepšie modely na vytváranie užitočných agentov – potrebujú systémy, ktoré podporujú spôsob, ktorým agenti kontrolujú súbory, spúšťajú príkazy, píšu kód a pokračujú v práci cez viacero krokov.
Systémy, ktoré dnes existujú, prinášajú kompromisy, keď tímy prechádzajú od prototypov k produkcii. Pracovné rámce, nezávislé od modelu, sú flexibilné, ale nevyužívajú naplno možnosti prelomových modelov. SDK poskytovateľov modelov môžu byť bližšie k modelu, ale často neposkytujú dostatočný prehľad o riadiacom prostredí. A spravované agentové API môžu zjednodušiť nasadenie, ale obmedzujú, kde agenti bežia a ako pristupujú k citlivým údajom.
Tu sú názory niektorých zákazníkov, ktorí s nami testovali nový nástroj SDK:
„GPT-5.4 nastavuje novú latku pre právnu prácu s veľkým objemom dokumentov. V našom hodnotení BigLaw Bench dosiahol 91 %. V porovnaní s inými modelmi je GPT-5.4 v súčasnosti lepší v štruktúrovaní komplexnej transakčnej analýzy, udržiavaní presnosti naprieč rozsiahlymi zmluvami a poskytovaní vysokej úrovne detailu, ktorú právni odborníci vyžadujú.”
S dnešným vydaním sa nástroj Agents SDK stáva schopnejším pre agentov, ktorí pracujú s dokumentmi, súbormi a systémami. Teraz pridáva konfigurovateľnú pamäť, orchestráciu zohľadňujúcu sandbox, nástroje súborového systému podobné nástroju Codex a štandardizované integrácie so základnými stavebnými prvkami, ktoré sa stávajú bežnými v prelomových systémoch agentov.
Tieto základné prvky zahŕňajú používanie nástrojov cez MCP(otvorí sa v novom okne), postupné odhaľovanie cez zručnosti(otvorí sa v novom okne),vlastné pokyny cez AGENTS.md(otvorí sa v novom okne), vykonávanie kódu cez nástroj shell(otvorí sa v novom okne), úpravy súborov cez nástroj apply patch(otvorí sa v novom okne) a ďalšie možnosti. Nástroj bude naďalej zahŕňať nové agentické vzory a stavebné prvky, aby vývojári mohli tráviť menej času aktualizáciami základnej infraštruktúry a viac času logike špecifickej pre danú doménu, ktorá robí ich agentov užitočnými.
Tento pracovný rámec pomáha vývojárom odomknúť viac schopností prelomového modelu tým, že zosúlaďuje vykonávanie so spôsobom, akým tieto modely dosahujú najlepšie výsledky. To udržiava agentov bližšie k prirodzenému prevádzkovému vzorcu modelu, čím sa zlepšuje spoľahlivosť a výkon pri zložitých úlohách, najmä keď je práca dlhodobá alebo koordinovaná naprieč v rozmanitom súbore nástrojov a systémov.
Okrem toho si uvedomujeme, že každý produkt je jedinečný a len zriedka presne zapadá do nejakej šablóny. Navrhli sme nástroj Agents SDK tak, aby podporoval túto rozmanitosť. Vývojári získajú nástroj, ktorý je hotový na okamžité použitie, no je zároveň flexibilný, takže ho možno jednoducho prispôsobiť vlastnému stacku, vrátane používania nástrojov, pamäte aj sandboxového prostredia.
Aktualizovaný nástroj Agents SDK natívne podporuje spúšťanie v sandboxe, takže agenti môžu bežať v kontrolovaných počítačových prostrediach so súbormi, nástrojmi a závislosťami, ktoré potrebujú na splnenie úlohy.
Mnohí užitoční agenti potrebujú pracovný priestor, v ktorom môžu čítať a zapisovať súbory, inštalovať závislosti, spúšťať kód a bezpečne používať nástroje. Natívna podpora sandboxu poskytuje vývojárom túto vrstvu na vykonávanie hneď od začiatku namiesto toho, aby si ju museli skladať sami.
Vývojári si môžu priniesť vlastný sandbox alebo využiť vstavanú podporu pre Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop a Vercel.
Aby boli tieto prostredia prenosné medzi poskytovateľmi, SDK tiež zavádza abstrakciu Manifestu na opis pracovného priestoru agenta. Vývojári môžu pripojiť lokálne súbory, definovať výstupné adresáre a načítať údaje od poskytovateľov úložiska vrátane AWS S3, Google Cloud Storage, Azure Blob Storage a Cloudflare R2.
To vývojárom poskytuje konzistentný spôsob formovania prostredia agenta od lokálneho prototypu až po produkčné nasadenie. Modelu tiež poskytuje predvídateľný pracovný priestor: kde nájsť vstupy, kam zapisovať výstupy a ako udržať prácu organizovanú počas dlhodobej úlohy.

Agentové systémy by mali byť navrhnuté s predpokladom vkladania falošných príkazov a pokusov o exfiltráciu údajov. Oddelenie riadiacej vrstvy a výpočtových zdrojov pomáha zabrániť tomu, aby sa prihlasovacie údaje dostali do prostredí, kde sa vykonáva kód generovaný modelom.
Umožňuje tiež trvalé vykonávanie. Keď je stav agenta externalizovaný, strata sandboxového kontajnera neznamená stratu behu. Vďaka vstavanému vytváraniu snímok a rehydratácii dokáže nástroj Agents SDK obnoviť stav agenta v novom kontajneri a pokračovať od posledného kontrolného bodu, ak pôvodné prostredie zlyhá alebo uplynie.
A nakoniec, agentov umožňuje lepšie škálovať. Spustenia agenta môžu používať jeden alebo viacero sandboxov. Sandboxy sa vyvolajú len vtedy, keď sú potrebné. Subagenti sa smerujú do izolovaných prostredí a práca sa paralelizuje naprieč kontajnermi na rýchlejšie vykonávanie.
Tieto nové schopnosti nástroja Agents SDK sú dostupné pre všetkých zákazníkov cez API a účtujú sa podľa štandardného cenníka API na základe tokenov a používania nástrojov.
Pri pokračovaní vo vývoji nástroja Agents SDK budeme rozširovať to, čo s ním dokážu vývojári vybudovať. Zjednodušíme tak nasadzovanie schopnejších agentov do produkcie s menšou mierou vlastnej infraštruktúry, pričom zachováme flexibilitu a kontrolu, ktoré vývojári potrebujú, aby agentov prispôsobili vlastným prostrediam.
Nové funkcie harness a sandbox sa najprv spúšťajú v jazyku Python, pričom podpora TypeScriptu je plánovaná na jedno z budúcich vydaní. Pracujeme aj na tom, aby sme do Pythonu aj TypeScriptu priniesli ďalšie schopnosti agenta, vrátane režimu kódu a subagentov.
Okrem toho chceme časom zjednotiť širší ekosystém agentov prostredníctvom podporovania väčšieho počtu poskytovateľov sandboxov, väčšieho počtu integrácií a viacerých spôsobov, ktorými môžu vývojári prepojiť SDK s nástrojmi a systémami, ktoré už používajú.


