2026 m. balandžio 15 d.

Kita agentų SDK evoliucijos pakopa

Atnaujintas agentų SDK padeda kūrėjams konstruoti agentus, galinčius peržiūrėti failus, paleisti komandas, redaguoti kodą ir dirbti su ilgalaikėmis užduotimis kontroliuojamose bandomosiose aplinkose.

Įkeliama...

Pristatome naujas agentų SDK galimybes. Kūrėjams suteikiama standartizuota, lengvai perprantama infrastruktūra, optimaliai veikianti su „OpenAI“ modeliais: tai modeliui pritaikyta infrastruktūra, leidžianti agentams dirbti su kompiuteryje esančiais failais ir įrankiais, bei integruotas vykdymas bandomojoje aplinkoje saugiam darbui užtikrinti.

Pavyzdžiui, kūrėjai gali suteikti agentui kontroliuojamą darbo erdvę, aiškias instrukcijas ir įrankius, reikalingus duomenims nagrinėti:

Python

1# pip install "openai-agents>=0.14.0"
2
3import asyncio
4import tempfile
5from pathlib import Path
6
7from agents import Runner
8from agents.run import RunConfig
9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10from agents.sandbox.entries import LocalDir
11from agents.sandbox.sandboxes import UnixLocalSandboxClient
12
13
14async def main() -> None:
15    with tempfile.TemporaryDirectory() as tmp:
16        dataroom = Path(tmp) / "dataroom"
17        dataroom.mkdir()
18        (dataroom / "metrics.md").write_text(
19            """# Annual metrics
20
21| Year | Revenue | Operating income | Operating cash flow |
22| --- | ---: | ---: | ---: |
23| FY2025 | $124.3M | $18.6M | $24.1M |
24| FY2024 | $98.7M | $12.4M | $17.9M |
25""",
26            encoding="utf-8",
27        )
28
29        agent = SandboxAgent(
30            name="Dataroom Analyst",
31            model="gpt-5.4",
32            instructions="Answer using only files in data/. Cite source filenames.",
33            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34        )
35
36        result = await Runner.run(
37            agent,
38            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39            run_config=RunConfig(
40                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41            ),
42        )
43        print(result.final_output)
44
45
46if __name__ == "__main__":
47    asyncio.run(main())
48

Norint sukurti naudingus agentus, kūrėjams nepakanka vien geriausių modelių – jiems reikia sistemų, palaikančių agentų gebėjimą peržiūrėti failus, vykdyti komandas, rašyti kodą ir toliau tęsti darbą per daugybę žingsnių.

Šiandieninėse sistemose neišvengiama kompromisų, kai komandos nuo prototipų pereina prie realaus naudojimo. Nuo modelio nepriklausomos struktūros yra lanksčios, tačiau nevisiškai išnaudoja priešakinių modelių galimybes. Modelių teikėjų SDK gali būti geriau pritaikyti modeliui, bet dažnai nesuteikia pakankamai informacijos apie infrastruktūros veikimą. Tuo tarpu valdomų agentų API supaprastina diegimą, bet riboja agentų veikimo vietą ir prieigą prie jautrių duomenų.

Štai ką pasakė keli klientai, kartu su mumis išbandę naująjį SDK:

„GPT-5.4 nustato naują kartelę daug dokumentų reikalaujančiam teisiniam darbui. Mūsų „BigLaw Bench“ vertinime jis surinko 91 proc. Palyginti su kitais modeliais, GPT-5.4 šiuo metu geriau sistemina sudėtingą sandorių analizę, išlaiko tikslumą ilguose languose ir užtikrina aukštą detalumo lygį, kurio reikalauja teisininkai.“

– Niko Grupen, „Harvey“ taikomųjų tyrimų vadovas

Našesnė infrastruktūra agento ciklui

Su šiandieniniu leidimu agentų SDK infrastruktūra tampa geriau pritaikyta agentams, dirbantiems su dokumentais, failais ir sistemomis. Dabar ji papildyta konfigūruojama atmintimi, bandomajai aplinkai pritaikytu orkestravimu, į „Codex“ panašiais failų sistemos įrankiais ir standartizuotomis integracijomis su primityvais, kurie tampa įprasti priešakinėse agentų sistemose.

Šie primityvai apima įrankių naudojimą per MCP⁠(atsidaro naujame lange), laipsnišką atskleidimą per įgūdžius⁠(atsidaro naujame lange), pasirinktines instrukcijas per AGENTS.md⁠(atsidaro naujame lange), kodo vykdymą naudojant shell⁠(atsidaro naujame lange) įrankį, failų redagavimą naudojant apply patch⁠(atsidaro naujame lange) įrankį ir kt. Laikui bėgant, į infrastruktūrą bus toliau integruojami nauji agentų veiklos modeliai ir primityvai, tad kūrėjai galės skirti mažiau laiko pagrindinės infrastruktūros atnaujinimams ir daugiau dėmesio konkrečios srities logikai, kuri ir paverčia jų agentus naudingais.

Diagramoje rodoma, kaip agentų SDK susieja naudotojo įvestį, modelius ir įrankius kuriant DI agentus.

Diagramoje rodoma, kaip kurti DI agentus pasitelkiant agentų SDK kartu su modeliais, įrankiais ir orkestravimu.

Be to, infrastruktūra padeda kūrėjams išnaudoti daugiau priešakinio modelio galimybių, nes vykdymas suderinamas su geriausiu šių modelių veikimo būdu. Taip agentai išlaiko artimesnį modeliui natūralų veikimo modelį, o tai pagerina patikimumą ir našumą atliekant sudėtingas užduotis – ypač tuomet, kai darbas trunka ilgai arba yra koordinuojamas naudojant įvairius įrankius ir sistemas.

Be to, suprantame, kad kiekvienas produktas yra unikalus ir retai tobulai atitinka vieną šabloną. Agentų SDK sukūrėme taip, kad palaikytų šią įvairovę. Kūrėjai gauna paruoštą naudoti, bet lanksčią infrastruktūrą, kurią lengva pritaikyti prie savo technologijų dėklo – įskaitant įrankių naudojimą, atmintį ir bandomąją aplinką.

Integruotas vykdymas bandomojoje aplinkoje

Atnaujintas agentų SDK standartiškai palaiko vykdymą bandomojoje aplinkoje, todėl agentai gali veikti kontroliuojamose kompiuterinėse aplinkose su failais, įrankiais ir priklausomybėmis, kurių jiems reikia užduočiai atlikti.

Daugeliui naudingų agentų reikalinga darbo erdvė, kurioje jie galėtų saugiai skaityti ir rašyti failus, įdiegti priklausomybes, vykdyti kodą bei naudoti įrankius. Integruotas bandomosios aplinkos palaikymas suteikia kūrėjams šį vykdymo sluoksnį iš karto, užuot vertus juos jį konstruoti patiems.

Kūrėjai gali naudoti savo bandomąją aplinką arba pasinaudoti integruotu „Blaxel“, „Cloudflare“, „Daytona“, E2B, „Modal“, „Runloop“ ir „Vercel“ palaikymu.

Kad šias aplinkas būtų galima lengvai perkelti tarp skirtingų teikėjų sistemų, SDK taip pat pristato manifesto abstrakciją, skirtą agento darbo erdvei aprašyti. Kūrėjai gali prijungti vietinius failus, nurodyti išvesties katalogus ir įkelti duomenis iš tokių saugyklų teikėjų kaip „AWS S3“, „Google Cloud Storage“, „Azure Blob Storage“ ir „Cloudflare R2“.

Tai suteikia kūrėjams nuoseklų būdą formuoti agento aplinką nuo vietinio prototipo iki diegimo realiose sistemose. Tai taip pat suteikia modeliui nuspėjamą darbo erdvę: jis žino, kur rasti įvesties duomenis, kur įrašyti išvestį ir kaip palaikyti darbo tvarką vykdant ilgalaikę užduotį.

Įmonių „Daytona“, E2B, „Modal“, „Cloudflare“, „Vercel“, „Blaxel“ ir „Runloop“ logotipai.

Infrastruktūros ir skaičiavimo resursų atskyrimas siekiant užtikrinti saugumą, patvarumą ir mastelio keitimą

Agentų sistemos turėtų būti kuriamos atsižvelgiant į galimus užklausų įterpimo ir slaptus duomenų išsiuntimo bandymus. Infrastruktūros ir skaičiavimo resursų atskyrimas padeda apsaugoti prisijungimo duomenis nuo aplinkų, kuriose vykdomas modelio sugeneruotas kodas.

Tai taip pat užtikrina sklandų ir patikimą vykdymą. Kai agento būsena perkeliama į išorę, praradus bandomąją programinę vykdymo aplinką neprarandamas pats procesas. Naudojant integruotas momentinių kopijų (angl. „snapshotting“) ir atnaujinimo (angl. „rehydration“) funkcijas, agentų SDK gali atkurti agento būseną naujoje programinėje vykdymo aplinkoje ir tęsti darbą nuo paskutinio kontrolinio taško, jei pradinė aplinka sugenda ar baigiasi jos galiojimo laikas.

Galiausiai tai leidžia lengviau keisti agentų mastelį. Vykdant agentus, galima naudoti vieną arba kelias bandomąsias aplinkas, jas iškviesti tik tada, kai reikia, nukreipti antrinius agentus į izoliuotas aplinkas ir lygiagrečiai paskirstyti darbą skirtingose programinėse vykdymo aplinkose siekiant greitesnio vykdymo.

Schemoje iliustruojama, kaip agentų SDK suteikia galimybę DI agentams naudoti papildomus skaičiavimo resursus sudėtingesnėms užduotims atlikti.

Diagramoje vaizduojama, kaip su agentų SDK sukurti DI agentai gali orkestruoti atskiras skaičiavimo sistemas, leisdami darbo krūviams veikti nepriklausomai ir taip palaikydami sudėtingesnes užduotis.

Kainos ir prieinamumas

Šios naujos agentų SDK galimybės per API yra prieinamos visiems klientams ir joms taikoma standartinė API kainodara, pagrįsta žetonais bei įrankių naudojimu.

Kas toliau?

Toliau plėtodami agentų SDK, ir toliau plėsime tai, ką kūrėjai gali su juo sukurti. Sieksime, kad būtų lengviau diegti našesnius agentus realiose sistemose su mažiau pritaikytos infrastruktūros poreikio, išlaikant lankstumą ir kontrolę, kurios kūrėjams reikia norint integruoti agentus į savo aplinkas.

Naujos infrastruktūros ir bandomosios aplinkos galimybės pirmiausia pristatomos „Python“ kalboje, o „TypeScript“ palaikymą planuojama pridėti būsimame leidime. Taip pat dirbame siekdami įtraukti papildomas agentų galimybes, tokias kaip kodo režimas ir antriniai agentai, tiek į „Python“, tiek į „TypeScript“.

Be to, ilgainiui siekiame sujungti platesnę agentų ekosistemą, palaikydami daugiau bandomųjų aplinkų teikėjų, daugiau integracijų ir suteikdami kūrėjams daugiau būdų sujungti SDK su jau naudojamais įrankiais bei sistemomis.

Autorius

OpenAI

Skaityti toliau

Peržiūrėti viską

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 dabar yra pageidaujamas „Microsoft 365 Copilot“ modelis

Produktas2026-07-09

ChatGPT dabar yra jūsų ambicingiausių darbų partneris

Produktas2026-07-09

GPT-5.6: jūsų ambicijas atitinkantis priešakinis intelektas

Produktas2026-07-09