Lumaktaw sa pangunahing content
OpenAI

Abril 15, 2026

Produkto

Ang susunod na ebolusyon ng Agents SDK

Ang na-update na Agents SDK ay tumutulong sa mga developer na bumuo ng mga agent na maaaring magsiyasat ng mga file, magpatakbo ng mga command, mag-edit ng code, at gumawa ng mga pangmatagalang gawain sa loob ng mga kontroladong sandbox environment.

Naglo-load…

Magpapakilala kami ng mga bagong kakayahan sa Agents SDK na magbibigay sa mga developer ng standardized na imprastraktura na madaling simulan at wastong binuo para sa mga modelo ng OpenAI: isang model-native harness na nagbibigay-daan sa mga ahente na gumana sa mga file at tool sa isang computer, kasama ang native sandbox execution para sa ligtas na pagpapatakbo ng gawaing iyon.

Halimbawa, puwedeng bigyan ng mga developer ang agent ng kontroladong workspace, mga tahasang tagubilin, at tool na kailangan nito para siyasatin ang ebidensya:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Higit pa sa pinakamahusay na mga modelo ang kailangan ng mga developer para makabuo ng mga kapaki-pakinabang na agent—kailangan nila ng mga system na sumusuporta sa kung paano sinusuri ng mga agent ang mga file, pinapatakbo ang mga command, nagsusulat ng code, at patuloy na nagtatrabaho sa maraming hakbang.

Ang mga system na umiiral ngayon ay may mga kapalit na kompromiso habang lumilipat ang mga team mula sa mga prototype patungo sa produksyon. Flexible ang model-agnostic frameworks pero hindi lubos na nagagamit ang mga frontier model; mas malapit ang model-provider SDK sa model pero kulang sa visibility sa harness; at pinapasimple ng managed agent APIs ang deployment pero nililimitahan ang pagpapatakbo at access sa sensitibong data.

Narito ang sinabi ng ilan sa mga customer na sumubok ng bagong SDK kasama namin:

“Nagtatakda ang GPT-5.4 ng bagong pamantayan para sa gawaing legal na maraming dokumento ang sangkot. Sa aming BigLaw Bench na pagsusuri, nakakuha ito ng 91%. Kung ikukumpara sa ibang modelo, mas mahusay sa kasalukuyan ang GPT-5.4 sa pag-istruktura ng kumplikadong transactional analysis, pagpapanatili ng accuracy sa mahahabang kontrata, at paghahatid ng mataas na antas ng detalye na kailangan ng mga legal practitioner.”
— Niko Grupen, Head ng Applied Research sa Harvey

Isang mas may kakayahang harness para sa agent loop

Sa release ngayong araw, nagiging mas may kakayahan ang harness ng Agents SDK para sa mga agent na gumagana sa mga dokumento, file, at system. Nagdaragdag na ito ngayon ng nako-configure na memory, orchestration na may kamalayan sa sandbox, mga filesystem tool na tulad ng sa Codex, at istandardisadong integrasyon sa mga primitive na nagiging karaniwan sa mga frontier na sistema ng agent.

Kabilang sa mga primitive na ito ang paggamit ng tool sa pamamagitan ng MCP(magbubukas sa bagong window), progressive disclosure sa pamamagitan ng mga skill(magbubukas sa bagong window), custom na tagubilin sa pamamagitan ng AGENTS.md(magbubukas sa bagong window), pagpapatupad ng code gamit ang shell(magbubukas sa bagong window) tool, pag-edit ng file gamit ang apply patch(magbubukas sa bagong window) tool, at higit pa. Patuloy na isasama ng harness ang mga bagong agentic pattern at primitive sa paglipas ng panahon, para mas kaunting oras ang magamit ng mga developer sa mga core infrastructure update at mas maraming oras sa domain-specific logic na ginagawang kapaki-pakinabang ang kanilang mga agent.

Diagram na nagpapakita kung paano ikinokonekta ng Agent SDK ang input ng user, mga modelo, at mga tool para bumuo ng mga AI agent.
Diagram na nagpapakita kung paano bumuo ng mga AI agent gamit ang Agent SDK kasama ang mga modelo, tool, at orkestrasyon.

Nakakatulong din ang harness sa mga developer na mas mapakinabangan ang kakayahan ng frontier na modelo sa pamamagitan ng pag-aangkop ng execution sa paraang pinakamahusay gumagana ang mga modelong iyon. Pinapanatili nitong mas malapit ang mga ahente sa natural na pattern ng pagpapatakbo ng modelo, na nagpapabuti sa pagiging maaasahan at pagganap sa mga kumplikadong gawain—lalo na kapag ang trabaho ay matagal nang tumatakbo o pinag-ugnay sa iba't ibang hanay ng mga tool at system.

Bukod pa rito, nauunawaan namin na ang bawat produkto ay natatangi at bihirang magkasya nang maayos sa isang hulmahan. Dinisenyo namin ang Agents SDK para suportahan ang pagkakaibang ito. Nakakakuha ang mga developer ng harness na turnkey pero flexible—na ginagawang madali itong iakma sa sarili nilang stack—kabilang ang paggamit ng tool, memory, at sandbox environment.

Lokal na pagpapatupad ng sandbox

Sinusuportahan ng na-update na Agents SDK ang sandbox execution nang native, para tumakbo ang mga agent sa mga kontroladong computer environment gamit ang mga file, tool, at dependency na kailangan nila para sa gawain.

Maraming kapaki-pakinabang na agent ang nangangailangan ng workspace kung saan maaari silang magbasa at magsulat ng mga file, mag-install ng mga dependency, magpatakbo ng code, at gumamit ng mga tool nang ligtas. Ang suporta sa native sandbox ay nagbibigay sa mga developer ng execution layer na agad-agad, sa halip na pilitin silang pagdugtungin ito nang mag-isa.

Puwedeng gumamit ang mga developer ng sarili nilang sandbox o gamitin ang built-in na suporta para sa Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, at Vercel.

Para gawing portable ang mga environment na iyon sa iba't ibang provider, nagpapakilala rin ang SDK ng Manifest abstraction para ilarawan ang workspace ng agent. Maaaring mag-mount ang mga developer ng mga lokal na file, magtakda ng mga output directory, at magdala ng data mula sa mga storage provider kabilang ang AWS S3, Google Cloud Storage, Azure Blob Storage, at Cloudflare R2.

Nagbibigay ito sa mga developer ng pare-parehong paraan para hubugin ang kapaligiran ng agent mula sa lokal na prototype hanggang sa pag-deploy sa produksyon. Nagbibigay din ito sa modelo ng nahuhulaang workspace: kung saan hahanapin ang mga input, kung saan isusulat ang mga output, at kung paano panatilihing organisado ang trabaho sa isang pangmatagalang gawain.

Mga logo ng Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Paghihiwalay ng harness mula sa compute para sa seguridad, tibay, at pag-scale

Dapat idisenyo ang mga agent system na may palagay na may mangyayaring prompt injection at mga pagtatangkang exfiltration. Nakakatulong ang paghihiwalay ng harness at compute na panatilihing wala ang mga credential sa mga environment kung saan nag-e-execute ang code na binuo ng modelo.

Nagbibigay-daan din ito sa matibay na pagtakbo. Kapag na-externalize ang state ng agent, ang pagkawala ng sandbox container ay hindi nangangahulugang mawawala rin ang pagpapatakbo. Gamit ang built-in na snapshotting at rehydration, maibabalik ng Agents SDK ang state ng agent sa bagong container at magpapatuloy mula sa huling checkpoint kung pumalya o nag-expire ang orihinal na environment.

Sa wakas, ginagawa nitong mas scalable ang mga agent. Maaaring gumamit ng ang mga pagpapatakbo ng agent ng isang sandbox o marami, gumamit lang ng mga sandbox kapag kinakailangan, idirekta ang mga subagent sa mga nakahiwalay na environment, at isagawa ang trabaho nang sabay-sabay sa iba't ibang container para sa mas mabilis na pagpapatupad.

Diagram ng daloy na nagpapakita kung paano binibigyang-daan ng Agent SDK ang mga AI agent na gumamit ng karagdagang compute resources para sa mas komplikadong mga gawain.
Diagram na nagpapakita kung paano makakapag-organisa ang mga AI agent na binuo gamit ang Agent SDK para pamahalaan ang magkakahiwalay na compute system, na nagpapahintulot sa mga workload na mag-run nang hiwalay habang sinusuportahan ang mas advanced na mga gawain.

Pagpepresyo at availability

Ang mga bagong kakayahan ng Agents SDK na ito ay magagamit na para sa lahat ng mga customer sa pamamagitan ng API at gumagamit ng karaniwang pagpepresyo ng API, batay sa mga token at paggamit ng tool.

Ano ang susunod

Habang patuloy naming dine-develop ang Agents SDK, patuloy naming palalawakin ang maaaring buuin ng mga developer gamit ito, ginagawang mas madali ang pagdadala ng mas may kakayahang mga agent sa produksyon nang may mas kaunting custom infrastructure, habang pinananatili ang flexibility at control na kailangan ng mga developer para maiangkop ang mga agent sa sarili nilang mga environment.

Unang inilulunsad sa Python ang mga bagong kakayahan sa harness at sandbox, at nakaplanong suportahan ang TypeScript sa susunod na release. Nagsusumikap din kaming magdala ng mga karagdagang kakayahan ng agent, kabilang ang code mode at mga subagent, sa parehong Python at TypeScript.

Bilang karagdagan, gusto din naming tumulong na mapag-isa ang mas malawak na ecosystem ng agent sa paglipas ng panahon, sa pamamagitan ng suporta para sa mas maraming sandbox provider, mas maraming integrasyon, at mas marami pang paraan para maisaksak ng mga developer ang SDK sa mga tool at system na ginagamit na nila.

May-akda

OpenAI