跳到主要內容
OpenAI

2026年4月15日

產品

Agents SDK 的下一步演進

更新後的 Agents SDK 可協助開發人員建立智能代理,以在受控的沙盒環境中檢查檔案、執行指令、編輯程式碼,並處理長期任務。

正在載入...

我們正為 Agents SDK 引入新能力,為開發人員提供標準化基礎設施,不但容易上手,同時以最適合 OpenAI 模型的方式正確構建:包括一個以模型為核心的原生執行框架,讓智能代理可在電腦上跨檔案與工具執行工作,以及原生沙盒執行能力,讓這些工作可安全運行。

例如,開發人員可以為智能代理提供受控工作區、明確指示,以及檢查證據所需的工具:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

開發人員要建立實用的智能代理,除了最好的模型,還需要能支援智能代理檢查檔案、執行指令、編寫程式碼,並在多個步驟中持續工作的系統。

而現時的系統通常未能應付所有需要,在團隊由原型走向正式環境時,往往需要在不同取捨之間平衡。與模型無關的框架雖然靈活,但未能充分發揮前沿模型的能力;模型供應商提供的 SDK 雖然更貼近模型,但往往欠缺對執行框架的足夠可視性;而代管式智能代理 API 雖然可以簡化部署,卻會限制智能代理可以在哪裡運行,以及如何存取敏感資料。

以下是部分與我們一同測試新 SDK 的客戶意見:

「GPT-5.4 為文件密集型法律工作訂立了新標準。在我們的 BigLaw Bench 評估中,GPT-5.4 的得分為 91%。與其他模型相比,GPT-5.4 目前更擅長整理複雜的交易分析結構、在冗長合約中維持準確性,並交付法律從業人員所需的精準細節。」
— Harvey 應用研究主管 Niko Grupen

更強大的智能代理循環執行框架

隨著今次發佈,Agents SDK 的執行框架在處理文件、檔案和系統的智能代理方面都更加強健。現在 Agents SDK 新增了可設定記憶和可感知沙盒的編排機制、類似 Codex 的檔案系統工具,以及與前沿智能代理系統中越來越常見的基礎元件的標準化整合。

這些基礎元件包括透過 MCP(在新視窗中開啟) 使用工具、透過技能(在新視窗中開啟)進行循序式揭示、透過 AGENTS.md(在新視窗中開啟) 提供自訂指示,使用 shell(在新視窗中開啟) 工具執行程式碼、使用 apply patch(在新視窗中開啟) 工具編輯檔案等等。在將來,這個執行框架會持續納入新的智能代理模式與基礎元件,讓開發人員能縮減花在核心基礎設施更新上的時間,同時把更多時間投放於令智能代理真正有用的領域專屬邏輯。

展示 Agent SDK 如何連接用戶輸入、模型與工具,以構建 AI 智能代理的示意圖。
展示如何透過 Agent SDK,配合模型、工具和編排機制來構建 AI 智能代理的示意圖。

這個執行框架亦有助開發人員更充分發揮前沿模型的能力,令執行方式更貼近模型的最佳運作模式。這樣可令智能代理更接近模型的自然操作模式,從而提升複雜任務的可靠性和效能,尤其是在需要長時間執行,或要協調多種工具與系統共同完成工作的情況下。

此外,我們明白每個產品都各有特色,甚少能完全套入單一模式。因此,我們在設計 Agents SDK 時,特別支援這種多樣性。開發人員可以採用即開即用而又靈活的執行框架,方便按自己的技術組合作出調整,包括工具使用、記憶與沙盒環境。

原生沙盒執行

更新後的 Agents SDK 原生支援沙盒執行,讓智能代理可以在受控的電腦環境中運行,並使用完成任務所需的檔案、工具和相依項目。

很很多實用的智能代理,都需要一個工作區,讓它們可以安全地讀寫檔案、安裝相依項目、執行程式碼及使用工具。原生沙盒支援讓開發人員無需自行拼湊整套執行層,也可直接使用。

開發人員可以自備沙盒,亦可使用內建對 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 及 Vercel 的支援。

為了讓這些環境可在不同供應商之間攜帶使用,SDK 亦引入了 Manifest 抽象層,用來描述智能代理的工作區。開發人員可以掛載本機檔案、定義輸出目錄,並從 AWS S3、Google Cloud Storage、Azure Blob Storage 及 Cloudflare R2 等儲存供應商引入資料。

這讓開發人員由本機原型到正式部署,都可以用一致方式設定智能代理的執行環境。同時亦為模型提供一個可預期的工作區:知道去哪裡讀取輸入、把輸出寫到哪裡,以及在長時間執行的任務中如何有條理地持續處理工作。

Daytona、E2B、Modal、Cloudflare、Vercel、Blaxel、Runloop 標誌

將執行框架與運算分離,以確保系統防護、持久性與擴展能力

設計智能代理系統時,應預設會面對提示注入和資料外洩等風險。因此將執行框架與運算分離,有助避免憑證落入模型生成程式碼的執行環境。

這亦有助確保持久執行能力。當智能代理的狀態已移出至外部儲存,即使失去某個沙盒容器,也不代表整個執行流程會中斷。透過內建的快照和還原功能,如果原有的環境失效或到期,Agents SDK 仍然可以在新的容器中恢復智能代理的狀態,並從上一個檢查點繼續執行。

最後,這亦令智能代理更具擴展能力。智能代理執行可以使用一個或多個沙盒,同時只在有需要時調用沙盒,將子智能代理分派到隔離環境,並在多個容器之間並行處理工作,以加快執行速度。

展示 Agent SDK 如何讓 AI 智能代理使用額外運算資源,以處理更複雜任務的流程圖。
展示以 Agent SDK 建立的 AI 智能代理如何編排獨立運算系統,讓各種工作可獨立執行,同時支援更進階任務的示意圖。

收費及提供情況

這些新的 Agents SDK 能力現已透過 API 向所有客戶正式推出,並按標準 API 定價收費,計算方式以 Token 與工具使用量為基礎。

展望將來

隨著我們持續發展 Agents SDK,我們會繼續擴展開發人員可建立的能力,讓他們更容易以更少的自訂基礎設施,將更強大的智能代理帶到正式環境,同時保留所需的靈活性與控制能力,讓智能代理能配合各自的環境運作。

新的執行框架與沙盒能力會首先在 Python 推出,而 TypeScript 支援則計劃於未來版本提供。我們亦正致力把更多智能代理能力帶到 Python 和 TypeScript,當中包括程式碼模式及子智能代理。

此外,我們亦希望隨著時間推移,協助整個更廣泛的智能代理生態系統更緊密整合,支援更多沙盒供應商、更多整合方式,以及讓開發人員可用更多方法,把 SDK 接入他們現時已在使用的工具和系統。

作者

OpenAI