2026年4月15日

Agents SDK 的下一步演進

更新後的 Agents SDK 可協助開發人員建立智能代理，以在受控的沙盒環境中檢查檔案、執行指令、編輯程式碼，並處理長期任務。

正在載入...

我們正為 Agents SDK 引入新能力，為開發人員提供標準化基礎設施，不但容易上手，同時以最適合 OpenAI 模型的方式正確構建：包括一個以模型為核心的原生執行框架，讓智能代理可在電腦上跨檔案與工具執行工作，以及原生沙盒執行能力，讓這些工作可安全運行。

例如，開發人員可以為智能代理提供受控工作區、明確指示，以及檢查證據所需的工具：

Python

1# pip install "openai-agents>=0.14.0"
2
3import asyncio
4import tempfile
5from pathlib import Path
6
7from agents import Runner
8from agents.run import RunConfig
9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10from agents.sandbox.entries import LocalDir
11from agents.sandbox.sandboxes import UnixLocalSandboxClient
12
13
14async def main() -> None:
15    with tempfile.TemporaryDirectory() as tmp:
16        dataroom = Path(tmp) / "dataroom"
17        dataroom.mkdir()
18        (dataroom / "metrics.md").write_text(
19            """# Annual metrics
20
21| Year | Revenue | Operating income | Operating cash flow |
22| --- | ---: | ---: | ---: |
23| FY2025 | $124.3M | $18.6M | $24.1M |
24| FY2024 | $98.7M | $12.4M | $17.9M |
25""",
26            encoding="utf-8",
27        )
28
29        agent = SandboxAgent(
30            name="Dataroom Analyst",
31            model="gpt-5.4",
32            instructions="Answer using only files in data/. Cite source filenames.",
33            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34        )
35
36        result = await Runner.run(
37            agent,
38            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39            run_config=RunConfig(
40                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41            ),
42        )
43        print(result.final_output)
44
45
46if __name__ == "__main__":
47    asyncio.run(main())
48

開發人員要建立實用的智能代理，除了最好的模型，還需要能支援智能代理檢查檔案、執行指令、編寫程式碼，並在多個步驟中持續工作的系統。

而現時的系統通常未能應付所有需要，在團隊由原型走向正式環境時，往往需要在不同取捨之間平衡。與模型無關的框架雖然靈活，但未能充分發揮前沿模型的能力；模型供應商提供的 SDK 雖然更貼近模型，但往往欠缺對執行框架的足夠可視性；而代管式智能代理 API 雖然可以簡化部署，卻會限制智能代理可以在哪裡運行，以及如何存取敏感資料。

以下是部分與我們一同測試新 SDK 的客戶意見：

「GPT-5.4 為文件密集型法律工作訂立了新標準。在我們的 BigLaw Bench 評估中，GPT-5.4 的得分為 91%。與其他模型相比，GPT-5.4 目前更擅長整理複雜的交易分析結構、在冗長合約中維持準確性，並交付法律從業人員所需的精準細節。」

— Harvey 應用研究主管 Niko Grupen

更強大的智能代理循環執行框架

隨著今次發佈，Agents SDK 的執行框架在處理文件、檔案和系統的智能代理方面都更加強健。現在 Agents SDK 新增了可設定記憶和可感知沙盒的編排機制、類似 Codex 的檔案系統工具，以及與前沿智能代理系統中越來越常見的基礎元件的標準化整合。

這些基礎元件包括透過 MCP⁠（在新視窗中開啟）使用工具、透過技能⁠（在新視窗中開啟）進行循序式揭示、透過 AGENTS.md⁠（在新視窗中開啟）提供自訂指示，使用 shell⁠（在新視窗中開啟）工具執行程式碼、使用 apply patch⁠（在新視窗中開啟）工具編輯檔案等等。在將來，這個執行框架會持續納入新的智能代理模式與基礎元件，讓開發人員能縮減花在核心基礎設施更新上的時間，同時把更多時間投放於令智能代理真正有用的領域專屬邏輯。

展示 Agent SDK 如何連接用戶輸入、模型與工具，以構建 AI 智能代理的示意圖。

展示如何透過 Agent SDK，配合模型、工具和編排機制來構建 AI 智能代理的示意圖。

這個執行框架亦有助開發人員更充分發揮前沿模型的能力，令執行方式更貼近模型的最佳運作模式。這樣可令智能代理更接近模型的自然操作模式，從而提升複雜任務的可靠性和效能，尤其是在需要長時間執行，或要協調多種工具與系統共同完成工作的情況下。

此外，我們明白每個產品都各有特色，甚少能完全套入單一模式。因此，我們在設計 Agents SDK 時，特別支援這種多樣性。開發人員可以採用即開即用而又靈活的執行框架，方便按自己的技術組合作出調整，包括工具使用、記憶與沙盒環境。

原生沙盒執行

更新後的 Agents SDK 原生支援沙盒執行，讓智能代理可以在受控的電腦環境中運行，並使用完成任務所需的檔案、工具和相依項目。

很很多實用的智能代理，都需要一個工作區，讓它們可以安全地讀寫檔案、安裝相依項目、執行程式碼及使用工具。原生沙盒支援讓開發人員無需自行拼湊整套執行層，也可直接使用。

開發人員可以自備沙盒，亦可使用內建對 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 及 Vercel 的支援。

為了讓這些環境可在不同供應商之間攜帶使用，SDK 亦引入了 Manifest 抽象層，用來描述智能代理的工作區。開發人員可以掛載本機檔案、定義輸出目錄，並從 AWS S3、Google Cloud Storage、Azure Blob Storage 及 Cloudflare R2 等儲存供應商引入資料。

這讓開發人員由本機原型到正式部署，都可以用一致方式設定智能代理的執行環境。同時亦為模型提供一個可預期的工作區：知道去哪裡讀取輸入、把輸出寫到哪裡，以及在長時間執行的任務中如何有條理地持續處理工作。

Daytona、E2B、Modal、Cloudflare、Vercel、Blaxel、Runloop 標誌

將執行框架與運算分離，以確保系統防護、持久性與擴展能力

設計智能代理系統時，應預設會面對提示注入和資料外洩等風險。因此將執行框架與運算分離，有助避免憑證落入模型生成程式碼的執行環境。

這亦有助確保持久執行能力。當智能代理的狀態已移出至外部儲存，即使失去某個沙盒容器，也不代表整個執行流程會中斷。透過內建的快照和還原功能，如果原有的環境失效或到期，Agents SDK 仍然可以在新的容器中恢復智能代理的狀態，並從上一個檢查點繼續執行。

最後，這亦令智能代理更具擴展能力。智能代理執行可以使用一個或多個沙盒，同時只在有需要時調用沙盒，將子智能代理分派到隔離環境，並在多個容器之間並行處理工作，以加快執行速度。

展示 Agent SDK 如何讓 AI 智能代理使用額外運算資源，以處理更複雜任務的流程圖。

展示以 Agent SDK 建立的 AI 智能代理如何編排獨立運算系統，讓各種工作可獨立執行，同時支援更進階任務的示意圖。

收費及提供情況

這些新的 Agents SDK 能力現已透過 API 向所有客戶正式推出，並按標準 API 定價收費，計算方式以 Token 與工具使用量為基礎。

展望將來

隨著我們持續發展 Agents SDK，我們會繼續擴展開發人員可建立的能力，讓他們更容易以更少的自訂基礎設施，將更強大的智能代理帶到正式環境，同時保留所需的靈活性與控制能力，讓智能代理能配合各自的環境運作。

新的執行框架與沙盒能力會首先在 Python 推出，而 TypeScript 支援則計劃於未來版本提供。我們亦正致力把更多智能代理能力帶到 Python 和 TypeScript，當中包括程式碼模式及子智能代理。

此外，我們亦希望隨著時間推移，協助整個更廣泛的智能代理生態系統更緊密整合，支援更多沙盒供應商、更多整合方式，以及讓開發人員可用更多方法，把 SDK 接入他們現時已在使用的工具和系統。

作者

OpenAI

繼續閲讀

查看全部

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 現已成為 Microsoft 365 Copilot 的首選模型

產品2026年7月9日

ChatGPT 現已成為你處理最遠大工作的夥伴

產品2026年7月9日

GPT-5.6：隨你的抱負擴展的前沿智能

產品2026年7月9日