我們正為 Agents SDK 引入新能力,為開發人員提供標準化基礎設施,不但容易上手,同時以最適合 OpenAI 模型的方式正確構建:包括一個以模型為核心的原生執行框架,讓智能代理可在電腦上跨檔案與工具執行工作,以及原生沙盒執行能力,讓這些工作可安全運行。
例如,開發人員可以為智能代理提供受控工作區、明確指示,以及檢查證據所需的工具:
開發人員要建立實用的智能代理,除了最好的模型,還需要能支援智能代理檢查檔案、執行指令、編寫程式碼,並在多個步驟中持續工作的系統。
而現時的系統通常未能應付所有需要,在團隊由原型走向正式環境時,往往需要在不同取捨之間平衡。與模型無關的框架雖然靈活,但未能充分發揮前沿模型的能力;模型供應商提供的 SDK 雖然更貼近模型,但往往欠缺對執行框架的足夠可視性;而代管式智能代理 API 雖然可以簡化部署,卻會限制智能代理可以在哪裡運行,以及如何存取敏感資料。
以下是部分與我們一同測試新 SDK 的客戶意見:
「GPT-5.4 為文件密集型法律工作訂立了新標準。在我們的 BigLaw Bench 評估中,GPT-5.4 的得分為 91%。與其他模型相比,GPT-5.4 目前更擅長整理複雜的交易分析結構、在冗長合約中維持準確性,並交付法律從業人員所需的精準細節。」
隨著今次發佈,Agents SDK 的執行框架在處理文件、檔案和系統的智能代理方面都更加強健。現在 Agents SDK 新增了可設定記憶和可感知沙盒的編排機制、類似 Codex 的檔案系統工具,以及與前沿智能代理系統中越來越常見的基礎元件的標準化整合。
這些基礎元件包括透過 MCP(在新視窗中開啟) 使用工具、透過技能(在新視窗中開啟)進行循序式揭示、透過 AGENTS.md(在新視窗中開啟) 提供自訂指示,使用 shell(在新視窗中開啟) 工具執行程式碼、使用 apply patch(在新視窗中開啟) 工具編輯檔案等等。在將來,這個執行框架會持續納入新的智能代理模式與基礎元件,讓開發人員能縮減花在核心基礎設施更新上的時間,同時把更多時間投放於令智能代理真正有用的領域專屬邏輯。
這個執行框架亦有助開發人員更充分發揮前沿模型的能力,令執行方式更貼近模型的最佳運作模式。這樣可令智能代理更接近模型的自然操作模式,從而提升複雜任務的可靠性和效能,尤其是在需要長時間執行,或要協調多種工具與系統共同完成工作的情況下。
此外,我們明白每個產品都各有特色,甚少能完全套入單一模式。因此,我們在設計 Agents SDK 時,特別支援這種多樣性。開發人員可以採用即開即用而又靈活的執行框架,方便按自己的技術組合作出調整,包括工具使用、記憶與沙盒環境。
更新後的 Agents SDK 原生支援沙盒執行,讓智能代理可以在受控的電腦環境中運行,並使用完成任務所需的檔案、工具和相依項目。
很很多實用的智能代理,都需要一個工作區,讓它們可以安全地讀寫檔案、安裝相依項目、執行程式碼及使用工具。原生沙盒支援讓開發人員無需自行拼湊整套執行層,也可直接使用。
開發人員可以自備沙盒,亦可使用內建對 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 及 Vercel 的支援。
為了讓這些環境可在不同供應商之間攜帶使用,SDK 亦引入了 Manifest 抽象層,用來描述智能代理的工作區。開發人員可以掛載本機檔案、定義輸出目錄,並從 AWS S3、Google Cloud Storage、Azure Blob Storage 及 Cloudflare R2 等儲存供應商引入資料。
這讓開發人員由本機原型到正式部署,都可以用一致方式設定智能代理的執行環境。同時亦為模型提供一個可預期的工作區:知道去哪裡讀取輸入、把輸出寫到哪裡,以及在長時間執行的任務中如何有條理地持續處理工作。

設計智能代理系統時,應預設會面對提示注入和資料外洩等風險。因此將執行框架與運算分離,有助避免憑證落入模型生成程式碼的執行環境。
這亦有助確保持久執行能力。當智能代理的狀態已移出至外部儲存,即使失去某個沙盒容器,也不代表整個執行流程會中斷。透過內建的快照和還原功能,如果原有的環境失效或到期,Agents SDK 仍然可以在新的容器中恢復智能代理的狀態,並從上一個檢查點繼續執行。
最後,這亦令智能代理更具擴展能力。智能代理執行可以使用一個或多個沙盒,同時只在有需要時調用沙盒,將子智能代理分派到隔離環境,並在多個容器之間並行處理工作,以加快執行速度。
這些新的 Agents SDK 能力現已透過 API 向所有客戶正式推出,並按標準 API 定價收費,計算方式以 Token 與工具使用量為基礎。
隨著我們持續發展 Agents SDK,我們會繼續擴展開發人員可建立的能力,讓他們更容易以更少的自訂基礎設施,將更強大的智能代理帶到正式環境,同時保留所需的靈活性與控制能力,讓智能代理能配合各自的環境運作。
新的執行框架與沙盒能力會首先在 Python 推出,而 TypeScript 支援則計劃於未來版本提供。我們亦正致力把更多智能代理能力帶到 Python 和 TypeScript,當中包括程式碼模式及子智能代理。
此外,我們亦希望隨著時間推移,協助整個更廣泛的智能代理生態系統更緊密整合,支援更多沙盒供應商、更多整合方式,以及讓開發人員可用更多方法,把 SDK 接入他們現時已在使用的工具和系統。


