我們為 Agents SDK 推出新功能,提供開發者一套標準化基礎設施,容易上手,並針對 OpenAI 模型最佳化:包含模型原生的執行框架,讓智慧體可在電腦上跨檔案與工具運作,以及可安全執行這些工作的原生沙盒環境。
例如,開發者可以為智慧體提供受控的工作區、明確的指示,以及檢查證據所需的工具:
開發人員要打造實用的智慧體,光靠最佳模型還不夠,還需要能支援智慧體檢查檔案、執行指令、撰寫程式碼,並在多個步驟中持續運作的系統。
現有系統在團隊從原型開發邁向正式上線時,往往需要在各種條件之間做取捨。與模型無關的框架具備彈性,但無法充分發揮前沿模型的能力;模型供應商的 SDK 雖然更貼近模型,但往往缺乏對運作框架的足夠掌握;代管式智慧體 API 雖可簡化部署,卻會限制智慧體的執行位置,以及存取敏感資料的方式。
以下是部分與我們一同測試新版 SDK 的客戶回饋:
「GPT-5.4 為文件密集型法律工作訂立了新標準。在我們的 BigLaw Bench 評估中,GPT-5.4 的得分為 91%。與其他模型相比,GPT-5.4 目前更擅長整理複雜的交易分析結構、在冗長合約中維持準確性,並交付法律從業人員所需的精準細節。」
隨著本次發布,Agents SDK 的運作框架在處理文件、檔案與系統時的能力進一步提升。現在新增可設定的記憶、具沙盒感知的協調機制、類似 Codex 的檔案系統工具,以及與前沿智慧體系統常見基礎元件的標準化整合。
這些基礎元件包括透過 MCP(在新視窗中開啟) 使用工具、透過技能(在新視窗中開啟)進行漸進式揭露、透過 AGENTS.md(在新視窗中開啟) 提供自訂指示,以及使用 shell(在新視窗中開啟) 工具執行程式碼、使用 apply patch(在新視窗中開啟) 工具編輯檔案等。這個執行協調機制會隨時間持續納入新的智慧體模式與基礎元件,讓開發人員減少花在核心基礎架構更新上的時間,並把更多精力投入在讓智慧體真正發揮價值的領域邏輯。
這個執行框架也會讓執行方式更貼近前沿模型最能發揮效能的運作方式,協助開發者更充分發揮前沿模型的能力。這讓智慧體更貼近模型的自然運作模式,進而提升在複雜任務中的可靠性與效能,特別是在需要長時間運作,或需跨多種工具與系統協調時。
此外,我們也明白每項產品各有特性,很少能完全套用既有模式。因此,我們設計 Agents SDK,就是為了支援這種差異。開發人員可使用一套開箱即用且具備彈性的執行框架,能輕鬆依自身技術堆疊調整,包括工具使用、記憶與沙盒環境。
更新後的 Agents SDK 原生支援沙盒執行,讓智慧體能在受控的電腦環境中運作,並使用執行任務所需的檔案、工具與相依套件。
許多實用的智慧體需要一個工作區,能讀寫檔案、安裝相依套件、執行程式碼,並安全使用工具。原生沙盒支援可直接提供這層執行環境,無需開發者自行拼湊。
開發人員可自備沙盒環境,或使用內建支援的 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel。
為了讓這些環境能在不同供應商之間移轉,SDK 也引入 Manifest 抽象層,用於描述智慧體的工作區。開發人員可以掛載本機檔案、定義輸出目錄,並從 AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2 等儲存服務匯入資料。
這讓開發者能以一致方式,從本機原型一路到正式部署,設定智慧體的執行環境。同時也為模型提供可預期的工作區,包括輸入來源、輸出位置,以及在長時間任務中維持有序運作的方式。

智慧體系統在設計時,應預設會遭遇提示注入與資料外洩攻擊。將執行框架與運算資源分離,有助於避免憑證外洩至模型生成程式碼的執行環境。
這個架構也支援可持續執行,讓整個流程不中斷。當智慧體的狀態外部化後,即使失去某個沙盒容器,也不代表整個執行流程會中斷。透過內建的快照與還原機制,若原始環境發生故障或到期,Agents SDK 可在新的容器中還原智慧體狀態,並從上一個檢查點繼續執行。
最後,這也讓智慧體更容易擴展。智慧體的執行可使用一個或多個沙盒,僅在需要時才啟用沙盒,將子智慧體導向隔離環境,並透過跨容器平行處理工作,加快執行速度。
這些 Agents SDK 新功能已全面開放給所有客戶,可透過 API 使用,並採用標準 API 定價,依 Token 與工具使用量計費。
隨著 Agents SDK 持續發展,我們會不斷擴展開發者可打造的能力,讓開發者以更少的自訂基礎架構,就能將更強大的智慧體投入正式環境,同時保有將智慧體整合進自身環境所需的彈性與控制能力。
新的執行框架與沙盒功能將率先在 Python 推出,並預計在未來版本支援 TypeScript。我們也正在努力將更多智慧體功能(包括程式碼模式和子智慧體)帶到 Python 和 TypeScript。
此外,我們也希望逐步強化整個智慧體生態的連結與協作,支援更多沙盒供應商、更多整合方式,以及讓開發者能更靈活地將 SDK 串接到既有工具與系統中。


