2025年10月6日

隆重推出 AgentKit

協助開發、部署和最佳化智慧體的全新工具。

載入中…

我們今天隆重推出 AgentKit，為開發者和企業提供一套全方位工具，協助開發、部署和打造最佳智慧體。直至今日，開發智慧體的過程中，還是得使用各種零散工具：沒有版本控管機制的複雜調度程序、自訂連接器、手動評測流程、提示調整，以及正式推出前耗時數週的前端作業。有了 AgentKit，開發者現在能以視覺方式設計工作流程，並運用以下新元件更快速嵌入智慧體使用者介面：

Agent Builder：視覺化 canvas，用以建立多重智慧體工作流程及控管版本
Connector Registry：管理員專用集中式平台，用來統一管理各項 OpenAI 產品的資料和工具連接狀態
ChatKit：一套工具組，用於將可自訂的聊天型智慧體融入產品體驗中

我們也擴充了評測功能，新增資料集、追蹤評分、自動化提示最佳化和第三方模型支援等功能，用來衡量和改善智慧體表現。

自三月推出 Responses API 和 Agents SDK⁠ 以來，我們觀察到已有許多開發者和企業針對深入研究、客戶支援和更多應用，打造出完整的工作流程。Klarna 開發了一款支援服務智慧體⁠，可處理三分之二的工單；Clay 則透過銷售智慧體達到了 10 倍成長⁠。AgentKit 以 Responses API 為基礎建構而成，可協助開發者提高智慧體開發的效率及可靠性。

運用 Agent Builder 設計工作流程

隨著智慧體工作流程越來越複雜，開發者需要更清楚掌握實際運作成效。Agent Builder⁠(在新視窗中開啟) 提供視覺化 canvas，可透過拖放節點來編排邏輯、連接工具，以及設定自訂 guardrail。此外，也支援預覽執行、內嵌式評測設定和完整版本控管，非常適合用於快速迭代流程。

視覺化建置工具介面的畫面，顯示客戶服務自動化流程。canvas 呈現連接的節點，分別標示為「開始」、「越獄 guardrail」、「分類智慧體」、「If/else」、「返回智慧體」、「保留智慧體」、「資訊智慧體」、「幻覺 guardrail」和「結束」。左方的側邊欄列出可用的節點類型，例如「智慧體」、「筆記」、「檔案搜尋」、「Guardrail」、「MCP」和「使用者核准」。頂端控制選項包含「評估」、「程式碼」、「預覽」和「發佈」。

開發者可以從空白 canvas 著手，也能使用預建的範本。

Ramp 團隊從空白 canvas 著手，只花了幾小時就開發出一款採購智慧體：

「Agent Builder 將以往需耗時數月的複雜調度作業、自訂程式碼和手動最佳化工作，濃縮到短短數小時。視覺化 canvas 可讓產品、法務和工程團隊同步協作，讓迭代週期縮短了 70%，智慧體兩週就能上線，不必等上兩季。」

— Ramp

同樣地，日本頂尖科技與網路服務公司 LY Corporation，在不到兩小時內，就運用 Agent Builder 打造出一款工作助理智慧體。

「Agent Builder 讓我們能以全新方式調度智慧體，而且工程師和領域專家可以透過同一個介面協作。我們只花了不到兩小時，就建立了第一套多重智慧體工作流程並實際運作，大幅加快了建立和部署智慧體的時程。」

— LY Corporation

我們也同時推出 Connector Registry，讓企業用來控管及維護跨工作區和組織的資料。Connector Registry⁠(在新視窗中開啟) 能將分散的眾多資料來源整合至單一管理面板，方便集中管理 ChatGPT 和 API 資料。這套登錄系統包含所有預建的連接器，例如、Dropbox、Google 雲端硬碟、Sharepoint 和 Microsoft Teams，還有第三方 MCP。

開發者也可以在 Agent Builder 中啟用 Guardrail⁠(在新視窗中開啟)，這是模組化的開源安全層，可防止智慧體出現非預期或惡意行為。Guardrail 可以遮蔽或標示 PII、偵測越獄手法，以及套用其他安全機制，協助使用者更輕鬆開發和部署安全可靠的智慧體。Guardrail 可以單獨部署，也能透過 Python⁠(在新視窗中開啟) 和 JavaScript⁠(在新視窗中開啟) 的 guardrail 函式庫部署。

透過 ChatKit 嵌入智慧體聊天體驗

為智慧體部署聊天使用者介面其實遠比想像複雜，不僅得處理串流回應、管理對話串、顯示模型思考過程，還得設計具吸引力的聊天體驗。ChatKit 將這一切化繁為簡，能輕鬆將聊天型智慧體嵌入產品中，呈現如原生功能般自然流暢的體驗。無論是應用程式還是網站，都能輕鬆嵌入，還能依據主題或品牌風格進行自訂。

「我們運用 ChatKit 為 Canva 開發者社群打造出一款支援服務智慧體，省下超過兩週的開發時間，並在一小時內完成整合。這款支援服務智慧體將我們的文件轉化為對話式體驗，徹底改變了開發者的互動習慣，如今能更輕鬆在 Canva 上開發應用程式和整合功能。」

— Canva

ChatKit 已應用在各種情境中，例如內部知識庫助理、入職引導、客戶支援服務和研究智慧體等。HubSpot⁠(在新視窗中開啟) 的客戶支援智慧體就是其中一例：

Ramp 平台的儀表板畫面，顯示支出管理介面。主面板向使用者 Daniel 打招呼，並列出多項申請，例如「申請 ChatGPT Business」(待審閱) 和「申請 HubSpot」(草稿)，以及航班、共乘和軟體的近期支出。右方打開一份 ChatGPT Business 軟體申請表，詳細列出從 2025 年 10 月 1 日至 2026 年 10 月 1 日，5 個名額每月 125 美元，並顯示一個黃色的「提交申請」按鈕。

透過全新 Evals 功能衡量智慧體表現

要打造出能在生產環境中運作的可靠智慧體，需經過嚴謹的效能評測。去年我們推出了 Evals⁠(在新視窗中開啟)，協助開發者測試提示和衡量模型的行為。如今我們新增四項新功能，進一步簡化建立評測的流程：

資料集：從零開始快速建立智慧體評測，並運用自動化評分器和人工標註機制持續擴充。
追蹤評分：對全套智慧體工作流程進行評估，並透過自動化評分程序找出需改進之處。
自動化提示最佳化：根據人工標註和評分器輸出結果產生改良版提示。
第三方模型支援：在 OpenAI Evals 平台中評測其他供應商的模型。

許多客戶已透過 Evals 顯著提升效能表現。

「透過這個評測平台，我們的多重智慧體盡職調查架構開發時間縮短了 50% 以上，而智慧體準確率提升了 30%。」

— Carlyle

介面顯示一個資料集表格，直欄包含「評分」、「語氣」、「回饋」和「準確率」。橫列顯示大拇指向上或向下的圖示、語氣標籤 (「專業」、「友善」、「無禮」和「不良」)，以及以 3.5 分為分界的準確率結果「通過」或「未通過」。頂端工具列中的選項包括「上傳」、「欄」、「評分」、「產生輸出」和「儲存」。

透過強化式微調提高智慧體效能

開發者可利用強化式微調⁠(在新視窗中開啟) (RFT) 自訂推理模型。此功能已在 OpenAI o4-mini 和 GPT‑5 非公開 Beta 版中全面開放。我們正與數十個客戶密切合作，積極在全面推出之前針對 GPT‑5 進一步完善 RFT。

我們今天在 RFT Beta 版中推出兩項新功能，讓智慧體表現更上一層樓：

自訂工具呼叫：訓練模型在適當時機呼叫適用工具，進一步提升推理成效
自訂評分器：依照實際應用情境，設定最重要的自訂評估準則

定價與可用性

今天起，ChatKit 和 Evals 新功能全面開放所有開發者使用。Agent Builder Beta 版已上線，而 Connector Registry Beta 版正逐步向部分 API、ChatGPT Enterprise 及 Edu 用戶開放，這些客戶具備全域管理控制台 (全域擁有者可在此集中管理網域、單一登入和多個 API 組織)。必須具備全域管理控制台⁠(在新視窗中開啟)才能啟用 Connector Registry。上述所有工具均包含在標準 API 模型定價中。

我們預計在近期推出獨立版 Workflows API，並為 ChatGPT 新增智慧體部署選項。

我們很期待看到您打造的成果。

作者

OpenAI

繼續閱讀

檢視全部

以 GPT-5.6 推進價格效能前沿

產品2026年7月30日

ChatGPT 的「健康」功能登場

產品2026年7月23日

隆重推出 OpenAI Presence

產品2026年7月22日