跳至主要內容
OpenAI

2025年10月6日

產品

隆重推出 AgentKit

協助開發、部署和最佳化智慧體的全新工具。

載入中…

我們今天隆重推出 AgentKit,為開發者和企業提供一套全方位工具,協助開發、部署和打造最佳智慧體。直至今日,開發智慧體的過程中,還是得使用各種零散工具:沒有版本控管機制的複雜調度程序、自訂連接器、手動評測流程、提示調整,以及正式推出前耗時數週的前端作業。有了 AgentKit,開發者現在能以視覺方式設計工作流程,並運用以下新元件更快速嵌入智慧體使用者介面:

  • Agent Builder:視覺化 canvas,用以建立多重智慧體工作流程及控管版本
  • Connector Registry:管理員專用集中式平台,用來統一管理各項 OpenAI 產品的資料和工具連接狀態
  • ChatKit:一套工具組,用於將可自訂的聊天型智慧體融入產品體驗中

我們也擴充了評測功能,新增資料集、追蹤評分、自動化提示最佳化和第三方模型支援等功能,用來衡量和改善智慧體表現。

自三月推出 Responses API 和 Agents SDK 以來,我們觀察到已有許多開發者和企業針對深入研究、客戶支援和更多應用,打造出完整的工作流程。Klarna 開發了一款支援服務智慧體,可處理三分之二的工單;Clay 則透過銷售智慧體達到了 10 倍成長。AgentKit 以 Responses API 為基礎建構而成,可協助開發者提高智慧體開發的效率及可靠性。

運用 Agent Builder 設計工作流程

隨著智慧體工作流程越來越複雜,開發者需要更清楚掌握實際運作成效。Agent Builder(在新視窗中開啟) 提供視覺化 canvas,可透過拖放節點來編排邏輯、連接工具,以及設定自訂 guardrail。此外,也支援預覽執行、內嵌式評測設定和完整版本控管,非常適合用於快速迭代流程。

視覺化建置工具介面的畫面,顯示客戶服務自動化流程。canvas 呈現連接的節點,分別標示為「開始」、「越獄 guardrail」、「分類智慧體」、「If/else」、「返回智慧體」、「保留智慧體」、「資訊智慧體」、「幻覺 guardrail」和「結束」。左方的側邊欄列出可用的節點類型,例如「智慧體」、「筆記」、「檔案搜尋」、「Guardrail」、「MCP」和「使用者核准」。頂端控制選項包含「評估」、「程式碼」、「預覽」和「發佈」。

開發者可以從空白 canvas 著手,也能使用預建的範本。

Ramp 團隊從空白 canvas 著手,只花了幾小時就開發出一款採購智慧體:

「Agent Builder 將以往需耗時數月的複雜調度作業、自訂程式碼和手動最佳化工作,濃縮到短短數小時。視覺化 canvas 可讓產品、法務和工程團隊同步協作,讓迭代週期縮短了 70%,智慧體兩週就能上線,不必等上兩季。」
— Ramp

同樣地,日本頂尖科技與網路服務公司 LY Corporation,在不到兩小時內,就運用 Agent Builder 打造出一款工作助理智慧體。

「Agent Builder 讓我們能以全新方式調度智慧體,而且工程師和領域專家可以透過同一個介面協作。我們只花了不到兩小時,就建立了第一套多重智慧體工作流程並實際運作,大幅加快了建立和部署智慧體的時程。」
— LY Corporation

我們也同時推出 Connector Registry,讓企業用來控管及維護跨工作區和組織的資料。Connector Registry(在新視窗中開啟) 能將分散的眾多資料來源整合至單一管理面板,方便集中管理 ChatGPT 和 API 資料。這套登錄系統包含所有預建的連接器,例如、Dropbox、Google 雲端硬碟、Sharepoint 和 Microsoft Teams,還有第三方 MCP。

開發者也可以在 Agent Builder 中啟用 Guardrail(在新視窗中開啟),這是模組化的開源安全層,可防止智慧體出現非預期或惡意行為。Guardrail 可以遮蔽或標示 PII、偵測越獄手法,以及套用其他安全機制,協助使用者更輕鬆開發和部署安全可靠的智慧體。Guardrail 可以單獨部署,也能透過 Python(在新視窗中開啟)JavaScript(在新視窗中開啟) 的 guardrail 函式庫部署。

透過 ChatKit 嵌入智慧體聊天體驗

為智慧體部署聊天使用者介面其實遠比想像複雜,不僅得處理串流回應、管理對話串、顯示模型思考過程,還得設計具吸引力的聊天體驗。ChatKit 將這一切化繁為簡,能輕鬆將聊天型智慧體嵌入產品中,呈現如原生功能般自然流暢的體驗。無論是應用程式還是網站,都能輕鬆嵌入,還能依據主題或品牌風格進行自訂。

「我們運用 ChatKit 為 Canva 開發者社群打造出一款支援服務智慧體,省下超過兩週的開發時間,並在一小時內完成整合。這款支援服務智慧體將我們的文件轉化為對話式體驗,徹底改變了開發者的互動習慣,如今能更輕鬆在 Canva 上開發應用程式和整合功能。」
— Canva

ChatKit 已應用在各種情境中,例如內部知識庫助理、入職引導、客戶支援服務和研究智慧體等。HubSpot(在新視窗中開啟) 的客戶支援智慧體就是其中一例:

Ramp 平台的儀表板畫面,顯示支出管理介面。主面板向使用者 Daniel 打招呼,並列出多項申請,例如「申請 ChatGPT Business」(待審閱) 和「申請 HubSpot」(草稿),以及航班、共乘和軟體的近期支出。右方打開一份 ChatGPT Business 軟體申請表,詳細列出從 2025 年 10 月 1 日至 2026 年 10 月 1 日,5 個名額每月 125 美元,並顯示一個黃色的「提交申請」按鈕。

透過全新 Evals 功能衡量智慧體表現

要打造出能在生產環境中運作的可靠智慧體,需經過嚴謹的效能評測。去年我們推出了 Evals(在新視窗中開啟),協助開發者測試提示和衡量模型的行為。如今我們新增四項新功能,進一步簡化建立評測的流程:

  • 資料集:從零開始快速建立智慧體評測,並運用自動化評分器和人工標註機制持續擴充。
  • 追蹤評分:對全套智慧體工作流程進行評估,並透過自動化評分程序找出需改進之處。
  • 自動化提示最佳化:根據人工標註和評分器輸出結果產生改良版提示。
  • 第三方模型支援:在 OpenAI Evals 平台中評測其他供應商的模型。

許多客戶已透過 Evals 顯著提升效能表現。

「透過這個評測平台,我們的多重智慧體盡職調查架構開發時間縮短了 50% 以上,而智慧體準確率提升了 30%。」
— Carlyle
介面顯示一個資料集表格,直欄包含「評分」、「語氣」、「回饋」和「準確率」。橫列顯示大拇指向上或向下的圖示、語氣標籤 (「專業」、「友善」、「無禮」和「不良」),以及以 3.5 分為分界的準確率結果「通過」或「未通過」。頂端工具列中的選項包括「上傳」、「欄」、「評分」、「產生輸出」和「儲存」。

透過強化式微調提高智慧體效能

開發者可利用強化式微調(在新視窗中開啟) (RFT) 自訂推理模型。此功能已在 OpenAI o4-mini 和 GPT‑5 非公開 Beta 版中全面開放。我們正與數十個客戶密切合作,積極在全面推出之前針對 GPT‑5 進一步完善 RFT。

我們今天在 RFT Beta 版中推出兩項新功能,讓智慧體表現更上一層樓:

  • 自訂工具呼叫:訓練模型在適當時機呼叫適用工具,進一步提升推理成效 
  • 自訂評分器:依照實際應用情境,設定最重要的自訂評估準則

定價與可用性

今天起,ChatKit 和 Evals 新功能全面開放所有開發者使用。Agent Builder Beta 版已上線,而 Connector Registry Beta 版正逐步向部分 API、ChatGPT Enterprise 及 Edu 用戶開放,這些客戶具備全域管理控制台 (全域擁有者可在此集中管理網域、單一登入和多個 API 組織)。必須具備全域管理控制台(在新視窗中開啟)才能啟用 Connector Registry。上述所有工具均包含在標準 API 模型定價中。

我們預計在近期推出獨立版 Workflows API,並為 ChatGPT 新增智慧體部署選項。

我們很期待看到您打造的成果。

作者

OpenAI