我們今天隆重推出 AgentKit,為開發者和企業提供一套全方位工具,協助開發、部署和打造最佳智慧體。直至今日,開發智慧體的過程中,還是得使用各種零散工具:沒有版本控管機制的複雜調度程序、自訂連接器、手動評測流程、提示調整,以及正式推出前耗時數週的前端作業。有了 AgentKit,開發者現在能以視覺方式設計工作流程,並運用以下新元件更快速嵌入智慧體使用者介面:
- Agent Builder:視覺化 canvas,用以建立多重智慧體工作流程及控管版本
- Connector Registry:管理員專用集中式平台,用來統一管理各項 OpenAI 產品的資料和工具連接狀態
- ChatKit:一套工具組,用於將可自訂的聊天型智慧體融入產品體驗中
我們也擴充了評測功能,新增資料集、追蹤評分、自動化提示最佳化和第三方模型支援等功能,用來衡量和改善智慧體表現。
自三月推出 Responses API 和 Agents SDK 以來,我們觀察到已有許多開發者和企業針對深入研究、客戶支援和更多應用,打造出完整的工作流程。Klarna 開發了一款支援服務智慧體,可處理三分之二的工單;Clay 則透過銷售智慧體達到了 10 倍成長。AgentKit 以 Responses API 為基礎建構而成,可協助開發者提高智慧體開發的效率及可靠性。
隨著智慧體工作流程越來越複雜,開發者需要更清楚掌握實際運作成效。Agent Builder(在新視窗中開啟) 提供視覺化 canvas,可透過拖放節點來編排邏輯、連接工具,以及設定自訂 guardrail。此外,也支援預覽執行、內嵌式評測設定和完整版本控管,非常適合用於快速迭代流程。

開發者可以從空白 canvas 著手,也能使用預建的範本。
Ramp 團隊從空白 canvas 著手,只花了幾小時就開發出一款採購智慧體:
「Agent Builder 將以往需耗時數月的複雜調度作業、自訂程式碼和手動最佳化工作,濃縮到短短數小時。視覺化 canvas 可讓產品、法務和工程團隊同步協作,讓迭代週期縮短了 70%,智慧體兩週就能上線,不必等上兩季。」
同樣地,日本頂尖科技與網路服務公司 LY Corporation,在不到兩小時內,就運用 Agent Builder 打造出一款工作助理智慧體。
「Agent Builder 讓我們能以全新方式調度智慧體,而且工程師和領域專家可以透過同一個介面協作。我們只花了不到兩小時,就建立了第一套多重智慧體工作流程並實際運作,大幅加快了建立和部署智慧體的時程。」
我們也同時推出 Connector Registry,讓企業用來控管及維護跨工作區和組織的資料。Connector Registry(在新視窗中開啟) 能將分散的眾多資料來源整合至單一管理面板,方便集中管理 ChatGPT 和 API 資料。這套登錄系統包含所有預建的連接器,例如、Dropbox、Google 雲端硬碟、Sharepoint 和 Microsoft Teams,還有第三方 MCP。
開發者也可以在 Agent Builder 中啟用 Guardrail(在新視窗中開啟),這是模組化的開源安全層,可防止智慧體出現非預期或惡意行為。Guardrail 可以遮蔽或標示 PII、偵測越獄手法,以及套用其他安全機制,協助使用者更輕鬆開發和部署安全可靠的智慧體。Guardrail 可以單獨部署,也能透過 Python(在新視窗中開啟) 和 JavaScript(在新視窗中開啟) 的 guardrail 函式庫部署。
為智慧體部署聊天使用者介面其實遠比想像複雜,不僅得處理串流回應、管理對話串、顯示模型思考過程,還得設計具吸引力的聊天體驗。ChatKit 將這一切化繁為簡,能輕鬆將聊天型智慧體嵌入產品中,呈現如原生功能般自然流暢的體驗。無論是應用程式還是網站,都能輕鬆嵌入,還能依據主題或品牌風格進行自訂。
「我們運用 ChatKit 為 Canva 開發者社群打造出一款支援服務智慧體,省下超過兩週的開發時間,並在一小時內完成整合。這款支援服務智慧體將我們的文件轉化為對話式體驗,徹底改變了開發者的互動習慣,如今能更輕鬆在 Canva 上開發應用程式和整合功能。」
ChatKit 已應用在各種情境中,例如內部知識庫助理、入職引導、客戶支援服務和研究智慧體等。HubSpot(在新視窗中開啟) 的客戶支援智慧體就是其中一例:

要打造出能在生產環境中運作的可靠智慧體,需經過嚴謹的效能評測。去年我們推出了 Evals(在新視窗中開啟),協助開發者測試提示和衡量模型的行為。如今我們新增四項新功能,進一步簡化建立評測的流程:
- 資料集:從零開始快速建立智慧體評測,並運用自動化評分器和人工標註機制持續擴充。
- 追蹤評分:對全套智慧體工作流程進行評估,並透過自動化評分程序找出需改進之處。
- 自動化提示最佳化:根據人工標註和評分器輸出結果產生改良版提示。
- 第三方模型支援:在 OpenAI Evals 平台中評測其他供應商的模型。
許多客戶已透過 Evals 顯著提升效能表現。
「透過這個評測平台,我們的多重智慧體盡職調查架構開發時間縮短了 50% 以上,而智慧體準確率提升了 30%。」

開發者可利用強化式微調(在新視窗中開啟) (RFT) 自訂推理模型。此功能已在 OpenAI o4-mini 和 GPT‑5 非公開 Beta 版中全面開放。我們正與數十個客戶密切合作,積極在全面推出之前針對 GPT‑5 進一步完善 RFT。
我們今天在 RFT Beta 版中推出兩項新功能,讓智慧體表現更上一層樓:
- 自訂工具呼叫:訓練模型在適當時機呼叫適用工具,進一步提升推理成效
- 自訂評分器:依照實際應用情境,設定最重要的自訂評估準則
今天起,ChatKit 和 Evals 新功能全面開放所有開發者使用。Agent Builder Beta 版已上線,而 Connector Registry Beta 版正逐步向部分 API、ChatGPT Enterprise 及 Edu 用戶開放,這些客戶具備全域管理控制台 (全域擁有者可在此集中管理網域、單一登入和多個 API 組織)。必須具備全域管理控制台(在新視窗中開啟)才能啟用 Connector Registry。上述所有工具均包含在標準 API 模型定價中。
我們預計在近期推出獨立版 Workflows API,並為 ChatGPT 新增智慧體部署選項。
我們很期待看到您打造的成果。


