2025年5月21日

Responses API 的新工具及功能

在 Responses API 中為開發人員及企業用戶引入遠端 MCP 伺服器支援、圖像產生、程式碼執行器及更多功能。

載入中…

今天，我們在 Responses API (我們打造代理應用程式的核心 API 原件 ) 中新增了多項內建工具。其中包含支援所有遠端模型上下文協定 (Model Context Protocol，簡稱 MCP) 伺服器⁠(在新視窗中開啟)以及類似圖像產生⁠(在新視窗中開啟)、程式碼執行器⁠(在新視窗中開啟)檔案搜尋改良版等工具⁠(在新視窗中開啟)。這些工具現已可用於 GPT‑4o 系列、GPT‑4.1 系列及 OpenAI o 系列推理模型。o3 及 o4-mini 現在可以在 Responses API 中直接於思考鏈內呼叫工具及函式，進而產生更具上下文關聯性的回答。使用 o3 及 o4-mini 搭配 Responses API 可在請求及工具呼叫間保留推理權杖，提升模型智慧，同時降低開發成本及延遲時間。

我們也為企業及開發人員在 Responses API 中引入可提升可靠性、可見性及隱私權的新功能。這些功能包括可非同步處理長時間任務並提升穩定性的背景模式⁠(在新視窗中開啟)、推理摘要支援⁠(在新視窗中開啟)及及加密推理項目支援⁠(在新視窗中開啟)等。

自 2025 年 3 月推出初版 Responses API (包含 Web 搜尋、檔案搜尋與電腦使用等工具) 以來，已有數十萬名開發人員使用該 API 在我們的模型上處理數兆個權杖。客戶透過 API 構建了各式代理應用程式，包括 Zencoder⁠(在新視窗中開啟) 的程式代理、Revi⁠(在新視窗中開啟) 的私募股權與投資銀行市場情報代理，以及 MagicSchool AI⁠(在新視窗中開啟) 的教育助理—這些應用皆運用 Web 搜尋功能將即時資訊整合至應用程式中。隨著今日新工具及功能的釋出，開發人員現在能構建更實用且可靠的代理程式。

新增遠端 MCP 伺服器支援

我們在 Responses API 中新增對遠端 MCP 伺服器⁠(在新視窗中開啟)的支援，進一步擴展原先在 Agents SDK 中的 MCP 功能⁠(在新視窗中開啟)。MCP 是對應用程式如何向 LLM 提供上下文進行標準化的開放協議。透過在 Responses API 支援 MCP 伺服器，開發人員僅需幾行程式碼，即可將我們的模型與任何 MCP 伺服器上託管的工具連接。以下是開發人員今日可如何搭配 Responses API 使用遠端 MCP 伺服器的一些範例：

Python

1response = client.responses.create(
2  model="gpt-4.1",
3  tools=[{
4    "type": "mcp",
5    "server_label": "shopify",
6    "server_url": "https://pitchskin.com/api/mcp",
7  }],
8  input="Add the Blemish Toner Pads to my cart"
9)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

熱門遠端 MCP 伺服器包括：Cloudflare⁠(在新視窗中開啟)、Hu、pot⁠(在新視窗中開啟)、Intercom⁠(在新視窗中開啟)、PayPal⁠(在新視窗中開啟)、Plaid⁠(在新視窗中開啟)、Shopify⁠(在新視窗中開啟)、Stripe⁠(在新視窗中開啟), Square⁠(在新視窗中開啟)、Twilio⁠(在新視窗中開啟)、Zapier⁠(在新視窗中開啟) 等等。我們預期遠端 MCP 伺服器的生態系統將在未來幾個月快速成長，使開發人員更容易打造可連接至現有工具與資料來源的強大代理程式。為了更有效支援本生態系統並協助這項開放標準的發展，OpenAI 也加入了 MCP 的指導委員會。

若要了解如何自行架設遠端 MCP 伺服器，請參考 Cloudflare⁠(在新視窗中開啟) 提供的指南。若要了解如何於 Responses API 中使用 MCP 工具，請參考我們 API Cookbook 中的指南⁠(在新視窗中開啟)。

圖像產生、程式碼執行器及檔案搜尋的更新

透過 Responses API 中的內建工具，開發人員只需一次 API 呼叫，即可輕鬆建立功能更強的代理程式。透過在推理過程中呼叫多項工具，模型在如 Humanity’s Last Exam 等業界標準評測 (source) 上的工具使用表現大幅提升。今天我們新增了以下工具：

圖片生成：除了可使用 Images API⁠(在新視窗中開啟)，開發人員現在也可以在 Responses API 中，將我們最新的圖像生成模型 (gpt-image-1) 作為工具使用。這項工具支援即時串流功能，讓開發人員在圖像產生過程中即可預覽畫面；同時也支援多輪編輯，開發人員可逐步提示模型進行細緻調整。深入瞭解⁠(在新視窗中開啟)。
程式碼解譯器開發人員現在可在 Responses API 中使用程式碼執行器⁠(在新視窗中開啟)。這項工具適用於資料分析、解決複雜的數學與程式問題，並幫助模型深入理解及操作圖像 (例如圖像思維)。像 o3 及 o4-mini 這類模型在其思考鏈中使用 Code Interpreter 工具的能力，已在多項基準測試中提升效能，包括 Humanity’s Last Exam (source)。深入瞭解⁠(在新視窗中開啟)。
檔案搜尋開發人員現在也可在我們的推理模型中存取檔案搜尋⁠(在新視窗中開啟)工具。檔案搜尋可讓開發人員根據用戶查詢，從文件中擷取相關片段納入模型上下文。我們也推出檔案搜尋工具的更新，支援橫跨多個向量儲存庫的搜尋，並支援使用陣列進行屬性篩選。深入瞭解⁠(在新視窗中開啟)。

Responses API 的新功能

除了新增的工具外，我們也為 Responses API 加入以下新功能，包括：

背景模式：如 Codex、deep research 與 Operator 等代理產品所示，推理模型可能需花數分鐘解決複雜問題。開發人員現在可在像 o3 這樣的模型上使用背景模式打造類似體驗，不必擔心逾時或其他連接問題—背景模式會非同步啟動這些任務。開發人員可輪詢這些任務物件以確認是否完成，或在應用程式需要更新狀態時啟動事件串流。深入瞭解⁠(在新視窗中開啟)。

Python

1response = client.responses.create(
2  model="o3",
3  input="Write me an extremely long story.",
4  reasoning={ "effort": "high" },
5  background=True
6)

推理摘要：Responses API 現可產生模型內部思考鏈的簡潔自然語言摘要，類似於您在 ChatGPT 中看到的內容。這讓開發人員更容易除錯、稽核並打造更好的終端用戶體驗。推理摘要不另收費。深入瞭解⁠(在新視窗中開啟)。

Python

1response = client.responses.create(
2    model="o4-mini",
3    tools=[
4        {
5            "type": "code_interpreter",
6            "container": {"type": "auto"}
7        }
8    ],
9    instructions=(
10        "You are a personal math tutor. "
11        "When asked a math question, run code to answer the question."
12    ),
13    input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14    reasoning={"summary": "auto"}
15)

加密推理項目：具備 Zero Data Retention (ZDR)⁠(在新視窗中開啟) 資格的客戶，現在可於 API 請求間重複使用推理項目—而不會在 OpenAI 的伺服器上儲存任何推理項目。對於如 o3 及 o4-mini 的模型，在函式呼叫間重複使用推理項目可提升智慧、降低權杖使用量並提升快取命中率，從而降低成本與延遲時間。深入瞭解⁠(在新視窗中開啟)。

Python

1response = client.responses.create(
2  model="o3",
3  input="Implement a simple web server in Rust from scratch.",
4  store=False,
5  include=["reasoning.encrypted_content"]
6)

定價與可用性

所有這些工具與功能現已於 Responses API 中提供，支援 GPT‑4o 系列、GPT‑4.1 系列，以及 OpenAI o 系列推理模型 (o1、o3、o3 mini、o4-mini ) 。圖像產生功能僅支援於 o3 推理模型系列。

現有工具的定價保持不變：圖像產生費用為每百萬個文字輸入權杖 5.00美元、每百萬個圖像輸入權杖 10.00 美元，以及每百萬個圖像輸出權杖 40.00 美元，快取的輸入權杖可享 75% 折扣。程式碼執行器之收費為每個執行容器 0.03 美元。檔案搜尋費用為每 GB 向量儲存每日 0.10 美元，以及每 1,000 次工具呼叫 2.50 美元。使用遠端 MCP 伺服器工具不另收費—僅計算來自 API 的輸出權杖。詳情請參見我們文件中的定價⁠(在新視窗中開啟)說明。

我們很期待看到您打造的成果！

作者

OpenAI