メインコンテンツにスキップ
OpenAI

2025年5月21日

製品

Responses API の新しいツールと機能

開発者および企業に向けて、リモート MCP サーバーのサポート、画像生成、コードインタープリターなどを搭載した Responses API が登場しました。

読み込んでいます...

本日、エージェントアプリケーションの構築に最適な主力 API プリミティブである Responses API に、新しいビルトインツールを追加します。これには、すべてのリモートモデルコンテキストプロトコル(MCP)サーバー(新しいウィンドウで開く)のサポートに加えて、画像生成(新しいウィンドウで開く)コード インタープリター(新しいウィンドウで開く)ファイル検索(新しいウィンドウで開く)の機能改善などが含まれています。これらのツールは、GPT‑4o シリーズ、GPT‑4.1 シリーズ、OpenAI o シリーズのリーズニングモデルで利用可能です。o3 および o4-mini モデルでは、Responses API の思考の連鎖内でツールや関数を直接呼び出すことができるため、より豊富なコンテキストを踏まえた関連性の高い回答を生成できます。o3 や o4-mini を Responses API と組み合わせて使用することで、リクエストおよびツール呼び出し全体を通して推論トークンが維持され、モデルの知的性能が向上するとともに、開発者にとってはコスト削減とレイテンシの低減にもつながります。

さらに、Responses API には、信頼性、可視性、企業および開発者のプライバシーを向上させる新機能も追加されています。この更新には、長時間実行されるタスクを非同期かつ安定的に処理できるバックグラウンドモード(新しいウィンドウで開く)推論サマリー(新しいウィンドウで開く)のサポート、暗号化された推論項目(新しいウィンドウで開く)のサポートなどが含まれています。 

2025年3月にウェブ検索、ファイル検索、コンピュータ使用などのツールを備えた Responses API をリリースして以来、何十万人もの開発者がこの API を活用し、モデル全体で数兆個ものトークンを処理してきました。お客様はこの API を使って、Zencoder(新しいウィンドウで開く) のコーディングエージェント、未公開株および投資銀行向けの Revi(新しいウィンドウで開く) の市場インテリジェンスエージェント、MagicSchool AI(新しいウィンドウで開く) の教育アシスタントなど、さまざまなエージェントアプリケーションを構築してきました。これらのアプリケーションはいずれも、ウェブ検索を活用して、関連性のある最新情報を動的に取得しています。開発者は、本日公開された新しいツールと機能により、さらに便利で信頼性の高いエージェントを構築できるようになります。

新しいリモート MCP サーバーのサポート

Agents SDK おける MCP サポート(新しいウィンドウで開く)のリリースを踏まえて、Responses API にリモート MCP サーバー(新しいウィンドウで開く)のサポートを追加します。MCP は、アプリケーションが LLM に対してコンテキストを提供する方法を標準化するためのオープンプロトコルです。Responses API で MCP サーバーがサポートされることで、開発者はわずか数行のコードで、任意の MCP サーバーにホストされたツールにモデルを接続できるようになります。以下に、開発者が現在どのように Responses API を使用してリモート MCP サーバーを活用しているかを示す例を紹介します。

Python

1
response = client.responses.create(
2
model="gpt-4.1",
3
tools=[{
4
"type": "mcp",
5
"server_label": "shopify",
6
"server_url": "https://pitchskin.com/api/mcp",
7
}],
8
input="Add the Blemish Toner Pads to my cart"
9
)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch.Skin の決済ページにエクスプレスオプション(Shop Pay、PayPal、G Pay)が表示されており、連絡先および配送フォームの入力欄とともに、「Blemish Toner Pads 200 mL(120 枚)」1個の注文概要が AUD $49 で表示されている。

一般的なリモート MCP サーバーには、Cloudflare(新しいウィンドウで開く)HubSpot(新しいウィンドウで開く)Intercom(新しいウィンドウで開く)PayPal(新しいウィンドウで開く)Plaid(新しいウィンドウで開く)Shopify(新しいウィンドウで開く)Stripe(新しいウィンドウで開く)Square(新しいウィンドウで開く)Twilio(新しいウィンドウで開く)Zapier(新しいウィンドウで開く) などがあります。今後数か月の間に、リモート MCP サーバーのエコシステムは急速に拡大すると予想されており、開発者はユーザーがすでに利用しているツールやデータソースに接続可能な、強力なエージェントを容易に構築できるようになると見込まれています。このエコシステムを最大限に支援し、成長中の標準仕様に貢献するため、OpenAI は MCP の運営委員会にも参画しています。

独自のリモート MCP サーバーを立ち上げる方法については、Cloudflare(新しいウィンドウで開く) のガイドをご覧ください。Responses API において MCP ツールを使用する方法については、API Cookbook のガイド(新しいウィンドウで開く)をご覧ください。

画像生成、コード インタープリター、ファイル検索の更新

Responses API に組み込まれているビルトインツールを使えば、開発者は1回の API コールで、より高性能なエージェントを簡単に作成できるようになります。推論の過程で複数のツールを呼び出すことにより、モデルは Humanity’s Last Exam(人類最後の試験)(情報源)のような業界標準のベンチマークにおいて、ツール呼び出しに関するパフォーマンスを大幅に向上させることができるようになりました。本日、以下の新しいツールが追加されました。

Responses API の新しい機能

新たに追加されたツールに加え、Responses API には以下の新機能への対応も行われています。

  • バックグラウンドモード:CodexDeep ResearchOperator といったエージェント製品では、リーズニングモデルが複雑な問題を解決するのに数分かかる場合があります。開発者は、バックグラウンドモードを利用することで、タイムアウトや接続切断などを気にせずに、o3 などのモデルで同様のエクスペリエンスを再現できます。バックグラウンドモードでは、これらのタスクを非同期で開始できます。開発者は、これらのオブジェクトをポーリングして処理の完了を確認することも、アプリケーションが最新の状態に追いつく必要が生じたタイミングで、イベントのストリーミングを開始することもできます。詳細はこちら(新しいウィンドウで開く)

Python

1
response = client.responses.create(
2
model="o3",
3
input="Write me an extremely long story.",
4
reasoning={ "effort": "high" },
5
background=True
6
)
  • 推論サマリー:Responses API における推論サマリーでは、ChatGPT と同様に、モデルが行った思考の連鎖を簡潔な自然言語で要約することができます。この機能は、開発者によるデバッグや監査、エンドユーザーにとってより優れた体験の構築を支援します。推論サマリーの利用には追加料金は発生しません。詳細はこちら(新しいウィンドウで開く)

Python

1
response = client.responses.create(
2
model="o4-mini",
3
tools=[
4
{
5
"type": "code_interpreter",
6
"container": {"type": "auto"}
7
}
8
],
9
instructions=(
10
"You are a personal math tutor. "
11
"When asked a math question, run code to answer the question."
12
),
13
input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14
reasoning={"summary": "auto"}
15
)
  • 暗号化された推論項目:ゼロデータ保持(ZDR)(新しいウィンドウで開く)に対応するお客様が対象となります。これにより、OpenAI のサーバーに推論項目を保存することなく、API リクエスト間で同じ推論項目を再利用できるようになります。o3 や o4-mini のようなモデルでは、関数呼び出しをまたいで推論項目を再利用することで、モデルのインテリジェンスが高まり、トークン使用量が削減され、キャッシュヒット率の向上によってコストとレイテンシも低減されます。詳細はこちら(新しいウィンドウで開く)

Python

1
response = client.responses.create(
2
model="o3",
3
input="Implement a simple web server in Rust from scratch.",
4
store=False,
5
include=["reasoning.encrypted_content"]
6
)

料金と可用性

これらすべてのツールおよび機能は Responses API で利用可能であり、GPT‑4o シリーズ、GPT‑4.1 シリーズ、OpenAI o シリーズのリーズニングモデル(o1、o3、o3‑mini、o4‑mini)でサポートされています。画像生成は、当社のリーズニングモデルシリーズの中では o3 のみでサポートされています。 

既存のツールの料金に変更はありません。画像生成の料金は、テキスト入力トークン100万個あたり$5.00、画像入力トークン100万個あたり$10.00、画像出力トークン100万個あたり$40.00です。キャッシュされた入力トークンは75%割引されます。コード インタープリターの料金は、1コンテナあたり$0.03です。ファイル検索は、ベクトルストレージ1GB あたり1日につき$0.10、ツール呼び出し1,000回あたり$2.50となります。リモート MCP サーバーツールの呼び出しには追加料金はかかりません。API からの出力トークンに対してのみ課金されます。詳細については、ドキュメント内の料金(新しいウィンドウで開く)セクションをご参照ください。 

これから皆さまがどのような創造を形にされるのか、心から楽しみにしております。

著者

OpenAI