
本日、私たちは、開発者および企業が実用的で信頼性の高いエージェントを構築するための新しいプラットフォーム基盤の最初の機能セットをリリースします。私たちは「エージェント」をユーザーの代わりにタスクを自律的に実行するシステムであると捉えています。この一年で、高度なリーズニング、マルチモーダル対応、新たな安全性向上技術など、モデルの新機能を次々と導入してきました。これらのリリースにより、複雑で複数ステップを要するタスクにも対応可能な、エージェント構築の基盤が整いました。一方で、こうした高度なモデル機能を本番環境で稼働するエージェントとして実装することは難しいというお客様からの声もいただいていました。エージェント開発にはプロンプトの細かな調整やカスタムのオーケストレーションが必要であり、開発プロセスを効率化するための情報の可視化や、十分な組み込みサポートが不足しているといった課題がありました。
これらの課題に対応するため、エージェント型のアプリケーション開発をよりシンプルにする新しい API とツールをリリースします。
- Responses API(新しいウィンドウで開く):エージェント構築に最適化された新たな API で Chat Completions API のシンプルな使いやすさと Assistants API のツール利用機能を統合しています
- 組み込みツール:Web 検索(新しいウィンドウで開く)、ファイル検索(新しいウィンドウで開く)、コンピュータ操作(新しいウィンドウで開く)を標準で提供します
- Agents SDK(新しいウィンドウで開く):単一または複数エージェントのワークフローを容易にオーケストレーションできる新しい SDK です
- 統合オブザーバビリティツール(新しいウィンドウで開く):エージェント型ワークフローの実行状況を追跡・可視化します
今回提供する新たなツールは、エージェントのコアロジック、オーケストレーション、インタラクションを効率化することで、開発者がより簡単かつ素早くエージェント開発を始めることを支援します。今後数週間から数ヶ月にかけて、エージェント型アプリケーション開発をさらに簡単かつ迅速に進めていただけるよう、新たなツールや機能を順次提供していく予定です。
Responses API は OpenAI が提供する組み込みツールを活用してエージェントを構築するための新しい API です。この API は Chat Completions API の使いやすさと Assistants API の強力なツール利用機能を統合しています。今後、モデルの機能がさらに進化していくにつれて Responses API は開発者がエージェント型アプリケーションを構築する際の、より柔軟で拡張性の高い基盤になると考えています。開発者は単一の Responses API 呼び出しで複数のツールを組み合わせたり、モデルとの複数回のやりとりを行うことで、これまで以上に複雑なタスクにも容易に対応できるようになります。
まず、Responses API は新しい標準の組み込みツールとして Web 検索、ファイル検索、コンピュータ操作などをサポートします。これらのツールは相互に連携し、モデルが現実世界のデータにアクセスできるようにすることで、タスク遂行能力を大幅に向上させます。また、開発者の利便性を重視した多くの改善が施されています。統一されたアイテムベースの設計、シンプルなポリモーフィズム、直感的なストリーミングイベントのサポートに加え、モデルのテキスト出力により簡単にアクセスできる response.output_text
のような SDK のヘルパー機能も提供しています。
Responses API は、複数の API や外部ベンダーとの複雑な連携を行うことなく、OpenAI のモデルと組み込みツールをシンプルにアプリケーションに統合したい開発者向けに設計しました。さらに、この API では OpenAI 上に簡単にデータを保存できるため、追跡機能や評価機能を用いてエージェントのパフォーマンスの評価を行うことができます。なお、OpenAI にデータを保存した場合でも、デフォルトではモデルの学習に使用されることはありません。本日よりすべての開発者に Responses API の提供を開始します。本 API 利用についての追加料金はありません。トークンおよびツール利用料については当社の料金ページに記載されている標準価格が適用されます。詳しくは Responses API クイックスタートガイド(英語)(新しいウィンドウで開く)をご確認ください。
- Chat Completions API(新しいウィンドウで開く):Chat Completions は、現在も当社で最も広く利用されている API であり、今後も新しいモデル・機能の提供とサポートを継続します。標準組み込みツールを必要としない開発者の皆さまは、引き続きこの API をご利用いただけます。また、組み込みツールや複数回のモデル呼び出しを必要としない新しいモデルについては、今後も Chat Completions にも随時提供します。ただし、Responses API は Chat Completions の全ての機能を包含した上位互換(新しいウィンドウで開く)であり、パフォーマンス面でも同等であるため、新規に API 連携を始める場合は Responses API の利用を推奨します。
- Assistants API(新しいウィンドウで開く):Assistants API のベータ版をご利用いただいた開発者の皆さまからいただいたフィードバックをもとに Responses API に重要な改善を施し、より柔軟で高速かつ使いやすい設計となりました。現在 Assistants API が提供している Assistant オブジェクト、Thread オブジェクト、Code Interpreter ツールなど全ての主要機能を Responses API でも利用可能とする開発を進めており、機能の同等性の実現を目指しています。この作業が完了次第、2026 年半ばを目処に Assistants API の正式な廃止を予定しています。その際には、開発者の皆さまが既存のデータを保持し、アプリケーションを円滑に移行できるよう、明確な移行ガイドを提供いたします。正式な廃止発表までは、引き続き Assistants API 向けにも新しいモデルの提供を継続します。Responses API への移行は OpenAI におけるエージェント開発の今後の方向性を示すものです。
Responses API の新しい Web 検索ツールを活用することで、開発者は Web 上の明確で適切な引用元とともに、迅速かつ最新の回答を取得できるようになりました。このツールは gpt-4o および gpt-4o-mini モデル使用時に利用可能で、他の組み込みツールやファンクションコールと組み合わせて使用できます。
初期のテストフェーズに参加された開発者の方々には、Web 検索ツールを活用して、ショッピングアシスタント、調査エージェント、旅行予約エージェントなど、Web 上の最新情報を必要とする幅広いユースケースのアプリケーション開発でご活用いただきました。
例えば Hebbia(新しいウィンドウで開く) は、資産運用会社、プライベートエクイティ企業や信用調査会社、法律事務所などが、膨大な公開・非公開データセットから迅速な意思決定に役立つ知見を得る用途に Web 検索ツールを活用しています。リアルタイムの検索機能を調査のワークフローに組み込むことで、より詳細でコンテキストに即した市場動向に関する知見を提供し、分析の精度と的確性を継続して高め、現行のベンチマークを上回る成果を実現しています。
なお、API の Web 検索ツールは ChatGPT の検索機能と同じモデルによって提供されています。短い事実ベースの質問に対する LLM の回答精度を評価するベンチマーク SimpleQA において GPT‑4o search preview は 90%、GPT‑4o mini search preview は 88% のスコアをそれぞれ達成しています。
SimpleQA Accuracy (higher is better)
API の Web 検索機能を利用して生成された回答には、ニュース記事やブログ投稿などの出典元へのリンクが含まれており、ユーザーは関連情報をより詳しく知ることができます。このように、明確でわかりやすい形で引用が文中に組み込まれることで、ユーザーは新たな形で情報と触れ合うことが可能になります。コンテンツ提供者にとっても、より幅広いオーディエンスにリーチする機会が広がります。
また、全てのウェブサイトやパブリッシャーは自身のコンテンツを API の Web 検索結果に掲載するかどうかを選択できます(新しいウィンドウで開く)。
Web 検索ツールは Responses API を利用するすべての開発者の皆さまにプレビュー版として提供されます。また、Chat Completions API を通じてファインチューニングされた検索用モデルである gpt-4o-search-preview および gpt-4o-mini-search-preview に直接アクセスすることも可能です。料金は GPT‑4o 検索が 1,000 クエリあたり 30 US ドル、GPT‑4o mini 検索が 1,000 クエリあたり 25 US ドルとなります。ぜひ Playground(新しいウィンドウで開く) で Web 検索をお試しいただき、さらに詳しい情報はこちら(新しいウィンドウで開く)をご覧ください。
この度、ファイル検索ツールが機能強化され、大量のドキュメントから関連情報を容易に抽出できるようになりました。複数のファイル形式への対応に加えて、クエリの最適化、メタデータによる絞り込み、カスタムのリランキングといった新機能により、高速かつ精度の高い検索結果が得られます。Responses API を使えば、これらの機能をわずか数行のコードで簡単に統合することができます。
ファイル検索ツールは、さまざまな実務用途に活用できます。例えば、カスタマーサポートのエージェントが FAQ に簡単にアクセスしたり、法律事務所のアシスタントが過去の判例を素早く弁護士や法務専門家に提示したり、コーディングエージェントが技術文書を効率的に参照したりすることができます。実際の事例として Navan(新しいウィンドウで開く) は自社の AI 搭載のトラベルエージェントにこのツールを導入し、顧客企業の出張ポリシーなどのナレッジベースから正確な回答を迅速にユーザーに提供しています。組み込みのクエリ最適化とリランキング機能を活用することで、追加のチューニングや設定を行うことなく強力な RAG(Retrieval-Augmented Generation)パイプラインを実現しています。さらに、ユーザーグループごとに専用のベクトルストアを設定することで、アカウント情報やユーザーの役割に応じて回答をパーソナライズし、顧客とスタッフ双方の時間を節約しながら、正確でカスタマイズされたサポートを提供しています。
このツールは Responses API を利用するすべての開発者の皆さまに提供します。料金(新しいウィンドウで開く)は1,000 クエリあたり 2.50 US ドル、ファイルストレージは 1GB あたり 1 日 0.10 US ドル(最初の 1GB は無料)でご利用いただけます。また、本ツールは引き続き Assistants API でも利用可能です。さらに、新たに Vector Store API のオブジェクトに検索用エンドポイントが追加され、他のアプリケーションや API から直接データをクエリすることも可能となりました。詳しくはドキュメント(新しいウィンドウで開く)をご確認いただき、ぜひ Playground(新しいウィンドウで開く) で実際にお試しください。
コンピュータ上でタスクを遂行できるエージェントを構築するために Responses API に組み込まれたコンピュータ操作のツールを利用できるようになりました。このツールは Operator でも使用されている Computer-Using Agent (CUA) モデルによって提供されています。このリサーチプレビューモデルは、コンピュータ操作タスクの性能を測るベンチマークである OSWorld(新しいウィンドウで開く) で 38.1%、WebArena(新しいウィンドウで開く) で 58.1%、Web ベースのインタラクションを評価する WebVoyager(新しいウィンドウで開く) で 87%という過去最高の精度を達成しています。
この組み込みのコンピュータ操作ツールは、モデルが生成するマウスやキーボードの操作をキャプチャし、それらを開発者の環境で直接実行可能なコマンドへ変換することで、コンピュータ上のタスクの自動化を可能にします。
コンピュータ操作ツールは、Web アプリケーションの品質保証やレガシーシステムにおけるデータ入力作業など、ブラウザベースのワークフロー自動化にも活用できます。例えば、収益向上をサポートする営業プラットフォームである Unify(新しいウィンドウで開く) はこのツールを活用したエージェントによって、顧客の意図を把握したり、アカウントの調査、そしてバイヤーへの積極的なアプローチを行っています。これにより、オンライン上の地図から特定企業の不動産取得状況を確認するといったような、従来の API 経由ではアクセスが難しかった情報も取得可能となりました。こうして得た情報をもとに、営業チームは顧客一人ひとりに最適化されたアプローチを大規模かつ高い精度で展開できるようになります。
別の事例として Luminai(新しいウィンドウで開く) は API が提供されず、データの標準化もされていないレガシーシステムを運用する大企業向けに、コンピュータ操作ツールを活用した複雑な業務ワークフローの自動化を提供しています。最近、大手コミュニティサービス組織とのパイロットプロジェクトを実施した際には、従来の RPA(ロボティック・プロセス・オートメーション)では数ヶ月かけても達成できなかった申請書処理や、ユーザー登録プロセスの自動化を、わずか数日で完了させることに成功しました。
昨年、Operator に CUA を導入する際、私たちは徹底した安全性の検証とレッドチームによる評価を実施し、特に「誤用」「モデルエラー」「フロンティアリスク」という 3 つの主要なリスク領域において対策を強化しました。
今回、API を通じて CUA の機能をローカルのオペレーティングシステムでの利用に拡大することに伴うリスクに対応するため、さらなる安全性の検証とレッドチームによる攻撃評価を追加で実施しています。また、開発者向けにはプロンプトインジェクション攻撃を防止する安全性チェック、センシティブなタスク実行時の確認プロンプト、開発者が環境を安全に隔離できるツール、ポリシー違反を効果的に検出する仕組みなどの安全対策を導入しました。こうした対策によりリスクは軽減されますが、依然としてモデルは特に非ブラウザ環境において予期せぬミスを起こす可能性があります。例えば、実世界のタスクに対する AI エージェントの性能を測定するベンチマークである OSWorld での CUA の成功率は現在 38.1% であり、オペレーティングシステム上でのタスクを自動化する観点での信頼性はまだ十分であるとは言えません。そのため、このようなケースでは人による監督下での運用を推奨しています。より詳細な API に特化した安全性対策については更新されたシステムカードをご参照ください。
ベンチマークの種類 | ベンチマーク | コンピューターの使用(ユニバーサルインターフェイス) | ウェブブラウジングエージェント | 人間 | |
---|---|---|---|---|---|
OpenAI CUA | 以前の SOTA | 以前の SOTA | |||
コンピューターの使用 | OSWorld | 38.1% | 22.0% | - | 72.4% |
ブラウザーの使用 | WebArena | 58.1% | 36.2% | 57.1% | 78.2% |
WebVoyager | 87.0% | 56.0% | 87.0% | - |
コンピュータ操作ツールは、本日より Responses API のリサーチプレビューとして Tier 3〜5(新しいウィンドウで開く) の開発者向けに提供を開始します。料金(新しいウィンドウで開く)は入力トークン 100 万トークンあたり 3 US ドル、出力トークンは 100 万トークンあたり 12 US ドルです。詳しくはドキュメント(新しいウィンドウで開く)をご確認いただき、ツールを用いた開発方法についてはサンプルアプリケーション(新しいウィンドウで開く)をご参照ください。
エージェントを構築するには、そのコアロジックを実装して各種ツールを利用可能にするだけでなく、複数のエージェントが連携するワークフローを適切にオーケストレーションする必要があります。この度、新たにオープンソースとして提供する Agents SDK は、昨年公開し、開発者コミュニティに広く採用された実験的な SDK の Swarm(新しいウィンドウで開く) から大幅に機能を進化させたもので、マルチエージェントのワークフロー構築をよりシンプルかつ効率的に行えるよう設計されています。
主な改善点は以下の通りです:
- エージェント:明確な指示と組み込みツールを備えた、容易に設定可能な LLM エージェントの提供
- ハンドオフ:状況に応じてエージェント間で適切に処理を連携・引き継ぎ
- ガードレール:入出力の検証を柔軟にカスタマイズ可能な安全性チェック機構
- トレーシングとオブザーバビリティ:エージェントの実行状況をトレースして可視化し、デバッグやパフォーマンスの最適化をサポート
Agents SDK は、カスタマーサポートの自動化、複数のステップを要するリサーチ、コンテンツ生成、コードレビュー、見込み客の開拓など、さまざまな実務用途に最適です。例えば Coinbase(新しいウィンドウで開く) は暗号資産ウォレットやオンチェーン上の各種アクティビティとシームレスに連携する AI エージェント用ツールキット AgentKit のプロトタイプ開発と導入を Agents SDK を利用して短期間で実現しました。Coinbase はわずか数時間で、自社の Developer Platform SDK のカスタムアクションを完全に機能するエージェントに統合しました。AgentKit の洗練されたアーキテクチャにより、新しいアクションを追加するプロセスがシンプルになり、開発者は複雑なエージェントのセットアップ作業にかかる時間を削減し、本質的な統合の作業に集中できるようになりました。
Box(新しいウィンドウで開く) は Web 検索ツールと Agents SDK を活用し、企業が Box 内に蓄積した非構造化データやインターネット上の情報から必要な知見を迅速に検索・抽出できるエージェントをわずか数日で開発しました。この仕組みにより、企業は社内のアクセス権限やセキュリティポリシーを遵守した上で、自社が保有する機密情報と Web 上の最新情報の両方を安全に検索・活用することが可能になります。例えば、金融サービス企業の場合、Box 内に保管した自社の市場分析情報を連携する Box の AI エージェントと Web 上のリアルタイムな経済データやニュースを組み合わせるカスタムエージェントを構築することで、アナリストに対して投資判断に役立つ包括的な情報を安全かつ迅速に提供することができます。
Agents SDK は Responses API および Chat Completions API と連携して動作します。また、Chat Completions と同様のスタイルの API エンドポイントを提供する他社のモデルとも互換性があります。開発者の皆さまは本日からこの SDK を Python のコードベースに組み込むことが可能です。また、今後 Node.js のサポートも予定しています。詳細はこちら(新しいウィンドウで開く)をご覧ください。
Agents SDK の設計にあたり、コミュニティにおける優れたオープンソースプロジェクトである Pydantic(新しいウィンドウで開く)、Griffe(新しいウィンドウで開く)、MkDocs(新しいウィンドウで開く) などから多くのインスピレーションを得ました。私たちは今後も Agents SDK をオープンソースのフレームワークとして提供し、コミュニティの皆さまと共に、さらなる発展を目指していきます。
私たちは、近い将来、エージェントがあらゆる産業の業務の中核となり、業務の生産性を飛躍的に向上させると考えています。企業が複雑なタスクに AI を活用する機会がますます増える中で、開発者や企業が実世界でのインパクトをもたらす自律型システムを効果的に構築できるよう、今後もその基盤となる機能を提供していきます。
本日のリリースで、私たちは開発者や企業が信頼性の高いエージェントを、より簡単かつ効果的に構築するための最初のビルディングブロックを提供しました。今後、モデルがさらにエージェントとしての能力を高めていくにつれ、私たちは、実運用でのエージェントの展開、評価、最適化を支援する API や新しいツールの緊密な連携をより一層強化していく予定です。私たちの目標は、開発者が様々な業界で多様なタスクに対応できるエージェントを構築するためのシームレスなプラットフォーム体験を提供することです。開発者の皆さまがこれからどのようなエージェントを作り上げていくのか、私たちも非常に楽しみにしています。まずはドキュメント(新しいウィンドウで開く)をご覧いただき、今後のアップデートにもぜひご期待ください。