Agents SDK の進化
アップデートされた Agents SDK により、開発者はサンドボックス環境内で、ファイルの確認、コマンドの実行、コード編集、長時間にわたるタスクの実行が可能なエージェントを構築できます。
Agents SDK に、開発者がすぐに使い始められ、OpenAI モデル向けに最適化された標準的な基盤となる新機能を追加しました。具体的には、エージェントがコンピュータ上のファイルやツールを横断して作業できるモデルネイティブのハーネスと、その処理を安全に実行できるネイティブのサンドボックス実行が含まれます。
たとえば、開発者はエージェントに、管理されたワークスペース、明確な指示、証拠を調査するためのツールを与えることができます。
開発者が有用なエージェントを構築するには、優れたモデルだけでなく、ファイルの確認、コマンドの実行、コードの記述、複数ステップにわたる処理を支えるシステムが必要です。
現在のシステムには、プロトタイプから本番環境へ移行する際にトレードオフが伴います。モデル非依存のフレームワークは柔軟ですが、フロンティアモデルの能力を十分に引き出せません。モデルプロバイダーの SDK はモデルに近い一方で、ハーネスの可視性が不足しがちです。また、マネージドエージェント API はデプロイを簡素化できる反面、実行環境や機密データへのアクセス方法に制約があります。
新しい SDK を私たちと共にテストしたお客様の声をご紹介します。
「GPT-5.4 は、文書量の多い法務業務において新たな基準を打ち立てました。当社の BigLaw Bench 評価では91%のスコアを記録しています。他のモデルと比べて、GPT-5.4 は複雑な取引分析の構造化、長大な契約書にわたる正確性の維持、そして法務専門家が求める高い詳細度の提供において優れています。」
本日のリリースにより、Agents SDK のハーネスは、ドキュメントやファイル、各種システムを扱うエージェント向けにさらに機能が強化されました。設定可能なメモリ、サンドボックスに対応したオーケストレーション、Codex のようなファイルシステムツールに加え、フロンティアのエージェントシステムで一般的になりつつあるプリミティブとの標準化された連携が追加されています。
これらのプリミティブには、MCP(新しいウィンドウで開く) を介したツール利用、skills(新しいウィンドウで開く) による段階的な情報開示、AGENTS.md(新しいウィンドウで開く) によるカスタム指示、shell(新しいウィンドウで開く) ツールによるコード実行、apply patch(新しいウィンドウで開く) ツールによるファイル編集などが含まれます。ハーネスには今後も新しいエージェント型のパターンやプリミティブが継続的に取り込まれるため、開発者はコアインフラの更新にかける時間を抑えつつ、エージェントの価値を高めるドメイン固有のロジックにより多くの時間を割くことができます。
また、このハーネスは、モデルが最も性能を発揮できる形に実行を合わせることで、フロンティアモデルの能力をより引き出せるよう支援します。これにより、エージェントはモデル本来の動作により近い形で動作し、特に長時間にわたる処理や、多様なツールとシステムをまたぐ複雑なタスクにおいて、信頼性とパフォーマンスが向上します。
さらに、製品ごとに要件は異なり、単一の型に当てはまることはほとんどありません。Agents SDK は、こうした多様性に対応できるよう設計されています。すぐに使い始められ、柔軟にカスタマイズできるため、ツール利用やメモリ、サンドボックス環境を含め、自身のスタックに合わせて簡単に適応できます。
Agents SDK のアップデートにより、サンドボックス実行がネイティブにサポートされ、エージェントはタスクに必要なファイルやツール、依存関係を備えた制御された環境で実行できるようになりました。
多くのエージェントでは、ファイルの読み書きや依存関係のインストール、コードの実行、安全なツール利用ができるワークスペースが必要になります。ネイティブのサンドボックスサポートにより、この実行レイヤーをすぐに利用でき、個別に構築する手間が不要になります。
開発者は、独自のサンドボックスを使用することも、Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel などの組み込みサポートを利用することもできます。
これらの環境をプロバイダー間で移行しやすくするため、SDK ではエージェントのワークスペースを記述するマニフェストという抽象化も導入されています。開発者は、ローカルファイルをマウントし、出力ディレクトリを定義し、AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2 などのストレージからデータを取り込めます。
これにより、ローカルでのプロトタイプから本番環境まで、一貫した方法でエージェントの実行環境を構築できます。また、モデルにとって予測しやすいワークスペースを提供します。入力の場所や出力先、長時間にわたるタスク全体で作業をどう整理するかが明確になります。

エージェントシステムは、プロンプトインジェクションや情報の流出を前提に設計する必要があります。ハーネスとコンピュートを分離することで、モデル生成コードが実行される環境から認証情報を隔離できます。
これにより、実行の継続性も確保できます。エージェントの状態が外部に保存されていれば、サンドボックスコンテナが失われても実行全体が失われるわけではありません。組み込みのスナップショットとリハイドレーションにより、元の環境で障害が発生した場合や有効期限が切れた場合でも、新しいコンテナでエージェントの状態を復元し、最後のチェックポイントから実行を再開できます。
さらに、エージェントのスケーラビリティも向上します。エージェントの実行では、1つまたは複数のサンドボックスを使い分けられます。必要なときだけ起動し、サブエージェントを隔離環境に振り分けることも可能です。さらに、コンテナ間で処理を並列化することで、実行を高速化できます。
これらの Agents SDK の新機能は、API を通じてすべてのお客様に提供されており、料金にはトークン使用量とツール利用に基づく標準の API 料金が適用されます。
Agents SDK の開発を今後も進めながら、開発者が構築できる範囲を広げ、カスタムインフラを抑えつつ、より高性能なエージェントを本番環境に導入しやすくしていきます。同時に、各環境に適応するために必要な柔軟性と制御性も維持していきます。
新しいハーネス機能とサンドボックス機能は、まず Python で提供されます。TypeScript への対応は今後のリリースで予定されています。また、コードモードやサブエージェントを含む追加機能についても、Python と TypeScript の両方への対応を進めています。
さらに、より多くのサンドボックスプロバイダーや統合に対応し、開発者が既存のツールやシステムに SDK を組み込みやすくすることで、エージェントエコシステム全体の発展を支援していきます。


