2025年12月18日

GPT‑5.2‑Codex が登場

プロフェッショナルなソフトウェアエンジニアリングと防御的サイバーセキュリティ向けの、最も先進的なエージェント活用型コーディングモデルです。

本日、GPT‑5.2‑Codex をリリースします。GPT‑5.2‑Codex は、複雑な実際のソフトウェアエンジニアリングに対応する、これまでで最も先進的なエージェント活用型コーディングモデルです。GPT‑5.2‑Codex は、GPT‑5.2⁠ を Codex におけるエージェント活用型コーディング向けにさらに最適化したバージョンです。コンテキスト圧縮による長期的な作業への対応強化、リファクタリングや移行といった大規模なコード変更での性能向上、Windows 環境でのパフォーマンス改善、そしてサイバーセキュリティ機能の大幅な強化が含まれます。

当社のモデルは、知能のフロンティアに沿って進化を続けています。その過程で、こうした改善がサイバーセキュリティ⁠などの専門分野における能力の向上にもつながっていることを当社では確認しています。例えば先週、Codex CLI と GPT‑5.1‑Codex‑Max を使用したセキュリティ研究者が、サービス拒否やソースコードの露出につながる可能性のある React の脆弱性を3件発見し、責任ある形で開示⁠（新しいウィンドウで開く）しました。

GPT‑5.2‑Codex は、これまでに当社がリリースしたどのモデルよりも強力なサイバーセキュリティ能力を備えています。これらの進歩は、大規模なサイバーセキュリティ強化に貢献する可能性がある一方で、慎重な提供方法が求められる新たなデュアルユースのリスクも生じさせます。GPT‑5.2‑Codex は、当社の Preparedness Framework においてサイバー能力が「High」レベルには達していません。ただし、将来的に能力がさらに向上する可能性を踏まえ、提供方法を設計しています。

能力とリスクの両方を考慮し、本日より、Codex CLI、IDE 拡張、クラウド、コードレビューにおいて、すべての有料 ChatGPT ユーザー向けに GPT‑5.2‑Codex の提供を開始します。同時に、API におけるサードパーティ提供を、安全に実現する準備を進めています。また、サイバー防衛向けの trusted access の開発も進めています。これは、審査を通過したセキュリティ専門家や組織に対し、将来の高度な AI サイバー能力への制御された目的限定のアクセスを提供する、招待制のパイロットです。これにより、強固な安全対策を維持しつつ、認可された防御的セキュリティ業務を実施できるようにします。

現実世界のソフトウェアエンジニアリングの最前線を切り拓く

GPT‑5.2‑Codex は、プロフェッショナルな知識作業における GPT‑5.2 の強み⁠と、GPT‑5.1‑Codex‑Max⁠ の最先端のエージェント活用型コーディングおよびターミナル操作能力を基盤としています。GPT‑5.2‑Codex では、長文コンテキストの理解、ツール呼び出しの信頼性、事実性、ネイティブなコンテキスト圧縮が強化されています。その結果、推論のトークン効率を維持しながら、長時間にわたるコーディング作業でも、より信頼できるパートナーとして活用できます。

ビジョン性能の強化により、GPT‑5.2‑Codex は、コーディング中に共有されるスクリーンショット、技術図、チャート、UI 画面を、より正確に解釈できるようになりました。また、GPT‑5.1‑Codex‑Max で導入された機能を基盤として、Windows ネイティブ環境におけるエージェント活用型コーディングが、より効果的かつ信頼性の高いものとなっています。

GPT‑5.2‑Codex は、現実的なターミナル環境における多様なタスクでのエージェント性能を評価するベンチマークである SWE-Bench Pro および Terminal-Bench 2.0 において、最先端の性能を達成しています。

これらの改善により、リポジトリのナビゲーションやリファクタリングから、プルリクエストの作成・レビューに至るまで、現実世界のソフトウェアエンジニアリング業務全体で、より高い性能を発揮します。

SWE-Bench Pro では、モデルにコードリポジトリが与えられ、現実的なソフトウェアエンジニアリングの課題を解決するためのパッチを生成する必要があります。このベンチマークは、データ汚染、課題の多様性の不足、評価の信頼性の低さといった SWE-Bench Verified の課題を解消することを目的として設計されています。

Terminal-Bench 2.0 は、実際のターミナル環境において AI エージェントを評価するためのベンチマークです。課題には、コードのコンパイル、モデルの学習、サーバーのセットアップなどが含まれます。

<PLACEHOLDER FOR FRONTEND HTML ASSETS>

現実世界でのサイバー能力

現代社会はソフトウェアによって成り立っており、その信頼性は強固なサイバーセキュリティに支えられています。そのため、銀行、医療、通信、その他の重要な社会インフラにおける基幹システムを稼働させ続けること、機密データを保護すること、そして人々が日常的に利用するソフトウェアを信頼できる状態に保つことが求められています。脆弱性は、発見されないまま長期間見過ごされることがあります。その発見、検証、修正の多くは、適切なツールを備えたエンジニアや独立したセキュリティ研究者のコミュニティに支えられています。

2025年12月11日、React チームは、React Server Components を用いて構築されたアプリに影響を与える、3件のセキュリティ脆弱性を公開しました。この公開が注目された理由は、脆弱性の内容そのものだけでなく、それがどのように発見されたかにもあります。

Stripe 傘下の企業である Privy に所属するセキュリティ研究者の Andrew MacPherson 氏は、Codex CLI や他のコーディングエージェントとともに GPT‑5.1‑Codex‑Max を使用し、前週に公開された別の重大な React の脆弱性である React2Shell の再現と調査を行っていました。その目的は、このモデルが現実世界における脆弱性研究をどの程度支援できるかを評価することでした。

そのため、彼は Codex を用いて、防御的セキュリティにおける標準的なワークフローを進めました。具体的には、ローカルのテスト環境を構築し、想定される攻撃対象領域について検討し、不正な入力を用いたファジングによってシステムを検証しました。元の React2Shell⁠（新しいウィンドウで開く）の問題を再現しようとする過程で、Codex は、さらなる調査が必要となる予期せぬ挙動を明らかにしました。このプロセスを通じて、わずか1週間のうちに、これまで知られていなかった3件の脆弱性が発見され、すべてが責任ある形で React チームに報告されました。

MacPherson 氏は、これらの発見につながった Codex のセッションも共有しています。これにより、エージェント活用型 AI システムが、広く利用されている本番環境のソフトウェアにおいて、仮説から検証済みの脆弱性へと至るプロセスをどのように加速できるのかが、具体的に示されています。

以下に、これらの会話からの注目すべき抜粋を示します。

[ADD/LINK TO ROLLOUT THAT DISCOVERED VULNERABILITY]

これは、高度な AI システムが、広く利用されている現実世界のソフトウェアにおいて、防御的セキュリティ業務を実質的に加速できることを示しています。同時に、防御側の作業を加速させるこれらの能力は、悪用へのハードルを下げてしまう可能性もあります。

サイバーセキュリティに関連するタスクにおいてエージェント活用型システムの能力が高まるにつれ、こうした進展を責任ある形で提供することを最重要事項としています。そのため、能力向上の一つひとつに対して、より強固な安全対策、厳格なアクセス制御、そしてセキュリティコミュニティとの継続的な連携を組み合わせています。

サイバー分野のフロンティアを前進させる

当社のサイバーセキュリティ評価の一つにおける性能を時系列で比較すると、GPT‑5‑Codex から能力が大きく向上し、GPT‑5.1‑Codex‑Max でさらに伸び、GPT‑5.2‑Codex でも改善が見られます。今後登場する AI モデルも、この傾向を引き継いで進化していくことが見込まれます。これに備え、当社では、Preparedness Framework⁠⁠（新しいウィンドウで開く）に基づくサイバー能力が各モデルで「High」レベルに達する可能性を前提として、計画および評価を行っています。GPT‑5.2‑Codex は現時点ではサイバー能力が「High」レベルには達していませんが、将来その水準を超えるモデルに備えた準備を進めています。

Professional Capture-the-Flag（CTF）評価は、Linux 環境において、専門レベルのサイバーセキュリティスキルを要する高度かつ複数ステップの現実世界の課題を、モデルがどの程度の頻度で解決できるかを測定します。

その結果として、本リリースにあわせてサイバー分野の安全対策を強化しています。あわせて、セキュリティコミュニティと緊密に連携しながら、安全対策の調整を行い、最も高い能力を持つモデルへの制御されたアクセスを提供するため、サイバー防衛向けの trusted access を導入します。

trusted access によるサイバー防衛の強化

セキュリティチームは、脅威アクターの行動の再現、修復対策に向けたマルウェア分析、重要なインフラのストレステストなどを行う際に、さまざまな制約に直面することがあります。trusted access プログラムは、要件を満たすユーザーや組織に対してこうした摩擦を取り除き、信頼された防御側の専門家が最先端の AI サイバー能力を活用してサイバー防衛を加速できるようにします。

本プログラムは当初、責任ある脆弱性開示の実績を持つ審査済みのセキュリティ専門家や、明確な業務上のサイバーセキュリティ用途を持つ組織を対象に、招待制で提供されます。

結論

GPT‑5.2‑Codex は、高度な AI が現実世界のソフトウェアエンジニアリングやサイバーセキュリティをどのように支援できるかという点で、一歩前進を示すものです。開発者や防御側の担当者が、長期的かつ複雑な課題に取り組めるよう支援すると同時に、責任あるセキュリティ研究を支えるツール群を強化します。

そのため、提供は段階的に進めています。また、アクセスと安全対策を組み合わせた設計とし、trusted access を通じてセキュリティコミュニティとも緊密に連携しています。これにより、防御面での効果を最大化しつつ、悪用のリスクを低減することを目指しています。本リリースを通じて得られる知見は、ソフトウェアとサイバーの両分野のフロンティアが進化し続ける中で、今後アクセスをどのように拡大していくかに直接反映されます。

脆弱性研究や認可されたレッドチーミングなど、倫理的なセキュリティ活動に取り組むセキュリティ専門家、またはそうした活動を行う組織の一員の方は、trusted access プログラムへの参加に関心がある旨をお知らせください。あわせて、本プログラムに期待する点についてのフィードバックも、こちらからお寄せいただけます。

著者

OpenAI

さらに読む

すべてを表示

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6、Microsoft 365 Copilot の新たな優先モデルに

製品2026年7月9日

ChatGPT は、あなたの最も意欲的な取り組みのパートナーに

製品2026年7月9日

GPT-5.6：目標に合わせて拡張するフロンティアインテリジェンス

製品2026年7月9日