2025年12月10日

AI の能力進化に対応したサイバーレジリエンスの強化

当社のモデルのサイバーセキュリティ能力が高まるにつれ、その強化を進めながら、安全対策を多層的に組み込み、世界中のセキュリティ専門家と連携しています。

読み込んでいます...

AI モデルのサイバー分野における能力は急速に進展しており、サイバー防御に大きな恩恵をもたらす一方で、慎重な管理が求められる新たなデュアルユースのリスクも生じています。たとえば、capture-the-flag（CTF）チャレンジで評価された能力は、2025年8月の GPT‑5⁠（新しいウィンドウで開く）の 27% から、2025年11月の GPT‑5.1‑Codex‑Max⁠（新しいウィンドウで開く）では 76% へと向上しています。

今後の AI モデルもこの進化の流れを継続すると見込まれます。これを踏まえ、当社では Preparedness Framework⁠（新しいウィンドウで開く）に基づき、各モデルがサイバーセキュリティ能力の「High」水準に達し得ることを前提として、計画と評価を行っています。ここでいうモデルとは、堅牢に防御されたシステムに対して実用的なゼロデイのリモートエクスプロイトを開発できる、または現実世界への影響を狙った複雑で秘匿性の高い企業・産業システムへの侵入作戦にも、実務レベルで支援できる能力を持つものを指します。本記事では、こうした水準に達するモデルに対する安全対策の考え方と、悪用を抑えつつ防御側に実質的な価値をもたらすための取り組みについて説明します。

これらの能力の進化に伴い、当社は防御的なサイバーセキュリティ用途に向けたモデルの強化に取り組むとともに、コード監査や脆弱性修正といった作業をより効率的に行えるツールの開発を進めています。人員やリソースが不足しがちな防御側にとって、当社のモデルや製品が大きな力となることを目指しています。

他のデュアルユース領域と同様に、防御と攻撃のサイバー運用は、多くの場合、同じ基盤となる知識や技術に依拠しています。これらの強力な能力が主に防御目的で活用され、悪意ある用途での能力の増幅を抑えられるよう、安全対策への投資を進めています。サイバーセキュリティはほぼあらゆる分野に関わるため、知識の制限や審査済みアクセスの利用といった単一の対策だけに頼ることはできません。代わりに、リスクのバランスを取りつつユーザーの利用を支える、多層防御（defense-in-depth）のアプローチが求められます。具体的には、機能へのアクセスや利用のあり方を適切に設計・誘導することで、高度なモデルが悪用のハードルを下げるのではなく、セキュリティ強化につながるようにすることを意味します。

この取り組みは一度きりのものではなく、防御側に優位性をもたらし、エコシステム全体にわたる重要インフラのセキュリティ体制を継続的に強化していくための、長期的な投資と位置づけています。

悪用の抑制

当社のモデルは安全に動作するよう設計・学習されており、サイバー悪用を事前に検知・対応するシステムによって支えられています。当社の能力や脅威環境の変化に応じて、これらの保護対策を継続的に改善しています。どのようなシステムでも、防御用途に大きな影響を与えずに、サイバーセキュリティ上の悪用を完全に防ぐことはできません。当社は、多層的な安全対策によりリスクを抑える戦略を採用しています。

この基盤として、多層防御のアプローチを採用し、アクセス制御、インフラの強化、外向き通信の制御、モニタリングを組み合わせて運用しています。さらに、検知・対応システムや、専用の脅威インテリジェンスおよびインサイダーリスク対策プログラムを組み合わせることで、新たな脅威を迅速に特定し、阻止できるようにしています。これらの安全対策は、変化する脅威環境に対応して進化し続けるよう設計されています。変化を前提とし、迅速かつ適切に対応できる体制を構築しています。

これを踏まえ、以下の取り組みを進めています。

有害なリクエストには拒否または安全に対応しつつ、教育用途および防御用途においては有用性を維持すること：当社では、明らかなサイバー悪用につながるリクエストには拒否または安全に対応するようフロンティアモデルを学習させる一方で、正当な防御用途および教育用途においては最大限役立つようにしています。
検知システム：当社は、フロンティアモデルを利用する製品全体にわたるモニタリングを継続的に改善・運用し、悪意の可能性があるサイバー活動を検知しています。挙動に不審な点や安全上の問題があると判断された場合、出力のブロック、より安全または制限されたモデルへの振り分け、あるいは対応措置のためのエスカレーションを行うことがあります。対応措置は、自動と人手による審査を組み合わせ、法的要件、重大性、反復性などの要素を踏まえて実施されます。また、開発者やエンタープライズのお客様と連携し、安全基準の共通認識を図るとともに、明確なエスカレーション経路のもとで責任ある利用を支援しています。
エンドツーエンドのレッドチーミング：当社は、専門のレッドチーミング組織と連携し、安全対策の評価と改善を行っています。彼らは、十分な能力とリソースを持つ攻撃者と同様に、エンドツーエンドで当社の防御を突破しようと試みます。これにより、課題を早期に特定し、システム全体を強化しています。

サイバーレジリエンス強化に向けたエコシステムの取り組み

当社は、防御的サイバーセキュリティへの AI 活用に早期から取り組んでおり、モデルとその活用の双方を発展させるため、世界中の専門家と緊密に連携しています。当社は、デジタル世界の安全性向上に取り組む世界中のサイバーセキュリティ実務者と連携し、防御を支える強力なツールの提供を進めています。新たな安全対策の展開にあたり、引き続きサイバーセキュリティコミュニティと連携し、AI がどの領域でレジリエンス強化に実質的に寄与できるのか、またどこに慎重な安全対策が求められるのかを見極めていきます。

こうした連携と並行して、防御側がより迅速に対応できるようにするとともに、安全対策を現実のニーズに合わせ、責任ある是正対応を大規模に進めています。

サイバー防衛向けのトラステッドアクセスプログラム

当社はまもなく、トラステッドアクセスプログラムを導入する予定です。サイバー防衛に取り組む適格なユーザーや顧客に対し、防御用途向けに、当社の最新モデルの高度な機能への段階的なアクセスを提供します。現在も、どの機能を広く提供できるか、またどの機能に段階的な制限が必要かについて適切な線引きを検討しており、これが今後のプログラム設計に影響する可能性があります。当社は、このトラステッドアクセスプログラムを、レジリエントなエコシステム構築に向けた重要な基盤と考えています。

Aardvark による防御力の強化

Aardvark は、開発者やセキュリティチームによる大規模な脆弱性の発見と修正を支援するエージェント型のセキュリティリサーチャーで、現在プライベートベータとして提供されています。コードベースをスキャンして脆弱性を検出し、メンテナーが迅速に適用できるパッチを提案します。コードベース全体を横断的に解析することで、オープンソースソフトウェアにおける新たな CVE をすでに特定しています。オープンソースソフトウェアのエコシステムおよびサプライチェーンの安全性向上に貢献するため、非商用のオープンソースリポジトリの中から選定したプロジェクトを対象に、無償でのカバレッジ提供を予定しています。参加のお申し込みはこちら。

フロンティアリスク評議会

当社は、経験豊富なサイバー防衛の専門家やセキュリティ実務者が当社チームと密に連携するための諮問機関として、フロンティアリスク評議会を設立します。本評議会はまずサイバーセキュリティ分野を中心に始動し、今後は他の先端的な能力領域へと対象を広げていきます。メンバーは、有用かつ責任ある能力と潜在的な悪用との境界について助言し、その知見は当社の評価や安全対策に直接反映されます。評議会の詳細については、近日中にご案内します。

業界とともに脅威モデルに関する共通理解を深める

最後に、当社は、業界のあらゆるフロンティアモデルにおいて、サイバー悪用が現実的に可能になると見込んでいます。これに対応するため、当社は、主要な AI ラボや業界パートナーが支援する非営利団体 Frontier Model Forum を通じて、他のフロンティアラボと連携し、脅威モデルやベストプラクティスに関する共通理解の醸成に取り組んでいます。この文脈では、脅威モデリングは、AI の能力がどのように悪用され得るか、さまざまな脅威アクターにとってどこに重要なボトルネックがあるか、またフロンティアモデルがどのような形で影響を及ぼし得るかを明らかにすることで、リスク低減に役立ちます。この連携は、脅威アクターや攻撃経路について、エコシステム全体で一貫した理解を築くことを目的としています。また、研究機関やメンテナー、防御側が対策をより効果的に改善できるようにするとともに、重要なセキュリティ知見がエコシステム全体に迅速に共有されることを目指しています。また、サイバーセキュリティ評価⁠（新しいウィンドウで開く）の策定に向けて、外部チームとも連携しています。独立した評価のエコシステムが、モデルの能力に関する共通理解の形成をさらに後押しすることを期待しています。

こうした活動は、エコシステムの防御面を強化していくという当社の長期的な方針を示しています。モデルの能力が高まるにつれて、そうした力が防御側にとって実際の力として活かされるようにすることが当社の目標です。現実のニーズに基づき、専門家の知見を反映し、慎重に運用されることを重視しています。こうした動きに加え、従来の枠組みでは生まれにくい革新的なアイデアを見いだすため、新たな施策やサイバーセキュリティ分野の助成も検討していきます。また、学術界、産業界、オープンソースコミュニティ全体から、大胆で創造的な防御策を広く募っていく予定です。これらはすべて継続的な取り組みであり、実社会におけるセキュリティを最も効果的に前進させる方法を見極めながら、今後もこれらのプログラムを進化させていきます。