メインコンテンツにスキップ
OpenAI

次世代のサイバー防衛を支える信頼性の高いアクセス

私たちは、サイバー防衛に携わる人々が社会全体を守れるよう、信頼性の高いアクセス、保護策、エコシステム支援を進化させ続けています。

読み込んでいます...

私たちは Trusted Access for Cyber(TAC)プログラムを拡大し、審査を通過した数千人の個人の防御担当者や、重要なソフトウェアの防御を担う数百のチームへと展開しています。当社はこれまで、アクセスの民主化、反復的な展開、そしてエコシステムのレジリエンスという原則に基づき、サイバー防衛プログラムを構築してきました。今後数か月でさらに高性能なモデルが登場することを見据え、防御的なサイバーセキュリティのユースケースに対応できるよう、当社のモデルをファインチューニングしています。その第一弾として本日、サイバー用途に対応するよう調整した GPT‑5.4 の派生モデル GPT‑5.4‑Cyber を公開します。本稿では、モデル能力の向上にあわせてサイバー防衛を拡大していく当社のアプローチが、今後のリリースのテストやデプロイメントの指針となると考えている点について紹介します。

AI の活用が進むことで、システム、データ、ユーザーの安全を守る防御担当者は、誰もが依存するデジタルインフラストラクチャ上の問題をより迅速に発見し、修正できるようになります。同様に、AI は危害を加えようとする攻撃者にも利用されています。OpenAI は、こうした状況に備えて準備を進めてきました。2023年以降、OpenAI はサイバーセキュリティ助成金プログラムを通じて防御担当者を支援し、Preparedness Framework を通じてセーフガードを強化してきました。同年、OpenAI は自社のモデルのサイバー能力の評価を開始し、2025年には、サイバー分野に特化したセーフガード(新しいウィンドウで開く)モデルのデプロイメントに組み込み始めました。今年前半には、脆弱性を大規模に特定・修正するための Codex Security の提供を開始し、セキュリティ担当者への支援をさらに強化しました。こうした機能を継続的に進化させるうえで、OpenAI は次の3つの原則を重視しています。

  • アクセスの民主化:OpenAI の目標は、不正利用を防ぎながら、これらのツールをできるだけ広く利用できるようにすることです。OpenAI は、正当な利用であれば、誰がアクセスできるかを恣意的に判断しないための仕組みを設計しています。つまり、厳格な KYC や本人確認など、明確で客観的な基準と方法を用いて、より高度な機能へのアクセスを認める対象を判断し、これらのプロセスを段階的に自動化していくということです。最終的には、重要インフラ、公共サービス、人々が日々利用するデジタルシステムを守る責任を担う人々を含め、規模の大小を問わず、正当な目的で利用する組織や担当者が高度な防御機能を利用できるようにすることを目指しています。
  • 段階的な展開:OpenAI は、こうしたシステムを慎重に社会へ展開し、時間をかけて改善していくことで、最も多くを学べると考えています。OpenAI は、モデルの能力とリスクへの理解が深まるにつれて、それに応じてモデルと安全システムを更新します。これには、特定のモデルごとの利点とリスクを理解すること、ジェイルブレイクやその他の敵対的攻撃に対する耐性を高めること、防御能力を強化しながら有害な影響を軽減することが含まれます。 
  • エコシステムのレジリエンスへの投資: OpenAI は、信頼に基づくアクセス経路、重点的な助成オープンソースのセキュリティイニシアチブ(新しいウィンドウで開く)への貢献、そして防御担当者が脆弱性をより迅速に発見してパッチを適用できるよう支援するCodex Securityのような技術を通じて、防御担当者のコミュニティを支援し、その活動を後押ししています。

サイバーセキュリティのレジリエンス強化と防御力向上に向けた当社の戦略

長年にわたり、当社のサイバーセキュリティ戦略は、研究への投資、悪用の防止、防御担当者の取り組みの加速に重点を置いてきました。モデルの能力が進化するにつれて、私たちはこれらの目標に向けてプログラムを拡大してきました。こうした取り組みは、以下の信念に基づいています。

  • サイバーリスクはすでに現実のものとなり、さらに加速しています。それでも、行動することはできます。デジタルインフラは、高度な AI が登場する以前から、長年にわたり 脆弱な状態にありました(新しいウィンドウで開く)。現在、既存のモデルは、脆弱性の発見、コードベース全体を横断した推論、サイバー関連ワークフローの重要な部分の支援に役立つようになっています。一方で、攻撃者も AI を使った新たな手法を試しています。既存のモデルでも、高度な仕組みを使ってテスト時の計算量を増やすことで、より高い能力を引き出せることが確認されています。つまり、セーフガードの整備は、将来の特定のしきい値に達するまで待つことはできません。
  • 利用者と利用方法に基づいて、アクセスを広げます。サイバー能力は本質的にデュアルユースであるため、リスクはモデルだけで決まるわけではありません。リスクは、ユーザーやそのユーザーに関する信頼シグナル(新しいウィンドウで開く)、付与されているアクセスレベルにも左右されます。
    • 安全対策を備えた汎用モデルへの幅広いアクセスは、より高リスクな機能に対する詳細な制御と両立可能です。これを支えるのは、より強固な検証、明確な意図の把握、そして利用状況の可視性向上です。
    • 大規模な利用を可能にするためには、信頼できるユーザーやユースケースを、より自動化された客観的な方法で検証できるシステムが必要です。これにより、手作業による判断に頼るのではなく、証拠と信頼できるシグナルに基づいてアクセスを拡大することが可能になります。誰が防御に取り組めるかを中央で一律に決めることは、現実的でも適切でもないと私たちは考えています。その代わりに、私たちは、検証、信頼シグナル、説明責任に基づくアクセスを通じて、できるだけ多くの正当な防御担当者が利用できるようにすることを目指しています。
  • 防御は、能力の向上にあわせて継続的に拡張されるべきです。モデルの能力が向上するにつれて、防御機能もそれに合わせて拡張していく必要があります。エージェント型コーディングは着実に進化しており、サイバーセキュリティーに直接的な影響を及ぼしています。これにあわせて、当社もアプローチを調整してきました。
    • OpenAI はまず、GPT‑5.2 でサイバー分野に特化した安全性トレーニングを開始し、その後、GPT‑5.3‑Codex と GPT‑5.4 を通じて追加のセーフガードを導入しました。また、OpenAI は Preparedness Framework に基づき、対象モデルをサイバー能力が「高い」モデルとして分類しました。並行して、OpenAI は防御担当者への支援も強化しました。1,000万ドル規模のサイバーセキュリティー助成金プログラムを開始し、無料のセキュリティスキャンを提供する Codex for Open Source(新しいウィンドウで開く) を通じて1,000件を超えるオープンソースプロジェクトに支援を届け、Codex Security の改善も継続しました。
    • Codex Security は、6か月前にプライベートベータとして、また 今年初め には研究プレビューとして公開されました。コードベースを自動的に監視し、問題を検証し、修正案を提示します。モデルが改善されるにつれて、システムの精度と有用性も向上しています。最近の公開以降、Codex Security は、重大度が「Critical」および「High」の3,000件を超える脆弱性の修正に貢献してきました。また、エコシステム全体で、重大度の低いさらに多くの発見事項の修正にも貢献しています。
    • これらのリリースを通じて、モデルによるセンシティブなリクエストへの対応方法を改善し、拒否の基準を見直しながら、TAC のようなプログラムを通じて信頼性の高いアクセスを拡大してきました。
  • ソフトウェア開発そのものをより安全にしなければなりません。最も強固なエコシステムとは、ソフトウェアの開発と並行して、セキュリティ問題を継続的に特定し、検証し、修正していくものです。高度なコーディングモデルとエージェント機能を開発者のワークフローに統合することで、開発の最中に即座に実行可能なフィードバックを提供できます。これにより、セキュリティを断続的な監査や静的なバグ一覧から、継続的で具体的なリスク低減へと移行できます。

Trusted Access for Cyber および GPT‑5.4‑Cyber の拡大

OpenAI は、サイバーセキュリティ向けに特別に設計されたモデルを含む最先端の機能への幅広いアクセスを提供することで、防御担当者を支援することを目指しています。2月に、OpenAI は Trusted Access for Cyber(TAC)を導入しました。これは、サイバーセキュリティ関連タスクにおいてセーフガードによる摩擦を抑えるための個人向け自動本人確認と、より柔軟にサイバー関連リクエストに対応できるモデルを提供するために一部の組織と連携する取り組みです。

本日、OpenAI と協力してサイバーセキュリティの防御担当者であることを認証する意思のあるユーザー向けに、追加のアクセス層を導入し、このプログラムを拡大します。最上位層のお客様は、GPT‑5.4‑Cyber を利用できるようになります。これは、追加のサイバー機能向けに特別にファインチューニングされ、機能制限がより少ないモデルです。これは GPT‑5.4 の派生モデルであり、正当なサイバーセキュリティ業務に対する拒否のしきい値を引き下げ、高度な防御ワークフロー向けの新たな機能を提供します。これには、セキュリティ専門家がソースコードにアクセスすることなく、コンパイル済みソフトウェアのマルウェアの可能性や脆弱性、セキュリティの堅牢性を分析できるバイナリリバースエンジニアリング機能が含まれます。

このモデルはより柔軟に対応できるため、OpenAI はまず、審査済みのセキュリティベンダー、組織、研究者を対象に、限定的かつ段階的な展開から開始します。より柔軟にサイバー関連リクエストに対応できるモデルへのアクセスには、制限が伴う場合があります。特にゼロデータ保持(新しいウィンドウで開く)(ZDR)のように、OpenAI が利用状況を確認しにくいユースケースではその傾向があります。これは特に、サードパーティープラットフォームを通じて OpenAI のモデルにアクセスしている開発者や組織に当てはまります。このような場合、OpenAI はユーザー、環境、リクエストの目的を直接把握しにくくなります。

TAC にアクセスするのは簡単です。

このプロセスを通じて承認されたすべての顧客は、正当なデュアルユースのサイバー活動において、セーフガードによる過度な摩擦が生じにくい既存モデルのバージョンにアクセスできるようになります。これにより、セキュリティ教育、防御的プログラミング、責任ある脆弱性調査を引き続き行えるようになります。すでに TAC に参加している顧客は、正当なサイバー防御担当者であることについて追加の認証を受けることで、GPT‑5.4‑Cyber へのアクセス申請を含む、追加のアクセス階層への参加希望を表明できます(新しいウィンドウで開く)

今後のモデルリリースとその先を見据えて

当社のサイバーセキュリティ防御体制は、何か月にもわたる反復的な改善の積み重ねの成果です。私たちは、現在採用されている一連の安全対策がサイバーリスクを十分に低減し、現行モデルの広範な展開を支えられると考えています。こうした安全対策は、今後登場するより高性能なモデルに対しても十分であると見込んでいます。一方で、サイバーセキュリティ業務向けに特化して学習され、より制限の少ないモデルについては、より厳格な運用と適切な管理が必要です。

長期的には、サイバーセキュリティにおける AI の安全性を継続的に確保するため、将来のモデルが現在の最も高度な専用モデルを大きく上回る能力を持つことを踏まえ、より広範な防御策が必要になると考えています。

著者

OpenAI