メインコンテンツにスキップ
OpenAI

次世代のサイバー防衛を支える信頼性の高いアクセス

私たちは、サイバー防衛に携わる人々が社会全体を守れるよう、信頼性の高いアクセス、保護策、エコシステム支援を進化させ続けています。

読み込んでいます...

私たちは Trusted Access for Cyber(TAC)プログラムを拡大し、審査を通過した数千人の個人の防御担当者や、重要なソフトウェアの防御を担う数百のチームへと展開しています。当社はこれまで、アクセスの民主化、反復的な展開、そしてエコシステムのレジリエンスという原則に基づき、サイバー防衛プログラムを構築してきました。今後数か月でさらに高性能なモデルが登場することを見据え、防御的なサイバーセキュリティのユースケースに対応できるよう、当社のモデルをファインチューニングしています。その第一弾として本日、サイバー用途に対応するよう調整した GPT‑5.4 の派生モデル GPT‑5.4‑Cyber を公開します。本稿では、モデル能力の向上にあわせてサイバー防衛を拡大していく当社のアプローチが、今後のリリースのテストやデプロイメントの指針となると考えている点について紹介します。

AI の活用の進展により、システム、データ、ユーザーの安全を守る責任を担う防御担当者は、誰もが依存するデジタルインフラストラクチャにおいて、問題をより迅速に発見して修正できるようになります。同様に、AI は危害を加えようとする攻撃者にも利用されています。私たちはこれに向けて準備を進めてきました。2023年以降、当社はサイバーセキュリティ助成金プログラムを通じて防御担当者を支援し、Preparedness Framework を通じて安全対策を強化してきました。同年、当社のモデルのサイバー能力の評価を開始し、2025 年には、サイバー分野に特化した安全対策(新しいウィンドウで開く)モデルのデプロイメントに含め始めました。今年前半には、大規模な脆弱性の特定と修正を支援する Codex Security の提供を開始し、セキュリティ担当者への支援をさらに強化しました。こうした機能の継続的な進化に対する当社のアプローチは、次の3つの原則に基づいています。

  • アクセスの民主化:私たちの目標は、不正利用を防ぎつつ、これらのツールを可能な限り広く利用できるようにすることです。私たちは、正当な利用のためにアクセス権を恣意的に決定することを避ける仕組みを設計しています。つまり、明確で客観的な基準と方法(例:厳格な KYC や本人確認)を用いて、より高度な機能にアクセスできるユーザーを判断し、これらのプロセスを時間とともに自動化するということです。最終的には、重要インフラや公共サービス、日常的に利用されるデジタルシステムを守る責任を持つ人々を含め、規模を問わず正当な主体が高度な防御機能を利用できるようにすることを目指しています。
  • 反復型開発:こうしたシステムを慎重に世に送り出すことで、私たちは最も多くを学び、時間をかけて改善していきます。私たちは、その能力とリスクについての理解を深めるのに応じて、モデルと安全システムを更新します。これには、特定のモデルに固有の利点とリスクを理解し、ジェイルブレイクやその他の敵対的攻撃に対する耐性を高め、防御能力を強化すると同時に、有害性を軽減することが含まれます。 
  • エコシステムのレジリエンスへの投資: 当社は、信頼できるアクセス経路、対象を絞った助成金オープンソースのセキュリティイニシアチブ(新しいウィンドウで開く)への貢献、そしてセキュリティ従事者がより迅速に脆弱性を発見して修正できるよう支援するCodex Securityのような技術を通じて、セキュリティ従事者のコミュニティを支援し、その活動を加速させています。

サイバーセキュリティのレジリエンス強化と防御力向上に向けた当社の戦略

長年にわたり、当社のサイバーセキュリティ戦略は、研究への投資、悪用の防止、防御担当者の取り組みの加速に重点を置いてきました。モデルの能力が進化するにつれて、私たちはこれらの目標に向けてプログラムを拡大してきました。こうした取り組みは、以下の信念に基づいています。

  • サイバーリスクはすでに現実のものとなっており、さらに加速していますが、対策を講じることは可能です。デジタルインフラは、高度な AI が登場する以前から、長年にわたり 脆弱な状態にありました(新しいウィンドウで開く)。現在、既存のモデルは、脆弱性の発見やコードベース全体を横断した推論、サイバー関連ワークフローの重要な部分の支援に役立つようになっており、脅威アクターは AI 主導の新たな手法を試しています。既存のモデルでも、テスト時の計算量を増やすことで、より高度な能力を引き出せることが確認されています。つまり、安全対策は将来の特定の閾値を待つことはできません。
  • これらのシステムを誰が利用しているか、またどのように利用されているかに基づいて、アクセスを拡大します。サイバー能力は本質的にデュアルユースであるため、リスクはモデルだけで決まるわけではありません。リスクは、ユーザーやその信頼シグナル(新しいウィンドウで開く)、付与されているアクセスレベルにも左右されます。
    • 安全対策を備えた汎用モデルへの幅広いアクセスは、より高リスクな機能に対する詳細な制御と両立可能です。これを支えるのは、より強固な検証、明確な意図の把握、そして利用状況の可視性向上です。
    • 大規模な利用を可能にするためには、信頼できるユーザーやユースケースを、より自動化された客観的な方法で検証できるシステムが必要です。これにより、手作業による判断に頼るのではなく、証拠と信頼できるシグナルに基づいてアクセスを拡大することが可能になります。誰が防御に取り組めるかを中央で一律に決めることは、現実的でも適切でもないと私たちは考えています。その代わりに、私たちは、検証、信頼シグナル、説明責任に基づくアクセスを通じて、できるだけ多くの正当な防御担当者が利用できるようにすることを目指しています。
  • 防御は、能力の向上にあわせて継続的に拡張されるべきです。モデルの能力が向上するにつれて、防御機能もそれに合わせて拡張していく必要があります。エージェント型コーディングは着実に進化しており、サイバーセキュリティーに直接的な影響を及ぼしています。これにあわせて、当社もアプローチを調整してきました。
    • まず、GPT‑5.2 でサイバー分野に特化した安全性トレーニングを開始し、その後、GPT‑5.3‑Codex と GPT‑5.4 を通じて追加の安全対策を実施しました。当社の Preparedness Framework において、このモデルを「高い」サイバー能力を有すると分類しました。並行して、防御者の支援も強化しました。1,000万ドルのサイバーセキュリティー助成金プログラムを開始し、無料のセキュリティースキャンを提供する Codex for Open Source(新しいウィンドウで開く) を通じて1,000を超えるオープンソースプロジェクトを支援し、Codex Security の改善も継続しました。
    • 6か月前にプライベートベータとして、また 今年初め に研究プレビューとして公開された Codex Security は、コードベースを自動的に監視し、問題を検証し、修正案を提示します。モデルが改善されるにつれて、システムの精度と有用性も向上しています。最近のローンチ以降、Codex Security は3,000件を超えるクリティカルおよび高重大度の脆弱性の修正に貢献してきました。また、エコシステム全体でさらに多くの低重大度の問題の修正にも対応しています。
    • これらのリリースを通じて、モデルによるセンシティブなリクエストへの対応方法を改善し、拒否の基準を見直しながら、TAC のようなプログラムを通じて信頼性の高いアクセスを拡大してきました。
  • ソフトウェア開発そのものをより安全にしなければなりません。最も強固なエコシステムとは、ソフトウェアの開発と並行して、セキュリティ問題を継続的に特定し、検証し、修正していくものです。高度なコーディングモデルとエージェント機能を開発者のワークフローに統合することで、開発の最中に即座に実行可能なフィードバックを提供できます。これにより、セキュリティを断続的な監査や静的なバグ一覧から、継続的で具体的なリスク低減へと移行できます。

Trusted Access for Cyber および GPT‑5.4‑Cyber の拡大

私たちは、サイバーセキュリティ向けに特別に設計されたモデルを含む最先端の機能への幅広いアクセスを提供することで、防御担当者を支援することを目指しています。2月に、私たちは Trusted Access for Cyber(TAC)を導入しました。これは、サイバーセキュリティ関連の作業における安全対策の負担を軽減するための個人向け自動本人確認と、より柔軟なサイバー対応モデルを提供するために一部の組織と連携する取り組みです。

本日、OpenAI と協力してサイバーセキュリティの防御担当者であることを認証する意思のあるユーザー向けに、追加のアクセス層を導入し、このプログラムを拡大します。最上位層のお客様は、GPT‑5.4‑Cyber を利用できるようになります。これは、追加のサイバー機能向けに特別にファインチューニングされ、機能制限がより少ないモデルです。これは GPT‑5.4 の派生モデルであり、正当なサイバーセキュリティ業務に対する拒否のしきい値を引き下げ、高度な防御ワークフロー向けの新たな機能を提供します。これには、セキュリティ専門家がソースコードにアクセスすることなく、コンパイル済みソフトウェアのマルウェアの可能性や脆弱性、セキュリティの堅牢性を分析できるバイナリリバースエンジニアリング機能が含まれます。

このモデルはより制限が少ないため、当社ではまず、審査を通過したセキュリティベンダー、組織、研究者を対象に、限定的かつ段階的な導入から開始します。より制限の少ないサイバー対応モデルの利用には、特にゼロデータ保持(新しいウィンドウで開く)(ZDR)のような可視性の低いユースケースに関して、制限が伴う場合があります。これは特に、サードパーティープラットフォームを通じて当社のモデルにアクセスしている開発者や組織に当てはまります。このような場合、OpenAI はユーザーや環境、リクエストの目的を直接把握しにくくなります。

TAC にアクセスするのは簡単です。

このプロセスを通じて承認されたすべてのお客様は、デュアルユースのサイバー活動に関連して作動する可能性があるセーフガードの制約が緩和された既存モデルのバージョンにアクセスできるようになります。これにより、セキュリティ教育、防御的プログラミング、責任ある脆弱性研究を引き続き支援できます。すでに TAC に参加しており、正当なサイバー防衛担当者であることを追加で認証する意思のあるお客様は、GPT‑5.4‑Cyber へのアクセス申請を含む追加のアクセス階層への参加を希望できます(新しいウィンドウで開く)

今後のモデルリリースとその先を見据えて

当社のサイバーセキュリティ防御体制は、何か月にもわたる反復的な改善の積み重ねの成果です。私たちは、現在採用されている一連の安全対策がサイバーリスクを十分に低減し、現行モデルの広範な展開を支えられると考えています。こうした安全対策は、今後登場するより高性能なモデルに対しても十分であると見込んでいます。一方で、サイバーセキュリティ業務向けに特化して学習され、より制限の少ないモデルについては、より厳格な運用と適切な管理が必要です。

長期的には、サイバーセキュリティにおける AI の安全性を継続的に確保するため、将来のモデルが現在の最も高度な専用モデルを大きく上回る能力を持つことを踏まえ、より広範な防御策が必要になると考えています。

著者

OpenAI