本日、GPT‑5 搭載のエージェント型セキュリティリサーチャー、Aardvark を発表します。
ソフトウェアセキュリティは、テクノロジー界における最も重要かつ困難な分野の1つです。毎年、企業やオープンソースのコードベース全体で数万件もの新しい脆弱性が発見されています。セキュリティ従事者は、攻撃者よりも先に脆弱性を見つけて修正するという困難な課題に直面しています。OpenAI は、セキュリティ従事者側が攻撃者側に対して有利になれるように取り組んでいます。
Aardvark は、AI とセキュリティ研究における画期的な産物で、開発者とセキュリティチームが大規模にセキュリティの脆弱性を発見して修正するのに役立つ自律型エージェントです。この分野で実際にどのように機能するかを検し、改良できるよう、プライベートベータ版でご利用いただけるようになりました。
Aardvark は、ソースコードリポジトリを継続的に分析して脆弱性を特定し、悪用される可能性を評価します。その後、重大度を優先順位付けして対象を絞ったパッチを提案します。
Aardvark は、コードベースへのコミットと変更点を監視し、脆弱性と悪用される可能性を特定して、修正案を提案することによって機能します。ファジングやソフトウェア構成分析などの従来のプログラム分析手法には依存しません。代わりに、LLM を活用した推論とツールを使用して、コードの動作を理解し、脆弱性を特定します。コードの読み取り、分析、テストの作成と実行、ツールの使用などを通じて、人間のセキュリティリサーチャーと同様のやり方でバグを探します。
Aardvark は、脆弱性を特定し、説明して修正するために、多段階のパイプラインを使用しています。
- 分析:リポジトリ全体の分析から始めて、プロジェクトのセキュリティ目標と設計に関する理解を反映した脅威モデルを作成します。
- コミットのスキャン:新しいコードをコミットする際には、リポジトリ全体と脅威モデルに対してコミットレベルの変更を検査して、脆弱性をスキャンします。リポジトリが初めて接続されるときに、Aardvark はその履歴をスキャンして既存の問題を特定します。そして発見した脆弱性を段階的に説明し、人間によるレビューのためにコードに注釈を付けます。
- 検証:Aardvark は潜在的な脆弱性を特定すると、隔離されたサンドボックス環境内でその脆弱性をトリガーし、悪用される可能性を確認します。そして正確で高品質、かつ誤検知の少ない分析情報がユーザーに返されるようにするための手順を説明します。
- パッチ適用:Aardvark は OpenAI Codex と連携し、発見した脆弱性の修正をサポートします。Codex で生成され、Aardvark でスキャンされたパッチが各検出結果に添付され、人間がレビューしてワンクリックで適用できる効率的なパッチが提供されます。
Aardvark はまたエンジニアと協力し、GitHub、Codex、既存のワークフローとも連携して、開発を遅延させることなく明確で実用的な洞察を提供します。Aardvark はセキュリティ問題を重視して構築されているものの、当社テストによると、論理的な欠陥や不完全な修正、プライバシーの問題などのバグも発見されうることがわかっています。
Aardvark はすでに数か月にわたって稼働しており、OpenAI の社内コードベースおよび外部のアルファ版パートナーのコードベースで実行されています。OpenAI 社内においては、重大な脆弱性を明らかにし、OpenAI の防御態勢に貢献しています。また当社パートナーも、複雑な条件下でのみ発生する問題の発見という Aardvark の分析の深さを強調しています。
「ゴールデン」リポジトリのベンチマークテストで、Aardvark は既知および人為的に導入された脆弱性の92%を特定しており、高い再現率と実際の有効性を実証しました。
Aardvark はオープンソースプロジェクトにも使用され、多数の脆弱性を発見しており、当社ではそれを責任を持って公開しています。うち10件には、 Common Vulnerabilities and Exposures(CVE)識別子が付与されています。
数十年にわたるオープンリサーチと責任ある情報開示の恩恵を受け、当社はデジタルエコシステムをあらゆる人にとってより安全なものにするためのツールや調査結果を提供することで、社会還元に努めています。当社では、オープンソースソフトウェアのエコシステムおよびサプライチェーンのセキュリティ向上に貢献するために、当社では商用目的ではないオープンソースリポジトリを選定して無償のスキャンを提供する予定です。
当社は最近、外部向けの協調開示ポリシーを更新しました。本ポリシーは、開発者にとってプレッシャーとなりうる厳格な開示期限ではなく、コラボレーションとスケーラブルな影響に重点を置いた、開発者に寄り添うスタンスを採用しています。Aardvark のようなツールによって発見されるバグの数は増えていくと予想しており、長期的レジリエンスの実現にむけて、継続的に協力していきたいと考えています。
ソフトウェアは現在、あらゆる産業の基盤となっています。言い換えるなら、ソフトウェアの脆弱性は、企業やインフラストラクチャ、ひいては社会にとって構造的リスクとなります。2024年だけで40,000件を超える CVE が報告されています。当社テストによると、コミットの約1.2%がバグを生み出しており、小さな変更が大きな影響を及ぼす可能性が示唆されました。
Aardvark は、セキュリティ従事者優先の新しいモデルです。コードの進化に合わせて継続的な保護を提供する、チームと協力して働くエージェント型セキュリティリサーチャーです。脆弱性を早期に発見して現実世界で悪用される可能性を検証し、明確な修正策を提供することで、Aardvark はイノベーションのペースを緩めることなくセキュリティを強化できます。当社はセキュリティに関わる専門知識へのアクセス拡大を非常に重要なこととして捉えています。プライベートベータ版から始めて、状況が把握でき次第、提供範囲を拡大していく予定です。
当社では、厳選されたパートナーの皆様に、Aardvark プライベートベータ版への参加をお願いしています。参加者は早期アクセス権を得て、検出精度や検証ワークフロー、またレポートエクスペリエンスを向上のために、当社チームと直接連携していただくことができます。
当社はさまざまな環境下でパフォーマンスを検証したいと考えています。貴組織またはオープンソースプロジェクトが参加をご希望の場合は、こちらからお申込みください。
著者
貢献者
Akshay Bhat、Andy Nguyen、Dave Aitel、Harold Nguyen、Ian Brelinsky、Tiffany Citra、Xin Hu、Matt Knight


