2026年2月13日

ChatGPT にロックダウンモードと一貫した「高リスク」ラベルが導入されました

読み込んでいます...

AI システムがより複雑なタスク、特にウェブや接続アプリを含むタスクを担うようになると、セキュリティの重要性が変わります。

特に重要な新たなリスクが1つあります。それはプロンプトインジェクション⁠です。これらの攻撃では、第三者が会話型 AI システムを誤誘導し、悪意のある指示に従わせようとしたり、機密情報を漏えいさせようとしたりします。

本日、ユーザーや組織がプロンプトインジェクション攻撃を軽減できるように設計された2つの新しい保護機能を導入します。これにより、リスクの可視性が向上し、制御が強化されます。

ChatGPT のロックダウンモードは、リスクの高いユーザー向けの高度なオプションのセキュリティ設定です
「高リスク」ラベル （ChatGPT、ChatGPT Atlas、Codex において追加のリスクをもたらす可能性がある特定の機能向け）

これらの追加は、モデル、製品、システムの各レベルにおける既存の保護を基盤としています。これには、サンドボックス化、URL ベースのデータ流出防止⁠、監視と施行、およびロールベースのアクセス制御や監査ログなどの企業向けの管理⁠が含まれます。

サイバー攻撃のリスクが最も高い従業員を組織が保護できるよう支援する

ロックダウンモードは、オプションの高度なセキュリティ設定で、著名な組織の幹部やセキュリティチームなど、高度な脅威に対する保護を強化する必要がある、セキュリティ意識の高い少数のユーザー向けに設計されています。ほとんどのユーザーにとっては必要ではありません。ロックダウンモードは、プロンプトインジェクションによるデータ流出のリスクを低減するために、ChatGPT が外部システムとやり取りする方法を厳格に制限します。

ロックダウンモードは、プロンプトインジェクションなどの攻撃によってユーザーの会話や接続されたアプリから機密データを盗み出すために、攻撃者が悪用しようとする可能性のある ChatGPT の特定のツールと機能を決定的に無効にします。

たとえば、ロックダウンモードではウェブ閲覧がキャッシュされたコンテンツに限定されており、ライブのネットワークリクエストが　OpenAI の管理するネットワークを離れることはありません。この制限は、機密データがブラウジングを通じて攻撃者に流出するのを防ぐことを目的としています。データの安全性を強く決定的に保証できない場合、いくつかの機能は完全に無効化されます。

「ロックダウンモード」と題された図では、セキュリティ境界内にある ChatGPT が、プライベート Web キャッシュ、ダウンロードされるファイル、Canvas 経由での Web アクセス、公開 Web の閲覧に接続している様子が示されています。外部の「攻撃者」と「パブリックウェブ」は境界の外側に描かれており、エントリポイントがブロックされてロックダウンモードでアクセスが制限されていることを示しています。

ロックダウンモードは、ChatGPT による特定の外部システムとのやり取りを厳しく制限することで、データが意図せず第三者と共有されるのを防ぐ新しい決定的な設定です。

ChatGPT のビジネスプランでは、すでにエンタープライズグレードのデータセキュリティ⁠が提供されています。ロックダウンモードはこれらの保護機能を基盤にしており、ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare、ChatGPT for Teachers で利用可能です。管理者は、ワークスペース設定⁠（新しいウィンドウで開く）で新しいロール⁠（新しいウィンドウで開く）を作成することで有効にできます。ロックダウンモードを有効にすると、既存の管理設定に追加の制限が適用されます。

ロックダウンモードについての詳細は、ヘルプセンター⁠（新しいウィンドウで開く）でご確認ください。

一部の重要なワークフローがアプリに依存しているため、ワークスペース管理者はより詳細な制御を保持します。管理者は、ロックダウンモードでユーザーが利用できるアプリと、そのアプリ内で使用可能な特定のアクションを正確に選択できます。さらに、ロックダウンモードとは別に、コンプライアンス API ログプラットフォーム⁠（新しいウィンドウで開く）は、アプリの使用状況、共有データ、接続されたソースを詳細に可視化し、管理者による継続的な監督を支援します。

ロックダウンモードは、今後数か月以内に消費者向けに提供される予定です。

ユーザーがリスクについて十分な情報に基づいた選択をできるように支援する

AI 製品はアプリやウェブに接続することでより役立ちます。当社は接続されたデータの安全性を確保する⁠ために多大な投資を行ってきました。同時に、一部のネットワーク関連機能は、業界の安全対策やセキュリティ対策ではまだ十分に対応されていない新たなリスクをもたらしています。一部のユーザーはこれらのリスクを受け入れることに抵抗がないかもしれません。私たちは、特にユーザーが自らのプライベートデータを扱う際に、それらを使用するかどうか、またどのように使用するかをユーザー自身が判断できることが重要だと考えています。

私たちのアプローチは、追加のリスクをもたらす可能性のある機能に対して、製品内でガイダンスを提供することです。これをより明確で一貫性のあるものにするため、既存の機能の短いリストに対して、ラベル付けの方法を標準化しています。これらの機能は、ChatGPT、ChatGPT Atlas、Codex の全体で一貫して「高リスク」ラベルを使用するようになるため、ユーザーはどこでそれらの機能に遭遇しても同じガイダンスを受けられます。

たとえば、コーディングアシスタントである Codex では、開発者が Codex にネットワークアクセスを許可することで、Web 上でドキュメントを調べるといったアクションを実行できるようになります。関連する設定画面には、「高リスク」ラベルが含まれており、何が変更されるのか、どのようなリスクが新たに生じる可能性があるのか、そしてそのアクセスがいつ適切となるのかについて、明確な説明が記載されています。

「エージェントのインターネットアクセス」設定パネルでは、トグルがオンに設定されており、ドメイン許可リストや追加の許可ドメイン（openai.comを含む）、許可された HTTP メソッドのオプションと、インターネットアクセスを有効にするとセキュリティリスクが高まることを強調する警告が表示されます。

ユーザーが Codex のネットワークアクセス権限を設定できる、Codex の設定画面のスクリーンショット。

今後の展開

当社は、特に新規のリスク、出現しつつあるリスク、または拡大するリスクに対して、安全性とセキュリティの保護手段を強化するための投資を継続しています。これらの機能に対する安全対策を強化し、セキュリティの進歩によって一般使用におけるリスクが十分に軽減されたと判断され次第、「高リスク」ラベルを削除します。また、ユーザーにリスクを最も効果的に伝えるために、このラベルが付く機能を今後も更新し続けます。

2026年

著者

OpenAI

さらに読む

すべてを表示

Safety and alignment in an era of long-horizon models

安全性2026年7月20日

Why teens deserve access to safe AI — card image

10代の若者に安全な AI が必要な理由

安全性2026年7月16日

GPT-Red：堅牢性向上に向けた自己改善を実現

安全性2026年7月15日