跳至主要內容
OpenAI

2026年2月13日

安全產品

在 ChatGPT 中引進「封鎖模式」和一致的「升級風險」標籤

載入中…

隨著 AI 系統承擔更複雜的任務 (尤其是涉及網路和連接應用程式的任務),安全風險的利害關係也隨之改變。

一個新興的風險變得尤為重要:提示注入。在這些攻擊中,第三方試圖誤導對話式 AI 系統,讓其遵循惡意指令或洩露敏感資訊。

今天,我們推出了兩項新的防護措施,旨在幫助使用者和組織緩解提示注入攻擊,並提供更清晰的風險可視性和更強的控制能力:

  • ChatGPT 中的封鎖模式是一項進階的可選安全設定,針對高風險使用者設計
  • 在 ChatGPT、ChatGPT Atlas 和 Codex 中,某些可能會帶來額外風險的功能會標示為「風險升級」

這些新增內容奠基於我們在模型、產品和系統等級的現有防護措施。包括沙箱隔離、防範 URL 式資料外洩、監控與執行,以及像角色權限控管和稽核記錄等企業控制

協助組織保護最容易受到網路攻擊威脅的員工

封鎖模式是一個可選的進階安全設定,專為一小群高度重視安全的使用者設計,例如知名組織的高階主管或安全團隊,他們需要更強的防護來抵禦進階威脅。對大多數使用者而言沒有必要。封鎖模式會嚴格限制 ChatGPT 與外部系統的互動方式,以降低提示注入造成資料外洩的風險。

封鎖模式會以確定性的方式停用 ChatGPT 中的某些工具和功能,以防範對手試圖利用這些工具和功能,透過提示注入等攻擊,從使用者的對話或連線的應用程式中竊取敏感資料。

例如,封鎖模式下的網頁瀏覽僅限於快取內容,因此不會有任何即時網路要求會離開 OpenAI 控制的網路。此限制旨在防範敏感資料透過瀏覽外洩給攻擊者。當我們無法提供資料安全的強大確定性保證時,某些功能將會完全停用。

標題為「鎖定模式」的圖表,顯示 ChatGPT 位於安全邊界內,可連線至隱私網頁快取、下載檔案、透過畫布存取網頁,以及瀏覽公共網路。外部的「攻擊者」和公共網路描繪在邊界之外,封鎖的進入點顯示在鎖定模式下的限制存取。

封鎖模式是一種新的確定性設定,透過嚴格限制 ChatGPT 與某些外部系統的互動,協助防範資料在無意間與第三方共享。

ChatGPT 商務方案已提供企業級資料安全。封鎖模式在這些保護措施之上進一步加強,適用於 ChatGPT Enterprise、ChatGPT Edu、ChatGPT 醫療照護版和 ChatGPT for Teachers。管理員可以在工作區設定(在新視窗中開啟)中建立新的角色(在新視窗中開啟)來啟用此功能。啟用後,封鎖模式會在現有的管理員設定之上增加額外的限制。

在我們的說明中心(在新視窗中開啟)深入瞭解「封鎖模式」。

由於某些關鍵工作流程依賴應用程式,因此工作區管理員保留更細緻的控制權限。他們可以精確選擇在封鎖模式中,哪些應用程式及其中特定的動作可供使用者使用。此外,與封鎖模式不同的是,合規 API 日誌平台(在新視窗中開啟)讓使用者掌控應用程式使用情況、共享資料和連線來源的詳情,幫助管理員維持監督。

我們計畫在未來幾個月內向消費者提供封鎖模式。

協助使用者做出有關風險的明智選擇

AI 產品與您的應用程式和網路連線時,可以提供更多的幫助,而我們也已投入大量資源,確保連線資料的安全。同時,某些與網路相關的功能引入了新的風險,而這些風險尚未完全被業界的安全與資安緩解措施充分解決。有些使用者可能會願意承擔這些風險,我們認為讓使用者有能力決定是否以及如何使用這些風險是很重要的,在處理他們的私人資料時更是如此。

我們的做法是針對可能帶來額外風險的功能,提供產品內部指引。為了讓這點更清楚且更一致,我們正在標準化一小部分既有功能的標示方式。這些功能現在將在 ChatGPT、ChatGPT Atlas 和 Codex 上使用一致的「風險升級」標籤,因此使用者無論在何處遇到這些功能,都能獲得相同的指引。

例如,在我們的程式碼助理 Codex 中,開發者可以授予 Codex 網路存取權限,使其在網路上執行操作,例如查閱文件。相關的設定畫面包含「風險升級」標籤,並清楚說明哪些內容會變更、可能會引進哪些風險,以及何時適合進行該存取。

「Agent 網際網路存取權限」的設定面板,切換開關設為開啟,顯示網域允許清單及其他允許的網域 (包括 openai.com)、允許的 HTTP 方法,以及一則標示在啟用網際網路存取權限時會有較高安全風險的警告。

Codex 設定畫面的螢幕截圖,使用者可以在此設定 Codex 的網路存取權限。

未來規畫

我們持續投資以增強安全與安全防護措施,特別是針對新穎、新興或與日俱增的風險。隨著強化這些功能的防護措施,一旦我們判定安全性進展已充分降低這些風險以供一般使用,我們將移除「風險升級」標籤。我們也會持續更新貼有此標籤的功能,以便向使用者傳達最佳的風險訊息。

作者

OpenAI