2026年4月14日

新網絡防禦時代的可信存取

我們不斷完善可信存取、保障措施及生態系統，協助網絡防禦者守護大眾安全。

正在載入...

我們正將「網絡可信存取」（TAC) 計劃擴展至數千名經驗證的個別防禦者，以及數百個負責保護關鍵軟件的團隊。多年來，我們一直基於普及化存取、循序部署及生態系統韌性這三項原則，建立網絡防禦計劃。為迎接 OpenAI 在未來數月推出的更強大模型，我們正針對防禦性網絡安全用例進行模型微調。由今日起，我們將推出一個經訓練後對網絡安全限制較少的 GPT‑5.4 變體：GPT‑5.4‑Cyber。本文將分享我們如何隨著模型能力提升，同步擴展網絡防禦，並以此指引未來版本的測試與部署。

AI 的進階應用讓防禦者（即負責保障系統、資料及用戶安全的人員）更快速地在大眾依賴的數碼基礎設施中發現並修復問題。同樣地，AI 正被企圖造成傷害的攻擊者利用⁠。我們一直在為此作好準備。自 2023 年起，我們一直透過網絡安全資助計劃⁠支援防禦者，並透過我們的防範應對架構⁠加強保障措施。同年，我們開始評估模型的網絡能力，並於2025年開始將網絡專屬保障措施⁠（在新視窗中開啟）納入我們的模型部署⁠。今年較早時，我們推出了 Codex Security⁠，旨在規模化地識別並修復漏洞，進一步加強對防禦者的支援。我們以三項原則為指引，推動能力持續進步：

普及化存取：我們的目標是在防止濫用的同時，盡可能廣泛地提供這些工具。我們設計的機制可避免隨意決定誰能獲得正當用途的存取權限，確保準則一致。這代表我們會使用清晰、客觀的準則與方法（例如嚴格的 KYC 及身份驗證），以決定誰可存取⁠更先進的功能，並隨時間將這些流程自動化。我們的終極目標，是向各種規模的合法單位提供進階防禦功能，包括負責保護關鍵基礎設施、公共服務以及大眾日常依賴的數碼系統的人員。
循序部署：我們透過謹慎地將這些系統投入實際應用⁠並隨時間持續改良，從中獲得最寶貴的學習經驗。隨著我們對模型能力與風險的了解加深，我們會相應地更新模型和安全系統。這包括了解特定模型的差異化優勢與風險、提高針對越獄攻擊及其他對抗性攻擊的韌性，以及在減輕危害的同時提升防禦能力。
強化生態系統韌性：我們透過可信的存取途徑、具針對性的資助⁠、開源安全計劃⁠（在新視窗中開啟）的支援，以及 Codex Security⁠ 等技術，推動並加速防禦者社群的發展，協助防禦者更快速地發現並修補漏洞。

我們的網絡安全韌性與加速防禦策略

多年來，我們的網絡安全策略一直致力於投資研究、防止濫用，以及為防禦者提升效率。隨著模型能力的進步，我們正朝著這些目標擴展計劃，而這些計劃皆植根於以下信念：

網絡風險已近在眼前且正不斷加劇，但我們可以採取行動。早在先進 AI 出現之前，數碼基礎設施多年來一直存在漏洞⁠（在新視窗中開啟）。現有模型已能協助識別漏洞、對程式碼庫進行推理，並支援網絡防禦工作流程的重要環節，而威脅行為者亦正嘗試使用各種新型的 AI 驅動手段。我們觀察到，透過在現有模型中運用更複雜的開發架構，並增加推理時運算，能激發出更強大的能力。這意味著保障措施需與時並進，不能空等未來的某個門檻才啟動。
根據用戶身份及其使用方式，擴展存取權限。網絡能力本質上具有雙重用途，因此風險並非單由模型本身所決定。風險高低亦取決於用戶身份、其相關的信任指標⁠（在新視窗中開啟），以及獲授權的存取層級。
- 普及通用模型的存取，同時針對高風險功能進行精細管理，並透過更嚴格的驗證、更明確的使用意圖以及更高的使用透明度來確保安全。
- 為了實現大規模的負責任使用，我們需要能以更自動、更客觀的方式，來驗證可靠用戶及用例的系統。這讓我們能夠根據實證及真實的信任訊號擴展存取，而非依賴人手決策。我們認為，由單一中心來決定誰有權進行自我防禦，既不切實際也不恰當。相反，我們致力於讓盡可能多的正當防禦者獲得存取權限，並以驗證、信任指標及問責機制為授權基礎。
防禦措施應隨能力提升而持續擴展。隨著模型能力提升，防禦措施也需要同步擴展。我們觀察到智能代理編碼的穩步提升，這對網絡安全有直接影響，而我們也已相應調整了方案。
- 我們從 GPT‑5.2 開始進行針對網絡安全的專門訓練，並在 GPT‑5.3‑Codex 與 GPT‑5.4 強化保障措施。在《防範應對架構》下，我們亦將此模型歸類為具備「高」級別的網絡安全能力。我們同步強化了對防禦者的支援：包括推出 1,000 萬美元的網絡安全資助計劃⁠、藉由 Codex for Open Source⁠（在新視窗中開啟）為逾千個項目提供免費安全掃描，並不斷改良 Codex Security。
- 繼半年前的私人測試版及今年較早時⁠的研究預覽後，Codex Security 現在已能自動監測程式碼庫、驗證漏洞並提出修復建議。隨著模型進步，系統的精準度與實用性也相應提升。Codex Security 自推出後表現卓越，已成功修復逾 3,000 項重大漏洞，並協助生態系統處理了大量其他風險級別的發現。
- 在這些版本中，我們亦進一步完善了模型處理敏感要求的方式，同時校準拒絕界線，並透過可信存取計劃 (TAC) 擴大存取範圍。
軟件開發本身必須變得更加安全。最強大的生態系統，是在編寫軟件的同時，能持續識別、驗證並修復安全問題。透過將先進編碼模型和智能代理功能整合到工作流程中，我們能在開發過程中為開發人員提供即時且具體的建議，這讓網絡安全從週期性的審計與漏洞盤點，轉變為持續且實質地降低風險。

擴展「網絡可信存取」與 GPT‑5.4‑Cyber

我們致力於普及前沿能力，包括網絡安全專用模型，藉此支援防禦者提升實力。在二月，我們推出了網絡可信存取⁠ (TAC)，一方面針對個人實施自動化身份驗證，以減少保障措施對網絡安全相關任務的阻礙，另一方面則與特定機構合作，提供限制較少的網絡模型。

我們今天進一步擴展此計劃，為願意配合 OpenAI 進行身份驗證的網絡安全防禦者，提供更多層級的存取權限。最高級別的客戶將可使用 GPT‑5.4‑Cyber，這款模型經過專門微調，具備更強的網絡安全能力，且功能限制更少。此版本的 GPT‑5.4 放寬了針對正當網絡安全工作的拒絕限制，並為進階防禦流程提供了新功能，包括二進位逆向工程能力。這讓安全專業人員無需取得原始碼，即可分析軟件是否藏有病毒、漏洞或安全缺陷。

由於此模型的限制較少，我們正向經審核的安全供應商、機構及研究人員展開有限度的循序部署。使用限制較少且具備網絡能力的模型可能會有部分限制，特別是針對零資料保留⁠（在新視窗中開啟） (ZDR) 等缺乏透明度的情況。對於透過第三方平台使用我們模型的開發者與機構而言，情況更是如此。因為在這些平台上，OpenAI 難以直接掌握用戶身份、操作環境或查詢意圖。

取得 TAC 的存取權限並不複雜：