我們正將「網絡可信存取」(TAC) 計劃擴展至數千名經驗證的個別防禦者,以及數百個負責保護關鍵軟件的團隊。多年來,我們一直基於普及化存取、循序部署及生態系統韌性這三項原則,建立網絡防禦計劃。為迎接 OpenAI 在未來數月推出的更強大模型,我們正針對防禦性網絡安全用例進行模型微調。由今日起,我們將推出一個經訓練後對網絡安全限制較少的 GPT‑5.4 變體:GPT‑5.4‑Cyber。本文將分享我們如何隨著模型能力提升,同步擴展網絡防禦,並以此指引未來版本的測試與部署。
AI 的進階應用讓防禦者(即負責保障系統、資料及用戶安全的人員)更快速地在大眾依賴的數碼基礎設施中發現並修復問題。同樣地,AI 正被企圖造成傷害的攻擊者利用。我們一直在為此作好準備。自 2023 年起,我們一直透過網絡安全資助計劃支援防禦者,並透過我們的防範應對架構加強保障措施。同年,我們開始評估我們模型的網絡能力,並於 2025 年開始在針對網絡的保障措施(在新視窗中開啟)中納入模型部署。今年較早時,我們推出了 Codex Security,旨在規模化地識別並修復漏洞,進一步加強對防禦者的支援。我們以三項原則為指引,推動能力持續進步:
- 普及化存取:我們的目標是在防止濫用的同時,盡可能廣泛地提供這些工具。我們設計的機制可避免隨意決定誰能獲得正當用途的存取權限,確保準則一致。這代表我們會使用清晰、客觀的準則與方法(例如嚴格的 KYC 及身份驗證),以決定誰可存取更先進的功能,並隨時間將這些流程自動化。我們的終極目標,是向各種規模的合法單位提供進階防禦功能,包括負責保護關鍵基礎設施、公共服務以及大眾日常依賴的數碼系統的人員。
- 循序部署:我們透過謹慎地將這些系統投入實際應用並隨時間持續改良,從中獲得最寶貴的學習經驗。隨著我們對模型能力與風險的了解加深,我們會相應地更新模型和安全系統。這包括了解特定模型的差異化優勢與風險、提高針對越獄攻擊及其他對抗性攻擊的韌性,以及在減輕危害的同時提升防禦能力。
- 強化生態系統韌性:我們透過可信的存取途徑、具針對性的資助、開源安全計劃(在新視窗中開啟)的支援,以及 Codex Security 等技術,推動並加速防禦者社群的發展,協助防禦者更快速地發現並修補漏洞。
我們的網絡安全韌性與加速防禦策略
多年來,我們的網絡安全策略一直致力於投資研究、防止濫用,以及為防禦者提升效率。隨著模型能力的進步,我們正朝著這些目標擴展計劃,而這些計劃皆植根於以下信念:
- 網絡風險已近在眼前且正不斷加劇,但我們可以採取行動。早在先進 AI 出現之前,數碼基礎設施多年來一直存在漏洞(在新視窗中開啟)。現有模型已能協助識別漏洞、對程式碼庫進行推理,並支援網絡防禦工作流程的重要環節,而威脅行為者亦正嘗試使用各種新型的 AI 驅動手段。我們觀察到,透過在現有模型中運用更複雜的開發架構,並增加推理時運算,能激發出更強大的能力。這意味著保障措施需與時並進,不能空等未來的某個門檻才啟動。
- 根據用戶身份及其使用方式,擴展存取權限。網絡能力本質上具有雙重用途,因此風險並非單由模型本身所決定。風險高低亦取決於用戶身份、其相關的信任指標(在新視窗中開啟),以及獲授權的存取層級。
- 普及通用模型的存取,同時針對高風險功能進行精細管理,並透過更嚴格的驗證、更明確的使用意圖以及更高的使用透明度來確保安全。
- 為了實現大規模的負責任使用,我們需要能以更自動、更客觀的方式,來驗證可靠用戶及用例的系統。這讓我們能夠根據實證及真實的信任訊號擴展存取,而非依賴人手決策。我們認為,由單一中心來決定誰有權進行自我防禦,既不切實際也不恰當。相反,我們致力於讓盡可能多的正當防禦者獲得存取權限,並以驗證、信任指標及問責機制為授權基礎。
- 防禦措施應隨能力提升而持續擴展。隨著模型能力提升,防禦措施也需要同步擴展。我們觀察到智能代理編碼的穩步提升,這對網絡安全有直接影響,而我們也已相應調整了方案。
- 我們從 GPT‑5.2 開始進行針對網絡安全的專門訓練,並在 GPT‑5.3‑Codex 與 GPT‑5.4 強化保障措施。在《防範應對架構》下,我們亦將此模型歸類為具備「高」級別的網絡安全能力。我們同步強化了對防禦者的支援:包括推出 1,000 萬美元的網絡安全資助計劃、藉由 Codex for Open Source(在新視窗中開啟) 為逾千個項目提供免費安全掃描,並不斷改良 Codex Security。
- 繼半年前的私人測試版及今年較早時的研究預覽後,Codex Security 現在已能自動監測程式碼庫、驗證漏洞並提出修復建議。隨著模型進步,系統的精準度與實用性也相應提升。Codex Security 自推出後表現卓越,已成功修復逾 3,000 項重大漏洞,並協助生態系統處理了大量其他風險級別的發現。
- 在這些版本中,我們亦進一步完善了模型處理敏感要求的方式,同時校準拒絕界線,並透過可信存取計劃 (TAC) 擴大存取範圍。
- 軟件開發本身必須變得更加安全。最強大的生態系統,是在編寫軟件的同時,能持續識別、驗證並修復安全問題。透過將先進編碼模型和智能代理功能整合到工作流程中,我們能在開發過程中為開發人員提供即時且具體的建議,這讓網絡安全從週期性的審計與漏洞盤點,轉變為持續且實質地降低風險。
我們致力於普及前沿能力,包括網絡安全專用模型,藉此支援防禦者提升實力。在二月,我們推出了網絡可信存取 (TAC),一方面針對個人實施自動化身份驗證,以減少保障措施對網絡安全相關任務的阻礙,另一方面則與特定機構合作,提供限制較少的網絡模型。
我們今天進一步擴展此計劃,為願意配合 OpenAI 進行身份驗證的網絡安全防禦者,提供更多層級的存取權限。最高級別的客戶將可使用 GPT‑5.4‑Cyber,這款模型經過專門微調,具備更強的網絡安全能力,且功能限制更少。此版本的 GPT‑5.4 放寬了針對正當網絡安全工作的拒絕限制,並為進階防禦流程提供了新功能,包括二進位逆向工程能力。這讓安全專業人員無需取得原始碼,即可分析軟件是否藏有病毒、漏洞或安全缺陷。
由於此模型的限制較少,我們正向經審核的安全供應商、機構及研究人員展開有限度的循序部署。使用限制較少且具備網絡能力的模型可能會有部分限制,特別是針對零資料保留(在新視窗中開啟) (ZDR) 等缺乏透明度的情況。對於透過第三方平台使用我們模型的開發者與機構而言,情況更是如此。因為在這些平台上,OpenAI 難以直接掌握用戶身份、操作環境或查詢意圖。
取得 TAC 的存取權限並不複雜:
- 個人用戶可以在 chatgpt.com/cyber(在新視窗中開啟) 驗證其身份。
- 企業可以透過其 OpenAI 代表,為團隊申請可信存取。
所有通過審核的客戶,將可存取特定版本的現有模型。這些版本放寬了具雙重用途網絡活動的限制,讓用戶能順利開展安全教育、防禦性編碼及漏洞研究等工作。現有的 TAC 客戶若願意進一步核實其正當防禦者身份,可申請(在新視窗中開啟)更高層級的存取權限,包括申請存取 GPT‑5.4‑Cyber。
我們的網絡安全防禦能力,是經過多月不斷改良與測試的成果。我們相信現有的保障措施已足以降低網絡風險,支持目前模型的廣泛部署。我們預計這套保障措施也適用於未來更強大的模型,然而,針對專門訓練且限制較少的的網絡安全模型,則需要更嚴格的部署與相應的管控措施。
長遠而言,要確保 AI 的網絡安全性,我們預期需要擴大防禦規模,因為未來模型的能力提升極快,甚至會超越現今最強大的專用模型。


