我們正在擴大網路安全可信存取計畫,涵蓋數千名經驗證的個別防禦人員,以及數百個負責保護關鍵軟體的團隊。多年來,我們依循普及化存取、漸進式部署與生態系韌性三大原則,持續打造網路防禦計畫。為因應未來幾個月推出能力更強的模型,我們針對防禦性資安情境進行模型微調,並率先推出一個針對資安需求放寬限制的 GPT‑5.4 版本:GPT‑5.4‑Cyber。本文說明我們如何讓網路防禦的擴展與模型能力同步成長,以此作為未來版本測試與部署的方向。
隨著 AI 持續導入,負責保護系統、資料與使用者安全的防禦人員工作效率明顯提升,能更快在大眾仰賴的數位基礎設施中發現並修正問題。同時,攻擊者也開始運用 AI 進行惡意行動。為此,我們一直積極準備。自 2023 年起,我們透過網路安全補助計畫支援防禦者,並透過應變整備框架持續強化防護措施。同年,我們開始評估模型的網路安全能力,並於 2025 年在模型部署中納入網路安全專用的防護措施(在新視窗中開啟)。今年稍早,我們推出 Codex Security,進一步強化對防禦人員的支援,協助大規模找出漏洞並加以修補。我們推動能力持續進步的方法依循三項原則:
- 普及存取:我們的目標是在防止濫用的前提下,讓這些工具盡可能廣泛開放使用。我們設計相關機制,避免由人為主觀判斷誰可以或不行基於正當用途取得存取權。這代表採用明確且客觀的標準與方法,例如嚴格的 KYC 與身分驗證,用於判斷 哪些人可以存取更進階的功能,並逐步將這些流程自動化。最終,我們希望讓各種規模的正當使用者都能取得進階防禦能力,包括負責保護關鍵基礎設施、公共服務,以及大眾日常仰賴的數位系統的人員。
- 漸進式部署:我們審慎將這些系統導入實際環境,持續改進,從中累積寶貴經驗。隨著對模型能力與風險的理解加深,我們也會同步更新模型與安全系統,包括掌握不同模型的優勢與風險差異、提升對越獄與其他對抗性攻擊的韌性,以及強化防禦能力,同時降低潛在危害。
- 強化生態系韌性:我們運用可信存取機制、定向補助、投入開放原始碼資安計畫(在新視窗中開啟),以及像 Codex Security 這類技術,支援並加速防禦者社群發展,協助更快找出及修補漏洞。
網路安全韌性與防禦加速策略
多年來,我們的網路安全策略聚焦於投入研究、防止濫用,並強化對防禦人員的支援。隨著模型能力持續提升,我們也擴展相關計畫,朝這些目標推進,背後依據以下幾項信念:
- 網路風險早已存在,且持續升高,但我們仍能採取行動。數位基礎設施在先進 AI 出現之前,就已長期處於脆弱狀態(在新視窗中開啟)。如今,現有模型已能協助找出漏洞、跨程式碼庫進行推理,並支援資安工作流程中的關鍵環節,同時惡意人士也在嘗試新的 AI 驅動攻擊方式。我們已觀察到,在測試階段投入更多運算資源,搭配精密的執行框架,可以從現有模型中引出越來越強的能力。這也代表,防護機制不能等到未來某個單一門檻才開始建立。
- 根據實際使用者與使用情境,調整並擴大存取權限。網路能力本質上具備雙重用途,因此風險不能只看模型本身。風險同時取決於使用者、其周遭的信任訊號(在新視窗中開啟),以及實際授予的存取權限層級。
- 在具備防護措施的前提下,可以廣泛開放通用模型的存取,同時針對高風險能力設置更細緻的控管機制,並搭配更嚴謹的驗證、更清楚的使用意圖訊號,以及更完善的使用情況可視性。
- 為了在大規模應用下確保負責任的使用,我們需要能以更自動化、更客觀的方式驗證可信的使用者與使用情境。這讓我們能根據證據與實際的信任訊號來擴大存取範圍,不必依賴人工判斷。我們認為由中央統一決定誰有權自我防衛,既不可行,也不恰當。我們的目標是盡可能協助眾多正當防禦者取得存取權限,並以驗證、信任訊號與問責機制作為基礎。
- 防禦措施應隨著能力提升而持續擴展。隨著模型能力提升,防禦能力也必須同步擴展。我們觀察到代理型程式設計持續進步,對資安帶來直接影響,因此我們也同步調整應對方式。
- 我們從 GPT‑5.2 開始進行網路安全專項訓練,接著在 GPT‑5.3‑Codex 和 GPT‑5.4 中加入更多防護措施加以擴展,並根據應變整備框架,將該模型的網路能力等級歸類為「高」。同時,我們也加強對防禦者的支援:推出 1,000 萬美元網路安全補助計畫、透過提供免費安全掃描的 Codex for Open Source(在新視窗中開啟) 觸及超過 1,000 個開放原始碼專案,並持續強化 Codex Security。
- Codex Security 於六個月前以私人 Beta 形式推出,並於今年稍早以研究預覽形式亮相,可自動監控程式碼庫、驗證問題,並提出修復建議。隨著模型持續進步,系統的精準度與實用性也同步提升。Codex Security 自近期推出以來,已協助修復超過 3,000 項重大與高嚴重程度漏洞,並在整個生態系中處理更多低嚴重程度的問題。
- 在這幾次發布中,我們也持續改進模型處理敏感請求的方式,一方面調整拒絕回應的界線,另一方面藉由網路安全可信存取計畫等機制擴大可信存取範圍。
- 軟體開發本身必須更加安全。最理想的生態系,應該能在軟體開發過程中持續找出、驗證並修正安全問題。我們將先進的程式設計模型與代理能力整合進開發工作流程,在開發過程中即時提供可採取行動的回饋,讓安全機制從零星稽核與靜態錯誤清單,轉為在開發過程中持續偵測並降低風險。
我們希望透過廣泛提供前沿能力的存取權,包括專為網路安全量身打造的模型,強化防禦者的能力。今年 2 月,我們推出了網路安全可信存取計畫,針對個人提供自動化身分驗證,減少資安相關任務中防護措施帶來的阻礙,同時也與少數組織合作,提供在資安情境下限制較少的模型。
我們今天擴大這項計畫,為願意與 OpenAI 合作驗證其網路安全防禦身分的使用者,新增更多存取層級。最高層級的客戶將可使用 GPT‑5.4‑Cyber,這是一款針對進階網路能力進行微調、限制較少的模型。這個版本的 GPT‑5.4 會降低正當資安工作的拒絕回應界線,並為進階防禦工作流程提供新能力,包括二進位逆向工程,讓安全專業人員即使沒有原始碼,也能分析已編譯軟體的惡意程式風險、潛在漏洞與整體安全穩健性。
由於這個模型的限制較少,我們會先從小規模、逐步推進的部署開始,提供給經審核的資安供應商、機構與研究人員使用。對這類限制較少且具備網路能力的模型,其存取可能仍會受到限制,尤其是在如零資料保留(在新視窗中開啟) (ZDR) 這類不透明的使用情境。這種情況在透過第三方平台存取模型的開發者與組織中尤為常見,因為 OpenAI 較難直接掌握使用者身分、使用環境或請求目的。
取得網路安全可信存取計畫的存取權限很簡單:
- 個人使用者可以在 chatgpt.com/cyber(在新視窗中開啟) 驗證身分。
- 企業可透過其 OpenAI 代表,為團隊申請可信存取權限。
凡經此流程核准的客戶都可存取現有模型的特定版本。這類版本降低了防護機制在面對軍民兩用網路活動時可能造成的干擾,使其能持續支援安全教育、防禦性程式設計與負責任的漏洞研究。客戶加入網路安全可信存取計畫後,若願意進一步驗證其為合法網路防禦者的客戶,可表達申請更高層級存取權的意願(在新視窗中開啟),包括申請使用 GPT‑5.4‑Cyber。
我們的資安防禦能力,是經過數個月反覆改進逐步累積的成果。我們認為,目前採用的這類防護措施,已足以降低網路風險,並支援現有模型的廣泛部署。我們預期,這些防護措施的不同版本,對於即將推出、能力更強的模型仍然適用;但針對專為資安工作訓練、且限制較少的模型,則需要更嚴格的部署方式與相應的控管措施。
長遠來看,為了確保 AI 在資安領域一直具備充足的防護能力,我們也預期未來需要更全面的防禦機制,因為新一代模型的能力將迅速超越目前最先進的專用模型。


