今日我們正式推出我們的應用程式系統防護智能代理 Codex Security。Codex Security 會深入理解你的項目上下文,從而找出其他智能代理工具難以發現的複雜漏洞,並提供可信度更高的安全問題分析和修復建議,在提升系統安全的同時,減少無關緊要錯誤帶來的干擾。
在評估真正的安全風險時,上下文非常關鍵。然而,目前不少 AI 系統防護工具只會標示影響較低的問題,或產生大量假陽性誤報,令安全團隊需要花費大量時間進行問題分流和分類處理。另一方面,智能代理正加快軟件開發的速度,令安全審查逐漸成為開發流程中的重要瓶頸。
Codex Security 正是為了解決這兩個問題而設計。透過結合我們前沿模型的智能代理推理能力與自動驗證機制,它可以提供可信度更高的安全問題分析及修復建議,讓團隊能集中處理真正重要的漏洞,並更快推出安全可靠的程式碼。
Codex Security 前身為 Aardvark,去年以私人 Beta 版本形式與少量客戶展開合作。在早期內部部署中,它發現了一個真實的 SSRF 漏洞、一個關鍵的跨租戶身份驗證漏洞,以及多個其他安全問題,而我們的系統防護團隊在數小時內便完成修補。與外部測試者的早期部署亦幫助我們改善了多個環節,包括用戶如何提供相關產品上下文,以及如何由初始設定順利過渡到保護程式碼的實際運作。在 Beta 版本測試期間,我們亦顯著提升了分析結果的質素。在不同時段對同一程式碼庫進行多次掃描時,準確度持續提升,其中一個案例自首次推出以來已把噪音減少 84%。我們亦把過度評估嚴重程度的情況降低了 90% 以上,而所有程式碼庫的假陽性率亦下降 50% 以上。這些改進令 Codex Security 在評估問題嚴重程度時,更能反映現實世界的風險,同時減少系統防護團隊不必要的問題分流工作。我們亦預期,隨著持續改進,系統的訊號與噪音比將會進一步提升。
由今天起,Codex Security 將透過 Codex 網絡版向 ChatGPT Enterprise、Business 和 Edu 客戶逐步推出,並在未來一個月提供免費使用。
Codex Security 利用 OpenAI 的前沿模型以及 Codex 智能代理。透過把漏洞發現、驗證和修補建立在系統本身的上下文之上,它可以有效減少噪音並加快修復流程。
- 建立系統上下文並生成可編輯的威脅模型:在設定掃描後,系統會分析你的程式碼庫,理解系統中與系統防護相關的重要結構,並建立一個項目專屬的威脅模型。這個模型會定義系統的核心功能、系統信任哪些服務或元件,以及哪些部分最容易受到攻擊。威脅模型亦可以由用戶自行編輯,以確保智能代理與團隊的實際架構保持一致。
- 確定問題優先次序並進行驗證:Codex Security 會以威脅模型作為背景脈絡,搜尋潛在漏洞,並根據在實際系統中的影響程度對問題進行分類。在可行情況下,Codex Security 會在沙盒驗證環境中測試這些問題,以區分真正的安全風險與噪音。用戶可以在「已驗證的安全問題」中查看相關分析。當 Codex Security 配置了符合項目的運行環境時,亦可以直接在系統實際運作的上下文中驗證潛在問題。這種更深入的驗證方式可以進一步減少假陽性誤報,並建立可運作的概念驗證(PoC),讓安全團隊更容易理解問題並採取修復行動。
- 在完整系統上下文下提出修補方案:最後,Codex Security 會根據系統設計意圖及周邊行為提出修復建議。這樣既能提升安全性,也能減少引入新問題的風險,使修補更容易審查與合併。用戶亦可以篩選安全問題,專注處理對團隊最重要、影響最大的部分。
Codex Security 亦會隨著使用過程逐步從你的反饋中學習,以改善其分析結果。當你調整某個問題的嚴重程度時,系統會利用這些反饋改善威脅模型,進一步掌握你的系統架構和風險環境,並在之後的掃描中提升準確度。
系統亦設計為可在大規模環境中運作,並優先呈現可信度最高的安全問題和容易採納的修補方案。在過去 30 天,Codex Security 已在 Beta 版本測試群組的外部程式碼庫中掃描超過 120 萬個提交項目,識別出 792 個關鍵安全問題和 10,561 個高嚴重程度問題。關鍵問題只出現在少於 0.1% 的掃描提交項目中,顯示系統能在大量程式碼中找出真正影響系統防護的問題,同時把審查人員需要處理的噪音降到最低。
「作為一間高度重視產品安全的公司,NETGEAR 很高興能參與這個優先體驗計劃,而成果亦遠超我們的預期。Codex Security 能夠無縫整合到我們成熟的安全開發環境中,進一步提升審查流程的速度與深度。它提供的發現結果清晰而全面,很多時甚至讓人感覺像有一位資深的產品安全研究員正在與我們並肩工作。」
開源軟件是現代系統的重要基礎,包括我們自己的系統。我們一直使用 Codex Security 掃描我們最依賴的開源程式碼庫,並與維護者分享發現的高影響安全問題,從而協助提升整個生態系統的安全。
在與開源維護者交流的過程中,我們發現一個非常一致的情況:問題並不是缺乏漏洞報告,而是低質素的報告太多。很多維護者表示,他們需要減少假陽性誤報、以更可持續的方式發現真正的系統防護問題,同時避免增加額外的問題分流工作。這些交流直接影響我們設計 Codex Security 支援開源社群的方式。與其產生大量推測性的問題,我們更專注於識別可信度高且可行動的安全問題,讓維護者可以更快處理。
作為這項工作的其中一部分,我們已向多個廣泛使用的開源項目報告關鍵漏洞,包括: OpenSSH(在新視窗中開啟)、GnuTLS(在新視窗中開啟)、GOGS(在新視窗中開啟)、Thorium(在新視窗中開啟)、libssh、PHP 和 Chromium 等等。目前已有 14 個 CVE 被分配,其中兩個採用雙重報告。我們在附錄中分享了一些例子。
我們最近亦開始把首批開源維護者納入 Codex for OSS 計劃。這個計劃為開源社群提供免費 ChatGPT Pro 和 Plus 帳戶、程式碼審查和 Codex Security 支援。像 vLLM 這樣的項目,已經在日常工作流程中使用 Codex Security 來發現並修補問題。
未來數星期,我們會繼續擴展這個計劃,讓更多維護者能更容易提升安全性、改善審查流程,並持續支持整個開源生態系統。如果你是開源項目維護者並有興趣參與,歡迎與我們聯絡。
我們亦會在未來幾日向 ChatGPT Enterprise、Business 和 Edu 客戶逐步推出 Codex Security。你亦可以查看相關文件(在新視窗中開啟),了解如何為你的團隊設定 Codex Security。
- GnuTLS certtool 堆積區緩衝區溢位(Off-by-One) — CVE-2025-32990(在新視窗中開啟)
- GnuTLS 在 SCT 擴充功能解析中的堆積區緩衝區過度讀取 — CVE-2025-32989(在新視窗中開啟)
- GnuTLS 在 otherName SAN 匯出中的 Double-Free 問題 — CVE-2025-32988(在新視窗中開啟)
- GOGS 可繞過雙重驗證(2FA) — CVE-2025-64175(在新視窗中開啟)
- GOGS 未經驗證的存取繞過 — CVE-2026-25242(在新視窗中開啟)
- 路徑穿越漏洞(可造成隨意寫入) — download_ephemeral、download_children(agent) — CVE-2025-35430(在新視窗中開啟)
- LDAP 注入漏洞(filters 及 DN) — LdapUserMap::new / get_unix_info / basic_auth_ldap — CVE-2025-35431(在新視窗中開啟)
- 未經驗證的 DoS 與電郵濫用問題 — resend_email_verification — CVE-2025-35432(在新視窗中開啟) , CVE-2025-35436(在新視窗中開啟)
- 更改密碼後未重新產生工作階段 — User::update_user — CVE-2025-35433(在新視窗中開啟)
- 停用 TLS 驗證 — Elasticsearch 客戶端 — CVE-2025-35434(在新視窗中開啟)
- DoS:除以零錯誤 — /api/streams/depth/.../{split} — CVE-2025-35435(在新視窗中開啟)
- gpg-agent 在 PKDECRYPT --kem=CMS(ECC KEM)中的堆疊緩衝區溢位 — CVE-2026-24881(在新視窗中開啟)
- TPM2 PKDECRYPT 在 RSA 和 ECC 情況下因未驗證密文長度而導致的堆疊緩衝區溢位 — CVE-2026-24882(在新視窗中開啟)
- CMS / PKCS7 AES-GCM ASN.1 參數堆疊緩衝區溢位 — CVE-2025-15467(在新視窗中開啟)
- PKCS#12 PBMAC1 PBKDF2 keyLength 溢位及 MAC 繞過 — CVE-2025-11187(在新視窗中開啟)


