跳至主要内容
OpenAI

2026年5月7日

安全防护

借助 GPT‑5.5 和 GPT‑5.5‑Cyber 扩展“网络安全受信访问”计划

我们的最新模型如何帮助防御生态系统的各个层级,并加速安全正向循环

正在加载…

构建 AI 核心基础架构是我们宏大愿景的一部分。多年来,我们始终致力于为网络安全防御者赋能,并持续记录着该领域的进展点滴。就在上周,我们发布了名为“智能时代网络安全”的行动计划,详细阐述了我们普及 AI 驱动型防御体系的愿景。两周前,我们正式推出了迄今为止最智能、最具直觉感知能力的模型 GPT‑5.5。目前,该模型已通过“网络安全受信访问计划” (Trusted Access for Cyber, 简称 TAC)为开发者和安全团队提供强大的网络安全能力。

今天,我们将向负责保护关键基础设施的防御者开放 GPT‑5.5‑Cyber 的受限预览版 (limited preview)。此举旨在为专业的网络安全工作流提供深度支持,从而为更广泛的生态系统保驾护航。

我们始终致力于提供与风险相匹配的安全保障与访问权限,赋能网络防御者更好地守护社会安全。在制定这一策略的过程中,我们与来自联邦及州政府、以及各主要商业实体的网络安全与国家安全领导者进行了深入交流,并从中汲取了宝贵的指导建议。

网络防御生态系统极为庞大。面对该生态内各类机构与研究人员的多样化需求,GPT‑5.5 与 GPT‑5.5‑Cyber 扮演着各不相同的角色。这具体取决于任务类型、应用场景,以及模型使用过程中的安全保障机制。对于大多数团队而言,结合了“网络安全受信访问计划”的 GPT‑5.5 依然是我们目前在合法合规的防御工作中,普适性最强、效能最高的模型,它同时具备防止技术滥用的强大安全屏障。

在本文中,我们将进一步深入分享“网络安全受信访问计划”的运作机制,解析 GPT‑5.5 与 GPT‑5.5‑Cyber 如何精准满足生态内防御者的多样化需求,并探讨不同的访问权限级别将如何影响模型的输出结果。

受信访问机制的运作原理

“网络安全受信访问计划”是一个基于身份与信任机制的框架,旨在确保强大的网络安全能力被交付至可靠的对象手中。该计划的核心目的,是让经过认证的防御者在执行防御任务时,能够更高效地利用 GPT‑5.5 的网络安全能力;与此同时,它依然会严格拦截任何可能在现实世界中造成实际危害的指令请求。

当防御者通过审核并获准加入“网络安全受信访问计划”后,系统将放宽基于分类器的拒绝限制 (lower classifier-based refusals),从而顺畅赋能各类经授权的网络安全工作流,涵盖漏洞识别与分级、恶意软件分析、二进制逆向工程、检测工程以及补丁验证等。当然,模型的安全防线依然牢固,会持续拦截诸如凭据窃取、隐蔽攻击、持久化控制、恶意软件部署及第三方系统利用等恶意行为。

正如我们在上周所宣布的那样,伴随访问权限的提升,我们要求防御者必须具备防钓鱼 (phishing-resistant) 的账户安全保护措施。自 2026 年 6 月 1 日起,对于访问我们能力最强、限制最少的网络安全模型的“网络安全受信访问计划”个人成员,系统将强制要求其开启“高级账户安全”(Advanced Account Security) 功能。已获得受信访问权限的组织机构,则可提供替代证明,确认其单点登录 (SSO) 流程中已内置防钓鱼的身份验证机制。

以下是当前各级受信访问权限的详细解析:

访问权限

具体变化

适用场景

GPT‑5.5(默认)

针对通用场景的标准安全保障

通用场景、开发者及知识型工作

结合“网络安全受信访问”的 GPT‑5.5

为授权环境内经过验证的防御工作提供更精准的安全保障

大多数防御安全工作流,包括安全代码审查、漏洞分级、恶意软件分析、检测工程及补丁验证

GPT‑5.5‑Cyber

针对特定授权工作流提供最大程度的宽容度,并辅以更严格的审核与账户级管控

针对特定工作流的预览访问权限,涵盖授权的红队测试、渗透测试及受控环境下的验证工作

若要直观感受不同模型访问权限级别之间的差异,对比它们的提示词与响应结果无疑是最有效的方式。以下第一个示例展示了在执行同一防御任务时,默认版 GPT‑5.5 与结合了“网络安全受信访问计划”的 GPT‑5.5 的具体差异。该任务的目标是:基于已公开的漏洞编写概念验证代码 (Proof-of-Concept),以在授权环境中验证修复效果。

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

对大多数防御者而言,结合“网络安全受信访问计划”的 GPT‑5.5 绝对是绝佳的首选:它不仅完美保留了模型广泛的通用能力与强大的安全底线,还能游刃有余地处理绝大部分合法合规的防御工作流,如安全代码审查、漏洞分级、恶意软件分析、检测工程以及补丁验证等。

只有当合规授权的工作流依然被模型拦截时,获取更高阶的专属访问权限才显得尤为必要。这种情况通常出现在红队测试与渗透测试等高风险工作流中:此时,防御者的需求往往不止于理论分析,而是要在受控环境中验证漏洞的实际可利用性。GPT‑5.5‑Cyber 正是为深度赋能这类极其专业的双用途 (dual-use) 工作流而生。

以下是一个简单的示例,带你一窥其在实际应用中的表现:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

GPT‑5.5 与 GPT‑5.5‑Cyber 在网络安全任务中的表现

在通用知识型工作与网络安全任务中,GPT‑5.5 均是我们迄今为止最智能、最具直觉感知能力的模型,同时也是我们推荐大多数防御者首选的得力助手。在评估模型的网络安全性能时,我们重点考察其在真实防御工作流中应对复杂场景的能力,特别是那些需要多步推理、灵活调用工具,以及保持执行能力的任务。

推出像 GPT‑5.5‑Cyber 这类高权限网络安全模型的初始预览版,其核心目的并非在 GPT‑5.5 的基础上大幅拔高底层技术能力,而是经过专门训练,使其在处理安全相关任务时拥有更大的宽容度与自由度。

因此,你不应期待这一首发预览版能在每一项网络安全基准测试中全面超越 GPT‑5.5。相反,它的使命在于支持一个迭代式的部署流程:一方面为防御者加速赋能;另一方面,在辅以更严苛的身份验证、防滥用监控、白名单用途限定以及合作伙伴反馈闭环的前提下,安全地支撑那些亟需更高权限的特殊授权工作流。就目前而言,对于大多数常规安全工作流,结合了“网络安全受信访问计划”的 GPT‑5.5 依然是我们强烈推荐的通用起点。

全面拓展安全生态系统的防御能力

我们积极与各大安全厂商建立合作,因为他们正是将“模型能力”转化为“客户保护力”的关键枢纽。无论是在资产发现、安全开发、威胁检测、事件响应,还是网络边界管控环节,当这些防护层级协同进化时,便会驱动一个强大的“安全飞轮”:安全研究人员负责披露漏洞,并提供漏洞利用概念验证代码 (PoC) 与补丁指南;软件供应链安全工具则在源头把关,防止包含漏洞的代码或被篡改的依赖库混入生产环境;EDR(终端检测与响应)和 SIEM(安全信息与事件管理)合作伙伴如同敏锐的雷达,实时捕获真实环境中的攻击迹象;而网络与安全提供商则在官方修复补丁全面推送前,迅速部署 WAF(Web 应用防火墙)级别的缓解措施。

结合了“网络安全受信访问计划”的 GPT‑5.5 正是撬动这一飞轮的最佳基础起点。它能助力经过验证的防御者在整个安全生命周期中快人一步。同时,GPT‑5.5‑Cyber 则允许小范围的核心合作伙伴深入探索那些极度依赖高权限访问的高阶工作流。我们的最终目标,是助力整个安全生态系统以更快的速度保护广大客户,并通过合作伙伴的真实反馈,不断探明在哪些环节需要进一步强化模型评估、身份验证机制或安全护栏。

圆形“安全正向循环”图,包含四个阶段:漏洞修补、网络/安全防护、监控和供应链安全。

网络与安全提供商

在官方补丁全面覆盖之前的空窗期,网络与安全提供商能够有效降低系统的暴露风险。当防御者在验证漏洞并严密监控攻击迹象时,他们可以同步部署 WAF 规则、边缘防护策略以及配置变更,在受影响系统被彻底修复前,抢先阻断潜在的攻击路径。在应对这类复杂环境时,GPT‑5.5 能够为规则审查、配置分析、事件调查,以及安全变更管理提供强有力的支持。

我们正与这些生态伙伴紧密协作,评估如何将这些模型能力转化为客户能够在互联网规模上轻松部署的防护措施。这对于关键基础设施和公共服务领域尤为重要:在这些场景下,分秒必争地降低风险暴露面往往是重大考验。

“在 Cisco,我们将前沿模型视为安全人员强大的力量放大器。像 GPT-5.5 这样的模型正在从根本上改变我们的运行速度,使我们从事件调查到主动减少暴露面等各项工作中,都能行动得更快。但速度不能以牺牲信任为代价。这项技术的真正价值不仅在于模型本身,更在于我们为其构建的企业级框架 — 一个能帮助我们打造更安全产品的框架。我们的重点是利用这些新能力来重塑我们的安全开发与运营流程。对我们而言,目标是实现既快速又可靠的创新。”
— Anthony Grieco,Cisco 高级副总裁、首席安全与信任官

漏洞研究与补丁修复

“安全飞轮”的运转,始于发现漏洞、评估其危害等级,并对受影响的系统进行修复。结合了“网络安全受信访问计划”的 GPT‑5.5 能够包揽其中的大部分繁重工作:无论是理解晦涩难懂的代码、梳理受影响的攻击面、追踪漏洞根本原因,还是审查补丁、构建安全的复现环境、评估漏洞优先级,乃至将分析结果转化为切实可行的修复指南,它都能游刃有余。

然而,部分深度漏洞研究亟需更少的限制。特别是当授权合作伙伴为了进行协调披露 (coordinated disclosure) 或受控验证,需要编写针对性的漏洞利用概念验证代码 (PoC) 时。面对此类工作流,GPT‑5.5‑Cyber 便有了用武之地。通过更严格的验证、监控与反馈闭环,它正协助我们在小范围的合作伙伴中不断学习与优化。

“Intel 是芯片和软件领域的领导者,为全球计算产业提供可信基础。随着 AI 模型在推理能力和速度上不断进步,它们识别、分析并帮助缓解安全威胁的能力变得愈发关键。Intel 期待与 OpenAI 合作,将受治理、可扩展的 AI 能力带入真实世界的网络工作流 — 帮助企业加速漏洞研究、强化修复流程,并在大规模运营中更安全地开展工作。”
— Dhinesh Manoharan,Intel Corporation INT31 安全研究负责人


威胁检测与监控

如果存在漏洞的软件已经上线运行,接下来首要查明的就是:是否已有攻击者正伺机利用?此时,EDR、SIEM、IGA/PAM 以及各类监控合作伙伴,会迅速将最新的安全通报转化为来自生产环境的实战铁证:无论是遥测数据、安全告警,还是检测规则与响应工作流。GPT‑5.5 能够协助分析师迅速串联这些碎片化的信号,提炼关键信息,草拟检测规则,从而在从“漏洞披露”到“事件调查”的过程中大幅提速。这一闭环对于云环境尤为关键,因为在云端,风险暴露、补丁修复与威胁检测往往是深度耦合、牵一发而动全身的。

“在 SentinelOne,AI 真正的价值在于它能多快帮助我们将信号转化为可执行的防御优势。GPT-5.5 帮助分析师关联遥测数据、聚焦关键事项,并强化组织调查、检测和响应新兴威胁的方式。”
— Gregor Stewart,SentinelOne 首席 AI 官

软件供应链安全

飞轮运转的下一环,是将已知恶意代码彻底阻挡在生产环境之外。一旦明确了漏洞详情或遭遇了组件包投毒事件,软件供应链安全工具便会迅速介入,在这些高危依赖项、恶意更新和存在漏洞的代码路径蔓延至客户环境之前,将其拦截。结合了“网络安全受信访问计划”的 GPT‑5.5 能够深入审查依赖项变更,对自有代码中的可利用性进行推理,规划修复优先级,并在软件开发生命周期的极早期揪出组件包的异常行为。

我们正携手 Snyk、Gen Digital、Semgrep 以及 Socket 等优秀合作伙伴,共同测试模型能力在真实事件(如 axios 遭投毒攻击)中的实战表现。在这些场景中,最高效的“止血方案”,莫过于从根源上阻止任何包含漏洞或被篡改的依赖项进入构建环节。

“攻击者已经在将前沿模型武器化。通过部署 OpenAI 的‘网络安全受信访问’计划和 GPT-5.5,我们正在为 Snyk 的防御者提供保护关键供应链所需的能力。这种合作不仅是一个里程碑,更是一项战略必需。”
— Manoj Nair,Snyk 首席创新官

面向开源生态与防御者的 Codex Security

开源往往是漏洞在整个生态系统中极速蔓延的主要途径之一。因此,我们不仅关注下游防护,更将目光投向了上游,致力于从源头赋能开源项目的维护者。Codex Security 能够通过构建特定于代码库的威胁模型、探索真实的攻击路径、在隔离环境中验证问题,并自动生成修复补丁供人工审查,从而协助团队高效地识别、验证并修复漏洞。

借助 Codex for Open Source 计划,部分关键开源项目入选的维护者不仅能够获得 Codex Security 的有条件访问权限,还将配套获得 Codex 及 API 的使用额度。这一举措旨在切实减轻他们的日常维护与代码审查压力。

我们还发布了一个 Codex Security 插件,可将现有安全工作流直接带入任何 Codex 界面(如应用或 CLI),帮助开发者从威胁建模推进到漏洞发现、验证、攻击路径分析和修复方案验证。

展望未来

随着模型在网络安全领域的能力日益精进,将其价值最大化的最佳途径,莫过于助力防御者以更快的速度发现并修复系统软肋。然而,要以负责任的姿态普及这些强大能力,我们必须具备更高的掌控力:明确是谁在使用模型、目标系统是什么、以及这些操作是否经过合法授权。随着身份与组织验证机制、授权使用范围界定,以及防滥用监控体系的不断完善,我们预计未来模型权限的开放范围将稳步扩大。

申请加入“网络安全受信访问计划”的流程非常便捷:

所有顺利通过上述流程获批的客户,将解锁现有模型的专属版本。这些版本大幅减少了在执行双用途 (dual-use) 网络安全活动时,因触发安全护栏而产生的阻力,让防御者能够更加畅通无阻地开展安全教育培训、防御编程以及负责任的漏洞研究等工作。

事实上,早在 Alpha 测试阶段,GPT‑5.5‑Cyber 就已被成功应用于关键系统的自动化红队测试规模化演练,并出色完成了高危漏洞的验证工作。作为我们“负责任披露”(responsible disclosure) 承诺的一部分,我们将在未来的技术解析文章中详细披露这些实战案例。

未来,我们将通过构建多元化的模型矩阵,持续为防御者加速赋能。这不仅包括通过“网络安全受信访问计划”开放的旗舰模型,也涵盖像 GPT‑5.5‑Cyber 这样专精网络安全的垂直模型,乃至未来能力更加出色的新一代网络安全模型。

作者

OpenAI