Pular para o conteúdo principal
OpenAI

7 de maio de 2026

Segurança

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Carregando…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

Acesso

O que muda

Casos de uso pretendidos

GPT‑5.5 (padrão)

Salvaguardas padrão para uso geral

Uso geral, trabalho de desenvolvedor e trabalho de conhecimento

GPT‑5.5 com TAC

Salvaguardas mais precisas para trabalho defensivo verificado em ambientes autorizados

A maioria dos fluxos de trabalho de segurança defensiva, incluindo revisão segura de código, triagem de vulnerabilidades, análise de malware, engenharia de detecção e validação de patches

GPT‑5.5‑Cyber

Comportamento mais permissivo para fluxos de trabalho autorizados especializados, combinado com verificação mais forte e controles no nível da conta

Acesso em prévia para fluxos de trabalho especializados, incluindo red teaming autorizado, testes de penetração e validação controlada

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Como o GPT‑5.5 e o GPT‑5.5‑Cyber se saem em tarefas cibernéticas

O GPT‑5.5 é nosso modelo mais inteligente e intuitivo tanto para trabalho de conhecimento de uso geral quanto para tarefas de cibersegurança, e é o modelo que esperamos que a maioria dos defensores use. Avaliamos o desempenho cibernético em tarefas que exigem raciocínio em múltiplas etapas, uso de ferramentas e persistência em fluxos de trabalho defensivos realistas.

A prévia inicial de modelos mais permissivos para cyber, como o GPT‑5.5‑Cyber, não foi pensada para aumentar significativamente a capacidade cibernética além do GPT‑5.5 — ele foi treinado principalmente para ser mais permissivo em tarefas relacionadas à segurança.

Como resultado, não se espera que essa primeira prévia supere o GPT‑5.5 em todas as avaliações cibernéticas. Em vez disso, ela apoia um processo iterativo de implantação para acelerar os defensores e, com segurança, dar suporte a fluxos de trabalho autorizados mais especializados que exigem comportamento mais permissivo, combinado com verificação mais forte, monitoramento de uso indevido, delimitação de uso aprovado e feedback de parceiros. Por enquanto, o GPT‑5.5 com Trusted Access for Cyber continua sendo o ponto de partida recomendado para a maioria dos fluxos de trabalho de segurança.

Escalando a capacidade defensiva em todo o ecossistema de segurança

Estamos fazendo parceria com fornecedores de segurança porque eles estão no ponto em que a capacidade do modelo pode se transformar em proteção ao cliente: descoberta, desenvolvimento, detecção, resposta e aplicação de políticas de rede. Quando essas camadas melhoram juntas, elas criam um ciclo virtuoso de segurança: pesquisadores divulgam vulnerabilidades com provas de conceito de exploração e orientações de patch, ferramentas de segurança da cadeia de suprimentos de software impedem que código vulnerável e dependências comprometidas cheguem à produção, parceiros de EDR e SIEM detectam exploração em campo, e provedores de rede e segurança implantam mitigações em nível de WAF enquanto as correções são distribuídas.

O GPT‑5.5 com Trusted Access for Cyber é o ponto de partida amplo para esse trabalho. Ele pode ajudar defensores verificados a avançar mais rapidamente em todo o ciclo de vida da segurança, enquanto o GPT‑5.5‑Cyber permite que um conjunto menor de parceiros estude fluxos de trabalho avançados em que o comportamento de acesso especializado pode fazer diferença. O objetivo é ajudar o ecossistema de segurança a proteger clientes mais rapidamente e, em seguida, aprender com o feedback dos parceiros onde são necessárias avaliações, verificações ou salvaguardas mais rigorosas.

Diagrama circular de “ciclo virtuoso de segurança” com quatro etapas: correção de vulnerabilidades, proteção de rede/segurança, monitoramento e segurança da cadeia de suprimentos.

Provedores de rede e segurança

Provedores de rede e segurança podem reduzir a exposição enquanto as correções ainda estão sendo distribuídas. À medida que defensores validam uma vulnerabilidade e monitoram sinais de exploração, eles também podem implantar regras de WAF, mitigações de borda e mudanças de configuração que atenuem caminhos de ataque prováveis antes que todos os sistemas afetados tenham sido corrigidos. O GPT‑5.5 pode dar suporte à revisão de regras, análise de configuração, investigação de incidentes e gestão segura de mudanças em ambientes complexos. 

Estamos trabalhando com esses parceiros para nos ajudar a avaliar como essas capacidades se traduzem em proteções que clientes podem implantar em escala de internet, inclusive para infraestrutura crítica e serviços públicos, onde reduzir a exposição rapidamente é importante.

"Na Cisco, vemos modelos de fronteira como um poderoso multiplicador de força para defensores. Modelos como o GPT-5.5 estão mudando fundamentalmente a velocidade das nossas operações, permitindo que avancemos mais rápido em tudo, da investigação de incidentes à redução proativa de exposição. Mas velocidade não pode vir às custas da confiança. O verdadeiro valor dessa tecnologia não está apenas no modelo, mas no framework pronto para empresas que construímos ao redor dele. Um framework que nos ajuda a criar produtos mais seguros. Nosso foco é transformar nossos processos seguros de desenvolvimento e operações com essas novas capacidades. Para nós, trata-se de viabilizar uma inovação tão confiável quanto rápida."
— Anthony Grieco, vice-presidente sênior, Diretor de Segurança e Confiança, Cisco

Pesquisa de vulnerabilidades e correção

O ciclo virtuoso começa ao encontrar vulnerabilidades, validar sua criticidade e corrigir os sistemas afetados. O GPT‑5.5 com Trusted Access for Cyber pode ajudar na maior parte desse trabalho: compreender código desconhecido, mapear superfícies afetadas, rastrear a causa raiz, revisar patches, construir estruturas seguras de reprodução, priorizar a severidade e transformar descobertas em orientações de remediação.

Algumas pesquisas de vulnerabilidades exigem comportamento mais permissivo, especialmente quando parceiros autorizados precisam de provas de conceito de exploração para divulgação coordenada ou validação controlada. Esses são os fluxos de trabalho em que o GPT‑5.5‑Cyber pode nos ajudar a aprender com um conjunto menor de parceiros, sob verificação mais forte, monitoramento e ciclos de feedback.

“A Intel é líder em silício e software, fornecendo uma base confiável para a indústria global de computação. À medida que os modelos de IA continuam avançando em raciocínio e velocidade, sua capacidade de identificar, analisar e ajudar a mitigar ameaças de segurança se torna cada vez mais crítica. A Intel espera fazer parceria com a OpenAI para levar capacidades de IA governadas e escaláveis a fluxos de trabalho cibernéticos do mundo real — ajudando empresas a acelerar a pesquisa de vulnerabilidades, fortalecer processos de remediação e operar com mais segurança em escala.”
— Dhinesh Manoharan, Head de Pesquisa de Segurança INT31, Intel Corporation


Detecção e monitoramento

Se o software vulnerável já estiver implantado, a próxima pergunta é se alguém está explorando isso. Parceiros de EDR, SIEM, IGA/PAM e monitoramento transformam um novo aviso em evidências de ambientes em produção: telemetria, alertas, detecções e fluxos de resposta. O GPT‑5.5 pode ajudar analistas a conectar esses sinais, resumir o que importa, redigir detecções e passar mais rapidamente da divulgação à investigação. Esse mesmo ciclo é especialmente importante em ambientes de nuvem, onde exposição, remediação e detecção estão fortemente acopladas.

“Na SentinelOne, o verdadeiro valor da IA está na rapidez com que ela nos ajuda a transformar sinais em uma vantagem acionável para os defensores. O GPT-5.5 ajuda analistas a conectar a telemetria, focar no que importa e fortalecer a forma como as organizações investigam, detectam e respondem a ameaças emergentes.”
— Gregor Stewart, Diretor de IA, SentinelOne

Segurança da cadeia de suprimentos de software

A próxima etapa é impedir que código sabidamente malicioso chegue à produção em primeiro lugar. Depois que uma vulnerabilidade ou comprometimento de pacote é entendido, ferramentas de segurança da cadeia de suprimentos de software podem ajudar a bloquear dependências arriscadas, atualizações maliciosas e caminhos de código vulneráveis antes que eles se espalhem pelos ambientes dos clientes. O GPT‑5.5 com Trusted Access for Cyber pode ajudar a inspecionar mudanças em dependências, raciocinar sobre a explorabilidade em código próprio, priorizar remediação e identificar comportamento suspeito de pacotes mais cedo no ciclo de desenvolvimento. 

Parceiros como Snyk, Gen Digital, Semgrep e Socket podem nos ajudar a testar como essas capacidades se aplicam a incidentes como o comprometimento do axios, em que a correção mais rápida é impedir que dependências vulneráveis ou comprometidas entrem na build.

“Atacantes já estão transformando modelos de fronteira em armas. Ao implantar o Trusted Access for Cyber da OpenAI e o GPT-5.5, estamos dando aos defensores da Snyk a capacidade de que precisam para proteger cadeias de suprimentos críticas. Essa parceria não é apenas um marco; é uma necessidade estratégica.”
— Manoj Nair, Diretor de Inovação, Snyk

Codex Security para código aberto e defensores

O código aberto é uma das formas mais rápidas de uma vulnerabilidade se espalhar pelo ecossistema, por isso também estamos investindo na origem com mantenedores. O Codex Security ajuda equipes a identificar, validar e remediar vulnerabilidades construindo um modelo de ameaças específico para a base de código, explorando caminhos de ataque realistas, validando problemas em ambientes isolados e propondo patches para revisão humana.

Por meio do Codex for Open Source, mantenedores selecionados de projetos críticos podem receber acesso condicional ao Codex Security juntamente com o Codex e créditos de API para reduzir a carga de manutenção e revisão.

Também lançamos um plugin do Codex Security que leva o fluxo de trabalho de segurança existente diretamente para qualquer interface do Codex, como o app ou a CLI, ajudando desenvolvedores a ir da modelagem de ameaças à descoberta, validação, análise de caminhos de ataque e correções verificadas.

Olhando para o futuro

À medida que os modelos se tornam mais capazes em cibersegurança, o melhor uso dessa capacidade é ajudar defensores a encontrar e corrigir fraquezas mais rapidamente. Expandir o acesso a essas capacidades de forma responsável exige maior confiança sobre quem está usando o modelo, quais sistemas estão sendo alvo e se o trabalho é autorizado. À medida que verificações mais fortes de identidade e organização, delimitação de uso aprovado e monitoramento de uso indevido melhorarem, esperamos ampliar o acesso ao longo do tempo.

Conseguir acesso ao Trusted Access for Cyber é simples:

Todos os clientes aprovados por esse processo terão acesso a versões de modelos existentes com menos atrito em torno de salvaguardas que poderiam ser acionadas por atividade cibernética dual use, permitindo que continuem apoiando educação em segurança, programação defensiva e pesquisa responsável de vulnerabilidades. 

Durante os testes alfa, o GPT‑5.5‑Cyber já foi usado para escalar red teaming automatizado de sistemas críticos e validar vulnerabilidades de alta severidade, o que documentaremos em um futuro aprofundamento técnico como parte da divulgação responsável.

Esperamos continuar a acelerar os defensores com vários modelos, incluindo tanto nossos modelos principais por meio do Trusted Access for Cyber quanto modelos cibernéticos dedicados, como o GPT‑5.5‑Cyber, e modelos ainda mais capazes em cyber no futuro.

Autoria

OpenAI