Ir al contenido principal
OpenAI

7 de mayo de 2026

Seguridad

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Cargando…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Cómo rinden GPT‑5.5 y GPT‑5.5‑Cyber en tareas cibernéticas

GPT‑5.5 es nuestro modelo más inteligente e intuitivo tanto para el trabajo de conocimiento de propósito general como para tareas de ciberseguridad, y es el modelo que esperamos que utilicen la mayoría de los defensores. Evaluamos el rendimiento cibernético en tareas que requieren razonamiento de varios pasos, uso de herramientas y persistencia a lo largo de flujos de trabajo defensivos realistas.

La vista previa inicial de modelos permisivos en ciberseguridad como GPT‑5.5‑Cyber no pretende aumentar de forma significativa la capacidad cibernética más allá de GPT‑5.5; está entrenada principalmente para ser más permisiva en tareas relacionadas con la seguridad.

Como resultado, no se espera que esta primera vista previa supere a GPT‑5.5 en todas las evaluaciones cibernéticas. En su lugar, respalda un proceso de despliegue iterativo para acelerar a los defensores y apoyar de forma segura flujos de trabajo autorizados más especializados que requieren un comportamiento más permisivo, combinado con una verificación más sólida, supervisión del uso indebido, delimitación del uso aprobado y observaciones de socios. Por ahora, GPT‑5.5 con Trusted Access for Cyber sigue siendo el punto de partida recomendado para la mayoría de los flujos de trabajo de seguridad.

Ampliar la capacidad defensiva en todo el ecosistema de seguridad

Nos asociamos con proveedores de seguridad porque se hallan donde la capacidad del modelo puede convertirse en protección para el cliente: descubrimiento, desarrollo, detección, respuesta y aplicación en la red. Cuando esas capas mejoran a la vez, crean un círculo virtuoso de seguridad: los investigadores divulgan vulnerabilidades con pruebas de concepto de explotación y orientación para aplicar parches, las herramientas de seguridad de la cadena de suministro de software impiden que código vulnerable y dependencias comprometidas lleguen a producción, los EDR y SIEM asociados detectan la explotación en la práctica, y los proveedores de red y seguridad despliegan mitigaciones en WAF mientras se implementan las correcciones.

GPT‑5.5 con Trusted Access for Cyber es el punto de partida amplio para este trabajo. Puede ayudar a los defensores verificados a avanzar más rápido a lo largo del ciclo de vida de la seguridad, mientras que GPT‑5.5‑Cyber permite a un conjunto más reducido de socios estudiar flujos de trabajo avanzados en los que un comportamiento de acceso especializado puede ser importante. El objetivo es ayudar al ecosistema de seguridad a proteger a los clientes más rápido y, después, aprender de los comentarios de los socios dónde se necesitan evaluaciones, verificaciones o salvaguardas más estrictas.

Proveedores de red y seguridad

Los proveedores de red y seguridad pueden reducir la exposición mientras aún se aplican correcciones. A medida que los defensores validan una vulnerabilidad y vigilan su explotación, también pueden desplegar reglas de WAF, mitigaciones en el edge y cambios de configuración que bloqueen las rutas de ataque más probables antes de que se hayan corregido todos los sistemas afectados. GPT‑5.5 puede contribuir a la revisión de reglas, el análisis de configuración, la investigación de incidentes y la gestión segura de cambios en entornos complejos. 

Estamos trabajando con estos socios para ayudarnos a evaluar cómo esas capacidades se traducen en protecciones que los clientes pueden desplegar a escala de internet, también en infraestructuras críticas y servicios públicos donde es importante reducir rápidamente la exposición.

Investigación de vulnerabilidades y aplicación de parches

El círculo virtuoso empieza por encontrar vulnerabilidades, validar su criticidad y corregir los sistemas afectados. GPT‑5.5 con Trusted Access for Cyber puede ayudar en la mayor parte de este trabajo: comprender código desconocido, mapear las superficies afectadas, rastrear la causa raíz, revisar parches, crear entornos seguros de reproducción, priorizar la gravedad y convertir los hallazgos en orientación para la remediación.

Parte de la investigación de vulnerabilidades requiere un comportamiento más permisivo, especialmente cuando socios autorizados necesitan pruebas de concepto de explotación para una divulgación coordinada o una validación controlada. Esos son los flujos de trabajo en los que GPT‑5.5‑Cyber puede ayudarnos a aprender con un conjunto más pequeño de socios, bajo una verificación más sólida, supervisión y ciclos de comentarios.


Detección y supervisión

Si el software vulnerable ya está desplegado, la siguiente pregunta es si alguien lo está explotando. Los socios de EDR, SIEM, IGA/PAM y supervisión convierten un nuevo aviso en evidencias procedentes de entornos en vivo: telemetría, alertas, detecciones y flujos de respuesta. GPT‑5.5 puede ayudar a los analistas a conectar esas señales, resumir lo importante, redactar detecciones y agilizar el paso de la divulgación a la investigación. Ese mismo ciclo es especialmente importante en los entornos en la nube, donde la exposición, la remediación y la detección están estrechamente acopladas.

Seguridad de la cadena de suministro de software

El siguiente paso consiste en impedir que el código identificado como dañino llegue siquiera a producción. Una vez que se entiende una vulnerabilidad o el compromiso de un paquete, las herramientas de seguridad de la cadena de suministro de software pueden ayudar a detener dependencias arriesgadas, actualizaciones maliciosas y rutas de código vulnerables antes de que se propaguen por los entornos de los clientes. GPT‑5.5 con Trusted Access for Cyber puede ayudar a inspeccionar cambios en dependencias, razonar sobre la explotabilidad en código propio, priorizar la remediación y sacar a la luz comportamientos sospechosos de paquetes en una fase más temprana del ciclo de desarrollo. 

Socios como Snyk, Gen Digital, Semgrep y Socket pueden ayudarnos a probar cómo se aplican estas capacidades a incidentes como la vulneración de axios, donde la solución más rápida es impedir por completo que las dependencias vulnerables o comprometidas entren en la compilación.

Codex Security para el código abierto y los defensores

El código abierto es una de las formas más rápidas de que una vulnerabilidad se propague por el ecosistema, por lo que también invertimos en la fuente, junto a los mantenedores. Codex Security ayuda a los equipos a identificar, validar y corregir vulnerabilidades creando un modelo de amenazas específico para la base de código, explorando rutas de ataque realistas, validando problemas en entornos aislados y proponiendo parches para revisión humana.

A través de Codex for Open Source, determinados mantenedores de proyectos críticos pueden recibir acceso condicional a Codex Security junto con Codex y créditos de API para reducir la carga de mantenimiento y revisión.

También hemos lanzado un plugin de Codex Security que lleva el flujo de trabajo de seguridad existente directamente a cualquier interfaz de Codex, como la aplicación o la CLI, ayudando a los desarrolladores a pasar del modelado de amenazas al descubrimiento, la validación, el análisis de rutas de ataque y correcciones verificadas.

Mirando al futuro

A medida que los modelos ganan capacidades en ciberseguridad, el mejor uso posible es ayudar a los defensores a encontrar y corregir debilidades con mayor rapidez. Ampliar el acceso a esas capacidades de forma responsable requiere una mayor confianza en quién usa el modelo, a qué sistemas se dirige y si el trabajo está autorizado. A medida que mejoren la verificación reforzada de identidad y organización, la delimitación del uso aprobado y la supervisión del uso indebido, esperamos que el acceso se amplíe con el tiempo.

Conseguir acceso a Trusted Access for Cyber es sencillo:

Todos los clientes aprobados mediante este proceso obtendrán acceso a versiones de modelos existentes con menos fricción en torno a las salvaguardas que podrían activarse ante actividad cibernética de doble uso, lo que les permitirá seguir apoyando la educación en seguridad, la programación defensiva y la investigación responsable de vulnerabilidades. 

Durante las pruebas alfa, GPT‑5.5‑Cyber ya se ha utilizado para ampliar el red teaming automatizado de sistemas críticos y validar vulnerabilidades de alta gravedad, algo que documentaremos en un próximo análisis técnico en profundidad como parte de una divulgación responsable.

Esperamos seguir acelerando a los defensores con varios modelos, incluidos tanto nuestros modelos insignia a través de Trusted Access for Cyber, como modelos cibernéticos dedicados como GPT‑5.5‑Cyber e incluso modelos con aún más capacidades cibernéticas en el futuro.

Autor

OpenAI