Pasar al contenido principal
OpenAI

7 de mayo de 2026

Seguridad

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Cargando...

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Cómo se desempeñan GPT‑5.5 y GPT‑5.5‑Cyber en tareas cibernéticas

GPT‑5.5 es nuestro modelo más inteligente y más intuitivo tanto para trabajo de conocimiento de uso general como para tareas de ciberseguridad, y es el modelo que esperamos que utilicen la mayoría de los defensores. Evaluamos el rendimiento cibernético en tareas que requieren razonamiento de varios pasos, uso de herramientas y persistencia a lo largo de flujos de trabajo defensivos realistas.

La vista previa inicial de modelos permisivos en materia cibernética como GPT‑5.5‑Cyber no pretende aumentar de forma significativa la capacidad cibernética más allá de GPT‑5.5; está entrenada principalmente para ser más permisiva en tareas relacionadas con la seguridad.

Como resultado, no se espera que esta primera vista previa supere a GPT‑5.5 en todas las evaluaciones cibernéticas. En cambio, respalda un proceso de despliegue iterativo para acelerar a los defensores y apoyar de forma segura flujos de trabajo autorizados más especializados que requieren un comportamiento más permisivo, junto con verificación más estricta, monitoreo de uso indebido, delimitación del uso aprobado y retroalimentación de socios. Por ahora, GPT‑5.5 con Trusted Access for Cyber sigue siendo el punto de partida recomendado para la mayoría de los flujos de trabajo de seguridad.

Ampliar la capacidad defensiva en todo el ecosistema de seguridad

Nos estamos asociando con proveedores de seguridad porque ellos se sitúan en el punto donde la capacidad del modelo puede convertirse en protección para el cliente: descubrimiento, desarrollo, detección, respuesta y aplicación en la red. Cuando esas capas mejoran juntas, crean un volante de seguridad: los investigadores divulgan vulnerabilidades con pruebas de concepto de explotación y orientación para parches, las herramientas de seguridad de la cadena de suministro de software evitan que el código vulnerable y las dependencias comprometidas lleguen a producción, los socios de EDR y SIEM detectan la explotación en el entorno real y los proveedores de red y seguridad despliegan mitigaciones a nivel de WAF mientras se implementan las correcciones.

GPT‑5.5 con Trusted Access for Cyber es el punto de partida amplio para este trabajo. Puede ayudar a los defensores verificados a avanzar más rápido a lo largo del ciclo de vida de la seguridad, mientras que GPT‑5.5‑Cyber permite que un conjunto más pequeño de socios estudie flujos de trabajo avanzados en los que un comportamiento de acceso especializado puede ser importante. El objetivo es ayudar al ecosistema de seguridad a proteger a los clientes más rápido y luego aprender, a partir de la retroalimentación de los socios, donde se necesitan evaluaciones, verificaciones o salvaguardas más estrictas.

Proveedores de red y seguridad

Los proveedores de red y seguridad pueden reducir la exposición mientras las correcciones aún se están implementando. A medida que los defensores validan una vulnerabilidad y observan si hay explotación, también pueden desplegar reglas de WAF, mitigaciones perimetrales y cambios de configuración que atenúen las rutas de ataque probables antes de que se haya remediado cada sistema afectado. GPT‑5.5 puede respaldar la revisión de reglas, el análisis de configuración, la investigación de incidentes y la gestión segura de cambios en entornos complejos. 

Estamos trabajando con estos socios para ayudarnos a evaluar cómo esas capacidades se traducen en protecciones que los clientes puedan desplegar a escala de internet, incluso para infraestructura crítica y servicios públicos donde reducir la exposición rápidamente es importante.

Investigación de vulnerabilidades y aplicación de parches

El ciclo de mejora comienza con encontrar vulnerabilidades, validar su criticidad y aplicar parches a los sistemas afectados. GPT‑5.5 con Trusted Access for Cyber puede ayudar con la mayor parte de este trabajo: comprender código desconocido, mapear superficies afectadas, rastrear la causa raíz, revisar parches, construir entornos seguros de reproducción, priorizar la gravedad y convertir hallazgos en orientación de remediación.

Parte de la investigación de vulnerabilidades requiere un comportamiento más permisivo, especialmente cuando socios autorizados necesitan pruebas de concepto de explotación para divulgación coordinada o validación controlada. Esos son los flujos de trabajo en los que GPT‑5.5‑Cyber puede ayudarnos a aprender con un conjunto más pequeño de socios, bajo verificación, monitoreo y ciclos de retroalimentación más estrictos.


Detección y monitoreo

Si el software vulnerable ya está implementado, la siguiente pregunta es si alguien lo está explotando. Los socios de EDR, SIEM, IGA/PAM y monitoreo convierten un nuevo aviso en evidencia de entornos activos: telemetría, alertas, detecciones y flujos de respuesta. GPT‑5.5 puede ayudar a los analistas a conectar esas señales, resumir lo importante, redactar detecciones y pasar más rápido de la divulgación a la investigación. Ese mismo ciclo es especialmente importante en entornos en la nube, donde la exposición, la remediación y la detección están estrechamente acopladas.

Seguridad de la cadena de suministro de software

El siguiente giro consiste en evitar que código conocido como malicioso llegue a producción desde el principio. Una vez que se entiende una vulnerabilidad o el compromiso de un paquete, las herramientas de seguridad de la cadena de suministro de software pueden ayudar a detener dependencias riesgosas, actualizaciones maliciosas y rutas de código vulnerables antes de que se propaguen por los entornos de los clientes. GPT‑5.5 con Trusted Access for Cyber puede ayudar a inspeccionar cambios en dependencias, razonar sobre la explotabilidad en código propio, priorizar la remediación y detectar antes comportamientos sospechosos de paquetes dentro del ciclo de desarrollo. 

Socios como Snyk, Gen Digital, Semgrep y Socket pueden ayudarnos a probar cómo estas capacidades se aplican a incidentes como el compromiso de axios, donde la solución más rápida es evitar por completo que dependencias vulnerables o comprometidas entren en la compilación.

Codex Security para código abierto y defensores

El código abierto es una de las formas más rápidas en que una vulnerabilidad puede propagarse por el ecosistema, por eso también estamos invirtiendo aguas arriba con los responsables de mantenimiento. Codex Security ayuda a los equipos a identificar, validar y remediar vulnerabilidades al construir un modelo de amenazas específico para el código base, explorar rutas de ataque realistas, validar problemas en entornos aislados y proponer parches para revisión humana.

A través de Codex for Open Source, los responsables seleccionados de proyectos críticos pueden recibir acceso condicional a Codex Security junto con Codex y créditos de API para reducir la carga de mantenimiento y revisión.

También lanzamos un plugin de Codex Security que incorpora el flujo de trabajo de seguridad existente directamente en cualquier interfaz de Codex, como la app o la CLI, ayudando a los desarrolladores a pasar del modelado de amenazas al descubrimiento, la validación, el análisis de rutas de ataque y las correcciones verificadas.

Lo que viene

A medida que los modelos se vuelven más capaces en ciberseguridad, el mejor uso de esa capacidad es ayudar a los defensores a encontrar y corregir debilidades más rápido. Expandir el acceso a esas capacidades de forma responsable requiere mayor confianza sobre quién usa el modelo, a qué sistemas se dirige el trabajo y si este está autorizado. A medida que mejoren la verificación sólida de identidad y organización, la delimitación del uso aprobado y el monitoreo de uso indebido, esperamos que el acceso se amplíe con el tiempo.

Obtener acceso a Trusted Access for Cyber es sencillo:

Todos los clientes aprobados mediante este proceso obtendrán acceso a versiones de modelos existentes con menos fricción en torno a salvaguardas que podrían activarse ante actividad cibernética de doble uso, lo que les permitirá seguir respaldando la educación en seguridad, la programación defensiva y la investigación responsable de vulnerabilidades. 

Durante las pruebas alfa, GPT‑5.5‑Cyber ya se ha utilizado para ampliar el red teaming automatizado de sistemas críticos y validar vulnerabilidades de alta gravedad, lo cual documentaremos en un futuro análisis técnico profundo como parte de una divulgación responsable.

Esperamos seguir acelerando a los defensores con varios modelos, incluidos nuestros modelos insignia a través de Trusted Access for Cyber y modelos cibernéticos dedicados como GPT‑5.5‑Cyber, e incluso modelos con aún más capacidad cibernética en el futuro.

Autor

OpenAI