Passer au contenu principal
OpenAI

7 mai 2026

Sécurité

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Chargement...

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Performances de GPT‑5.5 et GPT‑5.5‑Cyber sur les tâches cyber

GPT‑5.5 est notre modèle le plus intelligent et le plus intuitif, à la fois pour le travail cognitif d’usage général et pour les tâches de cybersécurité, et c’est le modèle que nous pensons voir utilisé par la plupart des défenseurs. Nous évaluons les performances cyber sur des tâches qui exigent un raisonnement en plusieurs étapes, l’usage d’outils et de la persistance dans des workflows défensifs réalistes.

L’aperçu initial de modèles cyber plus permissifs comme GPT‑5.5‑Cyber n’a pas pour objectif d’accroître fortement les capacités cyber au-delà de GPT‑5.5 ; il est avant tout entraîné pour être plus permissif sur les tâches liées à la sécurité.

Par conséquent, ce premier aperçu ne devrait pas surpasser GPT‑5.5 sur chaque évaluation cyber. Il soutient plutôt un processus de déploiement itératif qui vise à la fois à accélérer le travail des défenseurs et à prendre en charge en toute sécurité des workflows autorisés plus spécialisés nécessitant un comportement plus permissif, associé à une vérification renforcée, à une surveillance des usages abusifs, à un cadrage des usages approuvés et aux retours des partenaires. Pour l’instant, GPT‑5.5 avec Trusted Access for Cyber reste le point de départ recommandé pour la plupart des workflows de sécurité.

Développer les capacités défensives dans tout l’écosystème de la sécurité

Nous nous associons à des fournisseurs de sécurité parce qu’ils se trouvent au point où les capacités du modèle peuvent devenir une protection client : découverte, développement, détection, réponse et application réseau. Lorsque ces couches progressent ensemble, elles créent une dynamique de sécurité : les chercheurs divulguent des vulnérabilités avec des preuves de concept d’exploitation et des indications de correctif, les outils de sécurité de la chaîne d’approvisionnement logicielle empêchent le code vulnérable et les dépendances compromises d’atteindre la production, les partenaires EDR et SIEM détectent l’exploitation dans la nature, et les fournisseurs réseau et sécurité déploient des atténuations au niveau WAF pendant que les correctifs sont déployés.

GPT‑5.5 avec Trusted Access for Cyber constitue le point de départ large de ce travail. Il peut aider les défenseurs vérifiés à avancer plus vite sur tout le cycle de vie de la sécurité, tandis que GPT‑5.5‑Cyber permet à un ensemble plus restreint de partenaires d’étudier des workflows avancés où un comportement d’accès spécialisé peut avoir de l’importance. L’objectif est d’aider l’écosystème de la sécurité à protéger plus rapidement les clients, puis d’apprendre grâce aux retours des partenaires là où des évaluations, vérifications ou garde-fous plus stricts sont nécessaires.

Fournisseurs réseau et sécurité

Les fournisseurs réseau et sécurité peuvent réduire l’exposition pendant que les correctifs sont encore en cours de déploiement. Quand les défenseurs valident une vulnérabilité et surveillent son exploitation, ils peuvent aussi déployer des règles WAF, des atténuations en périphérie et des changements de configuration qui limitent les voies d’attaque probables avant que chaque système affecté ait été remédié. GPT‑5.5 peut aider à la revue de règles, à l’analyse de configuration, à l’enquête sur incident et à la gestion sécurisée des changements dans des environnements complexes. 

Nous travaillons avec ces partenaires pour nous aider à évaluer comment ces capacités se traduisent en protections déployables par les clients à l’échelle d’Internet, notamment pour les infrastructures critiques et les services publics où il est essentiel de réduire rapidement l’exposition.

Recherche de vulnérabilités et correction

La dynamique commence par la découverte des vulnérabilités, la validation de leur criticité et la correction des systèmes affectés. GPT‑5.5 avec Trusted Access for Cyber peut aider pour l’essentiel de ce travail : comprendre du code inconnu, cartographier les surfaces affectées, remonter à la cause racine, examiner les correctifs, construire des dispositifs sûrs de reproduction, prioriser la sévérité et transformer les constats en recommandations de remédiation.

Certains travaux de recherche sur les vulnérabilités exigent un comportement plus permissif, surtout lorsque des partenaires autorisés ont besoin de preuves de concept d’exploitation pour une divulgation coordonnée ou une validation contrôlée. Ce sont les workflows pour lesquels GPT‑5.5‑Cyber peut nous aider à apprendre avec un plus petit nombre de partenaires, sous une vérification, une surveillance et des boucles de retour renforcées.


Détection et surveillance

Si un logiciel vulnérable est déjà déployé, la question suivante est de savoir si quelqu’un l’exploite. Les partenaires EDR, SIEM, IGA/PAM et de surveillance transforment un nouvel avis en preuves issues d’environnements réels : télémétrie, alertes, détections et workflows de réponse. GPT‑5.5 peut aider les analystes à relier ces signaux, résumer l’essentiel, rédiger des détections et passer plus vite de la divulgation à l’enquête. Cette même boucle est particulièrement importante dans les environnements cloud, où exposition, remédiation et détection sont étroitement liées.

Sécurité de la chaîne d’approvisionnement logicielle

L’étape suivante consiste à empêcher qu’un code déjà identifié comme problématique n’atteigne la production. Une fois qu’une vulnérabilité ou la compromission d’un package est comprise, les outils de sécurité de la chaîne d’approvisionnement logicielle peuvent aider à stopper les dépendances risquées, les mises à jour malveillantes et les chemins de code vulnérables avant qu’ils ne se propagent dans les environnements clients. GPT‑5.5 avec Trusted Access for Cyber peut aider à examiner les changements de dépendances, raisonner sur l’exploitabilité dans le code possédé, prioriser la remédiation et faire remonter plus tôt dans le cycle de développement les comportements suspects de packages. 

Des partenaires comme Snyk, Gen Digital, Semgrep et Socket peuvent nous aider à tester comment ces capacités s’appliquent à des incidents comme la compromission d’axios, où la correction la plus rapide consiste à empêcher des dépendances vulnérables ou compromises d’entrer dans la build.

Codex Security pour l’open source et les défenseurs

L’open source est l’un des moyens les plus rapides de propagation d’une vulnérabilité dans l’écosystème, c’est pourquoi nous investissons aussi en amont avec les mainteneurs. Codex Security aide les équipes à identifier, valider et corriger les vulnérabilités en construisant un modèle de menace propre à la base de code, en explorant des voies d’attaque réalistes, en validant les problèmes dans des environnements isolés et en proposant des correctifs pour revue humaine.

Grâce à Codex for Open Source, des mainteneurs sélectionnés de projets critiques peuvent recevoir un accès conditionnel à Codex Security, ainsi qu’à Codex et à des crédits API pour réduire la charge de maintenance et de revue.

Nous avons aussi publié un plugin Codex Security qui intègre le workflow de sécurité existant directement dans n’importe quelle interface Codex, comme l’application ou le CLI, afin d’aider les développeurs à passer de la modélisation des menaces à la découverte, à la validation, à l’analyse des voies d’attaque et à des correctifs vérifiés.

Perspectives

À mesure que les modèles deviennent plus performants en cybersécurité, le meilleur usage de cette capacité consiste à aider les défenseurs à trouver et corriger plus vite les faiblesses. Étendre l’accès à ces capacités de manière responsable suppose une confiance accrue dans l’identité de l’utilisateur du modèle, les systèmes qu’il cible et le caractère autorisé du travail effectué. À mesure que la vérification renforcée des identités et des organisations, le cadrage des usages approuvés et la surveillance des usages abusifs progresseront, nous nous attendons à ce que l’accès s’élargisse avec le temps.

Obtenir l’accès à Trusted Access for Cyber est simple :

Tous les clients approuvés via ce processus auront accès à des versions de modèles existants avec une réduction des frictions liées aux garde-fous susceptibles de se déclencher sur des activités cyber à double usage, ce qui leur permettra de continuer à soutenir l’éducation à la sécurité, la programmation défensive et la recherche responsable sur les vulnérabilités. 

Pendant les tests alpha, GPT‑5.5‑Cyber a déjà été utilisé pour étendre l’automatisation du red teaming de systèmes critiques et valider des vulnérabilités de haute sévérité, ce que nous documenterons dans une future analyse technique approfondie dans le cadre d’une divulgation responsable.

Nous comptons continuer à accélérer le travail des défenseurs avec différents modèles, notamment nos modèles phares via Trusted Access for Cyber, ainsi qu’avec des modèles cyber dédiés comme GPT‑5.5‑Cyber et des modèles encore plus performants pour la cybersécurité à l’avenir.

Auteur

OpenAI