Passer au contenu principal
OpenAI

7 mai 2026

Cybersécurité

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Chargement…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Comment GPT‑5.5 et GPT‑5.5‑Cyber performent sur les tâches cyber

GPT‑5.5 est notre modèle le plus intelligent et le plus intuitif, tant pour le travail de connaissance à usage général que pour les tâches de cybersécurité, et c’est le modèle que nous prévoyons que la plupart des défenseurs utiliseront. Nous évaluons la performance cyber sur des tâches qui exigent un raisonnement en plusieurs étapes, l’utilisation d’outils et de la persistance dans des flux de travail défensifs réalistes.

L’aperçu initial de modèles permissifs en matière cyber comme GPT‑5.5‑Cyber n’a pas pour but d’accroître de façon importante les capacités cyber au-delà de GPT‑5.5 — il est surtout entraîné pour être plus permissif sur les tâches liées à la sécurité.

Par conséquent, on ne s’attend pas à ce que ce premier aperçu surpasse GPT‑5.5 dans chaque évaluation cyber. Il soutient plutôt un processus de déploiement itératif visant à la fois à accélérer le travail des défenseurs et à appuyer de façon sûre des flux de travail autorisés plus spécialisés qui exigent un comportement plus permissif, jumelé à une vérification plus forte, à une surveillance des usages abusifs, à une délimitation des usages approuvés et à une rétroaction des partenaires. Pour l’instant, GPT‑5.5 avec Trusted Access for Cyber demeure le point de départ recommandé pour la plupart des flux de travail de sécurité.

Déployer les capacités défensives à grande échelle dans l’écosystème de la sécurité

Nous collaborons avec des fournisseurs de sécurité parce qu’ils sont à l’endroit où les capacités des modèles peuvent devenir une protection pour les clients : découverte, développement, détection, réponse et application réseau. Quand ces couches s’améliorent ensemble, elles créent une dynamique de sécurité : les chercheurs divulguent des vulnérabilités avec des preuves de concept d’exploitation et des directives de correction, les outils de sécurité de la chaîne d’approvisionnement logicielle empêchent le code vulnérable et les dépendances compromises d’atteindre la production, les partenaires EDR et SIEM détectent l’exploitation dans la nature, et les fournisseurs réseau et sécurité déploient des atténuations au niveau WAF pendant que les correctifs sont déployés.

GPT‑5.5 avec Trusted Access for Cyber constitue le point de départ général pour ce travail. Il peut aider les défenseurs vérifiés à progresser plus rapidement tout au long du cycle de vie de la sécurité, tandis que GPT‑5.5‑Cyber permet à un plus petit groupe de partenaires d’étudier des flux de travail avancés où un comportement d’accès spécialisé peut jouer un rôle. L’objectif est d’aider l’écosystème de la sécurité à protéger les clients plus rapidement, puis d’apprendre à partir des commentaires des partenaires où une évaluation, une vérification ou des mesures de protection plus strictes sont nécessaires.

Fournisseurs réseau et sécurité

Les fournisseurs réseau et sécurité peuvent réduire l’exposition pendant que les correctifs sont encore en cours de déploiement. Pendant que les défenseurs valident une vulnérabilité et surveillent une éventuelle exploitation, ils peuvent aussi déployer des règles WAF, des mesures d’atténuation en périphérie et des changements de configuration qui freinent les voies d’attaque probables avant que chaque système touché ait été corrigé. GPT‑5.5 peut appuyer l’examen des règles, l’analyse de configuration, l’enquête sur les incidents et la gestion sécurisée des changements dans des environnements complexes. 

Nous travaillons avec ces partenaires pour nous aider à évaluer comment ces capacités se traduisent en protections que les clients peuvent déployer à l’échelle d’Internet, y compris pour les infrastructures critiques et les services publics où il importe de réduire rapidement l’exposition.

Recherche sur les vulnérabilités et correction

La dynamique commence par la découverte de vulnérabilités, la validation de leur criticité et la correction des systèmes touchés. GPT‑5.5 avec Trusted Access for Cyber peut aider pour la majeure partie de ce travail : comprendre du code peu familier, cartographier les surfaces touchées, remonter à la cause première, examiner des correctifs, construire des environnements de reproduction sûrs, prioriser la gravité et transformer les constats en directives de remédiation.

Une partie de la recherche sur les vulnérabilités exige un comportement plus permissif, surtout lorsque des partenaires autorisés ont besoin de preuves de concept d’exploitation pour une divulgation coordonnée ou une validation contrôlée. Ce sont les flux de travail où GPT‑5.5‑Cyber peut nous aider à apprendre avec un plus petit groupe de partenaires, sous des mécanismes plus rigoureux de vérification, de surveillance et de rétroaction.


Détection et surveillance

Si un logiciel vulnérable est déjà déployé, la question suivante est de savoir si quelqu’un l’exploite. Les partenaires EDR, SIEM, IGA/PAM et de surveillance transforment un nouvel avis en éléments probants issus d’environnements en direct : télémétrie, alertes, détections et flux de réponse. GPT‑5.5 peut aider les analystes à relier ces signaux, à résumer l’essentiel, à rédiger des détections et à passer plus rapidement de la divulgation à l’enquête. Cette même boucle est particulièrement importante dans les environnements infonuagiques, où l’exposition, la remédiation et la détection sont étroitement liées.

Sécurité de la chaîne d’approvisionnement logicielle

Le virage suivant consiste à empêcher que du code connu comme malveillant n’atteigne la production en premier lieu. Une fois qu’une vulnérabilité ou la compromission d’un paquet est comprise, les outils de sécurité de la chaîne d’approvisionnement logicielle peuvent aider à bloquer les dépendances risquées, les mises à jour malveillantes et les chemins de code vulnérables avant qu’ils ne se propagent dans les environnements des clients. GPT‑5.5 avec Trusted Access for Cyber peut aider à examiner les changements de dépendances, à raisonner sur l’exploitabilité dans du code détenu, à prioriser la remédiation et à faire ressortir plus tôt dans le cycle de développement les comportements suspects des paquets. 

Des partenaires comme Snyk, Gen Digital, Semgrep et Socket peuvent nous aider à tester comment ces capacités s’appliquent à des incidents comme la compromission d’axios, où la solution la plus rapide consiste à empêcher que des dépendances vulnérables ou compromises n’entrent dans la compilation.

Codex Security pour l’open source et les défenseurs

L’open source est l’un des moyens les plus rapides par lesquels une vulnérabilité peut se propager dans l’écosystème; c’est pourquoi nous investissons aussi en amont avec les mainteneurs. Codex Security aide les équipes à identifier, valider et corriger les vulnérabilités en construisant un modèle de menace propre à la base de code, en explorant des voies d’attaque réalistes, en validant les problèmes dans des environnements isolés et en proposant des correctifs pour examen humain.

Grâce à Codex for Open Source, des mainteneurs sélectionnés de projets critiques peuvent recevoir un accès conditionnel à Codex Security en plus de Codex et de crédits API afin de réduire la charge de maintenance et d’examen.

Nous avons aussi lancé un plugiciel Codex Security qui intègre directement le flux de travail de sécurité existant dans toute interface Codex, comme l’application ou l’interface CLI, afin d’aider les développeurs à passer de la modélisation des menaces à la découverte, à la validation, à l’analyse des voies d’attaque et aux correctifs vérifiés.

Regarder vers l’avenir

À mesure que les modèles deviennent plus capables en cybersécurité, la meilleure utilisation de ces capacités consiste à aider les défenseurs à trouver et à corriger les faiblesses plus rapidement. L’élargissement responsable de l’accès à ces capacités exige une plus grande confiance quant à l’identité des personnes qui utilisent le modèle, aux systèmes qu’elles ciblent et au caractère autorisé du travail. À mesure que la vérification renforcée de l’identité et des organisations, la délimitation des usages approuvés et la surveillance des usages abusifs s’améliorent, nous nous attendons à ce que l’accès s’élargisse avec le temps.

Obtenir l’accès à Trusted Access for Cyber est simple :

Tous les clients approuvés dans le cadre de ce processus auront accès à des versions de modèles existants avec moins de friction liée aux mesures de protection susceptibles de se déclencher lors d’activités cyber à double usage, ce qui leur permettra de continuer à soutenir l’éducation en sécurité, la programmation défensive et la recherche responsable sur les vulnérabilités. 

Pendant les tests alpha, GPT‑5.5‑Cyber a déjà servi à déployer à grande échelle le red teaming automatisé de systèmes critiques et à valider des vulnérabilités de gravité élevée, ce que nous documenterons dans une future analyse technique approfondie dans le cadre d’une divulgation responsable.

Nous prévoyons continuer d’accélérer le travail des défenseurs avec divers modèles, y compris nos modèles phares via Trusted Access for Cyber, ainsi qu’avec des modèles cyber spécialisés comme GPT‑5.5‑Cyber et d’autres modèles encore plus capables en matière cyber à l’avenir.

Auteur

OpenAI