Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber
How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.
For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).
Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.
We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.
The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.
In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.
Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.
When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.
As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.
Here is a breakdown for how to think about the current trusted access levels:
The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.
- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation.
More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.
Here’s a simple example that shows what that looks like in practice:
GPT‑5.5 ist unser klügstes und intuitivstes Modell sowohl für allgemeine wissensbasierte Arbeit als auch für Cybersicherheitsaufgaben, und wir erwarten, dass die meisten Verteidigenden dieses Modell nutzen werden. Wir bewerten die Cyber-Leistung bei Aufgaben, die mehrstufiges Schlussfolgern, Tool-Nutzung und Ausdauer über realistische defensive Workflows hinweg erfordern.
Die erste Vorschau cyber-permissiver Modelle wie GPT‑5.5‑Cyber soll die Cyber-Fähigkeit gegenüber GPT‑5.5 nicht wesentlich steigern – sie wurde in erster Linie darauf trainiert, bei sicherheitsbezogenen Aufgaben permissiver zu sein.
Daher wird nicht erwartet, dass diese erste Vorschau GPT‑5.5 in jeder Cyber-Bewertung übertrifft. Stattdessen unterstützt sie einen iterativen Bereitstellungsprozess, um Verteidigende zu beschleunigen und zugleich stärker spezialisierte autorisierte Workflows, die permissiveres Verhalten erfordern, sicher zu unterstützen – kombiniert mit stärkerer Verifizierung, Missbrauchsüberwachung, einer klaren Eingrenzung zulässiger Nutzung und Partner-Feedback. Vorerst bleibt GPT‑5.5 mit Trusted Access for Cyber der empfohlene Ausgangspunkt für die meisten Sicherheits-Workflows.
Wir arbeiten mit Sicherheitsanbietern zusammen, weil dort Modellfähigkeiten in Kund:innenschutz übergehen: Entdeckung, Entwicklung, Erkennung, Reaktion und Netzwerkdurchsetzung. Wenn sich diese Ebenen gemeinsam verbessern, entsteht ein Sicherheits-Schwungrad: Forschende legen Schwachstellen mit Exploit-Proof-of-Concepts und Patch-Hinweisen offen, Tools für die Sicherheit der Software-Lieferkette verhindern, dass anfälliger Code und kompromittierte Abhängigkeiten die Produktion erreichen, EDR- und SIEM-Partner erkennen Ausnutzung in freier Wildbahn, und Netzwerk- sowie Sicherheitsanbieter setzen WAF-Maßnahmen ein, während Korrekturen ausgerollt werden.
GPT‑5.5 mit Trusted Access for Cyber ist der breite Ausgangspunkt für diese Arbeit. Es kann verifizierten Verteidigenden helfen, sich über den gesamten Sicherheitslebenszyklus hinweg schneller zu bewegen, während GPT‑5.5‑Cyber es einer kleineren Gruppe von Partnern erlaubt, fortgeschrittene Workflows zu untersuchen, bei denen spezialisiertes Zugriffsverhalten relevant sein könnte. Ziel ist es, dem Sicherheitsökosystem zu helfen, Kund:innen schneller zu schützen, und dann aus dem Feedback von Partnern zu lernen, wo engere Evaluierung, Verifizierung oder Schutzmaßnahmen nötig sind.
Netzwerk- und Sicherheitsanbieter
Netzwerk- und Sicherheitsanbieter können die Exposition verringern, während Korrekturen noch ausgerollt werden. Während Verteidigende eine Schwachstelle validieren und auf Ausnutzung achten, können sie auch WAF-Regeln, Edge-Mitigierungen und Konfigurationsänderungen bereitstellen, die wahrscheinliche Angriffswege abschwächen, bevor jedes betroffene System behoben wurde. GPT‑5.5 kann Regelprüfung, Konfigurationsanalyse, Vorfalluntersuchung und sicheres Änderungsmanagement in komplexen Umgebungen unterstützen.
Wir arbeiten mit diesen Partnern zusammen, um zu bewerten, wie sich diese Fähigkeiten in Schutzmaßnahmen übersetzen, die Kund:innen im Internet-Maßstab bereitstellen können, auch für kritische Infrastruktur und öffentliche Dienste, bei denen eine schnelle Reduzierung der Exposition wichtig ist.
Schwachstellenforschung und Patching
Das Schwungrad beginnt mit dem Finden von Schwachstellen, der Validierung ihrer Kritikalität und dem Patchen betroffener Systeme. GPT‑5.5 mit Trusted Access for Cyber kann bei den meisten dieser Aufgaben helfen: unbekannten Code verstehen, betroffene Flächen kartieren, die Grundursache nachvollziehen, Patches prüfen, sichere Reproduktions-Harnesses aufbauen, Schweregrade priorisieren und Erkenntnisse in Abhilfehinweise übersetzen.
Einige Arten der Schwachstellenforschung erfordern permissiveres Verhalten, insbesondere wenn autorisierte Partner Exploit-Proof-of-Concepts für koordinierte Offenlegung oder kontrollierte Validierung benötigen. Das sind die Workflows, bei denen GPT‑5.5‑Cyber uns helfen kann, mit einer kleineren Gruppe von Partnern zu lernen – unter stärkerer Verifizierung, Überwachung und Feedback-Schleifen.
Erkennung und Überwachung
Wenn anfällige Software bereits eingesetzt wird, lautet die nächste Frage, ob jemand sie ausnutzt. EDR-, SIEM-, IGA/PAM- und Monitoring-Partner verwandeln einen neuen Hinweis in Belege aus Live-Umgebungen: Telemetrie, Warnungen, Erkennungen und Reaktions-Workflows. GPT‑5.5 kann Analyst:innen helfen, diese Signale zu verknüpfen, das Wesentliche zusammenzufassen, Erkennungen zu entwerfen und schneller von der Offenlegung zur Untersuchung zu gelangen. Diese Schleife ist besonders wichtig in Cloud-Umgebungen, in denen Exposition, Abhilfe und Erkennung eng miteinander verknüpft sind.
Sicherheit der Software-Lieferkette
Der nächste Schritt besteht darin, zu verhindern, dass bekanntermaßen schädlicher Code überhaupt in die Produktion gelangt. Sobald eine Schwachstelle oder die Kompromittierung eines Pakets verstanden ist, können Tools für die Sicherheit der Software-Lieferkette helfen, riskante Abhängigkeiten, bösartige Updates und anfällige Codepfade zu stoppen, bevor sie sich über Kund:innenumgebungen verbreiten. GPT‑5.5 mit Trusted Access for Cyber kann helfen, Änderungen an Abhängigkeiten zu prüfen, über die Ausnutzbarkeit im eigenen Code zu schlussfolgern, Abhilfemaßnahmen zu priorisieren und verdächtiges Paketverhalten früher im Entwicklungszyklus sichtbar zu machen.
Partner wie Snyk, Gen Digital, Semgrep und Socket können uns helfen zu testen, wie diese Fähigkeiten auf Vorfälle wie die axios-Kompromittierung anwendbar sind, bei denen die schnellste Lösung darin besteht, zu verhindern, dass anfällige oder kompromittierte Abhängigkeiten überhaupt in den Build gelangen.
Open Source ist einer der schnellsten Wege, auf denen sich eine Schwachstelle im gesamten Ökosystem verbreiten kann, daher investieren wir mit Maintainer:innen auch vorgelagert. Codex Security hilft Teams, Schwachstellen zu identifizieren, zu validieren und zu beheben, indem ein Codebasis-spezifisches Bedrohungsmodell erstellt, realistische Angriffswege erkundet, Probleme in isolierten Umgebungen validiert und Patches zur menschlichen Prüfung vorgeschlagen werden.
Über Codex für Open Source können ausgewählte Maintainer:innen kritischer Projekte bedingten Zugang zu Codex Security zusammen mit Codex und API-Guthaben erhalten, um Wartungs- und Prüfaufwand zu verringern.
Wir haben außerdem ein Codex Security-Plugin veröffentlicht, das den bestehenden Sicherheits-Workflow direkt in jede Codex-Oberfläche wie die App oder CLI bringt und Entwickler:innen dabei hilft, vom Threat Modeling über die Entdeckung, Validierung, Angriffsweganalyse bis hin zu verifizierten Korrekturen zu gelangen.
Je leistungsfähiger Modelle in der Cybersicherheit werden, desto sinnvoller ist es, diese Fähigkeiten dafür einzusetzen, Verteidigenden zu helfen, Schwachstellen schneller zu finden und zu beheben. Den Zugang zu diesen Fähigkeiten verantwortungsvoll auszuweiten, erfordert größeres Vertrauen darin, wer das Modell nutzt, auf welche Systeme gezielt wird und ob die Arbeit autorisiert ist. Wenn stärkere Verifizierung von Identität und Organisation, eine klarere Eingrenzung genehmigter Nutzung und Missbrauchsüberwachung besser werden, erwarten wir, dass sich der Zugang im Laufe der Zeit ausweitet.
Zugang zu Trusted Access for Cyber zu erhalten, ist unkompliziert:
- Einzelne Nutzer:innen können ihre Identität unter chatgpt.com/cyber(wird in einem neuen Fenster geöffnet) verifizieren.
- Unternehmen können über ihre OpenAI-Ansprechperson Trusted Access beantragen.
Alle Kund:innen, die über diesen Prozess zugelassen werden, erhalten Zugang zu Versionen bestehender Modelle mit geringerer Reibung bei Schutzmaßnahmen, die bei Dual-Use-Cyberaktivität auslösen könnten. So können sie weiterhin Sicherheitsbildung, defensive Programmierung und verantwortungsvolle Schwachstellenforschung unterstützen.
Während der Alpha-Tests wurde GPT‑5.5‑Cyber bereits genutzt, um automatisiertes Red Teaming kritischer Systeme zu skalieren und Schwachstellen mit hohem Schweregrad zu validieren. Dies werden wir im Rahmen verantwortungsvoller Offenlegung in einem zukünftigen technischen Deep Dive dokumentieren.
Wir erwarten, Verteidigende weiterhin mit verschiedenen Modellen zu beschleunigen, darunter sowohl unsere Flagship-Modelle über Trusted Access for Cyber als auch dedizierte Cyber-Modelle wie GPT‑5.5‑Cyber und künftig noch cyberfähigere Modelle.


