Hopp til hovedinnhold
OpenAI

7. mai 2026

Sikkerhet

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Laster inn …

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

Tilgang

Hva som endres

Tiltenkte brukstilfeller

GPT‑5.5 (standardvalg)

Standard sikkerhetstiltak for generell bruk

Allmenn bruk, utviklerarbeid og kunnskapsarbeid

GPT‑5.5 med Trusted Access for Cyber

Mer presise sikkerhetstiltak for verifisert defensivt arbeid i autoriserte miljøer

De fleste defensive sikkerhetsarbeidsflyter, inkludert sikker kodegjennomgang, sårbarhetstriagering, analyse av skadevare, deteksjonsutvikling og patchvalidering

GPT‑5.5‑Cyber

Mest tillatende atferd for spesialiserte autoriserte arbeidsflyter, kombinert med sterkere verifisering og kontroller på kontonivå

Forhåndsvisningstilgang for spesialiserte arbeidsflyter, inkludert autorisert red teaming, penetrasjonstesting og kontrollert validering

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Hvordan GPT‑5.5 og GPT‑5.5‑Cyber presterer på cyberoppgaver

GPT‑5.5 er vår smarteste og mest intuitive modell for både generell kunnskapsarbeid og cybersikkerhetsoppgaver, og det er modellen vi forventer at de fleste forsvarere vil bruke. Vi evaluerer cyberytelse på oppgaver som krever flertrinns resonnering, bruk av verktøy og utholdenhet gjennom realistiske defensive arbeidsflyter.

Den første forhåndsvisningen av cybertillatende modeller som GPT‑5.5‑Cyber er ikke ment å øke cyberkapasiteten vesentlig utover GPT‑5.5 – den er først og fremst trent til å være mer tillatende i sikkerhetsrelaterte oppgaver.

Som følge av dette forventes ikke denne første forhåndsvisningen å overgå GPT‑5.5 i alle cyberevalueringer. I stedet støtter den en iterativ distribusjonsprosess for både å akselerere forsvarere og trygt støtte mer spesialiserte autoriserte arbeidsflyter som krever mer tillatende atferd, kombinert med sterkere verifisering, overvåking av misbruk, avgrensning av godkjent bruk og tilbakemeldinger fra partnere. Foreløpig er GPT‑5.5 med Trusted Access for Cyber fortsatt det anbefalte utgangspunktet for de fleste sikkerhetsarbeidsflyter.

Skalering av defensiv kapasitet på tvers av sikkerhetsøkosystemet

Vi samarbeider med sikkerhetsleverandører fordi de befinner seg der modellkapasitet kan bli til kundebeskyttelse: oppdagelse, utvikling, deteksjon, respons og nettverkshåndheving. Når disse lagene forbedres sammen, skaper de et sikkerhetssvinghjul: forskere offentliggjør sårbarheter med proof-of-concept for utnyttelse og veiledning for patching, verktøy for sikkerhet i programvareforsyningskjeden hindrer sårbar kode og kompromitterte avhengigheter i å nå produksjon, EDR- og SIEM-partnere oppdager utnyttelse i det fri, og nettverks- og sikkerhetsleverandører distribuerer tiltak på WAF-nivå mens rettelser rulles ut.

GPT‑5.5 med Trusted Access for Cyber er det brede utgangspunktet for dette arbeidet. Den kan hjelpe verifiserte forsvarere med å bevege seg raskere gjennom hele sikkerhetslivssyklusen, mens GPT‑5.5‑Cyber lar et mindre sett med partnere studere avanserte arbeidsflyter der spesialisert tilgangsatferd kan ha betydning. Målet er å hjelpe sikkerhetsøkosystemet med å beskytte kunder raskere, og deretter lære av tilbakemeldinger fra partnere hvor det er behov for strammere evaluering, verifisering eller sikkerhetstiltak.

Sirkulært diagram over «sikkerhetssvinghjul» med fire faser: sårbarhetspatching, nettverks-/sikkerhetsbeskyttelse, overvåking og sikkerhet i forsyningskjeden.

Nettverks- og sikkerhetsleverandører

Nettverks- og sikkerhetsleverandører kan redusere eksponering mens rettelser fortsatt rulles ut. Når forsvarere validerer en sårbarhet og følger med på utnyttelse, kan de også distribuere WAF-regler, tiltak i kanten og konfigurasjonsendringer som svekker sannsynlige angrepsveier før hvert berørte system er utbedret. GPT‑5.5 kan støtte regelgjennomgang, konfigurasjonsanalyse, hendelsesgransking og sikker endringsstyring på tvers av komplekse miljøer. 

Vi samarbeider med disse partnerne for å hjelpe oss med å evaluere hvordan disse egenskapene oversettes til beskyttelse kundene kan distribuere i internettskala, inkludert for kritisk infrastruktur og offentlige tjenester der det er viktig å redusere eksponering raskt.

«Hos Cisco ser vi på frontlinjemodeller som en kraftig styrkemultiplikator for forsvarere. Modeller som GPT-5.5 endrer fundamentalt tempoet i driften vår, slik at vi kan handle raskere på alt fra granskning av sikkerhetshendelser til proaktiv reduksjon av sikkerhetsrisiko. Men hastighet kan ikke gå på bekostning av tillit. Den virkelige verdien av denne teknologien ligger ikke bare i selve modellen, men i det bedriftsklare rammeverket vi bygger rundt den. Et rammeverk som hjelper oss med å utvikle sikrere produkter. Vi legger vekt på å modernisere prosessene våre for sikker utvikling og drift ved hjelp av disse nye funksjonene. For oss handler det om å muliggjøre innovasjon som er like pålitelig som den er rask.»
— Anthony Grieco, viseadministrerende direktør og sikkerhets- og tillitssjef hos Cisco

Sårbarhetsforskning og utbedring

Svinghjulet starter med å finne sårbarheter, validere hvor kritiske de er, og patche berørte systemer. GPT‑5.5 med Trusted Access for Cyber kan hjelpe med det meste av dette arbeidet: forstå ukjent kode, kartlegge berørte flater, spore rotårsak, gjennomgå patcher, bygge sikre reproduksjonsoppsett, prioritere alvorlighetsgrad og gjøre funn om til veiledning for utbedring.

Noe sårbarhetsforskning krever mer tillatende atferd, spesielt når autoriserte partnere trenger proof-of-concept for utnyttelse for koordinert offentliggjøring eller kontrollert validering. Det er disse arbeidsflytene der GPT‑5.5‑Cyber kan hjelpe oss med å lære sammen med et mindre sett partnere, under sterkere verifisering, overvåking og tilbakemeldingssløyfer.

«Intel er ledende innen silisium og programvare og tilbyr et pålitelig fundament for den globale databransjen. Etter hvert som AI-modeller fortsetter å utvikle seg i resonnering og hastighet, blir deres evne til å identifisere, analysere og bidra til å redusere sikkerhetstrusler stadig viktigere. Intel ser frem til å samarbeide med OpenAI for å bringe styrte, skalerbare AI-funksjoner inn i cyberarbeidsflyter i den virkelige verden – og hjelpe virksomheter med å fremskynde sårbarhetsforskning, styrke utbedringsprosesser og operere sikrere i stor skala.»
— Dhinesh Manoharan, Head of INT31 Security Research, Intel Corporation


Deteksjon og overvåking

Hvis sårbar programvare allerede er distribuert, er neste spørsmål om noen utnytter den. EDR-, SIEM-, IGA/PAM- og overvåkingspartnere gjør en ny rådgivning om til bevis fra levende miljøer: telemetri, varsler, deteksjoner og responsarbeidsflyter. GPT‑5.5 kan hjelpe analytikere med å koble disse signalene sammen, oppsummere det som betyr noe, utarbeide deteksjoner og bevege seg raskere fra offentliggjøring til gransking. Den samme sløyfen er spesielt viktig i skymiljøer, der eksponering, utbedring og deteksjon er tett koblet sammen.

«Hos SentinelOne handler den reelle verdien av AI om hvor raskt det hjelper oss å gjøre signaler om til en handlingsrettet fordel for forsvarere. GPT-5.5 hjelper analytikere med å koble sammen telemetri, fokusere på det som betyr noe, og styrke hvordan organisasjoner undersøker, oppdager og responderer på nye trusler.»
— Gregor Stewart, Chief AI Officer, SentinelOne

Sikkerhet i programvareforsyningskjeden

Neste sving er å hindre kjent dårlig kode i å nå produksjon i utgangspunktet. Når en sårbarhet eller kompromittering av en pakke er forstått, kan verktøy for sikkerhet i programvareforsyningskjeden bidra til å stoppe risikable avhengigheter, ondsinnede oppdateringer og sårbare kodeveier før de sprer seg på tvers av kundemiljøer. GPT‑5.5 med Trusted Access for Cyber kan bidra til å inspisere endringer i avhengigheter, resonnere om utnyttbarhet i egen kode, prioritere utbedring og avdekke mistenkelig pakkeatferd tidligere i utviklingssyklusen. 

Partnere som Snyk, Gen Digital, Semgrep og Socket kan hjelpe oss med å teste hvordan disse egenskapene gjelder for hendelser som axios-kompromitteringen, der den raskeste løsningen er å hindre sårbare eller kompromitterte avhengigheter i å komme inn i bygget i det hele tatt.

«Angripere gjør allerede banebrytende modeller til våpen. Ved å ta i bruk OpenAIs Trusted Access for Cyber og GPT-5.5 gir vi forsvarerne hos Snyk kapasiteten de trenger for å beskytte kritiske forsyningskjeder. Dette partnerskapet er ikke bare en milepæl; det er en strategisk nødvendighet.»
— Manoj Nair, Chief Innovation Officer, Snyk

Codex Security for åpen kildekode og forsvarere

Åpen kildekode er en av de raskeste måtene en sårbarhet kan spre seg på i økosystemet, derfor investerer vi også oppstrøms sammen med vedlikeholdere. Codex Security hjelper team med å identifisere, validere og utbedre sårbarheter ved å bygge en kodebasespesifikk trusselmodell, utforske realistiske angrepsveier, validere problemer i isolerte miljøer og foreslå rettelser for menneskelig gjennomgang.

Gjennom Codex for Open Source kan utvalgte maintainere av kritiske prosjekter få betinget tilgang til Codex Security sammen med Codex og API-kreditter for å redusere vedlikeholds- og gjennomgangsbelastningen.

Vi har også lansert en Codex Security-plugin som bringer den eksisterende sikkerhetsarbeidsflyten direkte inn i ethvert Codex-grensesnitt som appen eller CLI, og hjelper utviklere med å gå fra trusselmodellering til oppdagelse, validering, analyse av angrepsveier og verifiserte rettelser.

Fremtidsutsikter

Etter hvert som modeller blir mer kapable innen cybersikkerhet, er den beste bruken av denne kapasiteten å hjelpe forsvarere med å finne og fikse svakheter raskere. Å utvide tilgangen til disse kapasitetene på en ansvarlig måte krever sterkere sikkerhet for hvem som bruker modellen, hvilke systemer de retter seg mot, og om arbeidet er autorisert. Etter hvert som sterkere verifisering av identitet og organisasjon, avgrensning av godkjent bruk og overvåking av misbruk forbedres, forventer vi at tilgangen vil bli utvidet over tid.

Det er enkelt å få tilgang til Trusted Access for Cyber:

Alle kunder som godkjennes gjennom denne prosessen, vil få tilgang til versjoner av eksisterende modeller med redusert friksjon rundt sikkerhetstiltak som ellers kan utløses av cyberaktivitet med dobbelt brukspotensial, slik at de fortsatt kan støtte sikkerhetsopplæring, defensiv programmering og ansvarlig sårbarhetsforskning. 

Under alfatesting er GPT‑5.5‑Cyber allerede blitt brukt til å skalere automatisert red teaming av kritiske systemer og validere sårbarheter med høy alvorlighetsgrad, noe vi vil dokumentere i en fremtidig teknisk dypdykksartikkel som del av ansvarlig offentliggjøring.

Vi forventer å fortsette å akselerere forsvarere med ulike modeller, inkludert både våre flaggskipmodeller gjennom Trusted Access for Cyber, og med dedikerte cybermodeller som GPT‑5.5‑Cyber og enda mer cyberkapable modeller i fremtiden.

Forfatter

OpenAI