Fara beint í aðalefni
OpenAI

7. maí 2026

Öryggismál

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Hleður inn...

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Hvernig GPT‑5.5 og GPT‑5.5‑Cyber standa sig í netöryggisverkefnum

GPT‑5.5 er snjallasta og innsæisríkasta líkanið okkar bæði fyrir almenna þekkingarvinnu og netöryggisverkefni, og það er líkanið sem við gerum ráð fyrir að flestir varnaraðilar noti. Við metum frammistöðu í netöryggi á verkefnum sem krefjast fjölþættrar röksemdafærslu, verkfæranotkunar og úthalds í raunhæfum varnarverkflæðum.

Fyrsta forskoðun netöryggisfrjálslyndra líkana eins og GPT‑5.5‑Cyber er ekki ætluð til að auka netöryggisgetu verulega umfram GPT‑5.5 — hún er fyrst og fremst þjálfuð til að vera rýmri í öryggistengdum verkefnum.

Þess vegna er ekki búist við að þessi fyrsta forskoðun fari fram úr GPT‑5.5 í öllum netöryggismötum. Í staðinn styður hún endurtekningarferli við innleiðingu til að bæði hraða varnaraðilum og styðja á öruggan hátt sérhæfðari heimiluð verkflæði sem krefjast rýmri hegðunar, parað við sterkari staðfestingu, vöktun á misnotkun, afmörkun samþykktrar notkunar og endurgjöf samstarfsaðila. Að sinni er GPT‑5.5 með Trusted Access for Cyber enn ráðlagður upphafspunktur fyrir flest öryggisverkflæði.

Að skala varnargetu um allt öryggisvistkerfið

Við vinnum með öryggisbirgjum vegna þess að þeir sitja á þeim stað þar sem geta líkans getur orðið að vernd viðskiptavina: uppgötvun, þróun, greining, viðbrögð og framfylgd á neti. Þegar þessi lög batna saman mynda þau öryggissveifluhjól: rannsakendur tilkynna veikleika með proof-of-concept fyrir misnotkun og leiðbeiningum um plástra, verkfæri fyrir öryggi hugbúnaðaraðfangakeðjunnar koma í veg fyrir að veikur kóði og málamiðlaðar háðir komist í framleiðslu, EDR- og SIEM-samstarfsaðilar greina misnotkun úti í náttúrunni og net- og öryggisveitur setja út mótvægisaðgerðir á WAF-stigi á meðan úrbætur eru innleiddar.

GPT‑5.5 með Trusted Access for Cyber er breiði upphafspunkturinn fyrir þessa vinnu. Það getur hjálpað staðfestum varnaraðilum að hreyfa sig hraðar um allt öryggislífsferlið, á meðan GPT‑5.5‑Cyber gerir minni hópi samstarfsaðila kleift að rannsaka þróuð verkflæði þar sem sérhæfð hegðun í aðgangi getur skipt máli. Markmiðið er að hjálpa öryggisvistkerfinu að vernda viðskiptavini hraðar og læra síðan af endurgjöf samstarfsaðila hvar þörf er á nákvæmara mati, staðfestingu eða vörnum.

Net- og öryggisveitur

Net- og öryggisveitur geta dregið úr útsetningu á meðan úrbætur eru enn í innleiðingu. Þegar varnaraðilar staðfesta veikleika og fylgjast með misnotkun geta þeir einnig sett út WAF-reglur, jaðarmótvægisaðgerðir og stillingarbreytingar sem slæva líklegar árásarleiðir áður en öllum viðkomandi kerfum hefur verið kippt í liðinn. GPT‑5.5 getur stutt yfirferð reglna, greiningu stillinga, rannsókn atvika og örugga breytingastýringu í flóknum umhverfum. 

Við vinnum með þessum samstarfsaðilum að því að hjálpa okkur að meta hvernig þessi geta skilar sér í vörnum sem viðskiptavinir geta beitt á mælikvarða internetsins, þar á meðal fyrir mikilvæga innviði og opinbera þjónustu þar sem skiptir máli að draga hratt úr útsetningu.

Veikleikarrannsóknir og plástrun

Sveifluhjólið byrjar á því að finna veikleika, staðfesta alvarleika þeirra og plástra kerfin sem verða fyrir áhrifum. GPT‑5.5 með Trusted Access for Cyber getur hjálpað við flest þetta starf: að skilja ókunnan kóða, kortleggja yfirborð sem verða fyrir áhrifum, rekja rót orsaka, yfirfara plástra, byggja örugg prófunarumhverfi fyrir endurgerð, forgangsraða alvarleika og breyta niðurstöðum í leiðbeiningar um úrbætur.

Sumar veikleikarrannsóknir krefjast rýmri hegðunar, sérstaklega þegar heimilaðir samstarfsaðilar þurfa proof-of-concept fyrir misnotkun vegna samræmdrar upplýsingagjafar eða stýrðrar staðfestingar. Það eru verkflæðin þar sem GPT‑5.5‑Cyber getur hjálpað okkur að læra með minni hópi samstarfsaðila, undir sterkari staðfestingu, vöktun og endurgjafarlykkjum.


Greining og vöktun

Ef veikur hugbúnaður er þegar kominn í notkun er næsta spurning hvort einhver sé að misnota hann. EDR-, SIEM-, IGA/PAM- og vöktunarsamstarfsaðilar breyta nýrri ráðgjöf í sönnunargögn úr lifandi umhverfum: fjarritunargögn, viðvaranir, greiningar og viðbragðsverkflæði. GPT‑5.5 getur hjálpað sérfræðingum að tengja þessi merki, draga saman það sem skiptir máli, semja greiningar og færa sig hraðar frá upplýsingagjöf að rannsókn. Sú sama lykkja er sérstaklega mikilvæg í skýjaumhverfum, þar sem útsetning, úrbætur og greining eru þétt samtvinnuð.

Öryggi hugbúnaðaraðfangakeðjunnar

Næsta umferð snýst um að koma í veg fyrir að þekktur slæmur kóði fari yfirhöfuð í framleiðslu. Þegar veikleiki eða málamiðlun pakka er skilin geta verkfæri fyrir öryggi hugbúnaðaraðfangakeðjunnar hjálpað til við að stöðva áhættusamar háðir, illgjarnar uppfærslur og viðkvæmar kóðaleiðir áður en þær dreifast um umhverfi viðskiptavina. GPT‑5.5 með Trusted Access for Cyber getur hjálpað til við að skoða breytingar á háðum, rökstyðja nýtanleika í eigin kóða, forgangsraða úrbótum og koma auga á grunsamlega hegðun pakka fyrr í þróunarferlinu. 

Samstarfsaðilar á borð við Snyk, Gen Digital, Semgrep og Socket geta hjálpað okkur að prófa hvernig þessi geta nýtist í atvikum eins og axios-málamiðluninni, þar sem hraðasta lausnin er að koma í veg fyrir að viðkvæmar eða málamiðlaðar háðir komist yfirhöfuð inn í byggingarferlið.

Codex Security fyrir opinn hugbúnað og varnaraðila

Opinn hugbúnaður er ein skjótasta leiðin sem veikleiki getur dreifst um vistkerfið, svo við erum einnig að fjárfesta ofar í keðjunni með viðhaldsaðilum. Codex Security hjálpar teymum að bera kennsl á, staðfesta og bæta úr veikleikum með því að byggja ógnarlíkan sem er sérsniðið að kóðagrunni, kanna raunhæfar árásarleiðir, staðfesta mál í einangruðu umhverfi og leggja til plástra til mannlegrar yfirferðar.

Í gegnum Codex fyrir opinn hugbúnað geta valdir viðhaldsaðilar mikilvægra verkefna fengið skilyrtan aðgang að Codex Security ásamt Codex og API-inneign til að draga úr viðhalds- og yfirferðarálagi.

Við höfum einnig gefið út Codex Security plugin sem færir núverandi öryggisverkflæði beint inn í hvaða Codex-viðmót sem er, eins og appið eða CLI, og hjálpar þróunaraðilum að fara frá ógnarlíkanagerð yfir í uppgötvun, staðfestingu, greiningu árásarleiða og staðfestar lagfæringar.

Fram undan

Eftir því sem líkön verða færari í netöryggi er besta nýting þeirrar getu að hjálpa varnaraðilum að finna og laga veikleika hraðar. Ábyrg útvíkkun aðgangs að þeirri getu krefst meiri vissu um hver notar líkanið, hvaða kerfi eru skotmörk og hvort vinnan sé heimiluð. Eftir því sem sterkari auðkennis- og stofnanastaðfesting, afmörkun samþykktrar notkunar og vöktun misnotkunar batnar gerum við ráð fyrir að aðgangur víkki með tímanum.

Að fá aðgang að Trusted Access for Cyber er einfalt:

Allir viðskiptavinir sem eru samþykktir í gegnum þetta ferli fá aðgang að útgáfum af núverandi líkönum með minni núningi í kringum varnir sem gætu farið í gang vegna tvínotaðrar netöryggisstarfsemi, sem gerir þeim kleift að halda áfram að styðja öryggisfræðslu, varnarforritun og ábyrgar veikleikarrannsóknir. 

Í alfa-prófunum hefur GPT‑5.5‑Cyber þegar verið notað til að skala sjálfvirka rauðteymisvinnu á mikilvægum kerfum og staðfesta mjög alvarlega veikleika, sem við munum skrá í tæknilegri djúpkönnun síðar sem hluta af ábyrgri upplýsingagjöf.

Við gerum ráð fyrir að halda áfram að hraða varnaraðilum með ýmsum líkönum, þar á meðal bæði flaggskipslíkunum okkar í gegnum Trusted Access for Cyber og sérhæfðum netöryggislíkönum eins og GPT‑5.5‑Cyber og enn netöryggisfærari líkönum í framtíðinni.

Höfundur

OpenAI