Pereiti prie pagrindinio turinio
OpenAI

2026 m. gegužės 7 d.

Saugumas

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Įkeliama...

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Kaip GPT‑5.5 ir GPT‑5.5‑Cyber veikia kibernetinio saugumo užduotyse

GPT‑5.5 yra mūsų išmaniausias ir intuityviausias modelis tiek bendro pobūdžio žinių darbui, tiek kibernetinio saugumo užduotims, ir būtent šį modelį, tikimės, naudos dauguma gynėjų. Kibernetinį našumą vertiname pagal užduotis, kurioms reikia daugiapakopio protavimo, įrankių naudojimo ir atkaklumo atliekant realistiškas gynybines darbo eigas.

Pradinė tokių kibernetiškai leistinesnių modelių kaip GPT‑5.5‑Cyber peržiūra nėra skirta reikšmingai padidinti kibernetines galimybes, palyginti su GPT‑5.5 – jis daugiausia apmokytas būti leistinesnis su saugumu susijusiose užduotyse.

Dėl to nesitikima, kad ši pirmoji peržiūra pranoks GPT‑5.5 kiekviename kibernetinio saugumo vertinime. Vietoj to ji palaiko iteracinį diegimo procesą, skirtą ir spartinti gynėjų darbą, ir saugiai palaikyti labiau specializuotas autorizuotas darbo eigas, kurioms reikia leistinesnio elgesio, kartu taikant stipresnį tikrinimą, piktnaudžiavimo stebėseną, patvirtintų naudojimo atvejų aprėžimą ir partnerių grįžtamąjį ryšį. Kol kas GPT‑5.5 su „Trusted Access for Cyber“ daugumai saugumo darbo eigų išlieka rekomenduojamu pradžios tašku.

Gynybinių galimybių plėtra visoje saugumo ekosistemoje

Bendradarbiaujame su saugumo tiekėjais, nes būtent ten modelio galimybės gali virsti klientų apsauga: atradimu, kūrimu, aptikimu, atsaku ir tinklo užtikrinimu. Kai šie sluoksniai gerėja kartu, jie sukuria saugumo ciklą: tyrėjai atskleidžia pažeidžiamumus kartu su išnaudojimo koncepcijos įrodymais ir pataisų gairėmis, programinės įrangos tiekimo grandinės įrankiai neleidžia pažeidžiamam kodui ir kompromituotoms priklausomybėms patekti į realią naudojimo aplinką, EDR ir SIEM partneriai aptinka išnaudojimą realioje aplinkoje, o tinklo ir saugumo tiekėjai diegia WAF lygmens švelninimo priemones, kol pataisos dar tik diegiamos.

GPT‑5.5 su „Trusted Access for Cyber“ yra platus šio darbo pradžios taškas. Jis gali padėti patvirtintiems gynėjams greičiau judėti per visą saugumo gyvavimo ciklą, o GPT‑5.5‑Cyber suteikia mažesniam partnerių ratui galimybę tirti pažangias darbo eigas, kuriose gali būti svarbus specializuotas prieigos elgesys. Tikslas – padėti saugumo ekosistemai greičiau apsaugoti klientus, o tada iš partnerių grįžtamojo ryšio mokytis, kur reikia griežtesnio vertinimo, tikrinimo ar apsaugos priemonių.

Tinklo ir saugumo tiekėjai

Tinklo ir saugumo tiekėjai gali sumažinti riziką, kol pataisos dar diegiamos. Kai gynėjai patvirtina pažeidžiamumą ir stebi jo išnaudojimą, jie taip pat gali diegti WAF taisykles, kraštines švelninimo priemones ir konfigūracijos pakeitimus, kurie sumažina tikėtinų atakų kelių poveikį dar prieš ištaisant kiekvieną paveiktą sistemą. GPT‑5.5 gali padėti peržiūrėti taisykles, analizuoti konfigūraciją, tirti incidentus ir saugiai valdyti pakeitimus sudėtingose aplinkose.

Su šiais partneriais dirbame tam, kad įvertintume, kaip šios galimybės virsta apsaugomis, kurias klientai gali diegti interneto mastu, įskaitant kritinę infrastruktūrą ir viešąasias paslaugas, kur svarbu greitai sumažinti riziką.

Pažeidžiamumų tyrimai ir taisymas

Ciklas prasideda nuo pažeidžiamumų radimo, jų kritiškumo patvirtinimo ir paveiktų sistemų taisymo. GPT‑5.5 su „Trusted Access for Cyber“ gali padėti didžiojoje šio darbo dalyje: suprasti nepažįstamą kodą, nustatyti paveiktus paviršius, atsekti pirminę priežastį, peržiūrėti pataisas, kurti saugią atkūrimo infrastruktūrą, nustatyti prioritetus pagal rimtumą ir paversti radinius ištaisymo gairėmis.

Kai kuriems pažeidžiamumų tyrimams reikia leistinesnio elgesio, ypač kai autorizuotiems partneriams reikia išnaudojimo koncepcijos įrodymų koordinuotam atskleidimui ar kontroliuojamam patvirtinimui. Būtent tokiose darbo eigose GPT‑5.5‑Cyber gali padėti mums mokytis su mažesniu partnerių ratu, taikant stipresnį tikrinimą, stebėseną ir grįžtamojo ryšio ciklus.


Aptikimas ir stebėsena

Jei pažeidžiama programinė įranga jau įdiegta, kitas klausimas – ar kas nors ją išnaudoja. EDR, SIEM, IGA/PAM ir stebėsenos partneriai paverčia naują pranešimą įrodymais iš veikiančių aplinkų: telemetrija, įspėjimais, aptikimais ir atsako darbo eigomis. GPT‑5.5 gali padėti analitikams susieti šiuos signalus, apibendrinti, kas svarbiausia, parengti aptikimo taisykles ir greičiau pereiti nuo atskleidimo prie tyrimo. Tas pats ciklas ypač svarbus debesų aplinkose, kur rizika, ištaisymas ir aptikimas yra glaudžiai susiję.

Programinės įrangos tiekimo grandinės saugumas

Kitas žingsnis – neleisti žinomai blogam kodui apskritai patekti į realias sąlygas. Kai pažeidžiamumas ar paketo kompromitavimas tampa suprantamas, programinės įrangos tiekimo grandinės įrankiai gali padėti sustabdyti rizikingas priklausomybes, kenkėjiškus atnaujinimus ir pažeidžiamo kodo kelius dar prieš jiems išplintant klientų aplinkose. GPT‑5.5 su „Trusted Access for Cyber“ gali padėti tikrinti priklausomybių pokyčius, vertinti išnaudojamumą nuosavame kode, nustatyti ištaisymo prioritetus ir anksčiau kūrimo cikle iškelti įtartiną paketų elgesį.

Tokie partneriai kaip „Snyk“, „Gen Digital“, „Semgrep“ ir „Socket“ gali padėti mums išbandyti, kaip šios galimybės taikomos tokiems incidentams kaip „axios“ kompromitavimas, kai greičiausias sprendimas yra visai neleisti pažeidžiamoms ar kompromituotoms priklausomybėms patekti į kūrimą.

„Codex Security“ atvirajam kodui ir gynėjams

Atvirasis kodas yra vienas greičiausių būdų, kaip pažeidžiamumas gali išplisti visoje ekosistemoje, todėl taip pat investuojame į aukštutinę grandies dalį kartu su prižiūrėtojais. „Codex Security“ padeda komandoms nustatyti, patvirtinti ir ištaisyti pažeidžiamumus, kurdama konkrečiam kodų rinkiniui pritaikytą grėsmių modelį, nagrinėdama realistiškus atakų kelius, patvirtindama problemas izoliuotose aplinkose ir siūlydama pataisas žmogaus peržiūrai.

Per „Codex for Open Source“ atrinkti kritinių projektų prižiūrėtojai gali gauti sąlyginę prieigą prie „Codex Security“ kartu su „Codex“ ir API kreditais, kad sumažintų priežiūros ir peržiūros naštą.

Taip pat išleidome „Codex Security“ papildinį, kuris esamą saugumo darbo eigą perkelia tiesiai į bet kurią „Codex“ sąsają, pavyzdžiui, programą ar CLI, padėdamas kūrėjams pereiti nuo grėsmių modeliavimo prie radinių aptikimo, patvirtinimo, atakų kelių analizės ir patvirtintų pataisų.

Žvelgiant į priekį

Modeliams tampant vis pajėgesniems kibernetinio saugumo srityje, geriausias šio pajėgumo panaudojimas yra padėti gynėjams greičiau rasti ir ištaisyti silpnąsias vietas. Atsakingas prieigos prie tokių galimybių plėtimas reikalauja didesnio užtikrintumo dėl to, kas naudoja modelį, į kokias sistemas taikomasi ir ar darbas yra autorizuotas. Tobulėjant stipresniam tapatybės ir organizacijos tikrinimui, patvirtintų naudojimo atvejų aprėžimui ir piktnaudžiavimo stebėsenai, tikimės, kad laikui bėgant prieiga plėsis.

Gauti prieigą prie „Trusted Access for Cyber“ yra paprasta:

Visi per šį procesą patvirtinti klientai gaus prieigą prie esamų modelių versijų, kuriose sumažinta apsaugos priemonių trintis, galinti suveikti dvejopo naudojimo kibernetinėje veikloje, ir taip galės toliau remti saugumo švietimą, gynybinį programavimą ir atsakingus pažeidžiamumų tyrimus. 

Per alfa testavimą GPT‑5.5‑Cyber jau buvo naudojamas automatizuoto kritinių sistemų saugumo testavimo mastui didinti ir didelio rimtumo pažeidžiamumams patvirtinti; tai dokumentuosime būsimame techniniame gilesniame nagrinėjime kaip atsakingo atskleidimo dalį.

Tikimės ir toliau spartinti gynėjų darbą naudodami įvairius modelius, įskaitant tiek mūsų pavyzdinius modelius per „Trusted Access for Cyber“, tiek specializuotus kibernetinius modelius, tokius kaip GPT‑5.5‑Cyber, ir ateityje dar labiau kibernetiškai pajėgius modelius.

Autorius

OpenAI