Ugrás a fő tartalomra
OpenAI

2026. május 7.

Kiberbiztonság

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Betöltés…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Hogyan teljesít a GPT‑5.5 és a GPT‑5.5‑Cyber kiberbiztonsági feladatokban?

A GPT‑5.5 a legokosabb és legintuitívabb modellünk mind az általános tudásmunkára, mind a kiberbiztonsági feladatokra, és arra számítunk, hogy a legtöbb védő ezt fogja használni. A kiberbiztonsági teljesítményt olyan feladatokon értékeljük, amelyek többlépéses érvelést, eszközhasználatot és kitartást igényelnek valósághű védelmi munkafolyamatokon át.

A GPT‑5.5‑Cyberhez hasonló, kiberbiztonságban megengedőbb modellek kezdeti előzetese nem azt célozza, hogy jelentősen növelje a kiberképességeket a GPT‑5.5‑höz képest – elsősorban arra tanítottuk, hogy megengedőbb legyen a biztonsággal kapcsolatos feladatokban.

Ennek eredményeként ez az első előzetes nem várhatóan fogja felülmúlni a GPT‑5.5‑öt minden egyes kiberbiztonsági értékelésben. Ehelyett egy iteratív bevezetési folyamatot támogat, amely egyszerre gyorsítja a védőket, és biztonságosan támogat speciálisabb, engedélyezett munkafolyamatokat, amelyek megengedőbb viselkedést igényelnek, erősebb ellenőrzéssel, visszaélésfigyeléssel, a jóváhagyott felhasználás körülhatárolásával és partneri visszajelzésekkel párosítva. Egyelőre a Trusted Access for Cyber hozzáféréssel rendelkező GPT‑5.5 marad a legtöbb biztonsági munkafolyamat számára ajánlott kiindulópont.

A védelmi képességek kiterjesztése a biztonsági ökoszisztémában

Biztonsági beszállítókkal működünk együtt, mert ők ott helyezkednek el, ahol a modellképesség ügyfélvédelemmé válhat: feltárás, fejlesztés, észlelés, válaszadás és hálózati kényszerítés. Amikor ezek a rétegek együtt javulnak, biztonsági lendkereket hoznak létre: a kutatók sebezhetőségeket tárnak fel kihasználást bemutató proof-of-conceptekkel és javítási útmutatóval, a szoftver-ellátásilánc eszközök megakadályozzák, hogy sérülékeny kód és kompromittált függőségek éles környezetbe kerüljenek, az EDR- és SIEM-partnerek észlelik a vadonban történő kihasználást, a hálózati és biztonsági szolgáltatók pedig WAF-szintű enyhítéseket vezetnek be, amíg a javítások kiterjednek.

A Trusted Access for Cyber hozzáféréssel rendelkező GPT‑5.5 ennek a munkának a széles körű kiindulópontja. Segíthet az ellenőrzött védőknek gyorsabban haladni a biztonsági életciklus egészében, míg a GPT‑5.5‑Cyber lehetővé teszi egy szűkebb partnerkör számára, hogy olyan fejlett munkafolyamatokat tanulmányozzon, ahol a speciális hozzáférési viselkedés számíthat. A cél az, hogy a biztonsági ökoszisztéma gyorsabban védhesse az ügyfeleket, majd a partneri visszajelzésekből megtanuljuk, hol van szükség szigorúbb értékelésre, ellenőrzésre vagy védelmi intézkedésekre.

Hálózati és biztonsági szolgáltatók

A hálózati és biztonsági szolgáltatók csökkenthetik a kitettséget, miközben a javítások még bevezetés alatt állnak. Miközben a védők validálnak egy sérülékenységet és figyelik a kihasználását, WAF-szabályokat, peremhálózati enyhítéseket és konfigurációs módosításokat is telepíthetnek, amelyek tompítják a valószínű támadási útvonalakat, még mielőtt minden érintett rendszert kijavítottak volna. A GPT‑5.5 támogathatja a szabályok felülvizsgálatát, a konfigurációelemzést, az incidensvizsgálatot és a biztonságos változáskezelést összetett környezetekben. 

Ezekkel a partnerekkel együtt dolgozunk annak értékelésén, hogy ezek a képességek miként fordíthatók le olyan védelmekké, amelyeket az ügyfelek internetes léptékben is telepíthetnek, beleértve a kritikus infrastruktúrát és a közszolgáltatásokat, ahol fontos a kitettség gyors csökkentése.

Sérülékenységkutatás és -javítás

A lendkerék a sérülékenységek megtalálásával, kritikusságuk validálásával és az érintett rendszerek javításával indul. A Trusted Access for Cyber-hozzáféréssel rendelkező GPT‑5.5 ennek a munkának a nagy részében segíthet: ismeretlen kód megértése, érintett felületek feltérképezése, gyökérokok visszakövetése, javítások felülvizsgálata, biztonságos reprodukciós környezetek létrehozása, súlyossági prioritások meghatározása és a megállapítások javítási útmutatássá alakítása.

Néhány sérülékenységkutatási feladat megengedőbb viselkedést igényel, különösen amikor az engedélyezett partnereknek kihasználást bemutató proof-of-conceptekre van szükségük összehangolt közzétételhez vagy ellenőrzött validáláshoz. Ezek azok a munkafolyamatok, ahol a GPT‑5.5‑Cyber segíthet nekünk tanulni egy kisebb partnerkörrel, erősebb ellenőrzés, monitorozás és visszacsatolási körök mellett.


Észlelés és monitorozás

Ha a sérülékeny szoftvert már telepítették, a következő kérdés az, hogy valaki kihasználja-e. Az EDR-, SIEM-, IGA/PAM- és monitorozó partnerek egy új figyelmeztetést élő környezetekből származó bizonyítékká alakítanak: telemetria, riasztások, észlelések és válaszadási munkafolyamatok formájában. A GPT‑5.5 segíthet az elemzőknek összekapcsolni ezeket a jeleket, összefoglalni a lényeget, detekciókat készíteni, és gyorsabban eljutni a közzétételtől a vizsgálatig. Ugyanez a kör különösen fontos a felhőkörnyezetekben, ahol a kitettség, a javítás és az észlelés szorosan összekapcsolódik.

Szoftverellátási lánc biztonsága

A következő fordulat az, hogy megakadályozzuk az ismerten rosszindulatú kód éles környezetbe való bejutását. Miután egy sérülékenységet vagy csomagkompromittálódást megértünk, a szoftverellátási lánc eszközei segíthetnek megállítani a kockázatos függőségeket, a rosszindulatú frissítéseket és a sérülékeny kódutakat, mielőtt azok szétterjednének az ügyfélkörnyezetekben. A Trusted Access for Cyber-hozzáféréssel rendelkező GPT‑5.5 segíthet a függőségváltozások vizsgálatában, a saját kódban lévő kihasználhatóság mérlegelésében, a javítások priorizálásában és a gyanús csomagviselkedés korábbi felszínre hozásában a fejlesztési ciklus során. 

Az olyan partnerek, mint a Snyk, a Gen Digital, a Semgrep és a Socket, segíthetnek nekünk tesztelni, hogyan alkalmazhatók ezek a képességek az olyan incidensekre, mint az axios kompromittálódása, ahol a leggyorsabb megoldás az, ha a sérülékeny vagy kompromittált függőségek egyáltalán nem jutnak be a buildbe.

Codex Security nyílt forráskódhoz és védőknek

A nyílt forráskód az egyik leggyorsabb módja annak, hogy egy sérülékenység elterjedjen az egész ökoszisztémában, ezért a karbantartók támogatásával a forrásnál is beruházunk. A Codex Security segít a csapatoknak a sérülékenységek azonosításában, validálásában és javításában azáltal, hogy kódbázis-specifikus fenyegetési modellt épít, valósághű támadási útvonalakat vizsgál, elszigetelt környezetben validálja a problémákat, és emberi felülvizsgálatra javításokat javasol.

A Codex for Open Source programon keresztül a kritikus projektek kiválasztott karbantartói feltételes hozzáférést kaphatnak a Codex Securityhez a Codex és API-jóváírások mellett, hogy csökkentsék a karbantartási és felülvizsgálati terheket.

Kiadtunk egy Codex biztonsági bővítményt is, amely a meglévő biztonsági munkafolyamatot közvetlenül bármely Codex-felületre, például az alkalmazásba vagy a CLI-be hozza el, segítve a fejlesztőket abban, hogy a fenyegetésmodellezéstől eljussanak a feltárásig, a validálásig, a támadási útvonal elemzéséig és az ellenőrzött javításokig.

Előretekintés

Ahogy a modellek egyre képzettebbé válnak a kiberbiztonságban, e képesség legjobb felhasználása az, hogy segítsen a védőknek gyorsabban megtalálni és kijavítani a gyengeségeket. E képességek felelős kiterjesztéséhez erősebb bizonyosságra van szükség abban, hogy ki használja a modellt, milyen rendszereket céloz meg, és hogy a munka engedélyezett-e. Ahogy javul az erősebb identitás- és szervezetellenőrzés, a jóváhagyott felhasználás körülhatárolása és a visszaélésfigyelés, arra számítunk, hogy a hozzáférés idővel szélesebb körűvé válik.

A Trusted Access for Cyberhez való hozzáférés egyszerű:

A folyamaton keresztül jóváhagyott ügyfél hozzáférést kap a meglévő modellek olyan verzióihoz, ahol kisebb a súrlódás a kettős felhasználású kibertevékenységekre aktiválódó védelmi intézkedések körül, lehetővé téve számukra, hogy továbbra is támogassák a biztonsági oktatást, a védekező programozást és a felelős sérülékenységkutatást. 

Az alfa tesztelés során a GPT‑5.5‑Cyber modellt már használták kritikus rendszerek automatizált támadásszimulációjának kiterjesztésére és magas súlyosságú sérülékenységek validálására; ezt egy jövőbeli műszaki mélyelemzésben fogjuk dokumentálni a felelős közzététel részeként.

Arra számítunk, hogy különböző modellekkel tovább gyorsítjuk a védőket, beleértve mind a Trusted Access for Cyber keretében elérhető zászlóshajó modelljeinket, mind az olyan dedikált kiberbiztonsági modelleket, mint a GPT‑5.5‑Cyber, valamint a jövőben még erősebb kiberképességű modelleket is.

Szerző

OpenAI