Preskočite na glavni sadržaj
OpenAI

7. svibnja 2026.

Zaštita

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Učitavanje…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Kako GPT‑5.5 i GPT‑5.5‑Cyber rade na kibernetičkim zadacima

GPT‑5.5 naš je najpametniji i najintuitivniji model za opći rad sa znanjem i zadatke kibernetičke sigurnosti te model za koji očekujemo da će ga koristiti većina stručnjaka za kibernetičku sigurnost. Kibernetičku izvedbu procjenjujemo na zadacima koji zahtijevaju rasuđivanje u više koraka, uporabu alata i ustrajnost u realističnim obrambenim radnim tokovima.

Početni pretpregled kibernetički permisivnih modela poput GPT‑5.5‑Cyber nije namijenjen znatnom povećanju kibernetičkih sposobnosti iznad GPT‑5.5 - primarno je treniran da bude permisivniji na sigurnosno povezanim zadacima.

Zbog toga se ne očekuje da će ovaj prvi pretpregled nadmašiti GPT‑5.5 u svakoj kibernetičkoj evaluaciji. Umjesto toga, podržava iterativan proces implementacije kako bi ubrzao stručnjake za kibernetičku sigurnost i sigurno podržao specijaliziranije autorizirane radne tokove koji zahtijevaju permisivnije ponašanje, uz snažniju verifikaciju, nadzor zloupotrebe, određivanje opsega odobrene uporabe i povratne informacije partnera. Zasad GPT‑5.5 uz Trusted Access for Cyber ostaje preporučena početna točka za većinu sigurnosnih radnih tokova.

Širenje obrambenih sposobnosti kroz sigurnosni ekosustav

Surađujemo s pružateljima sigurnosnih rješenja jer se nalaze ondje gdje sposobnosti modela mogu postati zaštita za korisnike: otkrivanje, razvoj, detekcija, odgovor i provedba zaštite na mrežnoj razini. Kada se ti slojevi zajedno poboljšavaju, stvaraju sigurnosni ciklus: istraživači objavljuju ranjivosti uz dokaze koncepta iskorištavanja i smjernice za zakrpe, alati za sigurnost opskrbnog lanca softvera sprječavaju da ranjiv kȏd i kompromitirane zavisnosti stignu u produkciju, EDR i SIEM partneri otkrivaju iskorištavanje u aktivnim okruženjima, a pružatelji mrežnih i sigurnosnih rješenja uvode mjere ublažavanja na razini WAF-a dok se uvode ispravci.

GPT‑5.5 uz Trusted Access for Cyber široka je početna točka za taj rad. Može pomoći provjerenim stručnjacima za kibernetičku sigurnost da brže napreduju kroz sigurnosni ciklus, dok GPT‑5.5‑Cyber manjem skupu partnera omogućuje proučavanje naprednih radnih tokova u kojima specijaliziraniji pristup može biti važan. Cilj je pomoći sigurnosnom ekosustavu da brže zaštiti korisnike, a zatim iz povratnih informacija partnera učiti gdje su potrebne strože evaluacije, verifikacija ili zaštitne mjere.

Pružatelji mrežnih i sigurnosnih rješenja

Pružatelji mrežnih i sigurnosnih rješenja mogu smanjiti izloženost dok se ispravci još uvode. Dok stručnjaci za kibernetičku sigurnost validiraju ranjivost i prate iskorištavanje, mogu uvesti i WAF pravila, mjere ublažavanja na rubu mreže i promjene konfiguracije koje smanjuju učinkovitost vjerojatnih putova napada prije nego što se svaki pogođeni sustav sanira. GPT‑5.5 može podržati pregled pravila, analizu konfiguracije, istragu incidenata i sigurno upravljanje promjenama u složenim okruženjima. 

S tim partnerima radimo kako bismo procijenili kako se te mogućnosti mogu pretvoriti u zaštitne mjere koje korisnici mogu primijeniti na razini interneta, uključujući ključnu infrastrukturu i javne usluge, gdje je važno brzo smanjiti izloženost.

Istraživanje ranjivosti i zakrpavanje

Sigurnosni ciklus započinje pronalaskom ranjivosti, procjenom njihove kritičnosti i zakrpavanjem pogođenih sustava. GPT‑5.5 uz Trusted Access for Cyber može pomoći u većini tog rada: razumijevanju nepoznatog koda, mapiranju pogođenih površina, praćenju temeljnog uzroka, pregledu zakrpa, izradi sigurnih reprodukcijskih okvira, određivanju prioriteta prema ozbiljnosti i pretvaranju nalaza u smjernice za sanaciju.

Neka istraživanja ranjivosti zahtijevaju permisivnije ponašanje, osobito kada autorizirani partneri trebaju dokaze koncepta iskorištavanja za koordinirano objavljivanje ili kontroliranu validaciju. To su radni tokovi u kojima nam GPT‑5.5‑Cyber može pomoći da učimo s manjim skupom partnera, uz strožu verifikaciju, nadzor i povratne informacije.


Otkrivanje i nadzor

Ako je ranjiv softver već implementiran, sljedeće je pitanje iskorištava li ga netko. EDR, SIEM, IGA/PAM i partneri za nadzor pretvaraju novu obavijest u dokaz iz aktivnih okruženja: telemetriju, upozorenja, detekcije i radne tokove odgovora. GPT‑5.5 može pomoći analitičarima povezati te signale, sažeti ono što je važno, izraditi detekcije i brže prijeći od objave do istrage. Ta ista petlja posebno je važna u cloud okruženjima, gdje su izloženost, sanacija i detekcija čvrsto povezane.

Sigurnost opskrbnog lanca softvera

Sljedeći korak jest spriječiti da kȏd za koji se zna da je loš uopće stigne u produkciju. Nakon što se razumije ranjivost ili kompromitacija paketa, alati za sigurnost opskrbnog lanca softvera mogu pomoći zaustaviti rizične ovisnosti, zlonamjerna ažuriranja i ranjive putove kȏda prije nego što se prošire korisničkim okruženjima. GPT‑5.5 uz Trusted Access for Cyber može pomoći u pregledu promjena ovisnosti, rasuđivanju o iskoristivosti vlastitog kȏda, određivanju prioriteta sanacije i ranijem otkrivanju sumnjivog ponašanja paketa u razvojnom ciklusu. 

Partneri kao što su Snyk, Gen Digital, Semgrep i Socket mogu nam pomoći testirati kako se te mogućnosti primjenjuju na incidente poput kompromitacije axiosa, gdje je najbrži način sanacije spriječiti da ranjive ili kompromitirane ovisnosti uopće uđu u build.

Codex Security za open source i stručnjake za kibernetičku sigurnost

Open source jedan je od najbržih načina na koji se ranjivost može proširiti kroz ekosustav, pa zato ulažemo i u rad s održavateljima upstream projekata. Codex Security pomaže timovima identificirati, validirati i sanirati ranjivosti izradom modela prijetnji specifičnog za kodnu bazu, istraživanjem realističnih putova napada, validacijom problema u izoliranim okruženjima i predlaganjem zakrpa za ljudski pregled.

Kroz Codex for Open Source, odabrani održavatelji ključnih projekata mogu dobiti uvjetni pristup alatu Codex Security uz Codex i API kredite radi smanjenja opterećenja održavanja i pregleda.

Također smo objavili plugin Codex Security koji postojeći sigurnosni radni tok donosi izravno u bilo koje Codex sučelje, poput aplikacije ili CLI-ja, pomažući developerima prijeći od modeliranja prijetnji do otkrivanja, validacije, analize putova napada i provjerenih ispravaka.

Pogled unaprijed

Kako modeli postaju sposobniji u kibernetičkoj sigurnosti, najbolja uporaba te sposobnosti jest pomoći stručnjacima za kibernetičku sigurnost da brže pronađu i isprave slabosti. Odgovorno proširivanje pristupa tim mogućnostima zahtijeva veće povjerenje u to tko koristi model, koje sustave cilja i je li rad autoriziran. Kako se poboljšavaju provjera identiteta i organizacija, određivanje opsega odobrene uporabe i nadzor zloupotrebe, očekujemo da će se pristup s vremenom širiti.

Dobivanje pristupa programu Trusted Access for Cyber jednostavno je:

Svi korisnici odobreni kroz ovaj postupak dobit će pristup verzijama postojećih modela sa smanjenim trenjem oko zaštitnih mjera koje bi se mogle aktivirati na kibernetičkoj aktivnosti dvojne namjene, što im omogućuje da i dalje podržavaju sigurnosno obrazovanje, obrambeno programiranje i odgovorno istraživanje ranjivosti. 

Tijekom alfa testiranja GPT‑5.5‑Cyber već se koristio za skaliranje automatiziranog red-team testiranja ključnih sustava i validaciju ranjivosti visoke ozbiljnosti, što ćemo dokumentirati u budućoj tehničkoj dubinskoj analizi u sklopu odgovornog objavljivanja.

Očekujemo da ćemo nastaviti ubrzavati rad stručnjaka za kibernetičku sigurnost raznim modelima, uključujući naše vodeće modele kroz Trusted Access for Cyber, namjenske kibernetičke modele poput GPT‑5.5‑Cyber i još sposobnije kibernetičke modele u budućnosti.

Autor

OpenAI