Sari la conținutul principal
OpenAI

7 mai 2026

Securitate

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Se încarcă…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Cum se descurcă GPT‑5.5 și GPT‑5.5‑Cyber la sarcini cibernetice

GPT‑5.5 este cel mai inteligent și intuitiv model al nostru atât pentru activități generale bazate pe cunoaștere, cât și pentru sarcini de securitate cibernetică, și este modelul pe care ne așteptăm ca majoritatea apărătorilor să îl folosească. Evaluăm performanța cibernetică pe sarcini care necesită raţionament în mai mulți pași, utilizarea de instrumente și perseverență în fluxuri de lucru defensive realiste.

Previzualizarea inițială a modelelor permisive din punct de vedere cibernetic, precum GPT‑5.5‑Cyber, nu este destinată să crească semnificativ capabilitatea cibernetică dincolo de GPT‑5.5 - este antrenată în principal pentru a fi mai permisivă în sarcini legate de securitate.

Ca urmare, nu ne așteptăm ca această primă previzualizare să depășească GPT‑5.5 în fiecare evaluare cibernetică. În schimb, susține un proces iterativ de implementare pentru a accelera apărătorii și a susține în siguranță fluxuri de lucru autorizate mai specializate, care necesită un comportament mai permisiv, împreună cu verificare mai strictă, monitorizarea utilizării abuzive, delimitarea utilizării aprobate și feedback din partea partenerilor. Pentru moment, GPT‑5.5 cu Trusted Access for Cyber rămâne punctul de plecare recomandat pentru majoritatea fluxurilor de lucru de securitate.

Extinderea capabilității defensive în întreg ecosistemul de securitate

Colaborăm cu furnizori de securitate deoarece ei se află acolo unde capabilitatea modelului se poate transforma în protecție pentru clienți: descoperire, dezvoltare, detecție, răspuns și aplicare la nivel de rețea. Când aceste straturi se îmbunătățesc împreună, creează o volantă a securității: cercetătorii dezvăluie vulnerabilități împreună cu demonstrații de concept de exploatare și îndrumări pentru patch-uri, instrumentele de securitate pentru lanțul de aprovizionare software împiedică ajungerea în producție a codului vulnerabil și a dependențelor compromise, partenerii EDR și SIEM detectează exploatarea în teren, iar furnizorii de rețea și securitate implementează măsuri de atenuare la nivel WAF în timp ce remediile sunt distribuite.

GPT‑5.5 cu Trusted Access for Cyber este punctul larg de plecare pentru această activitate. Poate ajuta apărătorii verificați să se miște mai rapid pe întreg ciclul de viață al securității, în timp ce GPT‑5.5‑Cyber permite unui set mai restrâns de parteneri să studieze fluxuri de lucru avansate în care un comportament specializat de acces poate conta. Scopul este să ajutăm ecosistemul de securitate să protejeze mai repede clienții, apoi să învățăm din feedbackul partenerilor unde este nevoie de evaluări, verificări sau măsuri de protecție mai stricte.

Furnizori de rețea și securitate

Furnizorii de rețea și securitate pot reduce expunerea în timp ce remediile sunt încă în curs de implementare. Pe măsură ce apărătorii validează o vulnerabilitate și urmăresc exploatarea, ei pot implementa și reguli WAF, atenuări la marginea rețelei și modificări de configurare care reduc efectul probabil al căilor de atac înainte ca fiecare sistem afectat să fi fost remediat. GPT‑5.5 poate susține revizuirea regulilor, analiza configurației, investigarea incidentelor și gestionarea sigură a schimbărilor în medii complexe. 

Lucrăm cu acești parteneri pentru a ne ajuta să evaluăm cum se traduc aceste capabilități în protecții pe care clienții le pot implementa la scară internet, inclusiv pentru infrastructură critică și servicii publice, unde contează reducerea rapidă a expunerii.

Cercetarea vulnerabilităților și aplicarea patch-urilor

Ciclul de îmbunătățire începe cu găsirea vulnerabilităților, validarea criticității lor și aplicarea patch-urilor pe sistemele afectate. GPT‑5.5 cu Trusted Access for Cyber poate ajuta la cea mai mare parte a acestei activități: înțelegerea codului necunoscut, cartografierea suprafețelor afectate, urmărirea cauzei de bază, revizuirea patch-urilor, construirea de mecanisme de reproducere sigure, prioritizarea severității și transformarea constatărilor în ghiduri de remediere.

Unele activități de cercetare a vulnerabilităților necesită un comportament mai permisiv, mai ales atunci când partenerii autorizați au nevoie de demonstrații de concept de exploatare pentru divulgare coordonată sau validare controlată. Acestea sunt fluxurile de lucru în care GPT‑5.5‑Cyber ne poate ajuta să învățăm împreună cu un set mai restrâns de parteneri, în condiții de verificare, monitorizare și bucle de feedback mai stricte.


Detecție și monitorizare

Dacă software-ul vulnerabil este deja implementat, următoarea întrebare este dacă cineva îl exploatează. Partenerii EDR, SIEM, IGA/PAM și de monitorizare transformă un nou buletin informativ în dovezi din medii reale: telemetrie, alerte, detecții și fluxuri de răspuns. GPT‑5.5 îi poate ajuta pe analiști să conecteze aceste semnale, să sintetizeze ce este important, să redacteze detecții și să treacă mai rapid de la divulgare la investigație. Același ciclu este deosebit de important în mediile cloud, unde expunerea, remedierea și detecția sunt strâns legate.

Securitatea lanțului de aprovizionare software

Pasul următor este prevenirea ajungerii în producție a codului cunoscut ca fiind problematic. Odată ce o vulnerabilitate sau compromiterea unui pachet este înțeleasă, instrumentele de securitate pentru lanțul de aprovizionare software pot ajuta la oprirea dependențelor riscante, a actualizărilor malițioase și a căilor de cod vulnerabile înainte ca acestea să se răspândească în mediile clienților. GPT‑5.5 cu Trusted Access for Cyber poate ajuta la inspectarea modificărilor dependențelor, la raționament privind exploatabilitatea în codul deținut, la prioritizarea remedierii și la evidențierea mai devreme a comportamentului suspect al pachetelor în ciclul de dezvoltare. 

Parteneri precum Snyk, Gen Digital, Semgrep și Socket ne pot ajuta să testăm modul în care aceste capabilități se aplică unor incidente precum compromiterea axios, unde cea mai rapidă soluție este împiedicarea dependențelor vulnerabile sau compromise să ajungă în procesul de build.

Codex Security pentru open source și apărători

Open source este una dintre cele mai rapide căi prin care o vulnerabilitate se poate răspândi în întregul ecosistem, așa că investim și în amonte, alături de responsabilii proiectelor. Codex Security ajută echipele să identifice, să valideze și să remedieze vulnerabilități prin construirea unui model de amenințare specific bazei de cod, explorarea unor căi de atac realiste, validarea problemelor în medii izolate și propunerea de patch-uri pentru revizuire umană.

Prin Codex for Open Source, responsabilii proiectelor selectați ai unor proiecte critice pot primi acces condiționat la Codex Security, alături de Codex și credite API pentru a reduce povara de mentenanță și revizuire.

Am lansat și un plugin Codex Security care aduce fluxul de lucru de securitate existent direct în orice interfață Codex, precum aplicația sau CLI-ul, ajutând dezvoltatorii să treacă de la modelarea amenințărilor la descoperire, validare, analiza căilor de atac și remedieri verificate.

Ce urmează

Pe măsură ce modelele devin mai capabile în securitatea cibernetică, cea mai bună utilizare a acestei capabilități este să îi ajute pe apărători să găsească și să remedieze mai repede punctele slabe. Extinderea responsabilă a accesului la aceste capabilități necesită o încredere mai mare în cine folosește modelul, ce sisteme vizează și dacă activitatea este autorizată. Pe măsură ce se îmbunătățesc verificarea mai puternică a identității și organizației, delimitarea utilizărilor aprobate și monitorizarea utilizării abuzive, ne așteptăm ca accesul să se extindă în timp.

Obținerea accesului la Trusted Access for Cyber este simplă:

Toți clienții aprobați prin acest proces vor primi acces la versiuni ale modelelor existente cu fricțiune redusă în jurul măsurilor de protecție care s-ar putea activa pentru activitate cibernetică cu utilizare atât defensivă, cât și ofensivă, permițându-le să continue să susțină educația în securitate, programarea defensivă și cercetarea responsabilă a vulnerabilităților. 

În timpul testării alpha, GPT‑5.5‑Cyber a fost deja folosit pentru a extinde red teaming-ul automatizat al sistemelor critice și pentru a valida vulnerabilități de severitate ridicată, aspecte pe care le vom documenta într-o viitoare analiză tehnică detaliată, ca parte a divulgării responsabile.

Ne așteptăm să continuăm să accelerăm apărătorii cu diverse modele, inclusiv atât prin modelele noastre de vârf prin Trusted Access for Cyber, cât și cu modele cibernetice dedicate precum GPT‑5.5‑Cyber și cu modele și mai capabile din punct de vedere cibernetic în viitor.

Autor

OpenAI