Przejdź do treści głównej
OpenAI

7 maja 2026

Zabezpieczenia

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Ładowanie…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Jak GPT‑5.5 i GPT‑5.5‑Cyber radzą sobie w zadaniach cyberbezpieczeństwa

GPT‑5.5 to nasz najinteligentniejszy i najbardziej intuicyjny model zarówno do ogólnych zadań opartych na wiedzy, jak i do zadań z zakresu cyberbezpieczeństwa, i to właśnie z niego spodziewamy się, że będzie korzystać większość obrońców. Oceniamy wyniki w cyberbezpieczeństwie na zadaniach wymagających wieloetapowego rozumowania, użycia narzędzi i wytrwałości w realistycznych obronnych procesach pracy.

Początkowy podgląd modeli bardziej liberalnych pod względem cyberbezpieczeństwa, takich jak GPT‑5.5‑Cyber, nie ma na celu znaczącego zwiększenia możliwości cybernetycznych ponad GPT‑5.5 — został on przede wszystkim wytrenowany tak, aby być bardziej liberalnym w zadaniach związanych z bezpieczeństwem.

W rezultacie nie oczekuje się, że ten pierwszy podgląd przewyższy GPT‑5.5 we wszystkich ewaluacjach cyberbezpieczeństwa. Zamiast tego wspiera iteracyjny proces wdrażania, który ma zarówno przyspieszać działania obrońców, jak i bezpiecznie wspierać bardziej wyspecjalizowane autoryzowane procesy wymagające bardziej liberalnego zachowania, w połączeniu z silniejszą weryfikacją, monitorowaniem nadużyć, określeniem zatwierdzonych zastosowań i informacją zwrotną od partnerów. Na razie GPT‑5.5 z Trusted Access for Cyber pozostaje zalecanym punktem wyjścia dla większości procesów bezpieczeństwa.

Skalowanie zdolności obronnych w całym ekosystemie bezpieczeństwa

Współpracujemy z dostawcami zabezpieczeń, ponieważ to oni znajdują się tam, gdzie możliwości modelu mogą przełożyć się na ochronę klienta: w wykrywaniu, opracowywaniu, detekcji, reagowaniu i egzekwowaniu zasad sieciowych. Gdy te warstwy ulepszają się razem, tworzą koło zamachowe bezpieczeństwa: badacze ujawniają podatności wraz z exploit proof-of-concepts i wskazówkami dotyczącymi poprawek, narzędzia bezpieczeństwa łańcucha dostaw oprogramowania zapobiegają przedostawaniu się podatnego kodu i przejętych zależności do produkcji, partnerzy EDR i SIEM wykrywają wykorzystanie podatności w rzeczywistych atakach, a dostawcy sieci i bezpieczeństwa wdrażają zabezpieczenia na poziomie WAF, podczas gdy poprawki są wprowadzane.

GPT‑5.5 z Trusted Access for Cyber to szeroki punkt wyjścia dla tych działań. Może pomagać zweryfikowanym obrońcom działać szybciej w całym cyklu bezpieczeństwa, podczas gdy GPT‑5.5‑Cyber umożliwia mniejszej grupie partnerów badanie zaawansowanych procesów, w których znaczenie może mieć wyspecjalizowane zachowanie dostępu. Celem jest pomoc ekosystemowi bezpieczeństwa w szybszej ochronie klientów, a następnie uczenie się na podstawie informacji zwrotnych od partnerów, gdzie potrzebne są ściślejsze oceny, weryfikacja lub zabezpieczenia.

Dostawcy sieci i bezpieczeństwa

Dostawcy sieci i bezpieczeństwa mogą ograniczać ekspozycję, gdy poprawki są jeszcze wdrażane. Gdy obrońcy potwierdzają podatność i obserwują próby jej wykorzystania, mogą też wdrażać reguły WAF, zabezpieczenia brzegowe i zmiany konfiguracji, które osłabiają prawdopodobne ścieżki ataku, zanim każdy dotknięty system zostanie naprawiony. GPT‑5.5 może wspierać przegląd reguł, analizę konfiguracji, dochodzenia incydentowe i bezpieczne zarządzanie zmianą w złożonych środowiskach. 

Współpracujemy z tymi partnerami, aby pomogli nam ocenić, jak te możliwości przekładają się na zabezpieczenia, które klienci mogą wdrażać w skali internetu, w tym dla infrastruktury krytycznej i usług publicznych, gdzie szybkie ograniczenie ekspozycji ma szczególne znaczenie.

Badania nad podatnościami i tworzenie poprawek

Koło zamachowe zaczyna się od znajdowania podatności, potwierdzania ich krytyczności i łatania dotkniętych systemów. GPT‑5.5 z Trusted Access for Cyber może pomóc w większości tych działań: zrozumieniu nieznanego kodu, mapowaniu powierzchni objętych problemem, śledzeniu przyczyny źródłowej, przeglądzie poprawek, budowaniu bezpiecznych środowisk odtworzeniowych, ustalaniu priorytetu ważności oraz zamienianiu ustaleń w wskazówki naprawcze.

Niektóre badania nad podatnościami wymagają bardziej liberalnego zachowania, szczególnie gdy autoryzowani partnerzy potrzebują exploit proof-of-concepts do skoordynowanego ujawnienia lub kontrolowanej walidacji. To właśnie te procesy pozwalają GPT‑5.5‑Cyber pomagać nam uczyć się we współpracy z mniejszą grupą partnerów, przy silniejszej weryfikacji, monitorowaniu i pętlach informacji zwrotnej.


Wykrywanie i monitorowanie

Jeśli podatne oprogramowanie jest już wdrożone, kolejne pytanie brzmi, czy ktoś już je wykorzystuje. Partnerzy EDR, SIEM, IGA/PAM i monitoringu zamieniają nowe ostrzeżenie w dowody z działających środowisk: telemetrię, alerty, detekcje i procesy reagowania. GPT‑5.5 może pomagać analitykom łączyć te sygnały, podsumowywać to, co najważniejsze, przygotowywać detekcje i szybciej przechodzić od ujawnienia do dochodzenia. Ta sama pętla jest szczególnie ważna w środowiskach chmurowych, gdzie ekspozycja, usuwanie zagrożeń i wykrywanie są ze sobą ściśle powiązane.

Bezpieczeństwo łańcucha dostaw oprogramowania

Kolejny obrót koła to zapobieganie trafianiu znanego złego kodu do produkcji. Gdy podatność lub przejęcie pakietu zostaną zrozumiane, narzędzia bezpieczeństwa łańcucha dostaw oprogramowania mogą pomóc zatrzymać ryzykowne zależności, złośliwe aktualizacje i podatne ścieżki kodu, zanim rozprzestrzenią się w środowiskach klientów. GPT‑5.5 z Trusted Access for Cyber może pomóc analizować zmiany zależności, rozumować o możliwości wykorzystania podatności we własnym kodzie, priorytetyzować działania naprawcze i wcześniej ujawniać podejrzane zachowania pakietów w cyklu tworzenia oprogramowania. 

Partnerzy tacy jak Snyk, Gen Digital, Semgrep i Socket mogą pomóc nam sprawdzić, jak te możliwości sprawdzają się w incydentach takich jak kompromitacja axios, gdzie najszybszym rozwiązaniem jest niedopuszczenie, by podatne lub przejęte zależności w ogóle trafiły do procesu budowania.

Codex Security dla open source i obrońców

Open source to jeden z najszybszych sposobów rozprzestrzeniania się podatności w całym ekosystemie, dlatego inwestujemy również upstream we współpracę z maintainerami. Codex Security pomaga zespołom identyfikować, weryfikować i usuwać podatności poprzez budowanie modelu zagrożeń specyficznego dla kodu, badanie realistycznych ścieżek ataku, walidację problemów w odizolowanych środowiskach oraz proponowanie poprawek do przeglądu przez człowieka.

W ramach Codex for Open Source wybrani maintainerzy krytycznych projektów mogą otrzymać warunkowy dostęp do Codex Security wraz z Codex i kredytami API, aby zmniejszyć obciążenie utrzymaniowe i przeglądowe.

Udostępniliśmy także wtyczkę Codex Security, która przenosi istniejący proces bezpieczeństwa bezpośrednio do dowolnego interfejsu Codex, takiego jak aplikacja lub CLI, pomagając deweloperom przejść od modelowania zagrożeń do odkrywania, walidacji, analizy ścieżek ataku i potwierdzonych poprawek.

Co dalej

W miarę jak modele stają się coraz bardziej zaawansowane w cyberbezpieczeństwie, najlepszym zastosowaniem tych możliwości jest pomaganie obrońcom w szybszym znajdowaniu i naprawianiu słabości. Odpowiedzialne rozszerzanie dostępu do tych możliwości wymaga większej pewności co do tego, kto korzysta z modelu, jakie systemy są celem oraz czy dana praca jest autoryzowana. Wraz z poprawą silniejszej weryfikacji tożsamości i organizacji, określania zatwierdzonych zastosowań i monitorowania nadużyć spodziewamy się, że z czasem dostęp będzie się poszerzał.

Uzyskanie dostępu do Trusted Access for Cyber jest proste:

Wszyscy klienci zatwierdzeni w tym procesie uzyskają dostęp do wersji istniejących modeli z mniejszymi tarciami wokół zabezpieczeń, które mogłyby uruchamiać się przy działaniach cybernetycznych o podwójnym zastosowaniu, co pozwoli im nadal wspierać edukację w zakresie bezpieczeństwa, defensywne programowanie i odpowiedzialne badania nad podatnościami. 

Podczas testów alfa GPT‑5.5‑Cyber był już używany do skalowania zautomatyzowanego red teamingu systemów krytycznych i walidowania podatności o wysokiej wadze, co opiszemy w przyszłym technicznym deep-dive w ramach odpowiedzialnego ujawniania.

Spodziewamy się nadal przyspieszać działania obrońców za pomocą różnych modeli, w tym zarówno naszych modeli podstawowych poprzez Trusted Access for Cyber, jak i dedykowanych modeli cybernetycznych, takich jak GPT‑5.5‑Cyber, a w przyszłości także modeli o jeszcze większych możliwościach cybernetycznych.

Autor

OpenAI