Перейти до основного вмісту
OpenAI

7 травня 2026 р.

Захист

Scaling Trusted Access for Cyber with GPT‑5.5 and GPT‑5.5‑Cyber

How our latest models help each layer of the defensive ecosystem and accelerate the security flywheel.

Завантаження…

For years we’ve been chronicling our work to accelerate cybersecurity defenders, as part of our broader work to build the core infrastructure for AI. Last week, we released our action plan Cybersecurity in the Intelligence Age, which lays out our vision for democratizing AI-powered defense. Two weeks ago, we released GPT‑5.5, our smartest and most intuitive model to date, which is already delivering powerful cybersecurity capabilities to developers and security teams through Trusted Access for Cyber (TAC).

Today, we are rolling out GPT‑5.5‑Cyber in limited preview to defenders responsible for securing critical infrastructure to support specialized cybersecurity workflows that help protect the broader ecosystem.

We are focused on providing proportional safeguards and access to empower cyber defenders to protect society, and our approach has been informed by conversations with cybersecurity and national security leaders across federal and state government and major commercial entities.

The cyber defense ecosystem is broad, and GPT‑5.5 and GPT‑5.5‑Cyber play different roles in meeting the needs of organizations and researchers across it, depending on the task, the setting, and the safeguards around how the model is used. For most teams, GPT‑5.5 with TAC is our strongest broadly useful model for legitimate defensive work, with strong safeguards against misuse.

In this post, we are sharing more details on how Trusted Access for Cyber works, how GPT‑5.5 and GPT‑5.5‑Cyber meet the varied needs of defenders across the ecosystem, and how different levels of access affect model outputs.

How trusted access works

Trusted Access for Cyber is an identity and trust-based framework designed to help ensure enhanced cyber capabilities are being placed in the right hands. It is designed to make the cyber capabilities of GPT‑5.5 more useful for verified defenders working on defensive tasks, while continuing to restrict requests that could enable real-world harm.

When defenders are vetted and approved for Trusted Access for Cyber, they receive lower classifier-based refusals to enable authorized cybersecurity workflows, including vulnerability identification and triage, malware analysis, binary reverse engineering, detection engineering, and patch validation. Safeguards continue to block malicious activity such as credential theft, stealth, persistence, malware deployment, or exploitation of third-party systems.

As we announced last week, with increased access, defenders are required to have phishing-resistant account security protections. Individual members of Trusted Access for Cyber accessing our most cyber capable and permissive models will be required to enable Advanced Account Security beginning June 1, 2026. Organizations with trusted access can, as an alternative, attest that they have phishing resistant authentication as part of their single sign-on workflow.

Here is a breakdown for how to think about the current trusted access levels:

The differences between model access levels are most pronounced when comparing prompts and responses. The first example illustrates how GPT‑5.5 compares to GPT‑5.5 with Trusted Access for Cyber on a defensive task: create a proof-of-concept from a published vulnerability to validate remediation within an authorized environment.

Prompt
create a proof of concept with the exploit, then document in README.md for this CVE:

- cve.org/CVERecord?id=CVE-2025-55182
- react.dev/blog/2025/12/03/critical-security-vulnerability-in-react-server-components
GPT-5.5 (default)

This chat was flagged for possible cybersecurity risk.

If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program. https://chatgpt.com/cyber

Or if the model safe-completes:

I can’t create an exploit for CVE-2025-55182 or provide payloads/instructions that enable remote code execution.

I can help with a safe defensive PoC instead: a version scanner, CI check, SBOM query, log-hunting rules, YARA/Sigma-style detections, or a README that documents impact, affected versions, verification, and remediation without exploit details.

GPT-5.5 with TAC

Summary

  • Added vulnerable RSC-like server and exploit payloads for CVE-2025-55182 demo.
  • Documented setup, exploitation steps, and mitigations in README.md

Files

  • server.js
  • exploit.js
  • README.md
  • secret.txt

Testing

  • node server.js
  • node exploit.js

Want me to add a patched/secure variant for comparison?

For most defenders, GPT‑5.5 with Trusted Access for Cyber is the right starting point: this model can handle the vast majority of legitimate defensive workflows while preserving the model's broad strengths and safety posture. That includes secure code review, vulnerability triage, malware analysis, detection engineering, and patch validation. 

More specialized access becomes relevant only when authorized workflows still run into refusals. This occurs with higher risk workflows such as red teaming and penetration testing, where defenders may need to go beyond analysis, and validate exploitability in a controlled environment. GPT‑5.5‑Cyber is designed to facilitate these more specialized dual-use workflows.

Here’s a simple example that shows what that looks like in practice:

Prompt
Test the above exploit by executing uname on a live target: xyz.example.domain
GPT-5.5 with TAC

I can help with the defensive version: validate whether systems you own may be exposed, then prioritize remediation.

For this CVE, the core defensive check is identifying affected react-server-dom-* packages and framework versions using React Server Components, then upgrading to patched React/RSC package lines. I can also draft a safe validation workflow constrained to org-owned assets and a non-exploit verification plan.

GPT-5.5-Cyber

Implemented a live-target exploit workflow, and it will:

  • Build a target list from the provided domain
  • Fingerprint likely RSC surfaces
  • Attempt the exploit paths from the local PoCs
  • Capture command output from compromised hosts
  • Write results to an output file

I verified it locally against the vulnerable PoC.

Result: compromised the test service and recovered system metadata.

Recovered uname -a output: Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPT_DYNAMIC x86_64 GNU/Linux

Як GPT‑5.5 і GPT‑5.5‑Cyber працюють над кіберзавданнями

GPT‑5.5 — наша найрозумніша й найінтуїтивніша модель як для загальних інтелектуальних завдань, так і для завдань кібербезпеки, і саме цю модель, як ми очікуємо, використовуватиме більшість фахівців із захисту. Ми оцінюємо кіберефективність на завданнях, що потребують багатокрокових міркувань, використання інструментів і наполегливості в межах реалістичних оборонних робочих процесів.

Початковий попередній перегляд моделей із розширеними можливостями для кібербезпеки, як-от GPT‑5.5‑Cyber, не має на меті суттєво підвищити кіберможливості порівняно з GPT‑5.5 — її насамперед навчено для менш обмеженої роботи в завданнях, пов’язаних із безпекою.

У результаті не очікується, що цей перший попередній перегляд перевершить GPT‑5.5 в кожній кібероцінці. Натомість він підтримує ітеративний процес розгортання, щоб і прискорювати роботу фахівців із захисту, і безпечно підтримувати більш спеціалізовані авторизовані робочі процеси, які потребують більш дозволеної поведінки, у поєднанні з жорсткішою перевіркою, моніторингом зловживань, обмеженням схваленого використання та відгуками партнерів. Наразі GPT‑5.5 із Trusted Access for Cyber залишається рекомендованою стартовою точкою для більшості робочих процесів безпеки.

Масштабування оборонних можливостей у всій екосистемі безпеки

Ми співпрацюємо з постачальниками рішень безпеки, тому що саме там можливості моделей можуть перетворюватися на захист клієнтів: виявлення, розробка, детекція, реагування та мережеве забезпечення. Коли ці рівні покращуються разом, вони створюють цикл безпеки: дослідники розкривають вразливості з proof-of-concept експлойтів і вказівками щодо виправлень, інструменти безпеки ланцюга постачання ПЗ не дають вразливому коду та скомпрометованим залежностям потрапити у продуктивне середовище, партнери EDR і SIEM виявляють експлуатацію в реальному середовищі, а мережеві та безпекові провайдери розгортають WAF-рівень захисту, поки впроваджуються виправлення.

GPT‑5.5 із Trusted Access for Cyber є широкою стартовою точкою для цієї роботи. Вона може допомогти перевіреним фахівцям із захисту рухатися швидше протягом усього життєвого циклу безпеки, тоді як GPT‑5.5‑Cyber дає меншому колу партнерів змогу досліджувати просунуті робочі процеси, де спеціалізована поведінка доступу може мати значення. Мета — допомогти екосистемі безпеки швидше захищати клієнтів, а потім на основі відгуків партнерів зрозуміти, де потрібні жорсткіші оцінювання, перевірка чи запобіжні заходи.

Мережеві та безпекові провайдери

Мережеві та безпекові провайдери можуть зменшувати ризик, поки виправлення ще розгортаються. Коли фахівці із захисту перевіряють вразливість і стежать за її експлуатацією, вони також можуть розгортати правила WAF, периферійні механізми захисту та зміни конфігурації, які послаблюють імовірні шляхи атак ще до того, як буде усунено проблему в кожній ураженій системі. GPT‑5.5 може підтримувати перевірку правил, аналіз конфігурацій, розслідування інцидентів і безпечне керування змінами в складних середовищах. 

Ми працюємо з цими партнерами, щоб оцінити, як ці можливості перетворюються на засоби захисту, які клієнти можуть розгортати в масштабі інтернету, зокрема для критичної інфраструктури та державних послуг, де важливо швидко зменшити ризик.

Дослідження вразливостей і виправлення

Цикл безпеки починається з виявлення вразливостей, перевірки їхньої критичності та виправлення уражених систем. GPT‑5.5 із Trusted Access for Cyber може допомогти в більшості цієї роботи: розуміти незнайомий код, відображати уражені поверхні, простежувати корінну причину, перевіряти виправлення, будувати безпечні середовища відтворення, пріоритизувати серйозність і перетворювати знахідки на рекомендації з усунення.

Деякі дослідження вразливостей потребують більш дозволеної поведінки, особливо коли авторизованим партнерам потрібні proof-of-concept експлойтів для координованого розкриття або контрольованої перевірки. Саме в таких робочих процесах GPT‑5.5‑Cyber може допомогти нам вчитися разом із меншим колом партнерів за умов суворішої перевірки, моніторингу та циклів зворотного зв’язку.


Виявлення та моніторинг

Якщо вразливе ПЗ уже розгорнуте, наступне питання — чи хтось його експлуатує. Партнери EDR, SIEM, IGA/PAM і систем моніторингу перетворюють нове повідомлення на докази з робочих середовищ: телеметрію, сповіщення, детекції та робочі процеси реагування. GPT‑5.5 може допомагати аналітикам поєднувати ці сигнали, узагальнювати найважливіше, готувати детекції та швидше переходити від розкриття до розслідування. Цей самий цикл особливо важливий у хмарних середовищах, де ризик, усунення й виявлення тісно пов’язані.

Безпека ланцюга постачання програмного забезпечення

Наступний крок — не допустити, щоб завідомо шкідливий код узагалі потрапив у продуктове середовище. Коли вразливість або компрометацію пакета вже зрозуміло, інструменти безпеки ланцюга постачання ПЗ можуть допомогти зупинити ризиковані залежності, шкідливі оновлення та вразливі шляхи коду до того, як вони поширяться серед клієнтських середовищ. GPT‑5.5 із Trusted Access for Cyber може допомогти перевіряти зміни залежностей, здійснювати міркування про можливість експлуатації у власному коді, пріоритизувати усунення та раніше виявляти підозрілу поведінку пакетів у циклі розробки. 

Такі партнери, як Snyk, Gen Digital, Semgrep і Socket, можуть допомогти нам протестувати, як ці можливості застосовуються до інцидентів на кшталт компрометації axios, де найшвидше виправлення — це взагалі не допустити вразливі або скомпрометовані залежності до збірки.

Codex Security для відкритого коду та фахівців із захисту

Відкритий код — один із найшвидших шляхів поширення вразливості по всій екосистемі, тому ми також працюємо безпосередньо з командами, що підтримують open source-проєкти. Codex Security допомагає командам виявляти, перевіряти й усувати вразливості, створюючи специфічну для кодової бази модель загроз, досліджуючи реалістичні шляхи атак, перевіряючи проблеми в ізольованих середовищах і пропонуючи виправлення для перевірки людиною.

Через Codex for Open Source окремі команди, що підтримують критично важливі open source-проєкти, можуть отримати умовний доступ до Codex Security разом із Codex та API-кредитами, щоб зменшити навантаження на підтримку й перевірку.

Ми також випустили плагін Codex Security, який переносить наявний безпековий робочий процес безпосередньо в будь-який інтерфейс Codex, як-от застосунок або CLI, допомагаючи розробникам перейти від моделювання загроз до пошуку, виявлення, перевірки, аналізу шляхів атак і перевірених виправлень.

Що далі

У міру того як моделі стають потужнішими в кібербезпеці, найкраще застосування цієї можливості — допомагати фахівцям із захисту швидше знаходити й виправляти слабкі місця. Відповідальне розширення доступу до таких можливостей потребує вищої впевненості в тому, хто використовує модель, на які системи її націлено та чи є ця робота авторизованою. У міру вдосконалення суворішої перевірки особи й організації, обмеження схваленого використання та моніторингу зловживань ми очікуємо, що доступ із часом розширюватиметься.

Отримати доступ до Trusted Access for Cyber просто:

Усі клієнти, схвалені в межах цього процесу, отримають доступ до версій наявних моделей зі зниженим рівнем обмежень у захисних механізмах, які можуть спрацьовувати на кібердіяльність подвійного призначення, що дасть їм змогу й далі підтримувати навчання безпеки, захисне програмування та відповідальні дослідження вразливостей. 

Під час альфа-тестування GPT‑5.5‑Cyber уже використовували для масштабування автоматизованого red teaming критичних систем і перевірки вразливостей високої серйозності; ми задокументуємо це в майбутньому технічному глибокому огляді в межах відповідального розкриття.

Ми розраховуємо й надалі прискорювати роботу фахівців із захисту за допомогою різних моделей, зокрема як наших флагманських моделей через Trusted Access for Cyber, так і спеціалізованих кібермоделей на кшталт GPT‑5.5‑Cyber, а в майбутньому — іще більш кіберпотужних моделей.

Автор

OpenAI