18 декабря 2025 г.

Представляем GPT‑5.2‑Codex

Самая передовая агентная модель для профессиональной разработки программного обеспечения и задач кибербезопасности.

Сегодня мы представляем GPT‑5.2‑Codex — самую продвинутую на сегодняшний день агентную модель для программирования, предназначенную для сложных задач профессиональной разработки программного обеспечения. GPT‑5.2‑Codex — это версия GPT‑5.2⁠, дополнительно оптимизированная для агентного кодинга в Codex. Она включает улучшения для работы с долгосрочными задачами благодаря сжатию контекста, более эффективную обработку крупных изменений кода, таких как рефакторинг и миграции, улучшенную работу в средах Windows, а также существенно усиленные возможности в области кибербезопасности.

По мере того как наши модели продвигаются к новым рубежам интеллекта, мы видим, что эти улучшения дают и возможности для скачков в специализированных областях таких, как в кибербезопасности⁠. Например, всего на прошлой неделе исследователь в области безопасности, использовавший GPT‑5.1‑Codex‑Max с помощью Codex CLI обнаружил и ответственно раскрыл⁠(открывается в новом окне) уязвимость в React, которая могла привести к утечке исходного кода.

GPT‑5.2‑Codex обладает более сильными возможностями в кибербезопасности, чем любая модель, которую мы выпускали раньше. Эти достижения могут усилить кибербезопасность в ещё большем масштабе, но одновременно повышают риски двойного назначения (dual-use), поэтому к развертыванию нужен осторожный подход. Хотя GPT‑5.2‑Codex пока не достигает уровня возможностей в кибербезопасности «High» по нашей Программе готовности (Preparedness Framework), мы проектируем подход к развертыванию⁠ с расчетом на рост возможностей в будущем.

Мы выпускаем сегодня GPT‑5.2‑Codex во всех вариантах доступа к Codex для платных пользователей ChatGPT и работаем в ближайшие недели над тем, чтобы безопасно предоставить доступ к GPT‑5.2‑Codex пользователям API. Параллельно мы запускаем пилотную программу доверенного доступа (trusted access) — только по приглашениям — к будущим возможностям и моделям с более мягкими ограничениями для проверенных специалистов и организаций, сфокусированных на оборонительной кибербезопасности. Мы считаем, что такой подход к развертыванию позволит сбалансировать доступность и безопасность.

Расширяя границы реальной разработки ПО

GPT‑5.2‑Codex опирается на сильные стороны GPT‑5.2⁠ в задачах связанных с профессиональными знаниями, а также на возможностях GPT‑5.1‑Codex‑Max⁠ для передового агентного программирования и работы в терминале. GPT‑5.2‑Codex теперь лучше понимает длинные контексты, надежно выполняет вызов инструментов (tool calling), точнее держит факты и поддерживает встроенное уплотнение (native compaction) — поэтому он становится более надежным партнером для длительных задач по разработке, оставаясь экономным по токенам при рассуждениях.

GPT‑5.2‑Codex демонстрирует передовые результаты на тестах SWE-Bench Pro и Terminal-Bench 2.0 — бенчмарках, созданных для оценки агентных возможностей модели на широком спектре задач в реалистичных терминальных средах. Модель также гораздо эффективнее и надежнее в агентном кодинге в нативных средах Windows, опираясь на возможности, представленные в GPT‑5.1‑Codex‑Max.

С этими улучшениями Codex увереннее работает с большими репозиториями в течение длительных сессий, сохраняя полный контекст. Он надежнее выполняет сложные задачи — крупные рефакторинги, миграции кода и разработку функций — продолжая итерации и не теряя нить даже при смене планов или неудачных попытках.

В SWE-Bench Pro⁠⁠⁠⁠ модели дают репозиторий кода, и она должна сгенерировать патч, чтобы решить реалистичную задачу разработки ПО. Terminal-Bench 2.0 — это бенчмарк для тестирования ИИ-агентов в реальных терминальных средах. Среди задач: компиляция кода, обучение моделей и настройка серверов.

Более мощные возможности визуального восприятия позволяют GPT‑5.2‑Codex точнее интерпретировать скриншоты, технические схемы, графики и элементы интерфейса, предоставляемые в ходе сеансов кодинга.

Codex может взять дизайн-макеты и быстро превратить их в рабочие прототипы, а вы можете работать вместе с Codex, чтобы довести эти прототипы до готового к запуску решения.

Дизайн-макет

Прототип, созданный GPT‑5.2‑Codex

Расширяя границы кибербезопасности

Если смотреть, как менялась производительность одной из наших ключевых систем оценки по кибербезопасности, видно резкое повышение возможностей: первый скачок — с GPT‑5‑Codex, затем еще один большой скачок с GPT‑5.1‑Codex‑Max, и теперь третий — с GPT‑5.2‑Codex. Мы ожидаем, что следующие модели ИИ продолжат двигаться по этой траектории. Готовясь к этому, мы планируем и оцениваем так, будто каждая новая модель может выйти на «High» уровень возможностей в кибербезопасности — по нашей Программе готовности⁠(открывается в новом окне). Хотя GPT‑5.2‑Codex пока не достиг уровня «High», мы готовимся к будущим моделям, которые преодолеют этот порог. Из-за выросших возможностей в кибербезопасности мы добавили дополнительные меры защиты в модель и продукт; они описаны в системной карточке⁠.

Оценка Professional Capture-the-Flag (CTF) показывает, как часто модель способна решать сложные многошаговые задачи, требующие профессиональных навыков в области кибербезопасности, в среде Linux.

Реальные возможности в области кибербезопасности

Современное общество работает на программном обеспечении, и его надёжность зависит от высокой кибербезопасности — обеспечения стабильной работы критически важных систем в банкинге, здравоохранении, коммуникациях и других ключевых сервисах, защиты конфиденциальных данных и уверенности людей в том, что программное обеспечение, на которое они полагаются каждый день, безопасно. Уязвимости могут существовать задолго до того, как о них кто-либо узнает, а их обнаружение, проверка и устранение часто зависит от инженеров и независимых специалистов по безопасности, владеющих необходимыми инструментами.

11 декабря 2025 года команда React опубликовала три уязвимости безопасности, затрагивающие приложения на React Server Components. Примечательны были не только сами уязвимости, но и то, как их обнаружили.

Эндрю МакФерсон, ведущий инженер по безопасности в Privy (компании Stripe), работал в GPT‑5.1‑Codex‑Max с Codex CLI и другими агентами для программирования, чтобы воспроизвести и изучить другую критическую уязвимость React, раскрытую неделей ранее, известную как React2Shell⁠(открывается в новом окне) (CVE-2025-55182⁠(открывается в новом окне)). Его целью было оценить, насколько хорошо модель помогает в исследовании уязвимостей в реальных условиях.

Сначала он попробовал несколько zero-shot анализов, попросив модель изучить патч и определить, какую уязвимость он устраняет. Когда это не дало результата, он перешел к более объемному итеративному подходу к промптам. Когда и эти подходы не сработали, он провел Codex через стандартные оборонительные практики безопасности — настроил локальную тестовую среду, разобрал возможные поверхности атаки и применил фаззинг (fuzzing), чтобы проверять систему некорректными входными данными. Пытаясь воспроизвести исходную проблему React2Shell, Codex выявил неожиданные поведения, которые потребовали более глубокого исследования. За одну неделю этот процесс привел к обнаружению ранее неизвестных уязвимостей, о которых было ответственно сообщено команде React.

Блок-схема «Обнаружение уязвимостей с помощью Codex: CVE-2025-55183», показывающая рабочий процесс, который начинается с Git-репозитория и сканирования кода на уязвимости с помощью Codex. Попытка zero-shot не удается, затем следует процесс под руководством эксперта: он изучает кодовую базу, определяет возможные цели, создает тестовую обвязку (harness) и проводит фаззинг-тестирование на примере приложения с повторной проверкой. Результаты проверяют, чтобы подготовить доказательство концепции, после чего уязвимость ответственно раскрывают и применяют патч обратно в репозиторий.

Это показывает, как продвинутые ИИ-системы могут заметно ускорять оборонительную работу по безопасности в широко используемом программном обеспечении. При этом возможности, которые помогают защитникам действовать быстрее, могут использовать и злоумышленники.

По мере того как агентные системы становятся более эффективными в задачах, связанных с кибербезопасностью, мы делаем приоритетной задачей их ответственное внедрение — сочетая каждое увеличение возможностей с усиленными мерами защиты, более строгим контролем доступа и постоянным сотрудничеством со специалистами по безопасности.

Укрепление киберзащиты через доверенный доступ

Команды безопасности могут сталкиваться с ограничениями, когда пытаются имитировать действия злоумышленников, анализировать вредоносное ПО для устранения последствий или проводить стресс-тесты критически важной инфраструктуры. Мы разрабатываем пилотную программу доверенного доступа (trusted access), чтобы убрать эти препятствия для соответствующих требованиям пользователей и организаций и дать проверенным специалистам по кибербезопасности возможность использовать передовые возможности ИИ, ускоряя киберзащиту.

На первом этапе эта пилотная программа будет доступна только по приглашению: для проверенных специалистов по безопасности с подтвержденным опытом ответственного раскрытия уязвимостей и для организаций с четким профессиональным сценарием использования (use case) в области кибербезопасности. Участники, которые пройдут отбор, получат доступ к нашим самым мощным моделям для оборонительных сценариев использования, чтобы выполнять законную работу двойного назначения.

Если вы специалист по безопасности или представляете организацию, которая занимается этичной работой в области безопасности — например, исследованием уязвимостей или авторизованными проверками в формате «красной команды» (Red Teaming), — приглашаем вас оставить заявку на участие и поделиться тем, что вы хотели бы видеть в программе здесь⁠(открывается в новом окне).

Заключение

GPT‑5.2‑Codex — это шаг вперед в том, как продвинутый ИИ может поддерживать реальную разработку ПО и специализированные области, такие как кибербезопасность, помогая разработчикам и защитникам справляться со сложной многоэтапной работой и усиливая инструменты для ответственных исследований в области безопасности.

Мы постепенно расширяем доступ к GPT‑5.2‑Codex, сочетая развертывание с мерами защиты и тесно взаимодействуя с сообществом специалистов по безопасности, мы стремимся максимизировать защитный эффект и снизить риск злоупотреблений. Выводы по этому выпуску напрямую повлияют на то, как мы будем расширять доступ по мере развития разработки ПО и кибербезопасности.

Автор

OpenAI

Читать далее

Просмотреть все

A scorecard for the AI age

Компания17 июл. 2026 г.

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 стал приоритетной моделью в Microsoft 365 Copilot

Товар9 июл. 2026 г.

GPT-5.6: Передовой искусственный интеллект, соразмерный вашим амбициям

Товар9 июл. 2026 г.