Представляем Codex
Облачный агент по разработке программного обеспечения, способный выполнять множество задач параллельно, работающий на Codex-1. Доступно сегодня для пользователей ChatGPT Pro, Business и Enterprise, а для пользователей Plus — в ближайшее время.

Обновление от 3 июня 2025 года: Codex теперь доступен пользователям ChatGPT Plus. Мы также предоставляем пользователям возможность подключать Codex к интернету во время выполнения задач. Пожалуйста, обратитесь к журналу изменений(открывается в новом окне) и документации(открывается в новом окне) для получения более подробной информации.
Сегодня мы запускаем предварительный ознакомительный доступ (research preview) к Codex: облачного агента по разработке программного обеспечения, который может выполнять множество задач параллельно. Codex может выполнять задачи для вас, такие как написание функций, ответы на вопросы о вашей кодовой базе, исправление ошибок и предложение pull-request'ов для проверки; каждая задача выполняется в собственной облачной песочнице, предварительно загруженной вашим репозиторием.
Codex работает на codex-1, версии OpenAI o3, оптимизированной для разработки программного обеспечения. Модель обучалась с использованием обучения с подкреплением на реальных задачах программирования в различных средах, чтобы формировать код, который точно отражает человеческий стиль и предпочтения PR, строго следует инструкциям и может итеративно запускать тесты до получения положительного результата. Сегодня мы начинаем внедрение Codex для пользователей ChatGPT Pro, Enterprise и Business, а вскоре будет добавлена поддержка для Plus и Edu.
Сегодня вы можете получить доступ к Codex через боковую панель в ChatGPT и назначить ему новые задачи по написанию кода, введя промпт и нажав «Code». Если вы хотите задать Codex вопрос о вашей кодовой базе, нажмите «Спросить». Каждая задача обрабатывается независимо в отдельной, изолированной среде, предварительно загруженной вашей кодовой базой. Codex может читать и редактировать файлы, а также выполнять команды, включая тестовые оболочки, линтеры и средства проверки типов. Выполнение задачи обычно занимает от 1 до 30 минут, в зависимости от сложности, и вы можете отслеживать прогресс Codex в реальном времени.
Как только Codex завершает задачу, он фиксирует изменения в своей среде. Codex предоставляет проверяемые доказательства своих действий через ссылки на журналы терминала и результаты тестов, что позволяет вам отслеживать каждый шаг, выполненный в процессе выполнения задачи. Затем вы можете просмотреть результаты, запросить дальнейшие правки, открыть pull request на GitHub или напрямую интегрировать изменения в локальную среду. Вы можете настроить среду Codex так, чтобы она максимально соответствовала вашей реальной среде разработки.
Codex может использовать файлы AGENTS.md, размещённые в вашем репозитории, как инструкции. Это текстовые файлы, аналогичные README.md, где вы можете сообщить Codex, как ориентироваться в вашей кодовой базе, какие команды запускать для тестирования и как лучше следовать стандартным практикам вашего проекта. Как и разработчики, агенты Codex лучше всего работают, когда у них есть настроенные среды разработки, надёжная тестовая инфраструктура и понятная документация.
В бенчмарках по задачам программирования и внутренних тестах codex-1 демонстрирует высокую производительность даже без файлов AGENTS.md или пользовательских каркасов.
23 образца, проверенные SWE-Bench, которые не запускались на нашей внутренней инфраструктуре, были исключены. codex-1 был протестирован при максимальной длине контекста в 192 000 токенов и среднем «усилии рассуждения», что является настройкой, которая будет доступна в продукте сегодня. Для получения подробной информации об оценках o3, см. здесь.
Наш внутренний бенчмарк задач SWE — это тщательно отобранный набор реальных внутренних задач SWE в OpenAI.
Мы выпускаем Codex в формате исследовательского предварительного доступа (research preview) в соответствии с нашей итеративной стратегией развертывания. При разработке Codex мы уделили первостепенное внимание безопасности и прозрачности, чтобы пользователи могли проверять результаты — это мера предосторожности, которая становится все более важной, поскольку модели ИИ самостоятельно справляются с более сложными задачами кодирования, а требования безопасности развиваются. Пользователи могут проверять работу Codex с помощью цитат, терминальных журналов и результатов тестов. В условиях неопределённости или при сбоях тестов агент Codex явно сообщает об этих проблемах, позволяя пользователям принимать обоснованные решения о дальнейших действиях. По-прежнему важно, чтобы пользователи вручную проверяли и подтверждали весь код, сформированный агентом, перед его интеграцией и выполнением.


Основной целью при обучении codex-1 было максимально приблизить результаты к предпочтениям и стандартам кодирования, принятым у разработчиков. По сравнению с OpenAI o3, codex-1 постоянно создает более чистые исправления, готовые к немедленной проверке человеком и интеграции в стандартные рабочие процессы.
Защита от вредоносных приложений, созданных с использованием технологий программной инженерии на базе ИИ, таких как разработка вредоносного ПО, становится все более критичной. В то же время важно, чтобы защитные меры не мешали законным и полезным приложениям, которые могут включать техники, иногда используемые и для разработки вредоносного ПО, такие как низкоуровневая разработка ядра.
Чтобы сбалансировать безопасность и полезность, Codex был обучен выявлять и точно отклонять запросы, направленные на разработку вредоносного ПО, при этом четко различая и поддерживая законные задачи. Мы также усовершенствовали наши политические рамки и включили строгие оценки безопасности для эффективного укрепления этих границ. Мы опубликовали приложение к системной карте o3, чтобы отразить эти оценки.
Агент Codex полностью функционирует в защищённом, изолированном контейнере в облаке. Во время выполнения задачи доступ в интернет отключён, что ограничивает взаимодействие агента исключительно кодом, предоставленным через репозитории GitHub, и предустановленными зависимостями, которые настроены пользователем через скрипт настройки. Агент не может получить доступ к внешним веб-сайтам, API или другим сервисам.
Технические команды в OpenAI начали использовать Codex как часть своего ежедневного инструментария. Чаще всего он используется инженерами OpenAI для выполнения повторяющихся, четко определённых задач, таких как рефакторинг, переименование и написание тестов, которые в противном случае могли бы сбить фокус. Он одинаково полезен для создания новых функций, подключения компонентов, исправления ошибок и написания документации. Команды вырабатывают новые привычки: сортировка дежурных задач, планирование задач в начале дня и разгрузка фоновой работы, чтобы продолжать движение. Уменьшая количество переключений контекста и выявляя забытые задачи, Codex помогает инженерам быстрее выпускать продукты и сосредотачиваться на самом важном.
В преддверии выпуска мы также работали с небольшой группой внешних тестировщиков, чтобы лучше понять, как Codex функционирует в различных кодовых базах, процессах разработки и командах.
- Cisco(открывается в новом окне) изучает, как Codex может помочь инженерным командам быстрее воплощать их амбициозные идеи в жизнь. Как один из первых партнёров по проектированию, компания Cisco помогает формировать будущее Codex, оценивая его в реальных сценариях использования по всему своему продуктовому портфелю и делясь обратной связью с командой OpenAI.
- Temporal(открывается в новом окне) использует Codex для ускорения разработки функций, отлаживания проблем, написания и выполнения тестов, а также рефакторинга больших кодовых баз. Это также помогает им сохранять концентрацию, выполняя сложные задачи в фоновом режиме, поддерживая поток работы инженеров и ускоряя итерации.
- Superhuman(открывается в новом окне) использует Codex для ускорения небольших, но повторяющихся задач, таких как улучшение тестового покрытия и исправление сбоев интеграции. Это также помогает быстрее выпускать продукты, позволяя менеджерам продукта вносить небольшие изменения в код без привлечения инженера, за исключением проверки кода.
- Kodiak(открывается в новом окне) использует Codex для создания инструментов отладки, улучшения тестового покрытия и рефакторинга кода, ускоряя разработку Kodiak Driver — своей технологии автономного вождения. Codex также стал ценным справочным инструментом, помогающим инженерам понять незнакомые части стека, предоставляя соответствующий контекст и информацию о прошлых изменениях.
На основе опыта первых тестировщиков мы рекомендуем назначать четко определённые задачи нескольким агентам одновременно и экспериментировать с различными типами задач и промптов, чтобы эффективно изучать возможности модели.
В прошлом месяце мы запустили Codex CLI — легковесный агент программирования с открытым исходным кодом, который работает в вашем терминале. Это привносит мощь таких моделей, как o3 и o4-mini, в ваш локальный рабочий процесс, помогая быстрее выполнять задачи.
Сегодня мы также выпускаем уменьшенную версию codex-1 — версию o4-mini, специально разработанную для использования в Codex CLI. Эта новая модель поддерживает более быстрые рабочие процессы в CLI и оптимизирована для быстрого (с низкой задержкой) режима вопросов и ответов по коду и редактирования, при этом она сохраняет сильные стороны в следовании инструкциям и стиле. Теперь она доступна в качестве модели по умолчанию в Codex CLI и в API как codex-mini-latest. Текущий снимок модели Codex-mini будет регулярно обновляться по мере её улучшения.
Мы также значительно упростили подключение вашей учетной записи разработчика к Codex CLI. Вместо ручного формирования и настройки токена API, теперь вы можете войти в систему через свою учетную запись ChatGPT и выбрать ту организацию в API, которую хотите использовать. Мы автоматически сформируем и настроим для вас API-ключ. Пользователи Plus и Pro, которые войдут в систему Codex CLI с помощью ChatGPT, смогут начать получать бесплатные API-кредиты на сумму 5 и 50 долларов США соответственно, начиная с сегодняшнего дня и в течение следующих 30 дней.
Начиная с сегодняшнего дня, мы внедряем Codex для пользователей ChatGPT Pro, Enterprise и Business по всему миру, а поддержка для Plus и Edu появится в ближайшее время. Пользователи получат щедрый доступ без дополнительной оплаты в ближайшие недели, чтобы изучать возможности Codex, после чего мы внедрим ограниченный доступ и гибкие ценовые варианты, позволяющие приобретать дополнительное использование по запросу. Мы планируем вскоре расширить доступ для пользователей Plus и Edu.
Для разработчиков, использующих codex-mini-latest, модель доступна в Responses API по цене 1,50 доллара США за 1 млн входных токенов и 6 долларов США за 1 млн выходных токенов, со скидкой 75 % на кэширование промптов.
Codex всё ещё находится на ранней стадии разработки. В формате исследовательского предварительного доступа (research preview) в Codex пока отсутствуют такие функции, как ввод изображений для фронтенд-работы и возможность корректировать действия агента в процессе его работы. Кроме того, делегирование задач удалённому агенту занимает больше времени, чем интерактивное редактирование, к которому нужно привыкнуть. Со временем взаимодействие с агентами Codex будет все больше напоминать асинхронное взаимодействие с коллегами. По мере развития возможностей моделей мы ожидаем, что агенты будут выполнять более сложные задачи в течение более длительных периодов.
Мы представляем будущее, в котором разработчики управляют задачами, которые хотят выполнять, а остальное делегируют агентам, двигаясь быстрее и становясь более продуктивными с помощью ИИ. Чтобы достичь этой цели, мы разрабатываем набор инструментов Codex поддерживающих как совместную работу в реальном времени, так и асинхронное делегирование задач.
Использование инструментов ИИ, таких как Codex CLI и другие, быстро стало отраслевой нормой, помогая разработчикам быстрее писать код. Но мы считаем, что асинхронный, многоагентный рабочий процесс, представленный Codex в ChatGPT, станет стандартным способом, которым инженеры будут создавать высококачественный код.
В конечном итоге мы видим, как эти два способа взаимодействия — работа в реальном времени и делегирование задач — сходятся. Разработчики будут взаимодействовать с ИИ-агентами в своих IDE и повседневных инструментах, чтобы задавать вопросы, получать предложения и передавать более длительные задачи, всё это в едином рабочем процессе.
В будущем мы планируем внедрить более интерактивные и гибкие процессы с задействованием агентов. Разработчики вскоре смогут предоставлять рекомендации в процессе выполнения задач, сотрудничать в разработке стратегий внедрения и получать своевременные обновления о ходе выполнения. Мы также предполагаем более глубокую интеграцию с инструментами, которые вы уже используете: сегодня Codex подключается к GitHub, и вскоре вы сможете назначать задачи из Codex CLI, ChatGPT Desktop или даже таких инструментов, как ваш трекер задач или система CI.
Разработка программного обеспечения — одна из первых отраслей, которая испытала значительный рост производительности благодаря использованию искусственного интеллекта, открывая новые возможности для отдельных лиц и небольших команд. Хотя мы оптимистично оцениваем эти достижения, мы также сотрудничаем с партнёрами, чтобы лучше понять последствия широкого внедрения агентов в рабочие процессы разработчиков, и развитие навыков у людей с разным уровнем квалификации в разных регионах мира.
Это только начало — и нам не терпится увидеть, что вы создадите с Codex.
Системное сообщение
Мы делимся системным сообщением codex-1, чтобы помочь разработчикам понять поведение модели по умолчанию и адаптировать Codex для эффективной работы в пользовательских рабочих процессах. Например, системное сообщение codex-1 побуждает Codex выполнять все тесты, указанные в файле AGENTS.md, но если у вас мало времени, вы можете попросить Codex пропустить эти тесты.