Представляємо Codex
Хмарний агент програмної інженерії на базі codex-1, здатний виконувати багато завдань паралельно. Доступно для користувачів ChatGPT Pro, Business та Enterprise вже сьогодні, а для користувачів Plus — незабаром.

Оновлення від 3 червня 2025 р.: Codex тепер доступний для користувачів ChatGPT Plus. Ми також надаємо можливість користувачам забезпечити Codex доступом до Інтернету під час виконання завдань. Будь ласка, зверніться до журналу змін(відкривається у новому вікні) та документації(відкривається у новому вікні) для отримання додаткової інформації.
Сьогодні ми запускаємо попередній доступ до Codex — хмарного агента розробки програмного забезпечення, який може виконувати багато завдань одночасно. Codex може виконувати для вас такі завдання, як написання функцій, відповіді на запитання про вашу кодову базу, виправлення помилок і створення запитів на включення змін для перегляду; кожне завдання виконується у власному середовищі хмарної пісочниці, попередньо завантаженому з вашим репозиторієм.
Codex працює на codex-1 — версії OpenAI o3, оптимізованої для розробки програмного забезпечення. Його навчали за допомогою навчання з підкріпленням на реальних задачах із програмування в різних середовищах для створення коду; він ретельно відображає людський стиль і вподобання PR, точно дотримується інструкцій і може ітеративно виконувати тести до отримання позитивного результату. Відсьогодні ми починаємо впроваджувати Codex для користувачів ChatGPT Pro, Enterprise та Business; підтримка для Plus та Edu з'явиться незабаром.
Сьогодні ви можете отримати доступ до Codex через бічну панель у ChatGPT і призначити йому нові завдання для кодування, ввівши запит і натиснувши «Кодувати». Якщо ви хочете поставити Codex питання про вашу кодову базу, натисніть «Запитати». Кожне завдання обробляється незалежно в окремому, ізольованому середовищі, попередньо завантаженому вашою кодовою базою. Codex може читати та редагувати файли, а також виконувати команди, включно з тестовими оболонками, лінтерами та перевірками типів. Виконання завдання зазвичай займає від 1 до 30 хвилин, залежно від складності, а прогрес Codex можна відстежувати в режимі реального часу.
Після завершення завдання Codex фіксує зміни у своєму середовищі. Codex надає перевірені докази своїх дій через посилання на термінальні логи та результати тестів, що дозволяє вам простежити кожен крок, зроблений під час виконання завдання. Далі ви можете переглянути результати, запитати подальші правки, відкрити pull request на GitHub або безпосередньо інтегрувати зміни у ваше локальне середовище. У продукті ви можете налаштувати середовище Codex таким чином, щоб воно максимально відповідало вашому реальному середовищу розробки.
Codex можна керувати через файли AGENTS.md, розміщені у вашому репозиторії. Це текстові файли, подібні до README.md, в яких ви можете повідомити Codex, як орієнтуватися у вашій кодовій базі, які команди запускати для тестування та як найкраще дотримуватися стандартних практик вашого проєкту. Як і розробники-люди, агенти Codex найкраще працюють, коли їм надають налаштовані середовища розробки, надійні тестові налаштування та чітку документацію.
В оцінках кодування та внутрішніх бенчмарках codex-1 демонструє високу продуктивність навіть без файлів AGENTS.md чи спеціальних шаблонів.
Було виключено 23 зразки SWE-Bench Verified, які не підлягають запуску на нашій внутрішній інфраструктурі. codex-1 тестували з максимальною довжиною контексту 192 тисячі токенів і середнім рівнем міркування — це ж налаштування відсьогодні буде доступне в продукті. Детальніше про оцінки o3 можна дізнатися тут.
Наш внутрішній бенчмарк завдань SWE — це ретельно підібраний набір реальних внутрішніх завдань SWE в OpenAI.
Ми випускаємо Codex як дослідницьку ознайомчу версію відповідно до нашої поступової стратегії впровадження. При розробці Codex ми надали пріоритет безпеці та прозорості, щоб користувачі могли перевіряти його результати — це захисний механізм, який стає дедалі важливішим у міру того, як ШІ-моделі самостійно виконують складні завдання з програмування, а питання безпеки змінюються. Користувачі можуть перевіряти роботу Codex за посиланнями на джерела, термінальними логами та результатами тестів. У разі невизначеності або невдач тестів агент Codex чітко повідомляє про ці проблеми, дозволяючи користувачам приймати обґрунтовані рішення щодо подальших дій. Для користувачів все ще важливо вручну переглядати та перевіряти весь код, згенерований агентом, перед інтеграцією та виконанням.


Основною метою під час навчання codex-1 було тісне узгодження виводів із людськими вподобаннями та стандартами кодування. Порівняно з OpenAI o3, codex-1 стабільно створює чистіші патчі, готові до негайного перегляду та інтеграції у стандартні робочі процеси.
Захист від розробки програмного забезпечення на основі ШІ зі злими намірами — наприклад, для написання шкідливого ПЗ — стає дедалі важливішим. Водночас важливо, щоб заходи захисту не надмірно заважали легітимним і корисним програмам, які можуть включати методи, що іноді також використовуються для розробки шкідливого ПЗ — наприклад, низькорівневу інженерію ядра.
Щоб збалансувати безпеку та корисність, Codex був навчений виявляти та точно відхиляти запити, спрямовані на розробку шкідливого програмного забезпечення, водночас чітко розрізняючи та підтримуючи легітимні завдання. Ми також вдосконалили наші політичні рамки та впровадили суворі оцінки безпеки, щоб ефективно зміцнити ці кордони. Ці оцінки відображені в опублікованому нами додатку до системної картки o3.
Агент Codex працює в повністю захищеному, ізольованому контейнері в хмарі. Під час виконання завдання доступ до Інтернету вимкнено, що обмежує взаємодію агента лише з кодом, який надається через репозиторії GitHub із попередньо встановленими залежностями, налаштованими користувачем через скрипт налаштування. Агент не має доступу до зовнішніх вебсайтів, API чи інших сервісів.
Технічні команди OpenAI почали використовувати Codex як частину свого щоденного інструментарію. Найчастіше його використовують інженери OpenAI для виконання повторюваних, чітко окреслених завдань, таких як рефакторинг, а також перейменування та написання тестів, які інакше могли б порушити концентрацію. Він однаково корисний для створення нових функцій, підключення компонентів, виправлення помилок і підготовки документації. Команди формують нові звички: розподіляють питання чергового виклику, планують завдання на початку дня та передають фонову роботу, щоб рухатися далі. Зменшуючи необхідність перемикання між контекстами та виявляючи забуті завдання, Codex допомагає інженерам швидше випускати продукти і залишатися зосередженими на найважливішому.
Напередодні релізу ми також працювали з невеликою групою зовнішніх тестувальників, щоб краще зрозуміти, як Codex функціонує на різних кодових базах, у процесах розробки та в різних командах.
- Cisco(відкривається у новому вікні) досліджують, як Codex може допомогти їхнім командам розробників швидше втілювати амбітні ідеї в життя. Як партнери на ранньому етапі розробки, Cisco допомагають формувати майбутнє Codex, оцінюючи його продуктивність у реальних випадках використання в усьому своєму портфоліо продуктів та надаючи відгук команді OpenAI.
- Temporal(відкривається у новому вікні) використовує Codex для прискорення розробки функцій, вирішення проблем, написання та виконання тестів, а також рефакторингу великих кодових баз. Виконуючи складні завдання у фоновому режимі, він допомагає їхнім розробникам зосередитися на інших пріоритетах, що підтримує темп роботи, водночас прискорюючи її.
- Superhuman(відкривається у новому вікні) використовує Codex для прискорення виконання невеликих, але повторюваних завдань, таких як покращення тестів і виправлення збоїв інтеграції. Він також допомагає команді швидше запускати розробку, дозволяючи менеджерам продукту вносити легкі зміни в код без залучення інженера, за винятком перевірки коду.
- Kodiak(відкривається у новому вікні) використовує Codex для написання інструментів налагодження, покращення тестів і рефакторингу коду, що прискорює розробку Kodiak Driver, їхньої технології автономного водіння. Codex також став цінним довідковим інструментом, що допомагає інженерам розуміти незнайомі частини стеку, виявляючи відповідний контекст і попередні зміни.
Ґрунтуючись на досвіді ранніх тестувальників, ми рекомендуємо призначати чітко визначені завдання кільком агентам одночасно та експериментувати з різними типами завдань і підказок, щоб ефективно дослідити можливості моделі.
Минулого місяця ми запустили Codex CLI — легкий агент кодування з відкритим кодом, який працює у вашому терміналі. Він втілює можливості таких моделей, як o3 та o4-mini, у вашому локальному робочому процесі, що спрощує їхнє поєднання для швидшого виконання завдань.
Сьогодні ми також випускаємо зменшену версію codex-1, версію o4-mini, розроблену спеціально для використання в Codex CLI. Ця нова модель підтримує швидші робочі процеси в CLI та оптимізована таким чином, щоб гарантувати низьку затримку в Q&A та редагуванні коду, зберігаючи при цьому ті ж самі переваги в дотриманні інструкцій та стилю. Зараз вона доступна як модель за замовчуванням у Codex CLI та в API під назвою codex-mini-latest. Ми продовжуємо вдосконалювати модель Codex-mini, тож базовий знімок екрана буде регулярно оновлюватися.
Ми також значно спрощуємо підключення вашого облікового запису розробника до Codex CLI. Замість ручного створення та налаштування токена API тепер ви можете увійти за допомогою свого облікового запису ChatGPT та вибрати організацію API, яку хочете використовувати. Ми автоматично створимо та налаштуємо для вас ключ API. Користувачі Plus і Pro, які увійдуть у Codex CLI за допомогою ChatGPT, можуть на старті отримати $5 і $50 у безкоштовних кредитах API відповідно (пізніше відсьогодні й протягом наступних 30 днів).
Відсьогодні ми розгортаємо Codex для користувачів ChatGPT Pro, Enterprise та Business по всьому світу; підтримка для Plus та Edu з'явиться найближчим часом. Для ознайомлення з можливостями Codex користувачі матимуть розширений доступ без додаткової оплати протягом наступних тижнів, після чого ми запровадимо обмежений доступ і гнучку цінову політику, яка дозволить вам купувати додаткове використання за потребою. Незабаром ми плануємо розширити доступ для користувачів Plus та Edu.
Для розробників, які працюють з codex-mini-latest, модель доступна в API Responses за ціною $1,50 за 1 млн вхідних токенів та $6 за 1 млн вихідних токенів, зі знижкою 75% на кешування запиту.
Codex усе ще знаходиться на ранній стадії розробки. Як версії, що знаходиться в дослідній експлуатації, наразі йому бракує таких функцій, як введення зображень для роботи на фронтенді та можливість коригувати дії агента під час його роботи. Крім того, варто бути готовим до того, що делегування завдань віддаленому агенту займає більше часу, ніж інтерактивне редагування. Із часом взаємодія з агентами Codex дедалі більше нагадуватиме асинхронну співпрацю з колегами. У міру вдосконалення можливостей моделі ми очікуємо, що агенти виконуватимуть складніші завдання протягом триваліших періодів.
Ми уявляємо майбутнє, де розробники виконують ту роботу, яка їм потрібна, а решту делегують агентам — працюючи швидше та стаючи продуктивнішими завдяки ШІ. Для цього ми створюємо набір інструментів Codex, які забезпечують підтримку як співпраці в реальному часі, так і асинхронного делегування.
Поєднання з інструментами ШІ, такими як Codex CLI та іншими, швидко стало нормою в галузі, допомагаючи розробникам швидше писати код. Але ми віримо, що асинхронний багатоагентний робочий процес, запроваджений Codex у ChatGPT, стане де-факто способом, яким інженери створюють високоякісний код.
Зрештою, ми бачимо, як ці два режими взаємодії — спільна робота в реальному часі та делегування завдань — поєднуються. Розробники співпрацюватимуть з ШІ-агентами у своїх IDE та повсякденних інструментах, щоб ставити запитання, отримувати поради та розподіляти довші завдання — усе це в єдиному робочому процесі.
Забігаючи наперед, ми плануємо запроваджувати більш інтерактивні та гнучкі робочі процеси агентів. Розробники незабаром зможуть надавати поради під час виконання завдань, співпрацювати над стратегіями впровадження та отримувати актуальну інформацію про хід виконання. Ми також передбачаємо глибші інтеграції з інструментами, які ви вже використовуєте: сьогодні Codex підключається до GitHub, і незабаром ви зможете призначати завдання з Codex CLI, ChatGPT Desktop або навіть таких інструментів, як трекер проблем чи система CI.
Програмна інженерія є однією з перших галузей, що зазнала значного зростання продуктивності завдяки штучному інтелекту, що відкрило нові можливості для окремих розробників та невеликих команд. Хоча ми оптимістично налаштовані щодо цих здобутків, ми також співпрацюємо з партнерами, щоб краще зрозуміти вплив широкого впровадження агентів на робочі процеси розробників, розвиток навичок серед людей, рівні навичок і географію.
Це лише початок. Нам уже кортить побачити, що разом із Codex створите саме ви.
Системне повідомлення
Ми ділимося системним повідомленням codex-1, щоб допомогти розробникам зрозуміти поведінку моделі за замовчуванням та налаштувати Codex для ефективної роботи в користувацьких робочих процесах. Наприклад, системне повідомлення codex-1 заохочує Codex запускати всі тести, згадані у файлі AGENTS.md, але якщо у вас мало часу, ви можете попросити Codex пропустити ці тести.