Představujeme Codex
Cloudový agent pro softwarové inženýrství, který může pracovat na mnoha úkolech současně, poháněný systémem codex-1. Dnes k dispozici uživatelům ChatGPT Pro, Business a Enterprise, a brzy i uživatelům Plus.

Aktualizace 3. června 2025: Codex je nyní dostupný uživatelům ChatGPT Plus. Také umožňujeme uživatelům poskytnout Codexu přístup k internetu během provádění úkolů. Další informace jsou uvedeny v přehledu změn(otevře se v novém okně) a dokumentaci(otevře se v novém okně).
Dnes spouštíme náhled výzkumné verze Codex: cloudového agenta pro softwarové inženýrství, který může pracovat na mnoha úkolech současně. Codex pro tebe může vykonávat úkoly, jako je psaní funkcí, odpovídání na otázky ohledně tvého kódu, oprava chyb a navrhování žádostí o kontrolu; každý úkol běží ve svém vlastním cloudovém pískovišti předem nahraném tvým repozitářem.
Codex je poháněn systémem codex-1, verzí OpenAI o3 optimalizovanou pro softwarové inženýrství. Byl vyškolen posilovací výukou na reálných úkolech programování v různých prostředích, aby vytvořil kód, který úzce odráží lidský styl a preference PR, přesně dodržuje pokyny a může iterativně spouštět testy, dokud nedosáhne úspěšného výsledku. Dnes začínáme zavádět Codex do modelů ChatGPT Pro, Enterprise a Business, přičemž podpora verzí Plus a Edu bude brzy k dispozici.
Dnes lze přistupovat k modelu Codex přes postranní panel v ChatGPT a přiřadit mu nové úkoly zadáním výzvy a kliknutím na „Kód“. Pokud chceš modulu Codex položit otázku ohledně své kódové základny, klikni na „Zeptat se“. Každý úkol se zpracovává nezávisle v samostatném, izolovaném prostředí s předem načtenou tvojí kódovou základnou. Codex může číst a upravovat soubory a také spouštět příkazy včetně testovacích nástrojů, linterů a kontrol typů. Podle složitosti trvá dokončení úkolu obvykle mezi 1 a 30 minutami a můžeš sledovat postup modulu Codex v reálném čase.
Jakmile Codex dokončí úkol, potvrdí změny ve svém prostředí. Codex poskytuje ověřitelné důkazy o svých akcích prostřednictvím citací terminálových protokolů a výstupů testů, což umožňuje sledovat během plnění úkolu každý krok. Poté můžeš zkontrolovat výsledky, požádat o další revize, otevřít žádost o změny v modulu GitHub nebo změny přímo integrovat do svého lokálního prostředí. V produktu si můžeš nakonfigurovat prostředí Codex tak, aby co nejvíce odpovídalo tvému reálnému vývojovému prostředí.
Codex může být řízen soubory AGENTS.md umístěnými ve tvém repozitáři. Jedná se o textové soubory, podobné README.md, kde můžeš Codex informovat, jak se orientovat ve tvé kódové základně, jaké příkazy spustit při testování a jak nejlépe dodržovat standardní postupy tvého projektu. Stejně jako lidští vývojáři fungují agenti Codex nejlépe, když mají k dispozici nakonfigurovaná vývojová prostředí, spolehlivá testovací nastavení a jasnou dokumentaci.
Při hodnocení kódů a v interních srovnávacích testech vykazuje Codex-1 silný výkon i bez souborů AGENTS.md nebo vlastního uspořádání.
23 vzorků ověřených SWE-Bench, které nebylo možné spustit v naší interní infrastruktuře, bylo vyloučeno. codex-1 byl testován s maximální kontextovou délkou 192 tisíc tokenů a středním 'úsilím odůvodňování', což je nastavení, které dnes bude v produktu dostupné. Podrobnosti o hodnocení o3 najdeš zde.
Náš interní srovnávací test pro úkoly SWE je pečlivě vybraná sada interních úkolů z reálného světa ve společnosti OpenAI.
V souladu s naší strategií iterativního nasazení vydáváme Codex jako náhled pro výzkumné pracovníky. Při navrhování modulu Codex jsme kladli důraz na bezpečnost a transparentnost, aby si uživatelé mohli ověřit jeho výstupy – ochrana, která je stále důležitější, jak modely AI samostatně řeší složitější úkoly a bezpečnostní úvahy se vyvíjejí. Uživatelé mohou zkontrolovat práci modulu Codex použitím citací, protokolů terminálu a výsledků testů. Když si agent modulu Codex není jistý nebo se setkává s chybami testu, výslovně sděluje tyto problémy, což uživatelům umožňuje činit informovaná rozhodnutí o tom, jak postupovat. Před integrací a spuštěním kódu vytvořeným agentem je stále nezbytné, aby uživatelé ručně kontrolovali a ověřovali veškerý kód.


Hlavním cílem při školení codex-1 bylo úzce sladit výstupy s preferencemi a standardy lidského programování. Ve srovnání s OpenAI o3 vytváří codex-1 důsledně čistší opravy připravené k okamžité kontrole lidmi a k začlenění do standardních pracovních postupů.
Důležitost ochrany před škodlivými aplikacemi softwarového inženýrství řízeného umělou inteligencí, jako je vývoj malwaru, neustále roste. Zároveň je důležité, aby ochranná opatření nebránila legitimním a prospěšným aplikacím, které mohou zahrnovat techniky někdy používané i k vývoji malwaru, jako je například nízkoúrovňový vývoj jádra.
Aby byla zajištěna rovnováha mezi bezpečností a užitečností, byl modul Codex vyškolen k identifikaci a přesnému odmítání žádostí zaměřených na vývoj škodlivého softwaru, přičemž jasně rozlišuje a podporuje legitimní úkoly. Také jsme vylepšili naše rámcové zásady a začlenili přísná bezpečnostní hodnocení, abychom tyto hranice účinně posílili. Zveřejnili jsme dodatek k systémové kartě o3, který odráží tato hodnocení.
Agent Codex funguje výhradně v zabezpečeném, izolovaném kontejneru v cloudu. Během vykonávání úkolu je přístup k internetu vypnutý, což omezuje interakci agenta pouze na kód explicitně poskytovaný prostřednictvím GitHub repozitářů a předinstalované závislosti, které uživatel konfiguruje pomocí nastavovacího skriptu. Agent nemůže přistupovat k externím webům, API ani jiným službám.
Technické týmy v OpenAI začaly používat model Codex jako součást svého každodenního nástroje. Nejčastěji ho používají inženýři OpenAI k uvolnění opakujících se, dobře definovaných úkolů, jako je refaktorování, přejmenovávání a psaní testů, které by jinak narušily soustředění. Při vytváření nových funkcí, propojování komponent, opravování chyb a tvorbě dokumentace je stejně užitečný. Týmy si vytvářejí nové návyky: třídí problémy v pohotovostním režimu, plánují úkoly na začátku dne a přenechávají práci na pozadí, aby zůstaly v pohybu. Tím, že Codex snižuje přepínání kontextu a zobrazuje zapomenuté úkoly, pomáhá technikům rychleji dodávat výsledky a soustředit se na to, co je nejdůležitější.
Před vydáním jsme také spolupracovali s malou skupinou externích testerů, abychom lépe pochopili, jak Codex funguje v různých kódových základnách, vývojových procesech a týmech.
- Cisco(otevře se v novém okně) prozkoumává, jak může Codex pomoci jejich inženýrským týmům rychleji realizovat ambiciózní nápady. Jako první návrhářští partneři pomáhá společnost Cisco utvářet budoucnost modulu Codex tím, že ho vyhodnocuje pro případy použití v reálném světě v celém svém produktovém portfoliu a poskytuje zpětnou vazbu týmu OpenAI.
- Temporal(otevře se v novém okně) využívá Codex k urychlení vývoje funkcí, ladění problémů, psaní a provádění testů a refaktorování rozsáhlých kódových základen. Také jim pomáhá zůstat soustředění tím, že spouští složité úkoly na pozadí – pomáhá technikům držet krok a zároveň zrychluje iteraci.
- Superhuman(otevře se v novém okně) používá Codex ke zrychlení malých, ale opakujících se úkolů, jako je zlepšení pokrytí testů a oprava selhání integrace. Také jim pomáhá rychleji dodávat výsledek tím, že umožňuje produktovým manažerům přispívat k mírným změnám kódu bez nutnosti zapojení technika s výjimkou kontroly kódu.
- Kodiak(otevře se v novém okně) využívá Codex k psaní ladicích nástrojů, zlepšování pokrytí testů a refaktorizaci kódu, což urychluje vývoj Kodiak Driver, jejich technologie autonomního řízení. Codex se také stal cenným referenčním nástrojem, který pomáhá technikům porozumět neznámým částem stacku tím, že zobrazuje relevantní kontext a minulé změny.
Na základě poznatků od raných testerů doporučujeme přidělovat dobře definované úkoly více agentům současně a experimentovat s různými typy úkolů a podnětů s cílem efektivně prozkoumat schopnosti modelu.
Minulý měsíc jsme spustili Codex CLI, odlehčený open-source agent zaměřený na programování, který běží ve tvém terminálu. Do tvého místního pracovního procesu přináší výkonnost modelů jako o3 a o4-mini, což usnadňuje jejich spojení za účelem rychlejšího dokončování úkolů.
Dnes také vydáváme menší verzi codex-1, verzi o4-mini určenou speciálně k používání v Codex CLI. Tento nový model podporuje rychlejší pracovní postupy v CLI a je optimalizován na nízkolatenční dotazy a úpravy kódu, přičemž si zachovává stejné silné stránky při dodržování instrukcí a stylu. Nyní je k dispozici jako výchozí model v Codex CLI a v API jako codex-mini-latest. Jak budeme pokračovat ve zlepšování modelu Codex-mini, bude základní snímek pravidelně aktualizován.
Také výrazně usnadňujeme připojení tvého vývojářského účtu ke Codex CLI. Místo ručního vytváření a konfigurace tokenu API se teď můžeš přihlásit prostřednictvím svého účtu ChatGPT a vybrat si organizaci API, kterou chceš použít. Automaticky ti vytvoříme a nakonfigurujeme API klíč. Uživatelé Plus a Pro, kteří se přihlásí do Codex CLI prostřednictvím ChatGPT, mohou také již dnes začít uplatňovat 5 a 50 dolarů v bezplatných API kreditech na následujících 30 dnů.
Od dneška zavádíme Codex pro uživatele ChatGPT Pro, Enterprise a Business po celém světě, přičemž podpora pro Plus a Edu bude brzy následovat. Uživatelé budou mít v nadcházejících týdnech velkorysý přístup bez dalších nákladů, abyste mohli prozkoumat, co Codex umí. Poté zavedeme omezený přístup a pružné stanovení cen, které vám umožní zakoupit další používání na vyžádání. Plánujeme brzy rozšířit přístup pro uživatele Plus a Edu.
Pro vývojáře, kteří pracují s codex-mini-latest, je model dostupný v Responses API a stojí 1,50 USD za 1 milion vstupních tokenů a 6 USD za 1 milion výstupních tokenů, se 75% slevou na ukládání výzev do mezipaměti.
Codex je stále v rané fázi svého vývoje. Jako výzkumný náhled v současné době postrádá funkce, jako jsou vstupy obrázků k práci s frontendem a možnost korigovat agenta během jeho práce. Navíc delegování na vzdáleného agenta trvá déle než interaktivní úpravy, což může chvíli trvat, než si na to zvykneš. Postupem času bude interakce s agenty modelu Codex stále více připomínat asynchronní spolupráci s kolegy. Jak se schopnosti modelů zlepšují, očekáváme, že agenti budou zvládat složitější úkoly po delší dobu.
Představujeme si budoucnost, kde vývojáři řídí práci, kterou chtějí vlastnit, a zbytek přenechávají agentům – s AI se pohybují rychleji a jsou produktivnější. Abychom toho dosáhli, vyvíjíme sadu nástrojů Codex, které poskytují podporu jak spolupráce v reálném čase, tak asynchronního delegování.
Párování s nástroji AI, jako je Codex CLI a další, se rychle stalo oborovou normou a pomáhá vývojářům programovat rychleji. Ale věříme, že asynchronní, multi-agentní pracovní tok zavedený nástrojem Codex v ChatGPT se stane de facto způsobem, jakým technici vytvářejí vysoce kvalitní kód.
Nakonec vidíme, že tyto dva způsoby interakce – párování v reálném čase a delegování úkolů – se sbližují. Vývojáři budou spolupracovat s AI agenty napříč svými IDE a každodenními nástroji, aby kladli otázky, získávali návrhy a přenechávali delší úkoly, to vše v jednotném pracovním postupu.
Do budoucna plánujeme zavést interaktivnější a pružnější pracovní postupy agentů. Vývojáři budou brzy moci poskytovat pokyny během zpracování úkolu, spolupracovat na implementačních strategiích a dostávat aktivní aktualizace o pokroku. Také si představujeme hlubší integrace napříč nástroji, které už používáš: dnes se Codex připojuje k GitHubu a brzy budeš moci přiřazovat úkoly z Codex CLI, ChatGPT Desktop nebo dokonce nástrojů jako tvůj sledovač problémů nebo CI systém.
Softwarové inženýrství je jedním z prvních odvětví, která díky umělé inteligenci zažívají významné zvýšení produktivity, což otevírá nové možnosti pro jednotlivce a malé týmy. I když jsme ohledně těchto přínosů optimističtí, spolupracujeme také s partnery, abychom lépe pochopili důsledky širokého zavádění agentů na pracovní postupy vývojářů, rozvoj dovedností mezi lidmi, úrovněmi dovedností a geografickými oblastmi.
Tohle je jen začátek – a těšíme se, co s nástrojem Codex vytvoříš.
Systémová zpráva
Sdílíme systémovou zprávu codex-1, abychom vývojářům pomohli pochopit výchozí chování modelu a přizpůsobit Codex tak, aby efektivně fungoval v přizpůsobených pracovních postupech. Například systémová zpráva codex-1 doporučuje modelu Codex spustit všechny testy uvedené v souboru AGENTS.md, ale pokud máš málo času, můžeš požádat Codex, aby tyto testy přeskočil.