Přeskoč na hlavní obsah
OpenAI

Představujeme GPT‑5.2‑Codex

Nejpokročilejší agentní programovací model pro profesionální softwarové inženýrství a obrannou kybernetickou bezpečnost.

Dnes vydáváme GPT‑5.2‑Codex, dosud nejpokročilejší agentní programovací model pro složité úkoly softwarového inženýrství v reálném světě. GPT‑5.2‑Codex je verzí GPT‑5.2, která je dále optimalizovaná pro agentní programování v Codexu. Součástí jsou vylepšení pro práci v dlouhém horizontu: zhuštění kontextu, silnější výkon při velkých změnách kódu typu refaktoringu a migrace, zlepšený výkon v prostředí Windows a výrazné posílení schopností v oblasti kybernetické bezpečnosti.

Tím, jak naše modely pokračují ve vývoji na hranici inteligence, pozorujeme, že se tato zlepšení projevují také ve skokovém zvyšování schopností ve specializovaných oblastech, jako je např. kybernetická bezpečnost. Například minulý týden výzkumník v oblasti bezpečnosti, který používal GPT‑5.1‑Codex‑Max s nástrojem Codex CLI našel a zodpovědně odhalil(otevře se v novém okně) zranitelné místo v knihovně Reacu, které by mohlo vést k odhalení zdrojového kódu.

GPT‑5.2‑Codex má silnější schopnosti v oblasti kybernetické bezpečnosti než jakýkoli model, který jsme dosud vydali. Tento pokrok může přispět k posílení kybernetické bezpečnosti ve velkém měřítku, ale také přináší nová rizika dvojího použití, která vyžadují opatrné zavádění. Ačkoli model GPT‑5.2‑Codex nedosahuje „vysoké“ úrovně kybernetických schopností podle našeho „rámce připravenosti“, náš přístup k nasazení navrhujeme s ohledem na budoucí růst schopností.

Vydáváme dnes GPT‑5.2‑Codex ve všech rozhraních Codex pro platící uživatele ChatGPT a pracujeme na bezpečném zpřístupnění GPT‑5.2‑Codex pro uživatele API v nadcházejících týdnech. Souběžně zkoušíme důvěryhodný přístup k nadcházejícím funkcím pouze pro zvané a modely s více povoleními pro prověřené odborníky a organizace zaměřené na obrannou kybernetickou bezpečnost. Jsme přesvědčeni, že tento přístup k nasazení zajistí rovnováhu mezi dostupností a bezpečností.

Posouvání hranic softwarového inženýrství v reálném světě

GPT‑5.2‑Codex navazuje na silné stránky GPT‑5.2 v oblasti odborných znalostí a na schopnosti modelu GPT‑5.1‑Codex‑Max v oblasti špičkového agentního programování a využívání terminálů. Díky vylepšenému porozumění dlouhým kontextům, spolehlivému volání nástrojů, vylepšené věcné správnosti a nativnímu zhušťování je GPT‑5.2‑Codex spolehlivějším partnerem pro dlouhotrvající programovací úlohy. Jeho uvažování zůstává s ohledem na počet tokenů efektivní.

GPT‑5.2‑Codex dosahuje špičkového výkonu v hodnoceních SWE-Bench Pro a Terminal-Bench 2.0, což jsou srovnávací hodnocení navržená k testování agentního výkonu na široké škále úkolů v realistických terminálových prostředích. Je také mnohem efektivnější a spolehlivější při agentském programování v nativních prostředích Windows, využívající schopnosti zavedené v modelu GPT‑5.1‑Codex‑Max.

Díky těmto vylepšením je Codex schopnější pracovat s rozsáhlými úložišti po delší dobu s neporušeným kontextem. Dokáže spolehlivěji dokončit složité úkoly, jako jsou rozsáhlé refaktorizace, migrace kódu a sestavování funkcí. Pokračuje v opakování bez ztráty přehledu i v případě, kdy se změní plány změní nebo selžou pokusy.

V případě hodnocení SWE-Bench Pro⁠⁠⁠⁠ dostane model repozitář kódu a musí vytvořit patch k vyřešení realistického úkolu softwarového inženýrství. Terminal-Bench 2.0 je benchmark pro testování AI agentů v reálných terminálových prostředích. Mezi úkoly patří kompilace kódu, školení modelů a nastavování serverů.

Výkonnější vizuální výkon umožňuje modelu GPT‑5.2‑Codex přesněji interpretovat snímky obrazovky, technické výkresy, grafy a plochy uživatelského rozhraní sdílené během programování.

Codex dokáže převzít návrhové makety a rychle je převést na funkční prototypy, a ty pak můžeš s Codexem tyto prototypy převést do výroby.

Návrh designu
Návrhový model použitý k vytvoření webového prototypu pomocí Codex-5.2
Prototyp generovaný GPT‑5.2‑Codex

Posouvání hranic kyberprostoru

Při porovnání výkonu v jednom z našich hodnocení kybernetické bezpečnosti vidíme v průběhu času skokový nárůst schopností: začíná to modelem GPT‑5‑Codex, další velký skok představuje GPT‑5.1‑Codex‑Max a opět GPT‑5.2‑Codex. Očekáváme, že nadcházející modely umělé inteligence budou v tomto směru pokračovat. V rámci příprav plánujeme a hodnotíme, jako by každý nový model mohl dle našeho Rámce připravenosti(otevře se v novém okně) dosáhnout „vysoké“ úrovně kybernetické bezpečnosti. Ačkoli GPT‑5.2‑Codex zatím nedosáhl „vysoké“ úrovně kybernetických schopností, připravujeme se na budoucí modely, které tuto hranici překročí. Vzhledem k zvýšeným kybernetickým schopnostem jsme do modelu a produktu přidali další ochranná opatření, která jsou uvedena na systémové kartě.

Profesionální hodnocení Capture-the-Flag (CTF) měří, jak často model dokáže vyřešit pokročilé, vícestupňové reálné výzvy (vyžadující profesionální úroveň dovedností v oblasti kybernetické bezpečnosti) v linuxovém prostředí.

Kybernetické schopnosti v reálném světě

Moderní společnost funguje na softwaru a jeho spolehlivost závisí na silné kybernetické bezpečnosti. Udržuje kritické systémy v bankovnictví, zdravotnictví, komunikacích a základních službách online, chrání citlivá data a stará se o to, že lidé mohou důvěřovat softwaru, na který se každý den spoléhají. Zranitelní místa mohou existovat dlouho předtím, než o nich kdokoli ví, a jejich nalezení, ověření a oprava často závisí na komunitě odborníků a nezávislých bezpečnostních výzkumníků vybavených správnými nástroji.

Dne 11. prosince 2025 zveřejnil tým React tři bezpečnostní zranitelnosti, které ovlivňují aplikace postavené na React Server Components. Pozoruhodné bylo nejen samotné odhalení zranitelných míst, ale i způsob, jakým byly odhaleny.

Andrew MacPherson, hlavní bezpečnostní výzkumník ve společnosti Privy (součást společnost Stripe), používal model GPT‑5.1‑Codex‑Max s nástrojem Codex CLI a dalšími kódovacími agenty k reprodukci a studiu jiné kritické zranitelnosti Reactu, která byla zveřejněna týden předtím a je známá jako React2Shell(otevře se v novém okně) (CVE-2025-55182(otevře se v novém okně)). Jeho cílem bylo zhodnotit, jak efektivně může model pomoci při výzkumu zranitelností v reálném světě.

Zpočátku se pokusil o několik zero-shot analýz, čímž přiměl model, aby vyzkoušel patch a identifikoval řešenou zranitelnost. Když to nepřineslo výsledky, přešel k přístupu s vyšším objemem a iterativním přístupem k zadávání promptů. Když tyto přístup neuspěly, vedl Codex standardními pracovními postupy obranného zabezpečení: nastavením místního testovacího prostředí, zdůvodněním potenciálních ploch útoku a použitím fuzzingu k prozkoumání systému pomocí špatně formátovaných vstupů. Při pokusu o reprodukci původního problému React2Shell se v Codexu objevila neočekávaná chování, která vyžadovala hlubší prozkoumání. Během jednoho týdne tento proces vedl k objevení dosud neznámých zranitelných míst, která byla zodpovědně nahlášena týmu React.

Diagram s názvem „Objevování zranitelností s Codexem: CVE-2025-55183“ zobrazující pracovní postup, který začíná v úložišti Git a pokračuje skenováním zranitelností kódem Codex. Zero-shot příklad selže a následuje proces vedený odborníkem, který zkoumá kódovou základnu, identifikuje možné cíle, vytvoří testovací rámec a provede fuzz testování na příkladové aplikaci s opětovným ověřením. Výsledky jsou ověřovány a vytvářejí důkaz konceptu. Výsledkem je odpovědném zveřejnění a patch, který se aplikuje zpátky na úložiště.

Toto ukazuje, jak mohou pokročilé systémy umělé inteligence výrazně urychlit obrannou bezpečnostní práci u široce používaného softwaru v reálném světě. Zároveň mohou být schopnosti, které pomáhají bezpečnostním týmům jednat rychleji, aktéry se špatnými úmysly.

Tím, jak se agentní systémy stávají schopnějšími v úkolech souvisejících s kybernetickou bezpečností, je naší hlavní prioritou zajistit, aby se tento pokrok využíval zodpovědně. Každé zlepšení schopností je spojeno se silnějšími ochrannými opatřeními, přísnějšími kontrolami přístupu a neustálou spoluprací s bezpečnostní komunitou.

Posilování kybernetické obrany skrze důvěryhodný přístup

Bezpečnostní týmy mohou ve chvílích, kdy se snaží napodobit aktéry hrozeb, analyzovat malware pro podporu nápravy nebo provádět zátěžové testy kritické infrastruktury, narazit na omezení. Vyvíjíme pilotní projekt důvěryhodného přístupu, který odstraní překážky pro uživatele a organizace, splňující podmínky, a povolí důvěryhodným bezpečnostním týmům využívat nejmodernější kybernetické schopnosti AI k urychlení kybernetické obrany.

Zpočátku bude pilotní program pouze na pozvání pro prověřené bezpečnostní profesionály s historií odpovědného zveřejňování zranitelností a pro organizace s jasným profesionálním využitím v oblasti kybernetické bezpečnosti. Účastníci, kteří splní podmínky, získají přístup k našim nejschopnějším modelům za účelem bezpečnosti, které umožní legitimní práci s dvojím využitím.

Pokud jsi bezpečnostní profesionál nebo součástí organizace, která se zabývá etickou bezpečností, jako je výzkum zranitelností nebo autorizovaný red-teaming, zveme tě, abys projevil zájem o připojení a podělil se o zpětnou vazbu ohledně toho, co bys rád viděl v programu zde(otevře se v novém okně).

Závěr

GPT‑5.2‑Codex představuje posun v tom, jak může pokročilá AI podporovat reálné softwarové inženýrství a specializované oblasti, jako je kybernetická bezpečnost. Pomáhá vývojářům a bezpečnostním týmům řešit složité, dlouhodobé úkoly a zároveň posiluje nástroje dostupné pro odpovědný výzkum v oblasti bezpečnosti.

Postupným zaváděním GPT‑5.2‑Codex, spojením přístupu s ochrannými opatřeními a úzkou spoluprací s bezpečnostní komunitou v podobě důvěryhodného přístupu se snažíme maximalizovat bezpečnostní dopad a zároveň snížit riziko zneužití. Poznatky z tohoto vydání budou přímo sloužit jako podklad pro budoucí rozšiřování přístupu, protože softwarové i kybernetické hranice se stále vyvíjejí.

Autor

OpenAI