Preskočiť na hlavný obsah
OpenAI

Predstavujeme GPT‑5.2‑Codex

Najpokročilejší agentský model kódovania pre profesionálne softvérové inžinierstvo a obrannú kybernetickú bezpečnosť.

Dnes vydávame GPT‑5.2‑Codex, doteraz najpokročilejší agentský model kódovania pre komplexné softvérové inžinierstvo v reálnom svete. GPT‑5.2‑Codex je verzia GPT‑5.2 , ktorá je ďalej optimalizovaná pre agentské kódovanie v Codexe, vrátane vylepšení dlhodobej práce prostredníctvom kompaktifikácie kontextu, silnejšieho výkonu pri rozsiahlych zmenách kódu, ako sú refaktoringy a migrácie, zlepšeného výkonu v prostrediach Windows a výrazne silnejších možností kybernetickej bezpečnosti.

Ako sa naše modely neustále vyvíjajú na hranici spravodajských informácií, pozorovali sme, že tieto vylepšenia sa premietajú aj do skokov v schopnostiach v špecializovaných oblastiach, ako je kybernetická bezpečnosť. Napríklad len minulý týždeň bezpečnostný výskumník používajúci GPT‑5.1‑Codex‑Max pomocou Codex CLI našiel a zodpovedne zverejnil(otvorí sa v novom okne) zraniteľnosť v Reacte, ktorá by mohla viesť k odhaleniu zdrojového kódu.

GPT‑5.2‑Codex má silnejšie možnosti kybernetickej bezpečnosti ako ktorýkoľvek model, ktorý sme doteraz vydali. Tieto pokroky môžu pomôcť posilniť kybernetickú bezpečnosť vo veľkom meradle, ale zároveň prinášajú nové riziká dvojakého použitia, ktoré si vyžadujú starostlivé nasadenie. Hoci GPT‑5.2‑Codex nedosahuje „vysokú“ úroveň kybernetických spôsobilostí v rámci nášho Rámca pripravenosti, navrhujeme náš prístup k nasadeniu s ohľadom na budúci rast spôsobilostí.

Dnes vydávame GPT‑5.2‑Codex vo všetkých rozhraniach Codex pre platených používateľov ChatGPT, a pracujeme na tom, aby sme v najbližších týždňoch bezpečne umožnili prístup k systému GPT‑5.2‑Codex pre používateľov API. Súbežne s tým pilotujeme dôveryhodný prístup len na pozvanie k nadchádzajúcim schopnostiam a viac povolujúcim modelom pre overených profesionálov a organizácie zamerané na obrannú kybernetickú bezpečnosť. Domnievame sa, že tento prístup k nasadeniu vyváži prístupnosť s bezpečnosťou.

Posúvanie hraníc v oblasti softvérového inžinierstva v reálnom svete

GPT‑5.2‑Codex stavia na silných stránkach GPT‑5.2 v oblasti odbornej znalostnej práce a na špičkových schopnostiach GPT‑5.1‑Codex‑Max v agentskom kódovaní a používaní terminálu. GPT‑5.2‑Codex je teraz lepší v porozumení dlhého kontextu, spoľahlivom volaní nástrojov, vylepšenej faktografii a natívnej kompaktifikácii, čo z neho robí spoľahlivejšieho partnera na dlhodobé kódovacie úlohy, pričom si zachováva efektívne využitie tokenov vo svojom uvažovaní.

GPT‑5.2‑Codex dosahuje špičkový výkon v benchmarkoch SWE-Bench Pro a Terminal-Bench 2.0, ktoré sú určené na testovanie výkonu agentov pri širokej škále úloh v realistických terminálových prostrediach. Je tiež oveľa efektívnejší a spoľahlivejší pri agentskom kódovaní v natívnych prostrediach Windows, pričom stavia na možnostiach zavedených v GPT‑5.1‑Codex‑Max.

S týmito vylepšeniami je Codex schopnejší pracovať vo veľkých repozitároch počas dlhších relácií s úplným kontextom. Dokáže spoľahlivejšie dokončovať zložité úlohy, ako sú rozsiahle refaktory, migrácie kódu a budovanie funkcií – pokračuje v iterácii bez straty prehľadu, aj keď sa tarify zmenia alebo keď pokusy zlyhajú.

V SWE-Bench Pro⁠⁠⁠⁠ je modelu pridelený repozitár kódu a musí vygenerovať opravu na vyriešenie realistickej softvérovej inžinierskej úlohy. Terminal-Bench 2.0 je benchmark pre testovanie agentov umelej inteligencie v reálnych terminálových prostrediach. Úlohy zahŕňajú kompiláciu kódu, trénovanie modelov a nastavenie serverov.

Vďaka lepšiemu výkonu vizuálneho spracovania dokáže GPT‑5.2‑Codex presnejšie interpretovať snímky obrazovky, technické diagramy, grafy a povrchy používateľského rozhrania zdieľané počas kódovacích relácií.

Codex dokáže vziať návrhové makety a rýchlo ich premeniť na funkčné prototypy. Môžeš sa spárovať s Codexom a uviesť tieto prototypy uviedli do produkcie.

Dizajnový návrh
Návrhový model použitý na generovať webový prototyp s Codex-5.2
Prototyp generovaný GPT‑5.2‑Codex

Posúvanie kybernetických hraníc

Pri mapovaní výkonnosti na jednom z našich základných hodnotení kybernetickej bezpečnosti v priebehu času vidíme prudký nárast schopností počnúc GPT‑5‑Codex, ďalší veľký skok s GPT‑5.1‑Codex‑Max a teraz tretí skok s GPT‑5.2‑Codex. Očakávame, že nadchádzajúce modely umelej inteligencie budú pokračovať v tomto smere. V rámci prípravy plánujeme a vyhodnocujeme, ako by každý nový model mohol dosiahnuť „vysokú“ úroveň kybernetickej bezpečnosti meranú naším Rámcom pripravenosti⁠(otvorí sa v novom okne). Hoci GPT‑5.2‑Codex ešte nedosiahol „vysokú“ úroveň kybernetických schopností, pripravujeme sa na budúce modely, ktoré túto hranicu prekročia. V dôsledku zvýšených kybernetických schopností sme pridali ďalšie záruky do modelu a produktu, ktoré sú uvedené v systémovej karte.

Profesionálne hodnotenie Capture-the-Flag (CTF) meria, ako často dokáže model riešiť pokročilé, viacstupňové výzvy z reálneho sveta (vyžadujúce si profesionálne zručnosti v oblasti kybernetickej bezpečnosti) v prostredí Linuxu.

Kybernetické schopnosti v reálnom svete

Moderná spoločnosť funguje na softvéri a jeho spoľahlivosť závisí od silnej kybernetickej bezpečnosti – udržiavania kritických systémov v bankovníctve, zdravotníctve, komunikáciách a základných službách online, ochrany citlivých údajov a zabezpečenia toho, aby ľudia mohli dôverovať softvéru, na ktorý sa spoliehajú každý deň. Zraniteľnosti môžu existovať dávno predtým, ako sa o nich niekto dozvie, a ich nájdenie, overenie a oprava často závisí od komunity inžinierov a nezávislých bezpečnostných výskumníkov vybavených správnymi nástrojmi.

Dňa 11. decembra 2025 tím React zverejnil tri bezpečnostné zraniteľnosti ovplyvňujúce aplikácie vytvorené pomocou React Server Components. Toto odhalenie bolo pozoruhodné nielen kvôli samotným zraniteľnostiam, ale aj kvôli spôsobu, akým boli odhalené.

Andrew MacPherson, hlavný bezpečnostný inžinier v spoločnosti Privy (spoločnosť Stripe), používal GPT‑5.1‑Codex‑Max s Codex CLI a inými kódovacími agentmi na reprodukciu a štúdium inej kritickej zraniteľnosti v Reacte, ktorá bola zverejnená týždeň predtým, známej ako React2Shell(otvorí sa v novom okne) (CVE-2025-55182(otvorí sa v novom okne)). Jeho cieľom bolo zhodnotiť, ako efektívne môže model pomôcť pri výskume zraniteľností v reálnom svete.

Spočiatku sa pokúsil o niekoľko zero-shot analýz, čím podnietil model, aby preskúmal opravu a identifikoval zraniteľnosť, ktorú riešila. Keď to neprinieslo výsledky, prešiel na prístup s vyšším objemom a iteratívnym podnecovaním. Keď tieto prístupy neuspeli, previedol Codex štandardnými pracovnými postupmi obrannej bezpečnosti – nastavením lokálneho testovacieho prostredia, analýzou potenciálnych povrchov útoku a použitím fuzzingu na testovanie systému s nesprávnymi vstupmi. Pri pokuse o reprodukciu pôvodného problému React2Shell Codex odhalil neočakávané správanie, ktoré si vyžadovalo hlbšie preskúmanie. V priebehu jediného týždňa tento proces viedol k objaveniu predtým neznámych zraniteľností, ktoré boli zodpovedne oznámené tímu React.

Diagram toku s názvom „Objavovanie zraniteľností pomocou Codex: CVE-2025-55183“, znázorňujúci pracovný postup, ktorý začína úložiskom Git a skenovaním kódu pomocou Codexu na zraniteľnosti. Zero-shot pokus zlyhá, a po ňom nasleduje proces vedený odborníkom, ktorý skúma kódovú základňu, identifikuje možné ciele, vytvára rámec a vykonáva fuzz testovanie na príkladovej aplikácii s opätovnou validáciou. Výsledky sú overené na vytvorenie dôkazu konceptu, čo vedie k zodpovednému zverejneniu a aplikovaniu opravy späť do úložiska.

Toto ukazuje, ako pokročilé systémy umelej inteligencie môžu podstatne zrýchliť obrannú bezpečnostnú prácu v široko používanom softvéri v reálnom svete. Zároveň schopnosti, ktoré pomáhajú obrancom pohybovať sa rýchlejšie, môžu byť zneužité aj zlomyseľnými aktérmi.

Keďže agentské systémy sú čoraz schopnejšie v úlohách súvisiacich s kybernetickou bezpečnosťou, kladieme si za kľúčovú prioritu zabezpečiť zodpovedné nasadenie týchto pokrokov – každý zisk v oblasti možností spájame so silnejšími zárukami, prísnejšími kontrolami prístupu a neustálou spoluprácou s bezpečnostnou komunitou.

Posilnenie kybernetickej obrany prostredníctvom dôveryhodného prístupu

Bezpečnostné tímy sa môžu stretnúť s obmedzeniami pri pokuse o emuláciu aktérov hrozieb, analýzu škodlivého softvéru na podporu nápravy alebo záťažové testovanie kritickej infraštruktúry. Vyvíjame pilotný projekt dôveryhodného prístupu, aby sme odstránili prekážky pre oprávnených používateľov a organizácie a povolili dôveryhodným obrancom využívať najmodernejšie kybernetické schopnosti umelej inteligencie na urýchlenie kybernetickej obrany.

Pilotný program bude spočiatku dostupný len na základe pozvánky pre overených bezpečnostných profesionálov s preukázanou históriou zodpovedného zverejňovania zraniteľností a pre organizácie s jasným profesionálnym prípadom použitia v oblasti kybernetickej bezpečnosti. Oprávnení účastníci získajú prístup k našim najvýkonnejším modelom na obranné použitie, aby povolili legitímnu prácu s dvojitým použitím.

Ak si bezpečnostný profesionál alebo súčasťou organizácie, ktorá sa zaoberá etickou bezpečnostnou prácou, ako je výskum zraniteľností alebo autorizovaný red-teaming, pozývame ťa, aby si vyjadril/-a záujem o účasť a podelil/a sa o pripomienky tu(otvorí sa v novom okne), ohľadom toho, čo by si chcel/-a vidieť v programe.

Záver

GPT‑5.2‑Codex predstavuje krok vpred v tom, ako môže pokročilá umelá inteligencia podporovať softvérové inžinierstvo v reálnom svete a špecializované domény ako kybernetická bezpečnosť – pomáha vývojárom a obrancom riešiť zložité, dlhodobé úlohy a posilňuje nástroje dostupné pre zodpovedný výskum v oblasti bezpečnosti.

Zavedením GPT‑5.2‑Codex Postupným zavádzaním, spárovaním nasadenia s bezpečnostnými opatreniami a úzkou spoluprácou s bezpečnostnou komunitou sa snažíme maximalizovať obranný vplyv a zároveň znížiť riziko zneužitia. To, čo sa z tejto verzie dozvieme, priamo ovplyvní, ako budeme v priebehu času rozširovať prístup, keďže hranice softvéru a kybernetického priestoru budú pokračovať v rozvoji.

Autor

OpenAI