Preskočite na glavni sadržaj
OpenAI

Predstavljamo GPT‑5.2‑Codex

Najnapredniji agentni model kodiranja za profesionalno softversko inženjerstvo i obrambenu kibernetičku sigurnost.

Danas objavljujemo GPT‑5.2‑Codex, najnapredniji agentni model kodiranja do sada za složeno, stvarno softversko inženjerstvo. GPT‑5.2‑Codex je verzija GPT‑5.2 dodatno optimizirana za agentno kodiranje u Codexu, uključujući poboljšanja u radu na dugoročnim zadacima kroz sažimanje konteksta, bolje performanse pri velikim promjenama koda kao što su refaktorisanja i migracije, poboljšane performanse u Windows okruženjima, te značajno poboljšane sposobnosti kibernetičke sigurnosti.

Kako naši modeli nastavljaju napredovati duž granice inteligencije, primijetili smo da se ova poboljšanja takođe pretvaraju u skokove sposobnosti u specijaliziranim domenama kao što je kibernetička sigurnost. Na primjer, samo prošle sedmice, sigurnosni istraživač koristeći GPT‑5.1‑Codex‑Max pomoću Codex CLI pronađena je i odgovorno otkrivena(otvara se u novom prozoru) ranjivost u Reactu koja bi mogla dovesti do izlaganja izvornog koda.

GPT‑5.2‑Codex ima snažnije sposobnosti u oblasti kibernetičke sigurnosti nego bilo koji model koji smo do sada objavili. Ovi napreci mogu pomoći u jačanju kibernetičke sigurnosti na velikoj skali, ali također podižu nove rizike dvostruke upotrebe koji zahtijevaju pažljivo uvođenje. Iako GPT‑5.2‑Codex ne dostiže 'visok' nivo kibernetičke sposobnosti prema našem Okviru za spremnost, mi dizajniramo naš pristup implementaciji imajući u vidu budući rast sposobnosti.

Objavljujemo GPT‑5.2‑Codex danas na svim Codex platformama za plaćene korisnike ChatGPT‑a, i radimo na sigurnom omogućavanju pristupa GPT‑5.2‑Codex za API korisnike u narednim sedmicama. Paralelno, provodimo pilot program sa pozivnicama za pouzdan pristup nadolazećim mogućnostima i permisivnijim modelima za provjerene profesionalce i organizacije fokusirane na odbrambeni rad u kibernetičkoj sigurnosti. Vjerujemo da će ovaj pristup implementaciji uravnotežiti pristupačnost i sigurnost.

Pomicanje granica u stvarnom softverskom inženjerstvu

GPT‑5.2‑Codex gradi na snagama GPT‑5.2 u profesionalnom radu sa znanjem i snagama GPT‑5.1‑Codex‑Max granične agentne sposobnosti kodiranja i korištenja terminala. GPT‑5.2‑Codex je sada bolji u razumijevanju dugog konteksta, pouzdanom pozivanju alata, poboljšanoj činjeničnosti i nativnom kompaktiranju, što ga čini pouzdanijim partnerom za dugotrajne zadatke kodiranja, dok ostaje efikasan u pogledu tokena u svom rezonovanju.

GPT‑5.2‑Codex postiže vrhunske performanse na SWE-Bench Pro i Terminal-Bench 2.0, mjerilima dizajniranim za testiranje agentnih performansi na širokom spektru zadataka u realističnim terminalskim okruženjima. Također je mnogo učinkovitiji i pouzdaniji u agentnom kodiranju u izvornim Windows okruženjima, nadograđujući se na mogućnosti uvedene u GPT‑5.1‑Codex‑Max.

S ovim poboljšanjima, Codex je sposobniji za rad u velikim repozitorijima tokom produženih sesija s punim kontekstom očuvanim. Može pouzdanije izvršavati složene zadatke kao što su velika refaktorisanja, migracije koda i izgradnja funkcionalnosti — nastavi iterirati bez gubitka orijentacije, čak i kada se planovi promijene ili pokušaji ne uspiju.

U SWE-Bench Pro, modelu se daje repozitorij koda i mora generirati zakrpu za rješavanje realističnog zadatka iz softverskog inženjeringa. Terminal-Bench 2.0 je mjerilo za testiranje UI agenata u stvarnim terminalskim okruženjima. Zadaci uključuju kompajliranje koda, obuku modela i postavljanje servera.

Jače vizuelne performanse omogućavaju GPT‑5.2‑Codexu da preciznije interpretira snimke ekrana, tehničke dijagrame, grafikone i korisnička sučelja podijeljena tokom sesija kodiranja.

Codex može uzeti dizajnerske makete i brzo ih prevesti u funkcionalne prototipove, a možete se udružiti s Codexom kako biste ove prototipove doveli do proizvodnje.

Dizajn mockup
Dizajnerski model korišten za generiranje web prototipa s Codex-5.2
Prototip generiran od strane GPT‑5.2‑Codex

Pomicanje granica cyber sigurnosti

Kada prikazujemo performanse na jednoj od naših osnovnih procjena kibernetičke sigurnosti tokom vremena, primjećujemo nagli porast sposobnosti počevši s GPT‑5‑Codex, zatim još jedan veliki porast s GPT‑5.1‑Codex‑Max i sada treći porast s GPT‑5.2‑Codex. Očekujemo da će nadolazeći AI modeli nastaviti slijediti ovu putanju. U pripremi, planiramo i procjenjujemo kao da svaki novi model može dostići 'Visok' nivo sposobnosti u kibernetičkoj sigurnosti, kako je mjerena našim Okvirom za spremnost(otvara se u novom prozoru). Iako GPT‑5.2‑Codex još nije dostigao 'visok' nivo kibernetičke sposobnosti, pripremamo se za buduće modele koji će preći taj prag. Zbog povećanih cyber sposobnosti, dodali smo dodatne zaštitne mjere u model i u proizvod, koje su navedene u sistem kartici.

Evaluacija Professional Capture-the-Flag (CTF) mjeri koliko često model može riješiti napredne, višestepene stvarne izazove (koji zahtijevaju profesionalne vještine iz oblasti kibernetičke sigurnosti) u Linux okruženju.

Sposobnosti cybera u stvarnom svijetu

Moderno društvo se oslanja na softver, a njegova pouzdanost zavisi od snažne sajber sigurnosti—održavanje kritičnih sistema u bankarstvu, zdravstvu, komunikacijama i osnovnim uslugama online, zaštita osjetljivih podataka i osiguranje da ljudi mogu vjerovati softveru na koji se oslanjaju svaki dan. Ranjivosti mogu postojati dugo prije nego što itko sazna za njih, a njihovo pronalaženje, potvrđivanje i ispravljanje često ovisi o zajednici inženjera i nezavisnih sigurnosnih istraživača opremljenih odgovarajućim alatima.

Dana 11. decembra 2025. godine, React tim je objavio tri sigurnosne ranjivosti koje utiču na aplikacije izgrađene s React Server Components. Ono što je učinilo ovo otkrivanje značajnim nije samo ranjivosti same po sebi, već i način na koji su otkrivene.

Andrew MacPherson, glavni inženjer sigurnosti u Privy (kompaniji Stripe), koristio je GPT‑5.1‑Codex‑Max sa Codex CLI-jem i drugim agentima za kodiranje kako bi se reproducirala i proučila druga kritična ranjivost u Reactu otkrivena sedmicu ranije, poznata kao React2Shell(otvara se u novom prozoru) (CVE-2025-55182(otvara se u novom prozoru)). Njegov cilj je bio procijeniti koliko dobro model može pomoći u istraživanju ranjivosti u stvarnom svijetu.

U početku je pokušao nekoliko zero-shot analiza, potičući model da ispita zakrpu i identificira ranjivost koju je riješila. Kada to nije dalo rezultate, prešao je na pristup s većim obimom i iterativnim poticanjem. Kada ti pristupi nisu uspjeli, vodio je Codex kroz standardne radne tokove defanzivne sigurnosti—postavljanje lokalnog testnog okruženja, rezonovanje o potencijalnim površinama napada i korištenje fuzzinga za ispitivanje sistema s neispravnim unosima. Dok smo pokušavali reproducirati originalni problem React2Shell, Codex je otkrio neočekivana ponašanja koja su zahtijevala dublju istragu. Tokom jedne sedmice, ovaj proces je doveo do otkrića ranije nepoznatih ranjivosti, koje su odgovorno prijavljene React timu.

Dijagram toka pod nazivom „Otkrivanje ranjivosti s Codexom: CVE-2025-55183“ prikazuje tijek rada koji počinje s Git repozitorijem i Codexom koji skenira kod za ranjivosti. Zero-shot pokušaj ne uspijeva, nakon čega slijedi proces vođen stručnjakom koji ispituje bazu koda, identificira moguće ciljeve, gradi okvire i provodi fuzz testiranje na primjeru aplikacije uz ponovnu validaciju. Rezultati se potvrđuju kako bi se kreirao dokaz koncepta, što vodi do odgovornog otkrivanja i zakrpe koja se primjenjuje nazad u repozitorij.

Ovo pokazuje kako napredni UI sistemi mogu značajno ubrzati rad na odbrambenoj sigurnosti u široko korištenom, stvarnom softveru. Istovremeno, sposobnosti koje pomažu braniteljima da se brže kreću također mogu biti zloupotrijebljene od strane zlonamjernih aktera.

Kako agentski sistemi postaju sposobniji za zadatke relevantne za kibernetičku sigurnost, činimo našim glavnim prioritetom da osiguramo odgovornu primjenu ovih napredaka—spajajući svaki napredak u sposobnosti sa jačim zaštitnim mjerama, strožim kontrolama pristupa i stalnom saradnjom sa sigurnosnom zajednicom.

Osnaživanje kibernetičke odbrane putem pouzdanog pristupa

Sigurnosni timovi mogu naići na ograničenja kada pokušavaju oponašati aktere prijetnji, analizirati zlonamjerni softver radi podrške sanaciji ili testirati otpornost kritične infrastrukture. Razvijamo pilot program pouzdanog pristupa kako bismo uklonili tu prepreku za kvalifikovane korisnike i organizacije te omogućili pouzdanim braniteljima korištenje naprednih AI kibernetičkih sposobnosti za ubrzanje kibernetičke odbrane.

U početku će pilot program biti dostupan samo na poziv za provjerene sigurnosne stručnjake s dokazanim iskustvom u odgovornom otkrivanju ranjivosti i organizacije s jasnim profesionalnim slučajem upotrebe u kibernetičkoj sigurnosti. Kvalifikovani učesnici će dobiti pristup našim najsposobnijim modelima za odbrambene slučajeve upotrebe kako bi omogućili legitimnu dvostruku upotrebu.

Ako ste sigurnosni stručnjak ili dio organizacije koja se bavi etičkim sigurnosnim radom kao što je istraživanje ranjivosti ili ovlašteno red-teaming, pozivamo vas da izrazite interes za pridruživanje i podijelite povratni odgovor o tome šta biste željeli vidjeti od programa ovdje(otvara se u novom prozoru).

Zaključak

GPT‑5.2‑Codex predstavlja korak naprijed u tome kako napredna AI može podržati stvarni softverski inženjering i specijalizirane domene poput kibernetičke sigurnosti—pomažući programerima i braniocima da se suoče s kompleksnim, dugoročnim zadacima, te jačajući alate dostupne za odgovorno istraživanje sigurnosti.

Pokretanjem GPT‑5.2‑Codex postepeno uvodimo, uparujući implementaciju sa zaštitnim mjerama i blisko sarađujući sa sigurnosnom zajednicom, s ciljem da maksimiziramo odbrambeni učinak dok smanjujemo rizik od zloupotrebe. Ono što naučimo iz ovog izdanja direktno će uticati na to kako ćemo vremenom proširivati pristup, dok se softverske i cyber granice nastave napredovati.

Autor

OpenAI