18. prosinca 2025.

Predstavljamo GPT‑5.2‑Codex

Najnapredniji model za programiranje koji radi putem agenata, namijenjen profesionalnom softverskom inženjerstvu i obrambenoj kibernetičkoj sigurnosti.

$ npm i -g @openai/codex

Danas objavljujemo GPT‑5.2‑Codex, dosad najnapredniji model za programiranje koji radi uz pomoć agenata i namijenjen je složenim, stvarnim zadacima softverskog inženjerstva. GPT‑5.2‑Codex je verzija modela GPT‑5.2⁠ dodatno optimizirana za rad s agentima u Codexu, uključujući poboljšanja dugotrajnog rada kroz sažimanje konteksta, snažnije performanse pri velikim promjenama koda poput refaktoriranja i migracija, bolje performanse u Windows okruženjima te znatno snažnije mogućnosti u području kibernetičke sigurnosti.

Kako se naši modeli nastavljaju razvijati duž granice inteligencije, primijetili smo da se ta poboljšanja prenose i na specijalizirana područja poput kibernetičke sigurnosti⁠. Primjerice, već prošlog tjedna jedan stručnjak za kibernetičku sigurnost, koristeći GPT‑5.1‑Codex‑Max s Codex CLI-jem pronašao je i odgovorno obznanio⁠(otvara se u novom prozoru) ranjivost u Reactu koja bi mogla dovesti do izloženosti izvornog kôda.

GPT‑5.2‑Codex ima snažnije mogućnosti u području kibernetičke sigurnosti od bilo kojeg modela koji smo dosad objavili. Ta unapređenja mogu pomoći u jačanju kibernetičke sigurnosti velikog opsega, ali istodobno otvaraju nove rizike dvojne namjene koji zahtijevaju pažljivo uvođenje. Iako GPT‑5.2‑Codex prema našem Okviru za pripremljenost ne doseže 'visoku' razinu kibernetičkih sposobnosti, naš pristup uvođenju⁠ osmišljavamo imajući na umu budući rast sposobnosti.

Objavljujemo GPT‑5.2‑Codex danas na svim Codex platformama za korisnike plaćenih verzija ChatGPT‑a te radimo na sigurnom omogućavanju pristupa GPT‑5.2‑Codexu za API korisnike u nadolazećim tjednima. Paralelno provodimo pilot program s pozivnicama za pouzdani pristup nadolazećim mogućnostima i slobodnijim modelima za provjerene stručnjake i organizacije usmjerene na obranu na polju kibernetičke sigurnosti. Vjerujemo da će ovaj pristup implementaciji uravnotežiti pristupačnost i sigurnost.

Pomicanje granica u stvarnom softverskom inženjerstvu

GPT‑5.2‑Codex nadograđuje se na prednosti modela GPT‑5.2⁠ u profesionalnom radu sa znanjem te sposobnosti modela GPT‑5.1‑Codex‑Max⁠ u programiranju uz pomoć izvršitelja i naprednom radu s terminalom. GPT‑5.2‑Codex sada je bolji u razumijevanju dugog konteksta, pouzdanom pozivanju alata, poboljšanoj činjeničnoj točnosti i izvornom sažimanju, što ga čini pouzdanijim partnerom za dugotrajne zadatke kodiranja, dok ostaje učinkovit u potrošnji tokena tijekom zaključivanja.

GPT‑5.2‑Codex postiže vrhunske rezultate na referentnim testovima SWE-Bench Pro i Terminal-Bench 2.0, osmišljenima za provjeru rada uz pomoć agenata na širokom rasponu zadataka u realističnim okruženjima terminala. Također je znatno učinkovitiji i pouzdaniji u programiranju uz pomoć agenata u izvornim Windows okruženjima, nadograđujući mogućnosti uvedene u modelu GPT‑5.1‑Codex‑Max.

S ovim poboljšanjima, Codex je sposobniji raditi u velikim repozitorijima tijekom produženih sesija s cjelokupno očuvanim kontekstom. Može pouzdanije izvršavati složene zadatke poput velikih refaktoriranja, migracija kôda i izgradnje značajki — nastavlja iterirati bez gubitka smjera, čak i kada se planovi promijene ili pokušaji ne uspiju.

U SWE-Bench Pro, model dobiva repozitorij kôda i mora generirati zakrpu kako bi riješio realističan zadatak iz softverskog inženjerstva. Terminal-Bench 2.0 je referentni test za ispitivanje AI izvršitelja (agenata) u stvarnim okruženjima terminala. Zadaci uključuju kompiliranje kôda, obuku modela i postavljanje poslužitelja.

Snažnije vizualne sposobnosti omogućuju GPT‑5.2‑Codexu preciznije tumačenje snimki zaslona, tehničkih dijagrama, grafikona i elemenata korisničkog sučelja koji se dijele tijekom programerskih sesija.

Codex može uzeti dizajnerske modele i brzo ih prevesti u funkcionalne prototipove, a s Codexom se možete povezati i kako biste te prototipove doveli do proizvodnje.

Dizajnerski model

Prototip smišljen od strane GPT‑5.2‑Codexa

Pomicanje granica kibernetičke sigurnosti

Kada pratimo performanse na jednoj od naših osnovnih procjena kibernetičke sigurnosti tijekom vremena, primjećujemo nagli porast sposobnosti počevši s GPT‑5‑Codexom, zatim još jedan veliki porast s modelom GPT‑5.1‑Codex‑Max, a sada i treći porast s GPT‑5.2‑Codexom. Očekujemo da će budući modeli umjetne inteligencije nastaviti tim putem. U pripremi za to, planiramo i procjenjujemo kao da bi svaki novi model mogao dosegnuti visoku razinu kibernetičkih sposobnosti, kako je definirano našim Okvirom pripravnosti⁠(otvara se u novom prozoru). Iako GPT‑5.2‑Codex još nije dosegnuo tu razinu kibernetičkih sposobnosti, već se pripremamo za buduće modele koji će prijeći taj prag. Zbog povećanih kibernetičkih sposobnosti, dodali smo dodatne zaštitne mjere u model i u proizvod, koje su navedene u sistemskoj kartici⁠.

Evaluacija Professional Capture-the-Flag (CTF) mjeri koliko često model može riješiti napredne, višekoračne izazove iz stvarnog svijeta (koji zahtijevaju profesionalnu razinu znanja iz kibernetičke sigurnosti) u Linux okruženju.

Kibernetičke sposobnosti u stvarnom svijetu

Moderno društvo oslanja se na softver, a njegova pouzdanost ovisi o snažnoj kibernetičkoj sigurnosti – o tome da ključni sustavi u bankarstvu, zdravstvu, komunikacijama i osnovnim uslugama ostanu dostupni, da se osjetljivi podaci zaštite i da ljudi mogu imati povjerenje u softver koji svakodnevno koriste. Ranjivosti mogu postojati dugo prije nego što itko za njih sazna, a njihovo otkrivanje, provjera i otklanjanje često ovise o zajednici inženjera i neovisnih sigurnosnih istraživača opremljenih odgovarajućim alatima.

Dana 11. prosinca 2025., React tim objavio je tri sigurnosne ranjivosti koje utječu na aplikacije izgrađene s alatom React Server Components. Ovo je otkriće bilo značajno ne samo zbog samih ranjivosti, već i načina na koji su otkrivene.

Andrew MacPherson, glavni inženjer za sigurnost u tvrtki Privy (društvu u vlasništvu Stripea), koristio je GPT‑5.1‑Codex‑Max s Codex CLI-jem i drugim agentima za kodiranje kako bi reproducirali i proučili drugačiju kritičnu ranjivost u Reactu, objavljenu tjedan ranije, poznatu kao React2Shell⁠(otvara se u novom prozoru) (CVE-2025-55182⁠(otvara se u novom prozoru)). Njegov je cilj bio procijeniti koliko model može pomoći u stvarnom istraživanju sigurnosnih ranjivosti.

U početku je pokušao nekoliko zero-shot analiza, potičući model da ispita zakrpu i identificira primijećenu ranjivost. Kad to nije donijelo rezultate, prebacio se na pristup s većim obujmom i iterativnim poticanjem. Kada ti pristupi nisu uspjeli, vodio je Codex kroz standardne postupke obrambene sigurnosti — postavljanje lokalnog testnog okruženja, razmatranje mogućih površina napada i korištenje fuzzinga (dodavanje nasumičnih podataka) za ispitivanje sustava s neispravnim upitima/unosima. Dok je pokušavao reproducirati izvorni problem React2Shella, Codex je otkrio neočekivana ponašanja koja su zahtijevala dublju istragu. Tijekom samo jednog tjedna, ovaj proces doveo je do otkrića dotad nepoznatih ranjivosti, koje su odgovorno prijavljene React timu.

Dijagram toka pod nazivom „Otkrivanje ranjivosti s Codexom: CVE-2025-55183“ prikazuje tijek rada koji započinje s Git repozitorijem i Codexom koji skenira kôd za ranjivosti. Pokušaj bez prethodnog učenja (zero-shot) ne uspijeva, nakon čega slijedi proces vođen stručnjakom koji ispituje bazu kôda, identificira moguće ciljeve, gradi okvir i provodi fuzz testiranje na primjeru aplikacije s ponovnom potvrdom. Rezultati su provjeravani kako bi se stvorio dokaz koncepta, što vodi do odgovornog otkrivanja i zakrpe koja se primjenjuje natrag u repozitorij.

To pokazuje kako napredni sustavi umjetne inteligencije mogu značajno ubrzati obrambeni sigurnosni rad u široko korištenom softveru iz stvarne prakse. Istodobno, sposobnosti koje pomažu braniteljima da budu brži također mogu biti zloupotrijebljene od strane zlonamjernih aktera.

Kako sustavi koji rade uz pomoć agenata postaju sve sposobniji u zadacima relevantnima za kibernetičku sigurnost, kao temeljni prioritet postavljamo odgovorno uvođenje tih unapređenja – povezivanje svakog povećanja sposobnosti sa snažnijim zaštitnim mjerama, strožim kontrolama pristupa i kontinuiranom suradnjom sa sigurnosnom zajednicom.

Osnaživanje kibernetičke obrane kroz pouzdan pristup

Sigurnosni timovi mogu naići na ograničenja kada pokušavaju oponašati prijetnje aktera, analizirati zlonamjerni softver radi sanacije ili provoditi stres-testiranje kritične infrastrukture. Mi razvijamo pilot program pouzdanog pristupa kako bismo uklonili taj stres za kvalificirane korisnike i organizacije te omogućili pouzdanim braniteljima da koriste najnaprednije AI mogućnosti za kibernetičku sigurnost kako bi ubrzali kibernetičku obranu.

U početku će pilot program biti dostupan samo uz poziv za provjerene sigurnosne stručnjake s dokazanim iskustvom u odgovornom otkrivanju ranjivosti i za organizacije s jasnim profesionalnim slučajem korištenja u kibernetičkoj sigurnosti. Kvalificirani sudionici dobit će pristup našim najsposobnijim modelima za obrambene slučajeve uporabe kako bi omogućili legitimni rad s dvostrukom namjenom.

Ako ste stručnjak za sigurnost ili dio organizacije koja se bavi etičkim sigurnosnim radom, poput istraživanja ranjivosti ili ovlaštenog red-team testiranja, pozivamo vas da iskažete interes za pridruživanje i ovdje⁠(otvara se u novom prozoru) podijelite povratne informacije o tome što biste željeli vidjeti u tom programu (i njegove rezultate).

Zaključak

GPT‑5.2‑Codex predstavlja napredak u načinu na koji napredna umjetna inteligencija može podržati stvarno softversko inženjerstvo i specijalizirane domene poput kibernetičke sigurnost i— pomažući programerima i sigurnosnim stručnjacima u rješavanju složenih, dugoročnih zadataka te jačajući alate dostupne za odgovorno istraživanje sigurnosti.

Postupnim uvođenjem modela GPT‑5.2‑Codex, povezivanjem implementacije sa zaštitnim mjerama i bliskom suradnjom sa sigurnosnom zajednicom, nastojimo maksimalno povećati obrambeni učinak uz smanjenje rizika od zlouporabe. Ono što naučimo iz ove verzije izravno će utjecati na to kako ćemo s vremenom širiti pristup za vrijeme stalnog razvoja softverskih i kibernetičkih granica.

Autor

OpenAI

Nastavite čitati

Prikaži sve

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 sada je preferirani model u Microsoft 365 Copilotu

Proizvod9. srp 2026.

ChatGPT je sad partner za vaš najambiciozniji rad

Proizvod9. srp 2026.

GPT-5.6: Granična inteligencija koja raste u skladu s vašom ambicijom

Proizvod9. srp 2026.