Preskočite na glavno vsebino
OpenAI

18. december 2025

IzdelekIzdajaPodjetje

Predstavljamo GPT‑5.2‑Codex

Najnaprednejši agentni kodirni model za profesionalni programski inženiring in obrambno kibernetsko varnost.

Danes predstavljamo GPT‑5.2‑Codex, doslej najnaprednejši agentni kodirni model za zahtevne, resnične primere programskega inženiringa. GPT‑5.2‑Codex je različica modela GPT‑5.2, dodatno optimizirana za agentno kodiranje v Codex-u. Vključuje izboljšave pri dolgoročnem delu s pomočjo zgoščevanja konteksta, bistveno boljše delovanje pri obsežnih spremembah kode, kot so preoblikovanja kode in migracije, izboljšano delovanje v okoljih Windows ter izrazito okrepljene zmogljivosti na področju kibernetske varnosti.

Ker se naši modeli še naprej razvijajo na meji umetnointeligenčnih zmogljivosti, opažamo, da se te izboljšave odražajo tudi v izrazitih preskokih zmogljivosti na specializiranih področjih, kot je kibernetska varnost. Na primer, že prejšnji teden je varnostni raziskovalec z uporabo GPT‑5.1‑Codex‑Max s Codex CLI odkril in odgovorno razkril(odpre se v novem oknu) ranljivost v Reactu, ki bi lahko povzročila razkritje izvorne kode.

GPT‑5.2‑Codex ima močnejše zmogljivosti kibernetske varnosti kot kateri koli model, ki smo ga doslej izdali. Ti napredki lahko pomembno prispevajo h krepitvi kibernetske varnosti v velikem obsegu, hkrati pa odpirajo nova tveganja dvojne rabe, ki zahtevajo premišljeno in odgovorno uvajanje. Čeprav GPT‑5.2‑Codex v okviru našega Okvira pripravljenosti ne dosega ravni kibernetskih zmogljivosti »High«, zasnovo našega pristopa k uvedbi oblikujemo z mislijo na prihodnjo rast zmogljivosti.

GPT‑5.2‑Codex danes uvajamo na vseh Codexovih vmesnikih za plačljive uporabnike ChatGPT‑ja, hkrati pa si prizadevamo, da bomo v prihodnjih tednih na varen način omogočili dostop do GPT‑5.2‑Codex tudi uporabnikom API-ja. Vzporedno preizkušamo zaupanja vreden dostop samo na povabilo do prihajajočih zmogljivosti in bolj permisivnih modelov za preverjene strokovnjake in organizacije, osredotočene na obrambno kibernetsko varnost. Verjamemo, da bo ta pristop k uvajanju uravnotežil dostopnost in varnost.

Premikanje meja na področju programskega inženiringa v resničnih okoljih

GPT‑5.2‑Codex gradi na prednostih modela GPT‑5.2 pri strokovnem delu z znanjem, GPT‑5.1‑Codex‑Maxpa je uvedel napredne agentne zmožnosti kodiranja in uporabe terminala. GPT‑5.2‑Codex je zdaj boljši pri razumevanju dolgih sobesedil, zanesljivem klicanju orodij, izboljšani faktografski natančnosti in nativnem zgoščevanju, kar ga naredi bolj zanesljivega partnerja za dolgotrajne naloge kodiranja, hkrati pa pri sklepanju ostaja učinkovit pri uporabi tokenov.

GPT‑5.2‑Codex dosega najsodobnejšo raven delovanja na merilih SWE-Bench Pro in Terminal-Bench 2.0, ki sta zasnovani za preverjanje agentnih zmogljivosti pri širokem naboru nalog v realističnih terminalskih okoljih. Poleg tega je bistveno učinkovitejši in zanesljivejši pri agentnem kodiranju v nativnih okoljih Windows, pri čemer nadgrajuje zmogljivosti, uvedene z modelom GPT‑5.1‑Codex‑Max.

Zaradi teh izboljšav je Codex sposobnejši za delo v velikih repozitorijih skozi daljša časovna obdobja, pri čemer ohranja celoten kontekst. Zanesljiveje lahko zaključi kompleksne naloge, kot so obsežna preoblikovanja kode, migracije kode in gradnja funkcionalnosti, ter nadaljuje z iteracijami brez izgube pregleda, tudi kadar se načrti spremenijo ali posamezni poskusi ne uspejo.

V okviru SWE-Bench Pro⁠⁠⁠⁠ model prejme repozitorij kode in mora ustvariti popravek za rešitev realistične naloge programskega inženiringa. Terminal-Bench 2.0 je merilo za testiranje UI-agentov v resničnih terminalskih okoljih. Naloge vključujejo prevajanje kode, učenje modelov in vzpostavitev strežnikov.

Izboljšana zmogljivost na področju vizualnega razumevanja omogoča, da GPT‑5.2‑Codex natančneje interpretira posnetke zaslona, tehnične diagrame, grafikone in elemente uporabniškega vmesnika, ki se delijo med kodirnimi sejami.

Codex lahko iz oblikovalskih konceptualnih modelov hitro izdela funkcionalne prototipe, vi pa lahko sodelujete s Codexom, da te prototipe pripeljete do produkcijske uporabe.

Oblikovalski model
Oblikovalski konceptualni model, uporabljen za generiranje spletnega prototipa z uporabo Codex-5.2
Prototip, ki ga je ustvaril GPT‑5.2‑Codex

Napredek na področju kibernetske meje

Pri prikazu razvoja zmogljivosti skozi čas v eni od naših osrednjih evalvacij kibernetske varnosti opažamo izrazit skok zmogljivosti z uvedbo GPT‑5‑Codex, nato še en velik skok z GPT‑5.1‑Codex‑Max in zdaj tretji skok z GPT‑5.2‑Codex. Pričakujemo, da bodo prihodnji modeli UI nadaljevali to smer razvoja. V pripravi na to načrtujemo in ocenjujemo, kot da bi lahko vsak nov model dosegel raven kibernetskih zmogljivosti »High«, kot jo opredeljuje naš Okvir pripravljenosti⁠(odpre se v novem oknu). Čeprav GPT‑5.2‑Codex še ni dosegel ravni kibernetskih zmogljivosti »High«, se že pripravljamo na prihodnje modele, ki bodo ta prag presegli. Zaradi povečanih kibernetskih zmogljivosti smo dodali dodatne varovalne mehanizme v model in izdelek, ki so opisani v sistemski kartici.

Evalvacija Professional Capture-the-Flag (CTF) meri, kako pogosto model uspe rešiti napredne, reševanje nalog iz resničnega sveta po korakih (zahtevajo strokovne spretnosti v kibernetski varnosti) v okolju Linux.

Kibernetske zmogljivosti v resničnem svetu

Sodobna družba temelji na programski opremi, njena zanesljivost pa je odvisna od močne kibernetske varnosti. Ta zagotavlja, da ključni sistemi v bančništvu, zdravstvu, komunikacijah in osnovnih storitvah ostajajo dosegljivi, da so občutljivi podatki zaščiteni in da lahko ljudje zaupajo programski opremi, ki jo vsakodnevno uporabljajo. Ranljivosti lahko obstajajo dolgo, preden jih kdorkoli zazna, njihovo odkrivanje, preverjanje in odpravljanje pa je pogosto odvisno od skupnosti inženirjev in neodvisnih varnostnih raziskovalcev, ki imajo na voljo ustrezna orodja.

Dne 11. decembra 2025 je ekipa React objavila tri varnostne ranljivosti, ki vplivajo na aplikacije, zgrajene z React Server Components. Posebnost tega razkritja ni bila zgolj v samih ranljivostih, temveč v načinu, kako so bile odkrite.

Andrew MacPherson, glavni varnostni inženir pri podjetju Privy (del podjetja Stripe) je uporabljal GPT‑5.1‑Codex‑Max skupaj s Codex CLI in drugimi kodirnimi agenti za poustvarjanje in preučevanje druge kritične ranljivosti v Reactu, razkrite teden prej, znane kot React2Shell(odpre se v novem oknu) (CVE-2025-55182(odpre se v novem oknu)). Njegov cilj je bil oceniti, kako učinkovito lahko model pomaga pri raziskovanju ranljivosti v resničnih okoljih.

Sprva je izvedel več analiz brez predhodnega umerjanja, pri katerih je model pozval, naj pregleda popravek in prepozna ranljivost, ki jo ta naslavlja. Ker ti poskusi niso dali rezultatov, je prešel na iterativni pristop z večjim številom pozivov. Ko tudi ti pristopi niso bili uspešni, je Codex vodil skozi standardne obrambne varnostne delovne tokove. Vzpostavil je lokalno testno okolje, sistematično razmišljal o možnih napadih in izvajal teste v iskanju napak pri kodiranju s preizkušanjem sistema z nepravilno oblikovanimi vnosi. Med poskusom poustvaritve izvorne težave React2Shell je Codex odkril nepričakovana vedenja, ki so zahtevala poglobljeno preiskavo. V enem samem tednu je ta postopek pripeljal do odkritja prej neznanih ranljivosti, ki so bile odgovorno razkrite ekipi React.

Diagram poteka z naslovom »Odkrivanje ranljivosti s Codexom: CVE-2025-55183«, ki prikazuje delovni tok, ki se začne z Git repozitorijem in nadaljuje s tem, da Codex pregleduje kodo za ranljivosti. Poskus brez predhodnega umerjanja ni uspešen, sledi pa proces, ki ga vodi strokovnjak. Ta vključuje pregled kode, identifikacijo možnih tarč, izdelavo testnega ogrodja ter izvajanje testov v iskanju napak pri kodiranju s preizkušanjem sistema z nepravilno oblikovanimi vnosi nad primerom aplikacije in ponovno validacijo. Rezultati se preverijo z izdelavo dokaza koncepta, kar vodi do odgovornega razkritja in popravka, ki se nato vnese nazaj v repozitorij.

To ponazarja, kako lahko napredni sistemi UI bistveno pospešijo obrambno varnostno delo v pogosto uporabljeni programski opremi iz resničnega sveta. Hkrati pa lahko zmogljivosti, ki branilcem pomagajo hitreje ukrepati, zlorabijo tudi zlonamerni akterji.

Ker agentni sistemi postajajo vse zmogljivejši pri nalogah, povezanih s kibernetsko varnostjo, je naša osrednja prednostna naloga zagotoviti, da se ti napredki uvajajo odgovorno. To vključuje povezovanje vsakega povečanja zmogljivosti z močnejšimi varovalnimi mehanizmi, strožjim nadzorom dostopa ter stalnim sodelovanjem z varnostno skupnostjo.

Krepitev kibernetske obrambe z zaupanja vrednim dostopom

Varnostne ekipe se pri poskusih posnemanja ravnanj groženjskih akterjev, analizi zlonamerne programske opreme za podporo sanaciji ali obremenitvenem testiranju kritične infrastrukture pogosto soočajo z omejitvami. Razvijamo pilotni program zaupanja vrednega dostopa, da odstranimo to oviro za upravičene uporabnike in organizacije ter omogočimo zaupanja vrednim branilcem uporabo naprednih UI-zmogljivosti na področju kibernetske varnosti za pospeševanje kibernetske obrambe.

Pilotni program bo sprva dostopen zgolj na podlagi povabil in namenjen preverjenim varnostnim strokovnjakom z dokazano prakso odgovornega razkrivanja ranljivosti ter organizacijam z jasno opredeljenim profesionalnim primerom uporabe na področju kibernetske varnosti. Upravičeni udeleženci bodo dobili dostop do naših najzmogljivejših modelov za obrambne primere uporabe, da omogočijo legitimno dvojno uporabo.

Če ste varnostni strokovnjak ali del organizacije, ki izvaja etično varnostno delo, kot so raziskovanje ranljivosti ali pooblaščeno simulirano iskanje šibkih točk v nadzorovanem okolju, vas vabimo, da izrazite zanimanje za sodelovanje in tukaj(odpre se v novem oknu) posredujete povratne informacije o tem, kaj bi si želeli videti v okviru programa.

Zaključek

GPT‑5.2‑Codex predstavlja pomemben korak naprej pri tem, kako lahko napredna UI podpira programsko inženirstvo v realnih okoljih in specializirana področja, kot je kibernetska varnost. Razvijalcem in obrambnim strokovnjakom pomaga pri obvladovanju kompleksnega, dolgoročnega dela ter krepi nabor orodij, ki so na voljo za odgovorno varnostno raziskovanje.

S postopnim uvajanjem GPT‑5.2‑Codex‑a z vzporedno uvedbo varovalnih mehanizmov in s tesnim sodelovanjem z varnostno skupnostjo si prizadevamo povečati obrambni učinek ter hkrati zmanjšati tveganje zlorab. Ugotovitve, ki jih bomo pridobili s to izdajo, bodo neposredno usmerjale, kako bomo sčasoma širili dostop, ko se bodo programska in kibernetska meja še naprej razvijali.

Avtor

OpenAI