Bemutatjuk a GPT‑5.2‑Codexet
A legfejlettebb, ügynökalapú kódoló modell professzionális szoftvermérnöki és védelmi kiberbiztonsági feladatokra.
Ma bemutatjuk a GPT‑5.2‑Codexet, a komplex, valós szoftvermérnöki feladatokhoz készült, legfeljletteb ügynökalaú kódoló modellünket. A GPT‑5.2‑Codex a GPT‑5.2 olyan változata, amelyet tovább optimalizáltak az ügynökalapú kódolásra a Codexben; ennek részeként javult a hosszú távú feladatok kezelése kontextustömörítés révén, erősebb teljesítményt nyújt nagy volumenű kódváltoztatásoknál, például refaktorálások és migrációk esetén, jobb lett a teljesítménye Windows-környezetekben, valamint jelentősen megerősödtek kiberbiztonsági képességei.
Ahogy modelljeink tovább fejlődnek az intelligencia határain, megfigyeltük, hogy ezek a fejlesztések képességnövekedést is eredményeznek olyan speciális területeken, mint például a kiberbiztonság. Például, éppen a múlt héten, egy biztonsági kutató a Codex CLI-vel használt GPT‑5.1‑Codex‑Max segítségével a Codex CLI-vel azonosított és felelősségteljesen nyilvánosságra hozott(új ablakban nyílik meg) egy olyan sebezhetőséget a Reactben, amely a forráskód kiszivárgásához vezethetett volna.
A GPT‑5.2‑Codex erősebb kiberbiztonsági képességekkel rendelkezik, mint bármelyik eddigi modellünk. Ezek az előrelépések segíthetnek a kiberbiztonság széles körű megerősítésében, de új kettős felhasználású kockázatokat is felvetnek, amelyek körültekintő alkalmazást igényelnek. Bár a GPT‑5.2‑Codex nem éri el a „magas” szintű kiberképességet a Felkészültségi Keretrendszerünk szerint, a bevezetési stratégiánkat a jövőbeli képességnövekedés figyelembevételével tervezzük.
Ma útjára indul a GPT‑5.2‑Codex modell minden Codex-felületen a fizetős ChatGPT‑felhasználók számára. Emellett aktívan dolgozunk azon, hogy a következő hetekben biztonságosan engedélyezzük az API felhasználók részére a GPT‑5.2‑Codex hozzáférést. Ezzel párhuzamosan egy csak meghívásos alapon működő, megbízható hozzáférést biztosító pilotprogramot indítunk a jövőbeli képességekhez és engedékenyebb modellekhez, amelyeket ellenőrzött szakemberek és szervezetek számára fejlesztettünk ki, akik a védelmi kiberbiztonsági munkára összpontosítanak. Úgy hisszük, hogy ez a telepítési módszer egyensúlyt teremt a hozzáférhetőség és a biztonság között.
A GPT‑5.2‑Codex a GPT‑5.2 erősségeire épít a professzionális tudás területén végzett munkában és a GPT‑5.1‑Codex‑Maxerősségeire élvonalbeli, ügynökalapú kódolási és terminálhasználati képességeire. A GPT‑5.2‑Codex most már jobb a hosszú kontextus megértésében, megbízható eszközhasználatban, javított tényszerűségben és natív tömörítésben, így megbízhatóbb partner a hosszú távú kódolási feladatokhoz, miközben érvelésében tokenhatékony marad.
A GPT‑5.2‑Codex a legkorszerűbb teljesítményt éri el a SWE-Bench Pro és a Terminal-Bench 2.0 teszteken, amelyek célja az ügynöki teljesítmény vizsgálata különféle feladatok során valós terminálkörnyezetekben. A GPT‑5.1‑Codex‑Max‑ban bevezetett képességekre építve sokkal hatékonyabb és megbízhatóbb az ügynöki kódolás natív Windows környezetben.
Ezekkel a fejlesztésekkel a Codex jobban dolgozik a nagy adattárakban a hosszabb munkamenetek alatt, miközben a teljes kontextus érintetlen marad. Megbízhatóbban képes összetett feladatok elvégzésére, mint például a nagy refaktorálások, kódmigrációk és funkciók építése —, és akkor is képes tovább iterálni és követni a kontextust, ha a tervek menet közben változnak vagy egy-egy próbálkozás nem sikerül.
A SWE-Bench Prokeretében a modell kap egy kódtárat, és egy javítást kell generálnia egy valósághű szoftverfejlesztési feladat megoldásához. Terminal-Bench 2.0 egy benchmark az AI-ügynökök tesztelésére valódi terminálkörnyezetekben. A feladatok közé tartozik a kód összeállítása, a modellek betanítása és a szerverek beállítása.
A jobb látóteljesítmény engedélyezésével a GPT‑5.2‑Codex pontosabban értelmezi a kódolási munkamenetek során megosztott képernyőképeket, a technikai diagramokat, a grafikonokat és a felhasználói felületeket.
A Codex a dizájntervekből gyorsan működő prototípusokat készít, amelyeket vele együtt dolgozva akár éles környezetbe is át lehet vinni.
Dizájn vázlat

A GPT‑5.2‑Codex által generált prototípus
Amikor az egyik alapvető kiberbiztonsági értékelésünk teljesítményét ábrázoljuk az idő múlásával, éles ugrást látunk a képességekben, kezdve a GPT‑5‑Codex‑szel, majd egy újabb nagy ugrást a GPT‑5.1‑Codex‑Max‑szal, és most egy harmadik ugrást a GPT‑5.2‑Codex‑szel. Arra számítunk, hogy a következő AI-modellek ezt a pályát fogják folytatni. Előkészületként úgy tervezünk és értékelünk, mintha minden új modell elérhetné a „magas” szintű kiberbiztonsági képességet, ahogyan azt a Felkészültségi Keretrendszerünk(új ablakban nyílik meg) méri. Bár a GPT‑5.2‑Codex még nem érte el a „magas” szintű kiberképességet, készülünk a jövőbeli modellekre, amelyek átlépik ezt a küszöböt. A megnövekedett kiberképességek miatt további biztosítékokat adtunk a modellhez és a termékhez, amelyeket a rendszerkártyán részletezünk.
A Professzionális Capture-the-Flag (CTF) értékelés azt méri, hogy a modell milyen gyakran képes megoldani a fejlett, többlépéses valós kihívásokat (amelyek professzionális szintű kiberbiztonsági készségeket igényelnek) Linux környezetben.
A modern társadalom szoftvereken alapul, és megbízhatósága az erős kiberbiztonságtól függ - a banki, egészségügyi, kommunikációs és alapvető szolgáltatások kritikus rendszereinek online tartása, az érzékeny adatok védelme, valamint annak biztosítása, hogy az emberek megbízhassanak a szoftverekben, amelyekre a mindennapokban támaszkodnak. A sebezhetőségek már jóval azelőtt létezhetnek, hogy bárki is tudna róluk, és megtalálásuk, érvényesítésük és javításuk gyakran a megfelelő eszközökkel felszerelt mérnökök és független biztonsági kutatók közösségétől függ.
2025. december 11-én a React csapat három biztonsági sebezhetőséget tett közzé, amelyek a React Server Components-szel épített appokat érintik. Ami ezt a közzétételt figyelemre méltóvá tette, az nemcsak maguk a sebezhetőségek voltak, hanem az is, ahogyan felfedezték őket.
Andrew MacPherson, a Privy (a Stripe vállalat) vezető biztonsági mérnöke, a GPT‑5.1‑Codex‑Max‑ot használta a Codex CLI-vel és más kódoló ügynökökkel, egy másik kritikus React sebezhetőség reprodukálására és vizsgálatára, amelyet az előző héten hoztak nyilvánosságra, React2Shell(új ablakban nyílik meg) (CVE-2025-55182(új ablakban nyílik meg)) néven. Az volt a célja, hogy felmérje, mennyire hatékonyan tud a modell segíteni a valós környezetben végzett sebezhetőségi kutatásokban.
Eleinte több zero-shot elemzést végzett, és arra kérte a modellt, hogy vizsgálja meg a javítást, és határozza meg, melyik sebezhetőségre nyújt megoldást. Amikor ez nem hozott eredményt, áttért egy nagyobb volumenű, iteratív megközelítésre. Amikor ezek a megközelítések nem jártak sikerrel, végigvezette a Codexet a szabványos defenzív biztonsági munkafolyamatokon—helyi tesztkörnyezetet hozott létre, végiggondolta a lehetséges támadási felületeket, és fuzzing segítségével rosszul formált inputokkal tesztelte a rendszert. Miközben megpróbálták reprodukálni az eredeti React2Shell problémát, a Codex váratlan viselkedéseket tárt fel, amelyek mélyebb vizsgálatot igényeltek. Egyetlen hét alatt ez a folyamat korábban ismeretlen sebezhetőségek felfedezéséhez vezetett, amelyeket felelősségteljesen jelentettek a React csapatnak.
Ez bemutatja, hogy a fejlett AI-rendszerek hogyan képesek érdemben felgyorsítani a védelmi biztonsági munkát a széles körben használt, valós szoftverekben. Ugyanakkor azok a képességek, amelyek segítik a védelmi oldalt a gyorsabb reagálásban, rosszindulatú szereplők által is visszaélésre adhatnak lehetőséget.
Ahogy az ügynöki rendszerek egyre alkalmasabbá válnak a kiberbiztonsággal kapcsolatos feladatok elvégzésére, kiemelt prioritásként kezeljük, hogy ezeket az előrelépéseket felelősségteljesen alkalmazzuk – minden képességnövekedést erősebb védelmi intézkedésekkel, szigorúbb hozzáférés-ellenőrzésekkel és a biztonsági közösséggel való folyamatos együttműködéssel párosítva.
A biztonsági csapatok korlátozásokba ütközhetnek, amikor megpróbálják utánozni a fenyegető szereplőket, elemezni a rosszindulatú szoftvereket a helyreállítás támogatása érdekében, vagy stressztesztelni a kritikus infrastruktúrát. Egy megbízható hozzáférési pilotprogramot fejlesztünk, hogy eltávolítsuk a súrlódást a megfelelő felhasználók és szervezetek számára, és engedélyezzük a megbízható védők számára, hogy a legkorszerűbb AI-kiberképességeket használják a kibervédelem felgyorsítása érdekében.
Kezdetben a pilot program csak meghívásos alapon lesz elérhető olyan ellenőrzött biztonsági szakemberek számára, akik felelősségteljes sebezhetőség-nyilvánosságra hozatali múlttal rendelkeznek, valamint olyan szervezetek számára, amelyek egyértelmű professzionális kiberbiztonsági felhasználási esettel bírnak. A jogosult résztvevők hozzáférést kapnak legfejlettebb modelljeinkhez védelmi célokra, hogy lehetővé tegyék a legitim, kettős felhasználású munkát.
Ha biztonsági szakember vagy, vagy egy olyan szervezet tagja, amely etikus biztonsági munkát végez, mint például sebezhetőségi kutatás vagy engedélyezett red-teaming, meghívunk, hogy fejezd ki érdeklődésed a csatlakozás iránt, és oszd meg a visszajelzésed arról, mit szeretnél látni a programtól itt(új ablakban nyílik meg).
A GPT‑5.2‑Codex előrelépést jelent abban, hogy a fejlett AI hogyan támogathatja a valós szoftverfejlesztést és a domainokat, mint például a kiberbiztonságot—, segítve a fejlesztőket és a védelmi szakembereket a komplex, hosszú távú feladatok megoldásában, és erősítve a felelős biztonsági kutatáshoz rendelkezésre álló eszközöket.
A GPT‑5.2‑Codex fokozatos bevezetésével, a telepítést biztosítékokkal párosítva, és szorosan együttműködve a biztonsági közösséggel a védelem maximalizálására törekszünk, miközben csökkentjük a visszaélések kockázatát. Amit ebből a kiadásból megtudunk, az közvetlenül befolyásolja, hogyan bővítjük a hozzáférést az idő múlásával, miközben a szoftverek és a kibertechnológia határai a folytatásával haladnak előre.


