Pereiti prie pagrindinio turinio
OpenAI

2025 m. gruodžio 18 d.

ProduktasLeidimasBendrovė

Pristatome „GPT‑5.2‑Codex“

Pažangiausias agentinis kodavimo modelis, skirtas profesionaliai programinės įrangos inžinerijai ir gynybiniam kibernetiniam saugumui.

Šiandien išleidžiame „GPT‑5.2‑Codex“ – pažangiausią agentinį programavimo modelį, skirtą sudėtingai, realaus pritaikymo programinės įrangos inžinerijai. „GPT‑5.2‑Codex“ yra „GPT‑5.2“ versija, dar labiau optimizuota agentiniam kodavimui „Codex“ aplinkoje, įskaitant patobulinimus ilgalaikiam darbui per konteksto glaudinimą, geresnį našumą atliekant didelius kodo pakeitimus, tokius kaip pertvarkymas ir migracijos, pagerintą našumą „Windows“ aplinkose ir žymiai stipresnius kibernetinio saugumo gebėjimus.

Kadangi mūsų modeliai toliau tobulėja intelekto srityje, pastebėjome, kad šie patobulinimai taip pat reiškia gebėjimų šuolius specializuotuose domenuose, kaip kibernetinis saugumas. Pavyzdžiui, praėjusią savaitę saugumo tyrėjas, naudojęs „GPT‑5.1‑Codex‑Max“ su „Codex CLI“ rado ir atsakingai atskleidė(atsidaro naujame lange) „React“ pažeidžiamumą, kuris gali atskleisti šaltinio kodą.

„GPT‑5.2‑Codex“ turi stipresnius kibernetinio saugumo gebėjimus nei bet kuris anksčiau mūsų išleistas modelis. Šie patobulinimai gali padėti stiprinti kibernetinį saugumą dideliu mastu, tačiau jie taip pat kelia naujas dvigubo naudojimo rizikas, kurios reikalauja atsargaus diegimo. Nors „GPT‑5.2‑Codex“ nepasiekia aukšto kibernetinio pajėgumo lygio pagal mūsų Pasirengimo sistemą, mes kuriame savo diegimo metodiką, atsižvelgdami į būsimą pajėgumų augimą.

Išleidžiame „GPT‑5.2‑Codex“ šiandien visose „Codex“ aplinkose mokamiems „ChatGPT“ naudotojams ir dirbame, kad artimiausiomis savaitėmis API naudotojams saugiai suteiktume prieigą prie „GPT‑5.2‑Codex“. Lygiagrečiai vykdome bandomąją programą, suteikdami patikimą prieigą tik su pakvietimais prie būsimų galimybių ir modelių su mažiau apribojimų patikrintiems specialistams ir organizacijoms, orientuotiems į gynybinį kibernetinį saugumą. Tikime, kad toks diegimo būdas subalansuos prieinamumą ir saugą.

Plečiame ribas realaus pritaikymo programinės įrangos inžinerijoje

„GPT‑5.2‑Codex“ remiasi „GPT‑5.2“ stiprybėmis profesionalių žinių darbe ir „GPT‑5.1‑Codex‑Max“ pažangiomis agentinio kodavimo ir terminalo naudojimo galimybėmis. „GPT‑5.2‑Codex“ dabar geresnis dėl patobulinto ilgo konteksto supratimo, patikimo įrankių naudojimo, pagerinto faktinio tikslumo ir natūralaus glaudinimo – tai patikimesnis partneris ilgai trunkančioms kodavimo užduotims, išlaikant prieigos raktų efektyvumą samprotavimuose.

„GPT‑5.2‑Codex“ pasiekia pažangiausią našumą „SWE-Bench Pro“ ir „Terminal-Bench 2.0“ lyginamuosiuose testuose agentinio našumo vertinimui atliekant įvairias užduotis realistiškose terminalo aplinkose. Tai taip pat yra daug efektyvesnis ir patikimesnis agentinio kodavimo „Windows“ aplinkoje, remiantis galimybėmis, pristatytomis „GPT‑5.1‑Codex‑Max“.

Dėl šių patobulinimų „Codex“ yra pajėgesnis dirbti didelėse saugyklose per ilgus seansus, išlaikant visą kontekstą. Jis gali patikimiau atlikti sudėtingas užduotis, pavyzdžiui, didelio masto kodo pertvarkymą, migravimą ir funkcijų kūrimą – tęsdamas iteracijas ir nepamesdamas eigos, net kai keičiasi planai ar nepavyksta bandymai.

Programoje „SWE-Bench Pro“modeliui pateikiama kodo saugykla ir jis turi sugeneruoti pataisą, kad išspręstų realistinę programinės įrangos inžinerijos užduotį. „Terminal-Bench 2.0“ yra lyginamasis testas, skirtas DI agentams testuoti tikrose terminalo aplinkose. Užduotys apima kodo sudarymą, modelių mokymą ir serverių konfigūravimą.

Stipresnis vizijos našumas leidžia „GPT‑5.2‑Codex“ tiksliau interpretuoti ekrano kopijas, technines schemas, diagramas ir naudotojo sąsajos paviršius, dalijamus kodavimo seansų metu.

„Codex“ gali priimti dizaino maketus ir greitai paversti juos funkciniais prototipais, o jūs galite dirbti poroje su „Codex“, kad parengtumėte šiuos prototipus naudojimui realiose sistemose.

Dizaino maketas
Dizaino maketas, naudotas generuojant žiniatinklio prototipą su „Codex-5.2“
Prototipas, sugeneruotas naudojant „GPT‑5.2‑Codex“

Kibernetinių sienų stiprinimas

Lyginant našumą viename iš mūsųpagrindinių kibernetinio saugumo vertinimų laikui bėgant, matome staigų gebėjimų didėjimą, pradedant nuo „GPT‑5‑Codex“, dar vieną didelį šuolį su „GPT‑5.1‑Codex‑Max“, o dabar – ir trečią šuolį su „GPT‑5.2‑Codex“. Tikimės, kad būsimi DI modeliai tęs šią trajektoriją. Ruošdamiesi planuojame ir vertiname taip, tarsi kiekvienas naujas modelis galėtų pasiekti „Aukštą“ kibernetinio saugumo pajėgumų lygį, kaip matuojama pagal mūsų Pasirengimo sistemą(atsidaro naujame lange). Nors „GPT‑5.2‑Codex“ dar nepasiekė „aukšto“ lygio kibernetinio pajėgumo, mes ruošiamės būsimiems modeliams, kurie peržengs šią ribą. Dėl padidėjusių kibernetinių pajėgumų modelyje ir produkte įdiegėme papildomų apsaugos priemonių, kurios nurodytos sistemos kortelėje.

Profesionalus „Capture-the-Flag“ (CTF) vertinimas nustato, kaip dažnai modelis gali išspręsti pažangius, daugiapakopius realaus pasaulio iššūkius (reikalaujančius profesionalaus lygio kibernetinio saugumo įgūdžių) „Linux“ aplinkoje.

Realaus pritaikymo kibernetinės galimybės

Šiuolaikinė visuomenė veikia kartu su programine įranga, o jos patikimumas priklauso nuo stiprios kibernetinės saugos – užtikrinant, kad svarbios bankininkystės, sveikatos priežiūros, komunikacijos ir esminių paslaugų sistemos būtų prieinamos, apsaugant jautrius duomenis ir užtikrinant, kad žmonės galėtų pasitikėti programine įranga, kuria jie kasdien remiasi. Pažeidžiamumai gali egzistuoti dar ilgai prieš tai, kai kas nors apie juos sužino, o jų radimas, patvirtinimas ir taisymas dažnai priklauso nuo inžinierių ir nepriklausomų saugumo tyrėjų bendruomenės, turinčios tinkamus įrankius.

2025 m. gruodžio 11 d. „React“ komanda paskelbė tris saugumo pažeidžiamumus, turinčius įtakos programoms, sukurtoms naudojant „React Server Components“. Šį atskleidimą išskyrė ne tik patys pažeidžiamumai, bet ir tai, kaip jie buvo aptikti.

Andrew MacPhersonas, „Privy“ („Stripe“ įmonės) pagrindinis saugumo inžinierius, naudojo „GPT‑5.1‑Codex‑Max“ su „Codex CLI“ ir kitais kodavimo agentais, siekiant atkurti ir ištirti kitokį kritinį „React“ pažeidžiamumą, atskleistą praėjusią savaitę, žinomą kaip React2Shell(atsidaro naujame lange) (CVE-2025-55182(atsidaro naujame lange)). Jo tikslas buvo įvertinti, kaip modelis galėtų padėti atliekant realaus pritaikymo pažeidžiamumo tyrimus.

Iš pradžių jis pabandė atlikti keletą analizių be pavyzdžių, ragindamas modelį išnagrinėti pataisą ir nustatyti pažeidžiamumą, kurį ji ištaiso. Kai tai nedavė rezultatų, jis perėjo prie didesnės apimties iteracinio raginimo. Kai šie metodai nepasiteisino, jis vedė „Codex“ per standartinius gynybinės saugos darbo srautus – nustatydamas vietinę testavimo aplinką, svarstydamas galimus atakos paviršius ir naudodamas testavimo atsitiktiniais duomenimis metodą, kad sistemą išbandytų su neteisingai suformuotomis įvestimis. Bandant atkurti pradinę „React2Shell“ problemą, „Codex“ atskleidė netikėtus elgesio modelius, kurie reikalavo gilesnio tyrimo. Per vieną savaitę šis procesas lėmė anksčiau nežinomų pažeidžiamumų atradimą, apie kuriuos atsakingai buvo pranešta „React“ komandai.

Srauto diagrama, pavadinta „Pažeidžiamumų aptikimas su „Codex“: CVE-2025-55183“, vaizduojanti darbo eigą, kuri prasideda nuo „Git“ saugyklos ir „Codex“, nuskaitančio kodą ieškant pažeidžiamumų. Bandymas be pavyzdžių nepavyksta, po jo seka eksperto vadovaujamas procesas, kurio metu nagrinėjama kodų bazė, identifikuojami galimi taikiniai, sukuriamas testavimo karkasas ir atliekamas pavyzdinės programos „fuzz“ testavimas su pakartotiniu patvirtinimu. Rezultatai patikrinami sukuriant koncepcijos įrodymą, o tai lemia atsakingą atskleidimą ir pataisą, kuri pritaikoma atgal saugykloje.

Tai parodo, kaip pažangios DI sistemos gali reikšmingai paspartinti gynybinį saugumo darbą plačiai naudojamoje, realaus pasaulio programinėje įrangoje. Tuo pat metu pajėgumais, kurie padeda gynėjams veikti greičiau, gali piktnaudžiauti ir piktavaliai.

Kadangi agentinės sistemos tampa vis pajėgesnės atlikti kibernetiniam saugumui svarbias užduotis, mes laikome pagrindiniu prioritetu užtikrinti, kad šie pasiekimai būtų diegiami atsakingai – kiekvieną pajėgumų padidėjimą derinant su stipresnėmis apsaugos priemonėmis, griežtesne prieigos kontrole ir nuolatiniu bendradarbiavimu su saugumo bendruomene.

Kibernetinės gynybos stiprinimas per patikimą prieigą

Saugumo komandos gali susidurti su apribojimais, kai bando imituoti grėsmių vykdytojus, analizuoti kenkėjiškas programas, kad būtų galima jas pašalinti arba testuoti kritinę infrastruktūrą nepalankiausiomis sąlygomis. Kuriame patikimos prieigos bandomąją programą, kuri pašalina tą trintį kvalifikuotiems naudotojams ir organizacijoms bei suteikia galimybę patikimiems gynėjams naudoti pažangiausias DI kibernetines galimybes kibernetinei gynybai spartinti.

Iš pradžių bandomoji programa bus prieinama tik pakviestiems, patikrintiems saugumo specialistams, turintiems atsakingo pažeidžiamumų atskleidimo patirtį, ir organizacijoms, turinčioms aiškų profesionalų kibernetinio saugumo naudojimą. Reikalavimus atitinkantys dalyviai gaus prieigą prie mūsų pajėgiausių modelių gynybiniams panaudos atvejams, kad galėtų vykdyti teisėtą dvejopo naudojimo veiklą.

Jeigu esate saugumo specialistas arba organizacijos, vykdančios etišką saugumo veiklą, tokios kaip pažeidžiamumų tyrimai ar įgaliota raudonoji komanda, dalis, kviečiame išreikšti susidomėjimą prisijungti ir pasidalyti atsiliepimais apie tai, ką norėtumėte matyti iš šios programos čia(atsidaro naujame lange).

Išvada

„GPT‑5.2‑Codex“ žymi žingsnį į priekį, kaip pažangus DI gali suteikti palaikymą realaus pritaikymo programinės įrangos inžinerijai ir specializuotoms sritims, tokioms kaip kibernetinis saugumas – padėdamas programuotojams ir gynėjams spręsti sudėtingas, ilgalaikes užduotis ir stiprindamas atsakingų saugumo tyrimų įrankius.

Laipsniškai diegdami „GPT‑5.2‑Codex“ derindami diegimą su apsaugos priemonėmis ir glaudžiai bendradarbiaudami su saugumo bendruomene, siekiame maksimaliai padidinti gynybinį poveikį ir kartu sumažinti piktnaudžiavimo riziką. Tai, ką sužinosime iš šio leidimo, tiesiogiai paveiks, kaip laikui bėgant plėsime prieigą, nes tiek programinė įranga, tiek kibernetinės ribos toliau vystosi.

Autorius

OpenAI