18. desember 2025

Við kynnum GPT‑5.2‑Codex

Háþróaðasta fulltrúakóðunarlíkanið fyrir faglega hugbúnaðarverkfræði og til varnar netöryggi.

Í dag gefum við út GPT‑5.2‑Codex, fullkomnasta fulltrúakóðunarlíkanið hingað til fyrir flókna, raunverulega hugbúnaðarverkfræði. GPT‑5.2‑Codex er útgáfa af GPT‑5.2⁠ sem hefur verið enn frekar fínstillt fyrir fulltrúakóðun í Codex, þar á meðal úrbætur á langtímavinnu með samhengisþjöppun, betri afköst í stórum kóðabreytingum eins og endurgerðum og flutningum, bætt afköst í Windows-umhverfum og verulega sterkari netöryggisgetu.

Þar sem líkön okkar halda áfram að þróast eftir því sem framfarir í upplýsingaöflun hafa komið fram þýða umbætur einnig aukningu í getu á sérhæfðum sviðum eins og netöryggi⁠. Til dæmis, í síðustu viku notaði öryggisrannsakandi GPT‑5.1‑Codex‑Max með Codex CLI með Codex CLI fann og tilkynnti⁠(opnast í nýjum glugga) á ábyrgan hátt veikleika í React sem gæti leitt til birtingar á frumkóða.

GPT‑5.2‑Codex býr yfir sterkari netöryggisgetu en nokkur önnur gerð sem við höfum gefið út hingað til. Þessar framfarir geta hjálpað til við að styrkja verulega netöryggi, en þær skapa einnig nýjar áhættur varðandi tvíþætta notkun sem krefjast varkárrar innleiðingar. Þó að GPT‑5.2‑Codex nái ekki „háu“ stigi í netgetu samkvæmt viðbúnaðarramma okkar, erum við að hanna innleiðingaraðferð⁠ okkar með framtíðarvöxt getu í huga.

Við erum að gefa út GPT‑5.2‑Codex í dag á öllum Codex-viðmótum fyrir ChatGPT‑notendur í áskrift, og við vinnum að því að virkja öruggt aðgengi að GPT‑5.2‑Codex fyrir API-notendur á næstu vikum. Samhliða þessu erum við að prófa traustan aðgang að væntanlegum möguleikum og leyfilegri gerðum fyrir viðurkennda sérfræðinga og stofnanir sem einbeita sér að netöryggi. Við teljum að þessi aðferð við innleiðingu muni koma jafnvægi á aðgengi og öryggi.

Að færa mörk raunverulegrar hugbúnaðarverkfræði áfram

GPT‑5.2‑Codex byggir á styrkleikum GPT‑5.2⁠ í faglegri þekkingarvinnu og frontier-fulltrúakóðun GPT‑5.1‑Codex‑Max⁠ og færni til að nota stöðvar. GPT‑5.2‑Codex er nú betra í að skilja langt samhengi, áreiðanlegri í verkfæraköllun, með bættri staðreyndalegri nákvæmni og innbyggðri þjöppun, sem gerir það að áreiðanlegri samstarfsaðila fyrir langvarandi kóðunarverkefni, á meðan það er hagkvæmt í notkun á táknum í röksemdafærslu sinni.

GPT‑5.2‑Codex nær nýjustu frammistöðu á SWE-Bench Pro og Terminal-Bench 2.0, viðmiðum sem eru hönnuð til að prófa frammistöðu fulltrúa í fjölbreyttum verkefnum í raunverulegu stöðvaumhverfi. Það er einnig mun skilvirkara og áreiðanlegra við fulltrúakóðun í innbyggðum Windows-umhverfum, byggt á möguleikum sem kynntir voru í GPT‑5.1‑Codex‑Max.

Með þessum úrbótum er Codex betur fært um að vinna í stórum gagnasöfnum yfir lengri lotur með öllu samhenginu óskertu. Það getur áreiðanlegri lokið flóknum verkefnum eins og stórum endurbótum, kóðaflutningum og eiginleikasmíðum — haldið áfram að endurtaka sig án þess að missa stjórn, jafnvel þegar áætlanir breytast eða tilraunir mistakast.

Í SWE-Bench Pro⁠⁠⁠⁠ fær líkan kóðageymslu og þarf að búa til bót til að leysa raunhæft hugbúnaðarverkefni. Terminal-Bench 2.0 er viðmiðunarpróf til að prófa gervigreindarfulltrúa í raunverulegum skeljumhverfum. Verkefni fela í sér að setja saman kóða, þjálfun líkana og setja upp netþjóna.

Betri sjónræn frammistaða gerir GPT‑5.2‑Codex kleift að túlka skjámyndir, tæknilegar skýringarmyndir, töflur og notendaviðmótsyfirborð sem deilt er á meðan forritunarlotum stendur með nákvæmari hætti.

Codex getur tekið hönnunarherferðir og fljótt þýtt þær í hagnýtar frumgerðir og þú getur parað þig við Codex til að koma þessum frumgerðum í framleiðslu.

Hönnunarfrumgerð

Frumgerð búin til af GPT‑5.2‑Codex

Að efla netöryggi

Þegar við kortleggjum frammistöðu í einu af kjarnanetöryggismati okkar yfir tíma, sjáum við mikla aukningu í getu sem byrjar með GPT‑5‑Codex, annað stórt stökk með GPT‑5.1‑Codex‑Max og nú aftur þriðja stökk með GPT‑5.2‑Codex. Við búumst við að komandi gervigreindarlíkön muni halda áfram á þessari þróunarbraut. Við undirbúning erum við að skipuleggja og meta eins og hvert nýtt líkan geti náð „high“ stigi netöryggisgetu, eins og mælt er með viðbúnaðarramma⁠(opnast í nýjum glugga) okkar⁠. Þó að GPT‑5.2‑Codex hafi ekki enn náð „high“ stigi netöryggisgetu, erum við að undirbúa okkur fyrir framtíðarlíkön sem fara yfir þann þröskuld. Vegna aukinnar netöryggisgetu höfum við bætt við viðbótarvarúðarráðstöfunum í líkaninu og vörunni, sem eru útskýrðar í kerfiskortinu⁠.

Mat á faglegu Capture-the-Flag (CTF) prófi metur hversu oft líkanið getur leyst flóknar, margþættar raunverulegar áskoranir (sem krefjast faglegrar netöryggisgetu) í Linux-umhverfi.

Raunveruleg netöryggisgeta

Nútímasamfélagið reiðir sig á hugbúnað og áreiðanleiki hans byggist á öflugri netöryggisvernd—að halda mikilvægum kerfum í bankastarfsemi, heilbrigðisþjónustu, samskiptum og nauðsynlegri þjónustu í gangi, vernda viðkvæm gögn og tryggja að fólk geti treyst hugbúnaðinum sem það notar daglega. Veikleikar geta verið til staðar löngu áður en nokkur veit af þeim, og að finna, staðfesta og laga þá veltur oft á samfélagi verkfræðinga og sjálfstæðra öryggisrannsakenda sem hafa réttu verkfærin.

Þann 11. desember 2025 afhjúpaði React-teymið þrjá öryggisgalla sem höfðu áhrif á öpp sem smíðuð voru með React Server Components. Það sem gerði þessa upplýsingagjöf athyglisverða var ekki aðeins veikleikarnir sjálfir, heldur einnig hvernig þeir voru uppgötvaðir.

Andrew MacPherson, aðalöryggisverkfræðingur hjá Privy (fyrirtæki í eigu Stripe), var að nota GPT‑5.1‑Codex‑Max með Codex CLI og öðrum kóðunarfulltrúum til að endurskapa og rannsaka sérstakan mikilvægan React-veikleika sem var opinberaður viku áður, þekktur sem React2Shell⁠(opnast í nýjum glugga) (CVE-2025-55182⁠(opnast í nýjum glugga)). Markmið hans var að meta hversu vel líkanið gæti aðstoðað við rannsóknir á raunverulegum veikleikum.

Hann reyndi upphaflega nokkrar greiningar án sýnidæma, sem hvatti líkanið til að skoða bótina og bera kennsl á veikleikann sem það lagfærði. Þegar það skilaði ekki árangri, skipti hann yfir í ítrekaða aðferð með meiri umfangi í spurningum. Þegar þessar aðferðir skiluðu ekki árangri, leiddi hann Codex í gegnum hefðbundið varnaröryggisverkflæði—setti upp staðbundið prófunarumhverfi, rökstuddi möguleg árásaryfirborð og notaði fuzzing til að prófa kerfið með rangt sniðnum inntökum. Meðan verið var að reyna að endurskapa upprunalega React2Shell vandamálið, komu óvæntar hegðanir í ljós hjá Codex sem kröfðust ítarlegri rannsóknar. Á einni viku leiddi þetta ferli til uppgötvunar á áður óþekktum veikleikum, sem voru með ábyrgð tilkynntir til React-teymisins.

Flæðirit með titlinum „Uppgötvun veikleika með Codex: CVE-2025-55183“ sem sýnir vinnuflæði sem hefst með Git-geymslu og Codex sem skannar kóða fyrir veikleika. Tilraun án sýnidæma mistekst, og í kjölfarið fylgir ferli undir leiðsögn sérfræðinga sem skoðar kóðagrunninn, greinir möguleg skotmörk, býr til beisli og framkvæmir fuzz-prófanir gegn dæmiappi með endurnýjun. Niðurstöður eru staðfestar til að búa til sönnun á hugmyndinni, sem leiðir til ábyrgrar upplýsingagjafar og uppfærslu sem er sett aftur upp í gagnageymsluna.

Þetta sýnir fram á hvernig háþróuð gervigreindarkerfi geta verulega hraðað varnaröryggisstarfi í víða notuðum, raunverulegum hugbúnaði. Á sama tíma geta eiginleikar sem hjálpa varnaraðilum að hreyfa sig hraðar einnig verið misnotaðir af slæmum aðilum.

Eftir því sem fulltrúakerfi verða hæfari í verkefnum sem tengjast netöryggi, gerum við það að meginmarkmiði að tryggja að þessar framfarir séu innleiddar á ábyrgan hátt—með því að para hverja aukningu í getu við sterkari öryggisráðstafanir, strangari aðgangsstýringar og stöðugt samstarf við öryggissamfélagið.

Að efla netvarnir með traustum aðgangi

Öryggisteymi geta lent í takmörkunum þegar þau reyna að líkja eftir ógnaraðilum, greina spilliforrit til að veita aðstoð við úrbætur eða álagsprófa mikilvæga innviði. Við erum að þróa traust tilraunaverkefni fyrir aðgang til að fjarlægja þessa hindrun fyrir hæfa notendur og stofnanir og virkja traustum varnaraðilum til að nýta fremstu gervigreindargetu í netöryggi til að flýta fyrir netvörnum.

Í upphafi verður tilraunaverkefnið eingöngu fyrir boðsgesti, sem eru viðurkenndir öryggissérfræðingar með reynslu af ábyrgri upplýsingagjöf um veikleika, og stofnanir með skýrt faglegt notkunartilvik í netöryggi. Þátttakendur sem uppfylla skilyrði fá aðgang að hæfustu líkönum okkar fyrir varnartilvik til að gera kleift að vinna með lögmæta tvíþætta notkun.

Ef þú ert öryggissérfræðingur eða hluti af stofnun sem stundar siðferðilega öryggisvinnu eins og varnarleitarannsóknir eða viðurkennda „red-teaming“, bjóðum við þér að lýsa yfir áhuga á að taka þátt og deila ábendingum um það sem þú vilt sjá frá áætluninni hér⁠(opnast í nýjum glugga).

Niðurstaða

GPT‑5.2‑Codex er skref fram á við í því hvernig háþróuð gervigreind getur veitt aðstoð við raunverulega hugbúnaðarverkfræði og sérhæfð svið eins og netöryggi — hjálpað forriturum og varnaraðilum að takast á við flókin, langtímaverkefni og styrkt þau verkfæri sem eru tiltæk fyrir ábyrgar öryggisrannsóknir.

Með því að kynna GPT‑5.2‑Codex smám saman, para innleiðingu við öryggisráðstafanir og vinna náið með öryggissamfélaginu, stefnum við að því að hámarka varnaráhrif á sama tíma og draga úr hættu á misnotkun. Það sem við lærum af þessari útgáfu mun hafa bein áhrif á hvernig við aukum aðgang með tímanum, þar sem hugbúnaðar- og netöryggislandamæri halda áfram að þróast.

Höfundur

OpenAI

Haltu áfram að lesa

Skoða allt

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 er nú forgangslíkan í Microsoft 365 Copilot

Vara9. júl. 2026

ChatGPT er nú samstarfsaðili í metnaðarfyllstu verkefnunum þínum

Vara9. júl. 2026

GPT-5.6: framarleg greind sem vex með metnaði

Vara9. júl. 2026