Tutvustame GPT‑5.2‑Codexit
Kõige arenenum agentne kodeerimismudel professionaalseks tarkvaraarenduseks ja kaitsvaks küberturbeks.
Täna avaldame GPT‑5.2‑Codexi, seni kõige arenenuma agentliku kodeerimismudeli keerukate, reaalse maailma tarkvaraarenduste jaoks. GPT‑5.2‑Codex on GPT‑5.2 versioon, mis on veelgi optimeeritud agentlikuks kodeerimiseks Codexis, sealhulgas on parendatud pikaajaliste ülesannete täitmist konteksti tihendamise kaudu, tugevdatud jõudlust suurte koodimuudatuste, nagu refaktorite ja migratsioonide puhul, parendatud jõudlust Windowsi keskkondades ning oluliselt tugevdatud küberturvalisuse võimekust.
Kuna meie mudelid jätkavad intelligentsuse piiril edasiliikumist, oleme täheldanud, et need täiustused toovad kaasa ka võimekuse hüppeid spetsialiseeritud domeenides, nagu küberturvalisus. Näiteks just eelmisel nädalal kasutas üks turvalisuse uurija GPT‑5.1‑Codex‑Maxi Codex CLI leidis ja vastutustundlikult avaldas(avaneb uues aknas) haavatavuse Reactis, mis võib viia lähtekoodi avalikustamiseni.
GPT‑5.2‑Codexil on tugevamad küberturbevõimed kui ühelgi mudelil, mille oleme seni välja andnud. Need edusammud võivad aidata tugevdada küberturvalisust laiaulatuslikult, kuid samas tõstatavad need ka uusi topeltkasutusega riske, mis vajavad hoolikat rakendamist. Kuigi GPT‑5.2‑Codex ei saavuta meie Valmisolekuraamistiku kohaselt „kõrget“ küberturvalisuse taset, kavandame oma juurutusstrateegiat tulevase võimekuse kasvu silmas pidades.
Anname täna välja mudeli GPT‑5.2‑Codex kõigil Codexi platvormidel tasulistele ChatGPT kasutajatele ja töötame selle nimel, et lähinädalatel turvaliselt võimaldada GPT‑5.2‑Codexi juurdepääsu API kasutajatele. Paralleelselt piloteerime ainult kutsetega usaldusväärset juurdepääsu tulevastele võimekustele ja lubavamaid mudeleid kontrollitud spetsialistidele ja organisatsioonidele, kes keskenduvad kaitsvatele küberturvalisuse töödele. Usume, et see lähenemine juurutamisele tasakaalustab juurdepääsetavuse ja ohutuse.
GPT‑5.2‑Codex tugineb GPT‑5.2 tugevustele professionaalses teadmiste töös ja GPT‑5.1‑Codex‑Maxile tipptasemel agentliku kodeerimise ja terminali kasutamise võimekuses. GPT‑5.2‑Codex on nüüd parem pika konteksti mõistmisel, usaldusväärsel tööriistade kasutamisel, parendatud faktilisuse ja loomuliku tihendamise osas, muutes selle usaldusväärsemaks partneriks pikaajaliste kodeerimisülesannete jaoks, jäädes samas tõhusaks tokenite kasutamisel arutluses.
GPT‑5.2‑Codex saavutab tipptasemel jõudluse SWE-Bench Pro ja Terminal-Bench 2.0-is, mis on loodud testima agentset jõudlust laias valikus ülesannetes realistlikes terminalikeskkondades. See on ka palju tõhusam ja usaldusväärsem agentse programmeerimise osas Windowsi keskkondades, tuginedes GPT‑5.1‑Codex‑Maxi poolt tutvustatud võimekustele.
Nende täiustustega on Codex võimekam töötama suurtes varamutes pikemate seansside jooksul, säilitades täieliku konteksti. See suudab usaldusväärsemalt täita keerulisi ülesandeid, nagu suured refaktoreerimised, koodimigratsioonid ja funktsioonide ehitamine, jätkates itereerimist ilma järge kaotamata, isegi kui plaanid muutuvad või katsed ebaõnnestuvad.
SWE-Bench Pro'is antakse mudelile koodvaramu ja see peab koostama paranduse, et lahendada realistlik tarkvaraarenduse ülesanne. Terminal-Bench 2.0 on võrdlusalus tehisintellekti agentide testimiseks reaalsetes terminalikeskkondades. Ülesanded hõlmavad koodi kompileerimist, koolitust ja serverite seadistamist.
Tugevam visuaalne jõudlus lubab GPT‑5.2‑Codexil täpsemalt tõlgendada ekraanipilte, tehnilisi diagramme, graafikuid ja kasutajaliidese pindu, mida jagatakse programmeerimisseansside ajal.
Codex suudab disainimakette kiiresti funktsionaalseteks prototüüpideks tõlkida ning sa saad Codexiga koostööd teha, et viia need prototüübid tootmisse.
Disaini makett

Prototüüp koostatud GPT‑5.2‑Codexi poolt
Kui kaardistame aja jooksul ühe meie põhiküberturvalisuse hindamise tulemusi, näeme võimekuse järsku hüpet alates GPT‑5‑Codexist, veel üht suurt hüpet GPT‑5.1‑Codex‑Maxiga ja nüüd kolmandat hüpet GPT‑5.2‑Codexiga. Me eeldame, et tulevased tehisintellekti mudelid jätkavad samal kursil. Ettevalmistuse käigus plaanime ja hindame, justkui võiks iga uus mudel saavutada küberturvalisuse võimekuse „kõrge“ taseme, nagu mõõdetud meie valmisolekuraamistiku(avaneb uues aknas) alusel. Kuigi GPT‑5.2‑Codex ei ole veel saavutanud „kõrget“ kübervõimekuse taset, valmistume tulevasteks mudeliteks, mis selle läve ületavad. Tänu suurenenud kübervõimekusele oleme lisanud mudelisse ja tootesse täiendavaid kaitsemeetmeid, mis on välja toodud süsteemikaardis.
Professionaalne Capture-the-Flag (CTF) hindamine mõõdab, kui tihti mudel suudab lahendada keerulisi, mitmeastmelisi reaalse maailma väljakutseid (mis nõuavad professionaalse taseme küberturvalisuse oskusi) Linuxi keskkonnas.
Kaasaegne ühiskond toimib tarkvara abil ja selle usaldusväärsus sõltub tugevast küberkaitsest – hoides kriitilisi süsteeme panganduses, tervishoius, kommunikatsioonis ja olulistes teenustes võrgus, kaitstes tundlikke andmeid ning tagades, et inimesed saavad usaldada tarkvara, mida nad iga päev kasutavad. Haavatavused võivad eksisteerida kaua enne, kui keegi neist teadlikuks saab, ja nende leidmine, valideerimine ning parandamine sõltub sageli inseneride ja sõltumatute turvauurijate kogukonnast, kes on varustatud õigete tööriistadega.
2025. aasta 11. detsembril avaldas Reacti meeskond kolm turvahaavatavust, mis mõjutavad React Server Componentsiga ehitatud rakendusi. Mis tegi selle avalikustamise märkimisväärseks, polnud mitte ainult haavatavused ise, vaid ka see, kuidas need avastati.
Andrew MacPherson, peamine turvainsener ettevõttes Privy (Stripe'i ettevõte), kasutas GPT‑5.1‑Codex‑Maxi koos Codex CLI ja teiste agentidega, et taastoota ja uurida teist kriitilist Reacti haavatavust, mis avalikustati eelmisel nädalal ja on tuntud kui React2Shell(avaneb uues aknas) (CVE-2025-55182(avaneb uues aknas)). Tema eesmärk oli hinnata, kui hästi mudel suudab aidata reaalmaailma haavatavuse uurimisel.
Ta katsetas algselt mitmeid zero-shot analüüse, suunates mudeli uurima plaastrit ja tuvastama haavatavust, mida see käsitles. Kui see ei andnud tulemusi, läks ta üle suurema mahuga, iteratiivsele suunamise lähenemisele. Kui need lähenemised ei õnnestunud, juhendas ta Codexit läbi standardsete kaitsemeetmete turvavoogude – seadistades kohaliku testimiskeskkonna, analüüsides potentsiaalseid ründevektoreid ja kasutades fuzzimist, et sondeerida süsteemi vigaste sisenditega. Algse React2Shell probleemi taastamise katsel ilmnesid Codexi käigus ootamatud käitumised, mis vajasid põhjalikumat uurimist. Ühe nädala jooksul viis see protsess varem tundmatute haavatavuste avastamiseni, mis vastutustundlikult avalikustati Reacti meeskonnale.
See näitab, kuidas arenenud tehisintellekti süsteemid võivad oluliselt kiirendada kaitseturbe tööd laialdaselt kasutatavas, reaalse maailma tarkvaras. Samal ajal võivad võimed, mis aitavad kaitsjatel kiiremini tegutseda, olla ka pahatahtlike isikute poolt väärkasutatud.
Kuna agentuursed süsteemid muutuvad küberturvalisusega seotud ülesannetes üha võimekamaks, on meie peamine prioriteet tagada, et neid edusamme rakendatakse vastutustundlikult – iga võimekuse kasvu sidudes tugevamate kaitsemeetmete, rangemate juurdepääsukontrollide ja pideva koostööga turvavaldkonna kogukonnaga.
Turvameeskonnad võivad kokku puutuda piirangutega, kui nad üritavad jäljendada ohutegureid, analüüsida pahavara parandusmeetmete toetamiseks või stressitestida kriitilist infrastruktuuri. Arendame usaldusväärse juurdepääsu pilootprojekti, et eemalda hõõrdumist kvalifitseeritud kasutajate ja organisatsioonide jaoks ning luba usaldusväärsetel kaitsjatel kasutada tipptasemel tehisintellekti kübervõimekusi küberkaitse kiirendamiseks.
Esialgu on pilootprogramm ainult kutsetega, mis on mõeldud kontrollitud turvaspetsialistidele, kellel on vastutustundliku haavatavuste avalikustamise kogemus, ja organisatsioonidele, kellel on selge professionaalne küberturvalisuse kasutusjuhtum. Kvalifitseeruvad osalejad saavad juurdepääsu meie kõige võimekamatele mudelitele kaitseotstarbelisteks kasutusjuhtudeks, et lubada seaduslikku topeltkasutust.
Kui oled turvaspetsialist või osa organisatsioonist, mis tegeleb eetilise turvatööga, nagu haavatavuste uurimine või volitatud lööktestimine, kutsume sind üles avaldama huvi liitumise vastu ja jagama tagasisidet selle kohta, mida sa programmist oodata sooviksid siin(avaneb uues aknas).
GPT‑5.2‑Codex on samm edasi selles, kuidas täiustatud tehisintellekt saab toetada reaalse tarkvaratehnika ja spetsialiseeritud valdkondi, nagu küberturvalisus, aidates arendajatel ja kaitsjatel toime tulla keerukate ja pikaajaliste töödega ning tugevdades vastutustundliku turvalisuse uurimistöö jaoks saadaolevaid tööriistu.
GPT‑5.2‑Codexi käivitamisel järk-järgulise kasutuselevõtu, juurutamise sidumise turvameetmetega ja tiheda koostöö tegemisega turvakogukonnaga püüame maksimeerida kaitsvat mõju, vähendades samal ajal väärkasutuse ohtu. Sellest väljaandest õpitu mõjutab otseselt seda, kuidas me aja jooksul juurdepääsu laiendame, kuna tarkvara ja küberpiirid arenevad jätkuvalt.


