Tutvustame uut mudelit, mis avab veelgi rohkem sellest, mida Codex suudab: GPT‑5.3‑Codex, seni kõige võimekam agentne kodeerimismudel. Mudel täiustab nii GPT‑5.2‑Codexi eesrindlikku kodeerimisvõimekust kui ka GPT‑5.2 arutlus- ja professionaalsete teadmiste võimekust, ühendades need ühes mudelis, mis on ka 25% kiirem. See võimaldab võtta ette pikaajalisi ülesandeid, mis hõlmavad uurimistööd, tööriistade kasutamist ja keerulist teostust. Nagu kolleegiga, saad GPT‑5.3‑Codex'i selle töötamise ajal suunata ja sellega suhelda, ilma konteksti kaotamata.
GPT‑5.3‑Codex on meie esimene mudel, mis mängis iseenda loomisel olulist rolli. Codex'i meeskond kasutas varaseid versioone oma treeningu silumiseks, juurutuse haldamiseks ja testitulemuste ning hindamiste diagnoosimiseks—meie meeskond oli hämmastunud, kui palju Codex suutis iseenda arendust kiirendada.
Koos GPT‑5.3‑Codex'iga, Codex on saamas koodi kirjutamise ja ülevaatamise võimekusega agendist agendiks, mis suudab teha peaaegu kõike, mida arendajad ja spetsialistid arvutis teha saavad.
GPT‑5.3‑Codex on SWE-Bench Pro ja Terminal-Bench'i puhul uueks tööstusharu tipptasemeks ning näitab tugevat jõudlust OSWorldi ja GDPval'i puhul, neljal võrdlusalusel, mida kasutame programmeerimis-, agentsuse ja reaalse maailma võimekuste mõõtmiseks.
GPT‑5.3‑Codex saavutab tipptasemel jõudluse SWE-Bench Pro'l, mis on range hindamine reaalse maailma tarkvaratehnika alal. Kus SWE‑bench Verified testib ainult Pythonit, katab SWE‑Bench Pro nelja keelt ja on saastekindlam, väljakutsuvam, mitmekesisem ja tööstuslikult asjakohasem. See ületab samuti varasema tipptasemel jõudluse Terminal-Bench 2.0-l, mis mõõdab terminalioskusi, mida Codex'i-sugune agent vajab. Märkimisväärselt, GPT‑5.3‑Codex kasutab selleks vähem tokeneid kui ükski varasem mudel, lastes kasutajatel rohkem luua.
Piire nihutava kodeerimisvõimekuse, esteetika täiustuste ja tihendamise ühendamine loob mudeli, mis suudab teha silmapaistvat tööd ja loob päevade jooksul nullist väga funktsionaalseid keerukaid mänge ja rakendusi. Et testida mudeli veebiarenduse ja pikaajalisi agentseid võimekusi, palusime GPT‑5.3‑Codex'il luua meie jaoks kaks mängu: Codex app launch võidusõidumängu versioon kaks ja sukeldumismäng. Kasutades veebimängu arendamise oskust ja eelvalitud, üldisi järelviipasid nagu "paranda viga" või "tee mäng paremaks", täiustati GPT‑5.3‑Codex mänge autonoomselt miljonite tokenite abil. Vaata treilereid ja mängi mänge, et näha, mida Codex suudab teha.
Võidusõidumäng, kus on erinevad võidusõitjad, kaheksa kaarti ja isegi esemed, mida saad tühikuklahviga kasutada. Mängi seda ise siin(avaneb uues aknas)!
Sukeldumismäng, kus uurid erinevaid riffe, kogud need kõik, et täiendada oma kalakoodeksit, hallates samal ajal hapnikku, rõhku ja ohte. Mängi seda ise siin(avaneb uues aknas)!
GPT‑5.3‑Codex mõistab võrreldes GPT‑5.2‑Codex'iga ka paremini sinu kavatsust, kui palud tal luua igapäevaseid veebisaite. Lihtsad või ebamäärased viibad suunatakse nüüd vaikimisi saitidele, kus on rohkem funktsionaalsust ja mõistlikud vaikeseaded, andes sulle tugevama lähtealuse oma ideede elluviimiseks.
Näiteks palusime GPT‑5.3‑Codex'il ja GPT‑5.2‑Codex'il luua kaks allolevat sihtlehte. GPT‑5.3‑Codex kuvas automaatselt aastaplaani soodushinnaga kuutasuna, nii muutis see soodustuse selgeks ja taotluslikuks, selle asemel et korrutada aastast kogusummat. See lõi ka automaatselt vahetuva iseloomustuste karusselli ühe kasutajatsitaadi asemel kolme eristuva kasutajatsitaadiga, mille tulemusena tundub leht vaikimisi terviklikum ja tootmiskõlbulikum.
Viip: Loo maandumisleht Quiet KPI jaoks, mis on asutajasõbralik iganädalane mõõdikute kokkuvõte. Esteetika on pehme SaaS, klaasjad kaardid, lavendli-sinise gradient, peen hägusus. Sektsioonid, kangelane e-posti kogumisega, näidisaruande kaartide ruudustik, integratsioonide rida, iseloomustuste karussell, hinnastamise lüliti kuu-aasta, KKK, jalus.
- Kirjatüüp Satoshi või sarnane geomeetriline sans.
- Nuppudel pehmed nurgad, 14px raadius, tugevad fookusolekud.
- Lisa üks maitsekas kerimisel põhinev avaldus.
Tarkvarainsenerid, disainerid, tootejuhid ja andmeteadlased teevad palju enamat kui lihtsalt koodi genereerimine. GPT‑5.3‑Codex on loodud toetama kogu tarkvara elutsükli tööd—silumist, juurutamist, monitoorimist, PRD-de kirjutamist, teksti toimetamist, kasutajauuringuid, teste, mõõdikuid ja palju muud. Selle agentlikud võimed ulatuvad tarkvarast kaugemale, aidates sul luua kõike, mida soovid—olgu selleks slaidipakid või andmete analüüsimine tabelites.
Kohandatud oskustega, mis on sarnased nendega, mida kasutasime oma varasemate GDPval tulemuste jaoks, näitab GPT‑5.3‑Codex samuti tugevat tulemuslikkust professionaalses teadmustöös, mida mõõdetakse GDPval abil, olles samal tasemel kui GPT‑5.2. GDPval on OpenAI poolt 2025. aastal välja antud hindamine, mis mõõdab 44 ametis mudeli jõudlust hästi määratletud teadmustöö ülesannetes. Need ülesanded hõlmavad näiteks esitluste, arvutustabelite ja muude töötoodete loomist.
Allpool on mõned näited agendi tehtud tööst.
Viip + ülesande kontekst
GPT-5.3-Codex output

OSWorld on agentlik arvutikasutuse võrdlusalus, kus agent peab täitma produktiivsusülesandeid visuaalses töölauaarvuti keskkonnas. GPT‑5.3‑Codex demonstreerib varasematest GPT mudelitest palju tugevamat arvuti kasutamise võimekust.
OSWorld-Verifiedis kasutavad mudelid nägemist mitmesuguste arvutiülesannete täitmiseks. Inimeste skoor on umbes 72%.
Koos näitavad need tulemused kodeerimise, graafilise vaate loomise, arvutikasutuse ja reaaleluliste ülesannete lõikes, et GPT‑5.3‑Codex ei ole lihtsalt parem üksikute ülesannete täitmisel, vaid tähistab murrangulist sammu ühe üldotstarbelise agendi loomise suunas, et luua agent, mis suudab arutleda, luua ja täita kogu päriselu tehnilise töö spektri ulatuses.
Kuna mudelite võimed aina arenevad, nihkub lõhe sellelt, mida agendid suudavad teha, sellele, kui hõlpsasti inimesed saavad nendega suhelda, neid suunata ja jälgida, kui paljud neist töötavad paralleelselt. Rakendus Codex muudab agentide haldamise ja juhtimise palju lihtsamaks ning nüüd on see GPT‑5.3‑Codex'iga interaktiivsem. Uue mudeliga pakub Codex sagedasi värskendusi, et oleksid kursis peamiste otsuste ja edusammudega samal ajal, kui see töötab. Selle asemel, et oodata lõplikku väljundit, saad suhelda reaalajas—küsi küsimusi, aruta lähenemisviise ja suuna lahenduse poole. GPT‑5.3‑Codex seletab, mida see teeb, vastab tagasisidele ja hoiab sind algusest lõpuni kursis.
Luba roolimine, kui mudel töötab rakenduses jaotises Seaded > Üldine > Järeltegevuse käitumine.
Hiljutised kiired Codex'i täiustused tuginevad selliste uurimisprojektide tulemustele, millega on kogu OpenAI-s kuid või aastaid tegeletud. Codex kiirendab neid uurimisprojekte ning paljud OpenAI teadlased ja insenerid kirjeldavad oma tänast tööd kui põhimõtteliselt erinevat sellest, mis see oli vaid kaks kuud tagasi. Isegi GPT‑5.3‑Codex'i varased versioonid näitasid erakordseid võimeid, võimaldades meie meeskonnal töötada nende varasemate versioonidega, et täiustada koolitust ja toetada hilisemate versioonide juurutamist.
Codex on kasulik väga laia valiku ülesannete jaoks, mistõttu on keeruline täielikult loetleda viise, kuidas see meie meeskondi aitab. Näiteks kasutas uurimisrühm Codex'it, et jälgida ja siluda selle versioone katsetust. See kiirendas uurimistöö kaugemale taristu probleemide silumisest: see aitas jälgida mustreid kogu koolituse vältel, pakkus põhjalikku analüüsi interaktsiooni kvaliteedi kohta, pakkus välja parandusi ja ehitas rikkalikke rakendusi, et inimteadlased saaksid täpselt mõista, kuidas mudeli käitumine erines varasemate mudelite omast.
Insenerimeeskond kasutas Codex'it, et optimeerida ja kohandada raamistikku GPT‑5.3‑Codex'i jaoks. Kui hakkasime nägema kasutajaid mõjutavaid kummalisi erijuhtumeid, kasutasid meeskonnaliikmed Codex'it, et tuvastada konteksti renderdamise vead ja leida vahemälu madala tabamismäära algpõhjus. GPT‑5.3‑Codex jätkab meeskonna abistamist kogu käivituse vältel, skaleerides dünaamiliselt GPU klastreid, et kohanduda liikluspiikidega ja hoida latentsus stabiilsena.
Alfatestimise ajal soovis üks uurija mõista, kui palju lisatööd GPT‑5.3‑Codex iga käigu kohta ära tegi ja milline oli sellega seotud tootlikkuse erinevus. GPT‑5.3‑Codex töötas välja mitu lihtsat regex-klassifikaatorit, et hinnata täpsustuste sagedust, positiivseid ja negatiivseid kasutajate vastuseid, ülesande edenemist, ning seejärel käivitas need skaleeritavalt kõigi sessioonilogide peal ja koostas aruande koos järeldustega. Codex'iga ehitanud inimesed olid õnnelikumad, kuna agent mõistis paremini nende kavatsusi ja tegi iga vooruga rohkem edusamme, esitades vähem täpsustavaid küsimusi.
Kuna GPT‑5.3‑Codex erineb oma eelkäijatest nii palju, näitasid alfatestimise andmed arvukalt ebatavalisi ja mitteintuitiivseid tulemusi. Meeskonna andmeteadlane töötas GPT‑5.3‑Codex'iga, et luua uusi andmetorustikke ja visualiseerida tulemusi palju rikkalikumalt, kui meie standardsed armatuurlaua tööriistad võimaldasid. Tulemusi analüüsiti koos Codex'iga, mis tegi tuhandete andmepunktide põhjal kokkuvõtte peamistest järeldustest vähem kui kolme minutiga.
Eraldivõetuna on kõik need ülesanded huvitavad näited sellest, kuidas Codex saab aidata teadlasi ja tootearendajaid. Kokkuvõttes leidsime, et need uued võimalused kiirendasid märkimisväärselt meie uurimis-, inseneri- ja tootemeeskondade tööd.
Viimastel kuudel oleme täheldanud märkimisväärseid edusamme mudelite küberturvalisuse ülesannete täitmisega seotud jõudluses, see toob kasu nii arendajatele kui ka turbespetsialistidele. Paralleelselt oleme valmistanud ette tugevdatud küberkaitsemeetmeid, et toetada kaitseotstarbelist kasutust ja ökosüsteemi laiemat vastupidavust.
GPT‑5.3‑Codex on esimene mudel, mille liigitame, kui kõrge võimekusega küberturvalisusega seotud ülesannete täitmisel meie valmisoleku raamistikus, see on ka esimene mudel, mida oleme otseselt treeninud tarkvarahaavatavuste tuvastamiseks. Kuigi meil ei ole lõplikke tõendeid selle kohta, et see suudaks automatiseerida otsast otsani küberrünnakuid, rakendame ettevaatusabinõusid ja juurutame seni kõige põhjalikuma küberturvalisuse ohutuspaketi. Meie leevendusmeetmed hõlmavad ohutuskoolitust, automatiseeritud seiret, usaldusväärset juurdepääsu arenenud võimekustele ning jõustamismehhanisme, sealhulgas ohuluuret.
Kuna küberturvalisus on olemuselt topeltkasutusega valdkond, rakendame tõenduspõhist ja iteratiivset lähenemist, mis kiirendab kaitsjate võimet leida ja parandada haavatavusi, kuid samal ajal aeglustada väärkasutust. Selle osana käivitame Trusted Access for Cyber'i, see on pilootprogramm küberkaitse uuringute kiirendamiseks.
Investeerime ökosüsteemi kaitsemeetmetesse, näiteks laiendame oma turvauuringute agendi Aardvark privaatse beetaversiooni, kui meie esimese Codex Security toodete ja tööriistade komplekti pakkumist, ning teeme koostööd avatud lähtekoodiga hooldusteenuse pakkujatega, et pakkuda tasuta koodibaasi skaneerimist laialdaselt kasutatavatele projektidele, nagu Next.js—kus üks turvauurija kasutas Codex'it selliste haavatavuste leidmiseks, mis avalikustati(avaneb uues aknas) eelmisel nädalal.
Tuginedes meie 2023. aastal käivitatud 1 miljoni USD väärtuselisele küberturvalisuse toetusprogrammile, kohustume eraldama ka 10 miljonit USD API krediite, et kiirendada küberkaitset meie kõige võimekamate mudelite abil, eriti avatud lähtekoodiga tarkvara ja kriitilise taristu süsteemide jaoks. Heas usus turvauuringutega tegelevad organisatsioonid saavad taotleda API krediite ja tuge meie Cybersecurity Grant Progaram'i kaudu.
GPT‑5.3‑Codex on saadaval tasuliste ChatGPT plaanidega kõikjal, kus saad Codex'it kasutada: rakenduses, CLI-s, IDE-laienduses ja veebis. Töötame selle nimel, et peagi turvaliselt võimaldada juurdepääsu API-le.
Selle värskendusega käivitame nüüd ka GPT‑5.3‑Codexi. Codex'i kasutajate jaoks 25% kiirem tänu meie taristu ja järelduspinu täiustustele, mis toovad kaasa kiiremad interaktsioonid ja kiiremad tulemused.
GPT‑5.3‑Codex oli kaasdisainitud, treenitud ja käitatud NVIDIA GB200 NVL72 süsteemidel. Me oleme tänulikud NVIDIA-le nende partnerluse eest.
Koos GPT‑5.3‑Codex'iga, Codex liigub koodi kirjutamisest kaugemale, kasutades seda tööriistana arvuti juhtimiseks ja töö algusest lõpuni ärategemiseks. Nihutades piire, mida kodeerimisagent suudab teha, avame ka laiema klassi teadmistepõhist tööd – alates tarkvara loomisest ja juurutamisest kuni uurimise, analüüsimise ja keerukate ülesannete täitmiseni. See, mis algas keskendumisena, et olla parim kodeerimisagent, on saanud aluseks üldisemale koostööpartnerile arvutis, laiendades nii seda, kes saab ehitada, kui ka seda, mis on Codex'iga võimalik.
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (avalik) | 56,8% | 56,4% | 55,6% |
Terminal-Bench 2.0 | 77,3% | 64,0% | 62,2% |
OSWorld-Verified | 64,7% | 38,2% | 37,9% |
GDPval (võidud või viigid) | 70,9% | - | 70,9% (kõrge) |
Küberturvalisuse Capture-The-Flag ülesanded | 77,6% | 67,4% | 67,7% |
SWE-lancer IC Diamond | 81,4% | 76.0% | 74,6% |


