Esittelemme uuden mallin, joka avaa entistä enemmän Codexin mahdollisuuksia: GPT‑5.3‑Codex, tähän mennessä kyvykkäin agenttikoodausmalli. Malli parantaa sekä GPT‑5.2‑Codexin edistynyttä koodauskykyä että GPT‑5.2:n päättely- ja ammatillista tietämystä yhdessä mallissa, joka on myös 25 % nopeampi. Näin se voi suorittaa pitkäkestoisia tehtäviä, jotka sisältävät tutkimusta, työkalujen käyttöä ja monimutkaista toteutusta. Aivan kuten kollegan kanssa, voit ohjata ja olla vuorovaikutuksessa GPT‑5.3‑Codexin kanssa samalla, kun se työskentelee, kontekstia menettämättä.
GPT‑5.3‑Codex on ensimmäinen mallimme, jolla oli keskeinen rooli itsensä luomisessa. Codex-tiimi käytti varhaisia versioita oman koulutuksensa virheenkorjaukseen, käyttöönoton hallintaan ja testitulosten sekä arviointien diagnosointiin—tiimimme hämmästyi sitä, kuinka paljon Codex pystyi nopeuttamaan kehitystään.
GPT‑5.3‑Codexin avulla Codex muuttuu agentista, joka voi kirjoittaa ja tarkistaa koodia, agentiksi, joka voi tehdä lähes mitä tahansa, mitä kehittäjät ja ammattilaiset voivat tehdä tietokoneella.
GPT‑5.3‑Codex saavuttaa alan uuden huipputason SWE-Bench Pro:ssa ja Terminal-Benchissä, ja osoittaa vahvaa suorituskykyä OSWorldissa ja GDPvalissa, neljässä vertailuarvossa, joita käytämme koodaus-, agenttipohjaisten ja todellisen maailman kyvykkyyksien mittaamiseen.
GPT‑5.3‑Codex saavuttaa huipputason suorituskyvyn SWE-Bench Pro -testissä, joka on tiukka arvio todellisesta ohjelmistokehityksestä. Siinä missä SWE‑bench Verified testaa vain Pythonia, SWE‑Bench Pro kattaa neljä kieltä ja on vastustuskykyisempi saastumiselle, haastavampi, monipuolisempi ja teollisesti merkityksellisempi. Se ylittää myös huomattavasti aiemman huipputason suorituskyvyn Terminal-Bench 2.0:ssa, joka mittaa Codexin kaltaisen koodausagentin tarvitsemia terminaalitaitoja. Huomionarvoisesti, GPT‑5.3‑Codex tekee sen vähemmillä tokeneilla kuin mikään aiempi malli, jolloin käyttäjät voivat rakentaa enemmän.
Edistyneiden koodausominaisuuksien, esteettisten parannusten ja tiivistyksen yhdistäminen johtaa malliin, joka voi tehdä vaikuttavaa työtä ja rakentaa erittäin toimivia ja monimutkaisia pelejä ja sovelluksia tyhjästä muutamassa päivässä. Testataksemme mallin verkkokehityksen ja pitkäkestoisia agenttimaisia kyvykkyyksiä, pyysimme GPT‑5.3‑Codexia rakentamaan meille kaksi peliä: toisen version kilpa-ajopelistä Codex-sovelluksen julkaisusta ja sukelluspelin. Käyttämällä develop web game -taitoa ja ennalta valittuja, yleisiä kehotteita kuten ”korjaa bugi” tai ”paranna peliä”, GPT‑5.3‑Codex kehitti pelejä itsenäisesti miljoonien tokenien avulla. Katso trailerit ja pelaa pelejä itse nähdäksesi, mitä Codex voi tehdä.
Kilpa-ajopeli, jossa on erilaisia kilpailijoita, kahdeksan karttaa ja jopa esineitä, joita voi käyttää välilyöntinäppäimellä. Pelaa itse täällä(avautuu uudessa ikkunassa)!
Sukelluspeli, jossa tutkit erilaisia riuttoja, keräät ne kaikki täydentämään kalakoodeksia samalla halliten happea, painetta ja vaaroja. Pelaa itse täällä(avautuu uudessa ikkunassa)!
GPT‑5.3‑Codex ymmärtää tarkoituksesi paremmin, kun pyydät sitä luomaan arkipäiväisiä verkkosivustoja, GPT‑5.2‑Codexiin verrattuna. Yksinkertaiset tai epämääräiset kehotteet ohjautuvat nyt oletuksena sivustoille, joissa on enemmän toimintoja ja järkevät oletusarvot, mikä antaa sinulle vahvemman lähtökohdan ideoidesi toteuttamiseen.
Pyysimme esimerkiksi GPT‑5.3‑Codexia ja GPT‑5.2‑Codexia luomaan kaksi alla olevaa aloitussivua. GPT‑5.3‑Codex näytti automaattisesti vuosipaketin alennettuna kuukausihintana, mikä teki alennuksesta selkeän ja tarkoituksellisen, sen sijaan että vuosisummaa olisi kerrottu. Se loi myös automaattisesti vaihtuvan suosittelukarusellin, jossa oli kolme erillistä käyttäjäsitaattia yhden sijaan, mikä teki sivusta oletusarvoisesti kattavamman ja tuotantokelpoisemman.
Kehote: Luo Quiet KPI:lle aloitussivu, joka on perustajaystävällinen viikoittainen mittarikooste. Estetiikka on pehmeä SaaS: lasimaiset kortit, liukuväri laventelista siniseen, hienovarainen sumennus. Osiot, hero-osio sähköpostin kaappauksella, esimerkkitodistusten ruudukko, integraatiorivi, suosittelukaruselli, hinnoittelun vaihto kuukausittain/vuosittain, UKK, alatunniste.
- Kirjasintyyppi Satoshi tai vastaava geometrinen sans.
- Painikkeissa pehmeät kulmat, 14px säde, vahvat tarkennustilat.
- Lisää yksi tyylikäs vieritykseen perustuva paljastus.
Ohjelmistoinsinöörit, suunnittelijat, tuotepäälliköt ja data-analyytikot tekevät paljon muutakin kuin tuottavat koodia. GPT‑5.3‑Codex on suunniteltu tukemaan kaikkea työtä ohjelmistokehityksen elinkaaren aikana—virheenkorjausta, käyttöönottoa, valvontaa, PRD-tiedostojen kirjoittamista, tekstin muokkausta, käyttäjätutkimusta, testejä, mittareita ja paljon muuta. Sen agenttikyvyt ulottuvat ohjelmistoja pidemmälle ja auttavat sinua luomaan mitä tahansa—oli kyse sitten esitysdioista tai taulukoiden datan analysoinnista.
Mukautettujen taitojen avulla, jotka ovat samanlaisia kuin aiemmissa GDPval-tuloksissamme käytetyt, GPT‑5.3‑Codex osoittaa myös vahvaa suorituskykyä ammatillisessa tietotyössä, kuten GDPval-arvioinnissa mitattuna, ja vastaa GPT‑5.2:n tasoa. GDPval on OpenAI:n vuonna 2025 julkaisema arviointi, joka mittaa mallin suorituskykyä tarkasti määritellyissä tietotyötehtävissä 44 ammatissa. Nämä tehtävät sisältävät esimerkiksi esitysten, laskentataulukoiden ja muiden työtuotteiden luomisen.
Alla on muutamia esimerkkejä agentin tekemästä työstä.
Kehote ja tehtävän konteksti
GPT-5.3-Codex output

OSWorld on agenttipohjainen tietokoneen käytön vertailuarvo, jossa agentin on suoritettava tuottavuustehtäviä visuaalisessa työpöytätietokoneympäristössä. GPT‑5.3‑Codex osoittaa huomattavasti vahvempia tietokoneen käyttövalmiuksia aiempiin GPT‑malleihin verrattuna.
OSWorld-Verified -ohjelmassa mallit käyttävät visuaalista havainnointia suorittaakseen erilaisia tietokonetehtäviä. Ihmiset saavat ~72 % pistemäärän.
Yhdessä nämä tulokset koodauksen, frontendin sekä tietokoneen käytön ja tosielämän tehtävien osalta osoittavat, että GPT‑5.3‑Codex ei ole vain parempi pelkästään yksittäisissä tehtävissä, vaan merkitsee merkittävää muutosta kohti yhtä, yleiskäyttöistä agenttia, joka pystyy päättelemään, rakentamaan ja suorittamaan koko tosielämän teknisen työn kirjon.
Mallien suorituskyvyn kasvaessa kuilu siirtyy siitä, mitä agentit pystyvät tekemään, siihen, kuinka helposti ihmiset voivat olla vuorovaikutuksessa monien rinnakkain työskentelevien agenttien kanssa, ohjata ja valvoa niitä. Codex-sovellus helpottaa agenttien hallintaa ja ohjausta huomattavasti, ja nyt GPT‑5.3‑Codexin avulla se on vuorovaikutteisempi. Uuden mallin myötä Codex tarjoaa säännöllisiä päivityksiä, jotta pysyt ajan tasalla keskeisistä päätöksistä ja edistymisestä sen työskennellessä. Sen sijaan, että odottaisit lopullista tulosta, voit olla vuorovaikutuksessa reaaliajassa—esittää kysymyksiä, keskustella lähestymistavoista ja ohjata kohti ratkaisua. GPT‑5.3‑Codex kertoo, mitä se tekee, vastaa palautteeseen ja pitää sinut ajan tasalla alusta loppuun.
Ota ohjaus käyttöön, kun malli toimii sovelluksessa kohdassa Asetukset > Yleiset > Jatkokäyttäytyminen.
Viimeaikaiset Codexin nopeat parannukset perustuvat tutkimusprojektien saavutuksiin, jotka ovat kestäneet kuukausia tai vuosia koko OpenAI:ssa. Näitä tutkimusprojekteja vauhdittaa Codex, ja monet OpenAI:n tutkijat ja insinöörit kuvaavat työnsä olevan nykyään perustavanlaatuisesti erilaista kuin se oli vain kaksi kuukautta sitten. Jopa GPT‑5.3‑Codexin aikaiset versiot osoittivat poikkeuksellisia kykyjä, minkä ansiosta tiimimme voi työskennellä näiden aiempien versioiden kanssa parantaakseen koulutusta ja tukeakseen myöhempien versioiden käyttöönottoa.
Codex on hyödyllinen hyvin monenlaisissa tehtävissä, joten on vaikea luetella kattavasti kaikki tavat, joilla se auttaa tiimejämme. Esimerkkinä mainittakoon, että tutkimusryhmä käytti Codexia tämän julkaisun koulutusajon seurantaan ja virheiden korjaamiseen. Se nopeutti tutkimusta infrastruktuuriongelmien virheenkorjauksen lisäksi: se auttoi seuraamaan kuvioita koko koulutuksen ajan, tarjosi syvällisen analyysin vuorovaikutuksen laadusta, ehdotti korjauksia ja rakensi monipuolisia sovelluksia, jotta ihmistutkijat pystyivät tarkasti ymmärtämään, miten mallin käyttäytyminen erosi aiemmista malleista.
Insinööriryhmä käytti Codexia valjaiden optimoidakseen ja mukauttaakseen valikoimat GPT‑5.3‑Codexille. Kun aloimme havaita outoja reunatapauksia, jotka vaikuttivat käyttäjiin, tiimin jäsenet käyttivät Codexia tunnistaakseen kontekstin renderöintivirheet ja selvittääkseen alhaisten välimuistiosumaprosenttien perimmäiset syyt. GPT‑5.3‑Codex auttaa tiimiä edelleen julkaisun aikana skaalaamalla dynaamisesti GPU-klustereita liikennepiikkien mukaan ja pitämällä viiveen vakaana.
Alfatestauksen aikana eräs tutkija halusi ymmärtää, kuinka paljon lisätyötä GPT‑5.3‑Codex sai aikaan per vuoro ja mikä oli tuottavuuden ero. GPT‑5.3‑Codex kehitti useita yksinkertaisia regex-luokittelijoita arvioimaan selvennysten esiintymistiheyttä, myönteisiä ja kielteisiä käyttäjävastauksia sekä tehtävän edistymistä, ja ajoi ne sitten skaalautuvasti kaikkien istuntolokien sekä ja laati raportin johtopäätöksineen. Codexia käyttävät ihmiset olivat tyytyväisempiä, koska agentti ymmärsi paremmin heidän aikomuksensa ja edistyi enemmän jokaisella vuorolla, ja tarkentavia kysymyksiä tarvittiin vähemmän.
Koska GPT‑5.3‑Codex eroaa merkittävästi edeltäjistään, alfa-testien tulokset osoittivat useita epätavallisia ja intuition vastaisia havaintoja. Tiimin datatieteilijä työskenteli GPT‑5.3‑Codexin kanssa luodakseen uusia tietoprosesseja ja visualisoidakseen tulokset huomattavasti monipuolisemmin kuin vakiokoontinäyttötyökalumme mahdollistivat. Tulokset analysoitiin yhdessä Codexin kanssa, joka tiivisti keskeiset havainnot tuhansista datapisteistä alle kolmessa minuutissa.
Yksittäin tarkasteltuna kaikki nämä tehtävät ovat kiinnostavia esimerkkejä siitä, miten Codex voi auttaa tutkijoita ja tuotekehittäjiä. Yhdessä tarkasteltuna havaitsimme, että uudet ominaisuudet johtivat tutkimus-, suunnittelu- ja tuotetiimiemme työn merkittävään nopeutumiseen.
Viime kuukausien aikana olemme havainneet merkittäviä parannuksia mallin suorituskyvyssä kyberturvallisuustehtävissä, mikä hyödyttää sekä kehittäjiä että tietoturva-asiantuntijoita. Samanaikaisesti olemme valmistelleet vahvempia kyberturvatoimia tukemaan puolustuksellista käyttöä ja laajemman ekosysteemin kestävyyttä.
GPT‑5.3‑Codex on ensimmäinen malli, jonka luokittelemme korkean kyvykkyyden omaavaksi kyberturvallisuuteen liittyvissä tehtävissä valmiuskehyksemme puitteissa, ja ensimmäinen, jonka olemme suoraan kouluttaneet tunnistamaan ohjelmistojen haavoittuvuuksia. Vaikka meillä ei ole lopullista näyttöä siitä, että se voisi automatisoida kyberhyökkäykset alusta loppuun, noudatamme varotoimiin perustuvaa lähestymistapaa ja otamme käyttöön tähän mennessä kattavimman kyberturvallisuusratkaisumme. Lieventämistoimiimme kuuluvat turvallisuuskoulutus, automaattinen valvonta, luotettu pääsy kehittyneisiin ominaisuuksiin sekä täytäntöönpanoprosessit, joihin sisältyy uhkatiedustelu.
Koska kyberturvallisuus on luonteeltaan kaksoiskäyttöinen, noudatamme näyttöön perustuvaa, iteratiivista lähestymistapaa, joka nopeuttaa puolustajien kykyä löytää ja korjata haavoittuvuuksia samalla väärinkäyttöä hidastaen. Osana tätä käynnistämme Trusted Access for Cyber -pilottiohjelman kyberpuolustustutkimuksen nopeuttamiseksi.
Investoimme ekosysteemin suojatoimiin, kuten laajentamalla tietoturvatutkimusagenttimme Aardvarkin yksityistä beetaa ensimmäisenä tuotteena Codex Security -tuotteiden ja -työkalujen valikoimassamme, sekä tekemällä yhteistyötä avoimen lähdekoodin ylläpitäjien kanssa tarjotaksemme maksutonta koodikannan skannausta laajasti käytetyille projekteille, kuten Next.js:lle—jossa tietoturvatutkija käytti Codexia löytääkseen haavoittuvuuksia, jotka julkistettiin(avautuu uudessa ikkunassa) viime viikolla.
Vuonna 2023 käynnistetyn miljoonan dollarin kyberturvallisuusapurahaohjelman pohjalta myönnämme myös 10 miljoonaa dollaria API-hyvityksiä nopeuttaaksemme kyberpuolustusta kyvykkäimmillä malleillamme, erityisesti avoimen lähdekoodin ohjelmistojen ja kriittisten infrastruktuurijärjestelmien osalta. Vilpittömässä mielessä tietoturvatutkimusta tekevät organisaatiot voivat hakea API-hyvityksiä ja tukea kyberturvallisuusapurahaohjelmamme kautta.
GPT‑5.3‑Codex on saatavilla maksullisilla ChatGPT‑tilauksilla kaikkialla, missä Codexia voi käyttää: sovelluksessa, CLI:ssä, IDE-laajennuksessa ja verkossa. Pyrimme siihen, että voimme pian mahdollistaa API-käyttöoikeuden turvallisesti.
Tämän päivityksen myötä otamme nyt käyttöön myös GPT‑5.3‑Codexin 25 % nopeampana Codex-käyttäjille infrastruktuurin ja päättelypinon parannusten ansiosta, mikä nopeuttaa vuorovaikutusta ja tuloksia.
GPT‑5.3‑Codex suunniteltiin, koulutettiin ja otettiin käyttöön NVIDIA GB200 NVL72 -järjestelmissä. Olemme kiitollisia NVIDIAlle heidän kumppanuudestaan.
GPT‑5.3‑Codexin avulla Codex on siirtymässä koodin kirjoittamisen lisäksi käyttämään sitä välineenä tietokoneen käyttämiseen ja työn loppuun saattamiseen. Laajentamalla koodausagentin mahdollisuuksia avaamme samalla laajemman tietotyön kentän – ohjelmistojen rakentamisesta ja käyttöönotosta tutkimiseen, analysointiin ja monimutkaisten tehtävien suorittamiseen. Alun perin tavoitteena oli olla paras koodausagentti, mutta nyt siitä on muodostunut perusta yleisemmälle yhteistyökumppanille tietokoneella, laajentaen sekä sitä, kuka voi rakentaa, että sitä, mikä on mahdollista Codexin avulla.
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (julkinen) | 56,8 % | 56,4 % | 55,6 % |
Terminal-Bench 2.0 | 77,3 % | 64,0% | 62,2% |
OSWorld-Verified | 64,7% | 38,2 % | 37,9 % |
GDPval (voitot tai tasapelit) | 70,9 % | - | 70,9 % (korkea) |
Kyberturvallisuuden Capture The Flag -haasteet | 77,6 % | 67,4 % | 67,7 % |
SWE-lancer IC Diamond | 81,4 % | 76,0 % | 74,6 % |


