Päivitys 24. huhtikuuta 2026: GPT‑5.5 ja GPT‑5.5 Pro ovat nyt saatavilla API:ssa. Järjestelmäkorttia on myös päivitetty kuvaamaan sovellettavia lisäsuojatoimia.
Julkaisemme GPT‑5.5:n, tähän mennessä älykkäimmän ja intuitiivisimman mallimme, joka on seuraava askel kohti uutta tapaa saada työt tehdyksi tietokoneella.
GPT‑5.5 ymmärtää nopeammin, mitä yrität tehdä, ja pystyy hoitamaan suuremman osan työstä itse. Se on erityisen taitava koodin kirjoittamisessa ja virheiden korjaamisessa, verkossa tapahtuvassa tiedonhaussa, tietojen analysoinnissa, asiakirjojen ja taulukoiden laatimisessa, ohjelmistojen käytössä sekä eri työkalujen välillä siirtymisessä, kunnes tehtävä on suoritettu loppuun. Sen sijaan, että hallitsisit tarkasti jokaista vaihetta, voit antaa GPT‑5.5:lle sekavan, moniosaisen tehtävän ja luottaa siihen, että se suunnittelee, käyttää työkaluja, tarkistaa työnsä, selviytyy epäselvyyksistä ja jatkaa eteenpäin.
Edistyminen on erityisen merkittävää agenttisessa koodauksessa, tietokoneiden käytössä, tietotyössä ja varhaisessa tieteellisessä tutkimuksessa – aloilla, joilla edistyminen riippuu kontekstien välisestä päättelystä ja pitkäjänteisestä toiminnasta. GPT‑5.5 tarjoaa tämän älykkyyden parannuksen nopeudesta tinkimättä: suuremmat ja kyvykkäämmät mallit ovat usein hitaampia palvella, mutta GPT‑5.5 vastaa GPT‑5.4:n token-kohtaista viivettä todellisissa käyttötilanteissa ja suoriutuu samalla huomattavasti korkeammalla älykkyyden tasolla. Se käyttää myös merkittävästi vähemmän tokeneita samojen Codex-tehtävien suorittamiseen, mikä tekee siitä sekä tehokkaamman että suorituskykyisemmän.
Julkaisemme GPT‑5.5:n yhdessä tähän mennessä tehokkaimpien suojatoimenpiteidemme kanssa. Ne on suunniteltu vähentämään väärinkäyttöä ja samalla varmistamaan järjestelmän saatavuus hyödyllisiin tarkoituksiin. We evaluated this model across our full suite of safety and preparedness frameworks, worked with internal and external redteamers, added targeted testing for advanced cybersecurity and biology capabilities, and collected feedback on real use cases from nearly 200 trusted early-access partners before release.
Tänään GPT‑5.5 otetaan käyttöön ChatGPT:ssä ja Codexissa Plus-, Pro-, Business- ja Enterprise-käyttäjille, ja GPT‑5.5 Pro otetaan käyttöön ChatGPT:ssä Pro-, Business- ja Enterprise-käyttäjille. API-käyttöönotot edellyttävät erilaisia suojatoimia, ja teemme tiivistä yhteistyötä kumppaneiden ja asiakkaiden kanssa sen tarjoamiseen laajassa mittakaavassa liittyvien turvallisuus- ja tietoturvavaatimusten parissa. GPT‑5.5 ja GPT‑5.5 Pro ovat saatavilla API:ssa hyvin pian.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82,7 % | 75,1 % | - | - | 69,4 % | 68,5 % |
Expert-SWE (sisäinen) | 73,1 % | 68,5 % | - | - | - | - |
GDPval (voitot tai tasapelit) | 84,9 % | 83,0 % | 82,3 % | 82,0 % | 80,3 % | 67,3 % |
OSWorld-Verified | 78,7 % | 75,0 % | - | - | 78,0 % | - |
Toolathlon | 55,6 % | 54,6 % | - | - | - | 48,8 % |
BrowseComp | 84,4 % | 82,7 % | 90,1 % | 89,3 % | 79,3 % | 85,9 % |
FrontierMath Taso 1–3 | 51,7 % | 47,6 % | 52,4% | 50,0 % | 43,8 % | 36,9 % |
FrontierMath Taso 4 | 35,4 % | 27,1 % | 39,6 % | 38,0 % | 22,9 % | 16,7 % |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
OpenAI rakentaa agenttisen tekoälyn maailmanlaajuista infrastruktuuria, jonka avulla ihmiset ja yritykset ympäri maailmaa voivat hyödyntää tekoälyä työssään. Viimeisen vuoden aikana olemme nähneet tekoälyn nopeuttavan merkittävästi ohjelmistokehitystä. GPT‑5.5:n myötä Codexissa ja ChatGPT:ssä tuo sama muutos alkaa ulottua tieteelliseen tutkimukseen ja yleisesti tietokoneilla tehtävään työhön.
Näillä osa-alueilla GPT‑5.5 ei ole vain älykkäämpi, vaan myös tehokkaampi ongelmien ratkaisemisessa ja saavuttaa usein laadukkaampia tuloksia vähemmillä token ja harvemmilla uudelleenyrityksillä. Artificial Analysisin Coding Indexissä GPT‑5.5 tarjoaa huippuluokan älykkyyttä puoleen hintaan verrattuna kilpaileviin edistyneisiin koodausmalleihin.
Artificial Analysis Intelligence Index(avautuu uudessa ikkunassa) on 10 ulkopuolisen tahon suorittaman evaluaation painotettu keskiarvo: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 on tähän mennessä vahvin agenttinen malli. Terminal-Bench 2.0:ssa, joka testaa monimutkaisia komentorivityönkulkuja, jotka edellyttävät suunnittelua, iterointia ja työkalujen koordinointia, se saavuttaa huipputason 82,7 %:n tarkkuuden. SWE-Bench Pro-testissä, joka arvioi todellisten GitHub-ongelmien ratkaisemista, se saavuttaa 58,6 % ja ratkaisee yhdellä ajolla päästä päähän enemmän tehtäviä kuin aiemmat mallit. Expert-SWE-testissä, joka on sisäinen vertailuarvomme pitkän aikavälin koodaustehtäville ja jossa ihmisen suoritusaikaksi on arvioitu keskimäärin 20 tuntia, GPT‑5.5 suoriutuu myös paremmin kuin GPT‑5.4.
Kaikissa kolmessa arvioinnissa GPT‑5.5 parantaa GPT‑5.4:n pistemääriä käyttäen vähemmän tokeneja.
Mallin koodaukseen liittyvät vahvuudet näkyvät erityisen selvästi Codexissa, jossa se voi hoitaa suunnittelutyötä toteutuksesta ja refaktoroinneista virheenkorjaukseen, testaukseen ja validointiin. Alustavien testien perusteella GPT‑5.5 suoriutuu paremmin niistä toiminnoista, joihin todellinen insinöörityö perustuu, kuten kontekstin hallitsemisesta laajoissa järjestelmissä, epäselvien vikojen analysoinnista, oletusten tarkistamisesta työkaluilla sekä muutosten viemisestä läpi ympäröivään koodipohjaan.
Hahmotettu lentorata käyttää NASA/JPL Horizons -vektoridataa Orionista, Kuusta ja Auringosta, ja näkymän mittakaavaa on säädetty luettavuuden parantamiseksi.
Kehote: [liitetty kuva] Toteuta tämä uutena sovelluksena käyttäen WebGL:ää ja Viteä sekä Artemis II -mission oikeaa dataa. Varmista, että testaat sovelluksen huolellisesti, kunnes se toimii täysin ja näyttää samalta kuin kuvassa oleva sovellus. Kiinnitä erityistä huomiota planeettojen ja lentoratojen renderöintiin. Haluan pystyä vuorovaikutukseen 3D-mallinnuksen kanssa. Varmista, että siinä on realistinen ratamekaniikka.
Vertailuarvojen lisäksi varhaiset testaajat sanoivat, että GPT‑5.5 osoittaa aiempaa vahvempaa kykyä hahmottaa järjestelmän kokonaisuutta: miksi jokin epäonnistuu, mihin korjauksen on kohdistuttava ja mihin muuhun koodikannassa se vaikuttaisi.

”Ensimmäinen käyttämäni koodausmalli, jolla on todella selkeä käsitteellinen ymmärrys.”
Dan Shipper, Everyn perustaja ja toimitusjohtaja, kuvaili GPT‑5.5:tä seuraavasti: ”Se on ensimmäinen käyttämäni koodausmalli, jolla on poikkeuksellisen selkeä käsitteellinen ymmärrys.”
Sovelluksen julkaisemisen jälkeen hän käytti päiviä julkaisun jälkeisen ongelman selvittämiseen, ennen kuin otti mukaan yhden parhaista insinööreistään kirjoittamaan osan järjestelmästä uudelleen. Testatakseen GPT‑5.5:tä hän ikään kuin käänsi kelloa taaksepäin: pystyikö malli tarkastelemaan rikkinäistä tilaa ja tuottamaan samankaltaisen uudelleenkirjoituksen, johon insinööri lopulta päätyi? GPT‑5.4 ei pystynyt siihen. GPT‑5.5 pystyi.

”Tuntuu aidosti siltä, että työskentelen korkeamman älykkyyden kanssa, ja siinä on melkein tietynlaista kunnioitusta.”
Pietro Schirano, MagicPathin toimitusjohtaja, näki samanlaisen merkittävän muutoksen, kun GPT‑5.5 yhdisti haaran, jossa oli satoja käyttöliittymän ja koodin uudelleenkirjoittamiseen liittyviä muutoksia, päähaaraan, joka oli myös muuttunut huomattavasti, ja sai työn valmiiksi yhdellä kertaa noin 20 minuutissa.
Mallia testanneet kokeneet insinöörit totesivat, että GPT‑5.5 oli päättelykyvyssä ja autonomisuudessa huomattavasti vahvempi kuin GPT‑5.4 ja Claude Opus 4.7. Se havaitsi ongelmia etukäteen ja ennakoi testaus- ja arviointitarpeet ilman erillistä kehotusta. Eräässä tapauksessa insinööri pyysi sitä uudelleen suunnittelemaan kommenttijärjestelmän yhteistyöhön tarkoitetussa markdown-editorissa ja palasi lähes valmiiseen 12-diffin pinoon. Toiset totesivat tarvitsevansa yllättävän vähän toteutuksen korjauksia ja luottivat enemmän GPT‑5.5:n suunnitelmiin verrattuna GPT‑5.4:ään.
Eräs NVIDIAn insinööri, joka pääsi tutustumaan malliin jo varhaisessa vaiheessa, meni jopa niin pitkälle, että sanoi: "GPT‑5.5:n käytön menettäminen tuntuu kuin minulta olisi amputoitu raaja."
“GPT-5.5 on huomattavasti älykkäämpi ja sinnikkäämpi kuin GPT-5.4, paremmalla koodaussuorituskyvyllä ja luotettavammalla työkalujen käytöllä. ”Se pysyy tehtävän parissa huomattavasti pidempään keskeyttämättä sitä ennenaikaisesti, mikä on tärkeintä juuri niissä monimutkaisissa ja pitkäkestoisissa töissä, joita käyttäjämme antavat Cursorin hoidettavaksi.”
Samat vahvuudet, jotka tekevät GPT‑5.5:stä erinomaisen koodaamisessa, tekevät siitä myös tehokkaan jokapäiväisessä tietokonetyössä. Koska malli pystyy tulkitsemaan käyttäjän aikomuksia paremmin, se voi edetä luontevammin koko tietotyön ketjussa: etsiä tietoa, ymmärtää, millä on merkitystä, käyttää työkaluja, tarkistaa tuotoksen ja muokata raaka-aineet joksikin hyödylliseksi.
Codexissa GPT‑5.5 on GPT‑5.4:ää parempi asiakirjojen, laskentataulukoiden ja diaesitysten luomisessa. Alfatestaajat sanoivat sen suoriutuneen aiempia malleja paremmin tehtävissä, kuten operaatiotutkimuksessa, laskentataulukkomallinnuksessa ja sekavien liiketoimintatietojen muuntamisessa suunnitelmiksi. Yhdistettynä Codexin tietokonetaitoihin GPT‑5.5 tuo meidät lähemmäksi tunnetta, että malli todella osaa käyttää tietokonetta yhdessä käyttäjän kanssa: se näkee, mitä näytöllä näkyy, napsauttaa, kirjoittaa, liikkuu käyttöliittymissä ja siirtyy työkalusta toiseen tarkasti.
OpenAI:n tiimit hyödyntävät näitä vahvuuksia jo käytännön työssä. Tällä hetkellä yli 85 % yrityksen henkilöstöstä käyttää Codexia viikoittain eri toiminnoissa, kuten ohjelmistokehityksessä, taloushallinnossa, viestinnässä, markkinoinnissa, datatieteessä ja tuotehallinnassa. Viestinnän osastolla tiimi käytti Codex-alustan GPT‑5.5‑mallia kuuden kuukauden puhepyyntötietojen analysointiin, pisteytys- ja riskiluokitusmallin luomiseen sekä automatisoidun Slack-botin testaamiseen, jotta matalan riskin pyynnöt voitaisiin käsitellä automaattisesti, kun taas korkeamman riskin pyynnöt ohjattaisiin edelleen ihmisen tarkastettavaksi. Taloushallinnon tiimi käytti Codexia tarkastamaan 24 771 K-1-verolomakkeita (yhteensä 71 637 sivua) työnkulussa, jossa henkilötiedot oli rajattu pois. Tämä auttoi tiimiä nopeuttamaan tehtävän suorittamista kahdella viikolla edellisvuoteen verrattuna. Markkinoille saattamisen tiimissä työntekijä automatisoi viikoittaisten liiketoimintaraporttien laatimisen, mikä säästi 5–10 tuntia viikossa.
ChatGPT:ssä GPT‑5.5 Thinking tarjoaa nopeammin apua vaikeampiin ongelmiin älykkäämpien ja ytimekkäämpien vastausten avulla, jotta voit edetä monimutkaisissa työtehtävissä tehokkaammin. Se on erinomainen ammattilaistyössä, kuten koodauksessa, tutkimuksessa, tiedon synteesissä ja analyysissä sekä asiakirjapainotteisissa tehtävissä, etenkin lisäosia käytettäessä.
GPT‑5.5 Prossa varhaiset testaajat huomaavat merkittävän parannuksen sekä tehtävien vaativuudessa että laadussa, joita ChatGPT voi suorittaa. Viiveen väheneminen tekee siitä huomattavasti käytännöllisemmän vaativiin tehtäviin. GPT‑5.4 Prohon verrattuna testaajat huomasivat, että GPT‑5.5 Pron vastaukset ovat huomattavasti kattavampia, jäsennellympiä, tarkempia, osuvampia ja hyödyllisempiä. Sen suorituskyky on erityisen vahva liiketoiminnan, juridiikan, koulutuksen ja datatieteen aloilla.
GPT‑5.5 saavuttaa huipputason suorituskyvyn useilla vertailuarvoilla, jotka heijastavat tämäntyyppistä työtä. GDPval-arvioinnissa, joka testaa agenttien kykyä tuottaa tarkasti määriteltyä tietotyötä 44 ammatissa, GPT‑5.5 saavuttaa tuloksen 84,9 %. OSWorld-Verified-vertailussa, joka mittaa, pystyykö malli toimimaan oikeissa tietokoneympäristöissä itsenäisesti, se saavuttaa 78,7 %. Ja Tau2-bench Telecomissa, joka testaa monimutkaisia asiakaspalvelutyönkulkuja, se saavuttaa 98,0 % ilman kehotteen hienosäätöä. GPT‑5.5 suoriutuu vahvasti myös muissa tietotyön vertailutesteissä: 60,0 % FinanceAgentissa, 88,5 % sisäisissä investointipankkitoiminnan mallinnustehtävissä ja 54,1 % OfficeQA Prossa.
Tau2-bench Telecom suoritettiin ilman kehotteen hienosäätöä (ja GPT‑4.1:tä käyttäjämallina). GPT‑5.5 ymmärtää tehtävän tarkoituksen paremmin ja on token-tehokkaampi kuin sen edeltäjät.
GPT-5.5 tarjoaa suorituspainotteiseen työhön tarvittavaa kestävää suorituskykyä. Malli, joka on rakennettu ja otettu käyttöön NVIDIA GB200 NVL72 -järjestelmillä, antaa tiimeillemme mahdollisuuden tuottaa kokonaisvaltaisia ominaisuuksia luonnollisen kielen ohjeiden pohjalta, lyhentää vianetsintää päivistä tunteihin ja muuttaa viikkojen kokeilut monimutkaisissa koodikannoissa yön yli tapahtuvaksi edistymiseksi. Kyse ei ole vain nopeammasta koodaamisesta – vaan uudesta tavasta työskennellä, joka auttaa ihmisiä toimimaan täysin uudella nopeudella.
GPT‑5.5 osoittaa parannuksia myös tieteellisissä ja teknisissä tutkimustyönkuluissa, jotka vaativat enemmän kuin vain vaikeaan kysymykseen vastaamista. Tutkijoiden täytyy tutkia ideaa, kerätä näyttöä, testata oletuksia, tulkita tuloksia ja päättää, mitä kokeilla seuraavaksi. GPT‑5.5 onnistuu pysymään siinä silmukassa paremmin kuin muut mallit.
Erityisesti GPT‑5.5 osoittaa selkeän parannuksen GPT‑5.4:ään verrattuna GeneBenchissä(avautuu uudessa ikkunassa), uudessa arvioinnissa, joka keskittyy monivaiheiseen tieteellisen datan analyysiin genetiikassa ja kvantitatiivisessa biologiassa. Nämä ongelmat edellyttävät malleilta kykyä päätellä mahdollisesti epäselvästä tai virheellisestä datasta vähäisellä ohjauksella, käsitellä realistisia esteitä, kuten piileviä sekoittavia tekijöitä tai laadunvalvonnan epäonnistumisia, sekä soveltaa ja tulkita nykyaikaisia tilastollisia menetelmiä oikein. Mallin suorituskyky on vaikuttava, kun otetaan huomioon, että tässä esitetyt tehtävät vastaavat usein tieteellisten asiantuntijoiden monipäiväisiä projekteja.
Samoin BixBenchissä(avautuu uudessa ikkunassa), tosielämän bioinformatiikkaan ja data-analyysiin perustuvassa vertailutestissä, GPT‑5.5 saavutti johtavan suorituskyvyn niiden mallien joukossa, joiden tulokset on julkaistu. Mallin tieteelliset kyvykkyydet ovat nyt riittävän vahvat nopeuttamaan merkittävästi edistystä biolääketieteellisen tutkimuksen edistyneimmillä alueilla todellisena kanssatutkijana.
Toisessa esimerkissä GPT‑5.5:n sisäinen versio auttoi mukautetun testikehyksen avulla löytämään uuden todisteen(avautuu uudessa ikkunassa) Ramseyn luvuista, jotka ovat yksi kombinatoriikan keskeisistä tutkimuskohteista. Kombinatoriikka tutkii, miten diskreetit objektit liittyvät toisiinsa: graafit, verkot, joukot ja kuviot. Ramseyn luvut kysyvät karkeasti ottaen, kuinka suuri verkon pitää olla, ennen kuin jonkinlaisen järjestyksen ilmestyminen on väistämätöntä. Tulokset tällä alueella ovat harvinaisia ja usein teknisesti vaikeita. Tässä GPT‑5.5 löysi todistuksen pitkään tunnetulle asymptoottiselle tulokselle epädiagonaalisista Ramseyn luvuista, joka myöhemmin varmennettiin Leanissa. Tulos on konkreettinen esimerkki siitä, miten GPT‑5.5 osallistuu ei vain koodin tai selityksen tuottamiseen, vaan myös yllättävän ja hyödyllisen matemaattisen argumentin esittämiseen keskeisellä tutkimusalalla.
Varhaiset testaajat käyttivät ChatGPT:n GPT‑5.5 Pro -mallia pikemminkin tutkimuskumppanina kuin kertaluonteisena vastausmoottorina: he arvioivat käsikirjoituksia useaan kertaan, testasivat teknisiä perusteluja äärirajoilla, ehdottivat analyyseja ja työskentelivät koodin, muistiinpanojen ja PDF-tiedostojen kanssa. Yhteistä on se, että GPT‑5.5 auttaa tutkijoita etenemään kysymyksestä kokeeseen ja siitä tuloksiin paremmin.
Derya Unutmaz, Jacksonin genomilääketieteen laboratoriossa työskentelevä immunologian professori ja tutkija, käytti GPT‑5.5 Prota analysoidakseen geeniekspressiodataa sisältävää aineistoa, jossa oli 62 näytettä ja lähes 28 000 geeniä. Tuloksena syntyi yksityiskohtainen tutkimusraportti, jossa paitsi tiivistettiin havainnot, myös tuotiin esiin keskeisiä kysymyksiä ja oivalluksia – työ, jonka suorittaminen olisi hänen mukaansa vienyt hänen tiimiltään kuukausia.
Bartosz Naskręcki, Puolan Poznańissa sijaitsevan Adam Mickiewiczin yliopiston matematiikan apulaisprofessori, rakensi Codexissa GPT‑5.5:n avulla algebrallisen geometrian sovelluksen yhdestä kehotteesta 11 minuutissa. Sovellus visualisoi toisen asteen pintojen leikkauksen ja muunsi syntyvän käyrän Weierstrassin malliksi.
Myöhemmin hän laajensi sovellusta lisäämällä siihen vakaamman singulaarisuuksien visualisoinnin sekä tarkat kertoimet, joita voidaan käyttää uudelleen myöhemmissä töissä. Hänen mielestään merkittävämpi muutos on se, että Codexin avulla voidaan nyt toteuttaa räätälöityjä matemaattisen visualisoinnin ja tietokonealgebran työnkulkuja, joihin aiemmin tarvittiin erillisiä työkaluja. Nämä esimerkit yhdessä osoittavat, että GPT‑5.5 muuttaa asiantuntijoiden tavoitteet toimiviksi tutkimustyökaluiksi ja analyyseiksi.

Tekijä: Bartosz Naskręcki(avautuu uudessa ikkunassa)
Kehote: # Algebrallisen geometrian pintojen leikkaus
Tee sovellus, joka piirtää kaksi toisen asteen pintaa ja värittää leikkauskäyrän punaiseksi. Käytä laskennallista Riemann–Rochin lausetta muuntaaksesi tämän Weierstrassin käyräksi.
## Pääikkuna
Kaksi sävytettyä pintaa, joissa on hieman läpikuultava varjostus, ja korkealaatuinen teksturointi leikkaavat toisensa punaisen värisen algebraisen käyrän kohdalla
Kierto hiirellä molempiin suuntiin, täysi nipistyszoomaus, haptinen painallus pienen valikon avaamiseksi, jossa on liukusäätimet kunkin pinnan kertoimien muuttamiseen; tunnistus Z-puskurin tason avulla
## Oikeanpuoleinen ikkuna
Lyhyt Weierstrassin yhtälö (Q:n tai kvadratisen kentän laajennuksen yli) lasketaan lennossa tehokkaiden Riemann–Rochin lauseen kaavojen avulla
## Ambient-tila, jossa kaikki ohjaimet on piilotettu ja käyttäjä voi ihailla muotojen kauneutta
## Tekniset tiedot
Sovellus toimii selaimessa, kevyt toteutus, uusimpia full stack -kirjastoja hyödyntävä, siirrettävä ja käyttöönotettavissa
## Asiakirjat
Git-varasto, päiväkirja, suunnitelma (Markdown-tiedostot)
”On uskomattoman innostavaa käyttää OpenAI:n uutta GPT-5.5-mallia testiympäristössämme, saada sen tekemään päätelmiä massiivisista biokemiallisista tietoaineistoista ihmisten lääkkeiden vaikutusten ennustamiseksi ja nähdä sitten, kuinka se tuottaa merkittäviä tarkkuusparannuksia vaativimmissa lääkekehityksen arvioinneissamme. Jos OpenAI jatkaa samaan malliin, lääkekehityksen perusteet muuttuvat vuoden loppuun mennessä.”
GPT‑5.5:n tarjoaminen GPT‑5.4:n viiveellä vaati päättelyn uudelleensuunnittelua integroituna järjestelmänä, ei erillisten optimointien joukkona. GPT‑5.5 suunniteltiin, koulutettiin ja otettiin käyttöön NVIDIA GB200- ja GB300 NVL72 -järjestelmissä. Codex ja GPT‑5.5 olivat keskeisessä roolissa suorituskykytavoitteidemme saavuttamisessa. Codex auttoi tiimiä etenemään nopeammin ideasta vertailukelpoiseen toteutukseen: se hahmotteli lähestymistapoja, järjesti kokeiluja ja auttoi tunnistamaan, mihin optimointeihin kannatti panostaa enemmän. GPT‑5.5 auttoi löytämään ja toteuttamaan keskeisiä parannuksia itse järjestelmäpinossa. Yksinkertaisesti sanottuna malli auttoi parantamaan infrastruktuuria, joka sitä palvelee.
Yksi tällainen parannus oli kuormituksen tasapainottamiseen ja osiointiin liittyvät heuristiikat. Ennen GPT‑5.5:n käyttöönottoa jaoimme kiihdyttimelle lähetetyt pyynnöt kiinteään määrään osia, jotta työ jakautuisi tasaisesti laskentaytimien kesken ja varmistettaisiin, että sekä suuret että pienet pyynnöt voisivat suorittaa samalla GPU:lla. Ennalta määritelty staattisten lohkojen määrä ei kuitenkaan ole optimaalinen kaikentyyppiselle liikenteelle. GPU:iden hyödyntämisen tehostamiseksi Codex analysoi useiden viikkojen tuotantoliikenteen kuvioita ja kehitti räätälöityjä heuristisia algoritmeja työn optimaaliseen jakamiseen ja tasapainottamiseen. Toimenpiteellä oli huomattava vaikutus, sillä se nopeutti tokenien luomista yli 20 %.
Maailman valmisteleminen malleille, jotka ovat erittäin tehokkaita tietoturva-aukkojen havaitsemisessa ja korjaamisessa, on tiimityötä, joka edellyttää koko ekosysteemin sitoutumista kestävyyden rakentamiseen. Tähän tarvitaan mallien yleistä saatavuutta ja iteratiivista käyttöönottoa kyberpuolustuksen seuraavaa aikakautta varten.
Edistyneet mallit kehittyvät yhä kyvykkäämmiksi kyberturvallisuuden alalla. Nämä valmiudet tulevat yleistymään, ja uskomme, että paras tapa edetä on varmistaa, että niitä voidaan hyödyntää kyberpuolustuksen tehostamiseen ja ekosysteemin vahvistamiseen.
GPT‑5.5 on pieni mutta merkittävä askel kohti tekoälyä, joka pystyy ratkaisemaan joitakin maailman vaikeimmista haasteista, kuten kyberturvallisuuden. Joulukuussa julkaistun GPT‑5.2:n yhteydessä otimme ennakoivasti käyttöön tarvittavat kyberturvallisuustoimenpiteet rajoittaaksemme malleihimme kohdistuvaa mahdollista väärinkäyttöä. Nyt GPT‑5.5:n myötä otamme käyttöön tiukempia luokittelualgoritmeja mahdollisten kyberriskien torjumiseksi, mikä saattaa aluksi ärsyttää joitakin käyttäjiä, kun hienosäädämme niitä ajan myötä.
Olemme tunnistaneet kyberturvallisuuden yhdeksi kategoriaksi valmiuskehyksessämme(avautuu uudessa ikkunassa) jo vuosien ajan, kun mallimme ovat parantuneet asteittain. Samalla kehitämme ja kalibroimme lieventäviä toimenpiteitä vaiheittain, jotta voimme julkaista vastuullisesti malleja, joilla on merkittäviä kyberturvallisuusominaisuuksia.
- Otamme käyttöön alan johtavia suojatoimia tämän tason kyberkyvykkyyksille. Otimme ensimmäisen kerran käyttöön kyberturvallisuuteen liittyvät suojatoimet GPT‑5.2(avautuu uudessa ikkunassa):n myötä viime vuonna, ja olemme jatkaneet niiden testaamista, hiomista ja kehittämistä myöhemmissä versioissa. GPT‑5.5:tä varten suunnittelimme tiukemmat valvontatoimet korkean riskin toiminnalle ja arkaluonteisille kyberpyynnöille sekä lisäsuojauksia toistuvaa väärinkäyttöä vastaan. Laaja käyttö mahdollistetaan investoinneillamme mallin turvallisuuteen, todennettuun käyttöön ja luvattoman käytön valvontaan. Olemme tehneet yhteistyötä ulkopuolisten asiantuntijoiden kanssa kuukausien ajan kehittääksemme, testataksemme ja parantaaksemme näiden suojatoimien toimintavarmuutta. GPT‑5.5:n avulla varmistamme, että kehittäjät voivat suojata koodinsa helposti, samalla kun tehostamme valvontaa niissä verkkotyönkulkuissa, jotka ovat alttiimpia haitallisten toimijoiden hyökkäyksille.
- Laajennamme pääsyä kyberpuolustuksen nopeuttamiseksi kaikilla tasoilla. Tuomme kyberkäyttöön sallivammat mallimme saataville Trusted Access for Cyber -ohjelman kautta aloittaen Codexista, joka sisältää laajennetun käyttöoikeuden GPT‑5.5:n edistyneisiin kyberturvallisuusominaisuuksiin aiempaa vähäisemmillä rajoituksilla vahvistetuille käyttäjille, jotka täyttävät tietyt luottamuskriteerit(avautuu uudessa ikkunassa) julkaisun yhteydessä. Organisaatiot, jotka vastaavat kriittisen infrastruktuurin puolustamisesta, voivat hakea pääsyä kyberkäyttöön salliviin malleihin, kuten GPT‑5.4‑Cyberiin, edellyttäen että ne täyttävät tiukat turvallisuusvaatimukset voidakseen käyttää näitä malleja sisäisten järjestelmiensä suojaamiseen. Tämä tarjoaa laajalle joukolle todistettuja puolustajia tehokkaampia työkaluja lailliseen turvallisuustyöhön ilman turhia esteitä, jotta voimme varmistaa tärkeiden puolustusvalmiuksien saatavuuden kaikille. Käyttäjät voivat hakea luotettavaa käyttöoikeutta osoitteessa chatgpt.com/cyber(avautuu uudessa ikkunassa), jotta vältetään tarpeettomat käyttökiellot käytettäessä GPT‑5.5:tä vahvistettuihin puolustustarkoituksiin.
- Teemme yhteistyötä viranomaisten kanssa kansalaisten kannalta kriittisen infrastruktuurin suojelemiseksi. Tutkimme yhdessä, miten edistynyt tekoäly voi tukea luotettavien viranomaisten puolustustyötä, jotka vastaavat järjestelmistä, joista ihmiset ovat riippuvaisia, kuten tärkeiden veronmaksajatietojen suojaavista digitaalisista järjestelmistä aina sähköverkkoon ja paikallisyhteisöjen vesihuoltoon.
Käsittelemme GPT‑5.5:n biologisia/kemiallisia ja kyberturvallisuuskyvykkyyksiä ensisijaisina valmiuskehyksessämme(avautuu uudessa ikkunassa). Vaikka GPT‑5.5 ei saavuttanut kriittistä kyberturvallisuustasoa, arviointimme ja testimme osoittivat, että sen kyberturvallisuusominaisuudet ovat edistyneet verrattuna GPT‑5.4:ään.
Lisäksi GPT‑5.5 kävi ennen julkaisua läpi koko turvallisuus- ja hallintoprosessimme. Tämä sisälsi valmiusarvioinnit, toimialakohtaisen testauksen, uudet kohdennetut arvioinnit edistyneitä biologian ja kyberturvallisuuden valmiuksia varten sekä perusteellisen testauksen ulkopuolisten asiantuntijoiden kanssa. Lisätietoja on GPT‑5.5‑järjestelmäkortissa(avautuu uudessa ikkunassa).
Tämä työ heijastaa laajempaa lähestymistapaamme tekoälyn kestävyyteen, jota pidämme tarpeellisena mallien kehittyessä. Haluamme, että tehokas tekoäly on niiden ihmisten käytettävissä, jotka käyttävät sitä järjestelmien, instituutioiden ja kansalaisten suojelemiseen. Kestävä ratkaisu perustuu luotettavaan pääsyyn, vankkoihin suojatoimiin, jotka mukautuvat järjestelmän kapasiteetin mukaan, sekä operatiiviseen valmiuteen havaita vakavat väärinkäytökset ja reagoida niihin.
Tänään GPT‑5.5 otetaan käyttöön ChatGPT:ssä ja Codexissa Plus-, Pro-, Business- ja Enterprise-käyttäjille, ja GPT‑5.5 Pro otetaan käyttöön ChatGPT:ssä Pro-, Business- ja Enterprise-käyttäjille. GPT‑5.5 ja GPT‑5.5 Pro ovat saatavilla API:ssa hyvin pian.
ChatGPT:ssä GPT‑5.5 Thinking on saatavilla Plus-, Pro-, Business- ja Enterprise-käyttäjille. GPT‑5.5 Pro, joka on suunniteltu entistä vaikeampiin kysymyksiin ja tarkempaa työskentelyä varten, on saatavilla Pro-, Business- ja Enterprise-käyttäjille.
Codexissa GPT‑5.5 on saatavilla Plus-, Pro-, Business-, Enterprise-, Edu- ja Go-sopimuksissa 400K:n konteksti-ikkunalla. GPT‑5.5 on saatavilla myös Fast mode -tilassa, jossa se generoi token 1,5 kertaa nopeammin 2,5-kertaisella hinnalla.
API-kehittäjille gpt-5.5 on pian saatavilla Vastaukset- ja Keskustelun täydennys-API:eissa hintaan 5 $ per 1 M syötetunnistetta ja 30 $ per 1 M tuotostunnistetta, ja sen konteksti-ikkuna on 1 M. Batch- ja Flex-hinnoittelu ovat saatavilla puoleen hintaan API-vakiohinnasta, kun taas Priority-käsittely on saatavilla 2,5-kertaiseen hintaan API-vakiohinnasta. Julkaisemme myös gpt-5.5-pron API:ssa entistäkin paremman tarkkuuden saavuttamiseksi. Sen hinta on 30 dollaria / 1 miljoona syötetunnistetta ja 180 dollaria / 1 miljoona tuotostunnistetta. Katso täydelliset tiedot hinnoittelusivulta.
Vaikka GPT‑5.5 on hinnoiteltu korkeammaksi kuin GPT‑5.4, se on sekä älykkäämpi että paljon token-tehokkaampi. Codexissa olemme hienosäätäneet käyttökokemuksen huolellisesti niin, että GPT‑5.5 tuottaa useimmille käyttäjille parempia tuloksia vähemmillä tokeneilla (token) kuin GPT‑5.4, tarjoten samalla edelleen reilut käyttömäärät eri tilaustasoilla.
Koodaus
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (julkinen) * | 58,6 % | 57,7 % | - | - | 64,3 % | 54,2 % |
Terminal-Bench 2.0 | 82,7 % | 75,1 % | - | - | 69,4 % | 68,5 % |
Expert-SWE (sisäinen) | 73,1 % | 68,5 % | - | - | - | - |
*Laboratoriot ovat havainneet viitteitä ulkoa muistamisesta(avautuu uudessa ikkunassa) tässä arvioinnissa
Ammattilainen
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (voitot tai tasapelit) | 84,9 % | 83,0 % | 82,3 % | 82,0 % | 80,3 % | 67,3 % |
FinanceAgent v1.1 | 60,0 % | 56,0 % | - | 61,5 % | 64,4% | 59,7 % |
Investointipankkitoiminnan mallinnustehtävät (sisäinen) | 88,5 % | 87,3 % | 88,6 % | 83,6 % | - | - |
OfficeQA Pro | 54,1 % | 53,2% | - | - | 43,6 % | 18,1 % |
Tietokoneen käyttö ja visio
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Verified | 78,7 % | 75,0 % | - | - | 78,0 % | - |
MMMU Pro (ei työkaluja) | 81,2 % | 81,2 % | - | - | - | 80,5 % |
MMMU Pro (työkalujen kanssa) | 83,2 % | 82,1 % | - | - | - | - |
Työkalun käyttö
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84,4 % | 82,7 % | 90,1 % | 89,3 % | 79,3 % | 85,9 % |
MCP Atlas** | 75,3 % | 70,6 % | - | - | 79,1 % | 78,2 % |
Toolathlon | 55,6 % | 54,6 % | - | - | - | 48,8 % |
Tau2-bench Telecom*** | 98,0 % | 92,8 % | - | - | - | - |
** MCP Atlas: Scale AI:n tulokset viimeisimmän 26.4.2026 suoritetun päivityksen jälkeen.
*** Tau2-bench Telecom: tulokset versiolle 5.5 ja 5.4 alkuperäisillä kehotteilla, eli ei kehotteen mukautusta. Tämä ei sisällä muiden laboratorioiden tuloksia, jotka arvioitiin kehotteen mukautuksin.
Akateeminen
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25,0 % | 19,0 % | 33,2 % | 25,6 % | - | - |
FrontierMath Taso 1–3 | 51,7 % | 47,6 % | 52,4% | 50,0 % | 43,8 % | 36,9 % |
FrontierMath Taso 4 | 35,4 % | 27,1 % | 39,6 % | 38,0 % | 22,9 % | 16,7 % |
BixBench | 80,5 % | 74,0 % | - | - | - | - |
GPQA-diamond | 93,6 % | 92,8 % | - | 94,4 % | 94,2 % | 94,3 % |
Ihmiskunnan viimeinen koe (ei työkaluja) | 41,4 % | 39,8 % | 43,1 % | 42,7 % | 46,9 % | 44,4 % |
Ihmiskunnan viimeinen koe (työkalujen kanssa) | 52,2 % | 52,1 % | 57,2 % | 58,7 % | 54,7 % | 51,4 % |
Kyberturvallisuus
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Capture-the-Flags-haastetehtävät (sisäinen)**** | 88,1 % | 83,7 % | - | - | - | - |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
**** Laajennus vaikeimmista CTF:istä, joita käytetään järjestelmäkorteissa, sekä lisää vaikeita haasteita.
Pitkä konteksti
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256 000 f1 | 73,7 % | 62,5 % | - | - | 76,9% | - |
Graphwalks BFS 1mil f1 | 45,4 % | 9,4 % | - | - | 41.2% (Opus 4.6) | - |
Graphwalks parents 256k f1 | 90,1 % | 82,8 % | - | - | 93,6 % | - |
Graphwalks parents 1M f1 | 58,5 % | 44,4 % | - | - | 72,0 % (Opus 4.6) | - |
OpenAI MRCR v2 8-neulainen 4–8 K | 98,1 % | 97,3 % | - | - | - | - |
OpenAI MRCR v2 8-neulainen 8–16 K | 93,0 % | 91,4 % | - | - | - | - |
OpenAI MRCR v2 8-neulainen 16–32 K | 96,5 % | 97,2 % | - | - | - | - |
OpenAI MRCR v2 8-neulainen 32–64 K | 90,0 % | 90,5 % | - | - | - | - |
OpenAI MRCR v2 8-neulainen 64–128 K | 83,1 % | 86,0 % | - | - | - | - |
OpenAI MRCR v2 8-neulainen 128–256 K | 87,5 % | 79,3 % | - | - | 59,2 % | - |
OpenAI MRCR v2 8-neulainen 256–512 K | 81,5 % | 57,5 % | - | - | - | - |
OpenAI MRCR v2 8-neulainen 512 K – 1 M | 74,0 % | 36,6 % | - | - | 32,2 % | - |
Abstrakti ajattelu
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (vahvistettu) | 95,0 % | 93,7 % | - | 94,5 % | 93,5 % | 98,0 % |
ARC-AGI-2 (vahvistettu) | 85,0 % | 73,3 % | - | 83,3 % | 75,8 % | 77,1 % |
GPT‑arvioinnit suoritettiin xhigh-asetuksella tutkimusympäristössä, minkä vuoksi tulokset voivat joissakin tapauksissa poiketa hieman tuotantoympäristön ChatGPT:n tuloksista.








