Siirry pääsisältöön
OpenAI

13. marraskuuta 2025

Tuote

Esittelyssä GPT‑5.1 kehittäjille

Ladataan...

Julkaisemme tänään API-alustalla GPT‑5.1:n, GPT‑5‑sarjan seuraavan mallin, joka tasapainottaa älykkyyden ja nopeuden monenlaisissa agentti- ja koodaustöissä. GPT‑5.1 mukauttaa dynaamisesti ajattelun kestoa tehtävän monimutkaisuuden perusteella, mikä tekee mallista huomattavasti nopeamman ja tokenien kannalta tehokkaamman yksinkertaisissa päivittäisissä tehtävissä. Malli sisältää myös ”ei päättelyä” -tilan, joka reagoi nopeammin tehtäviin, jotka eivät vaadi syvällistä ajattelua, säilyttäen samalla GPT‑5.1:n edistyksellisen älykkyyden.

Jotta GPT‑5.1 olisi entistäkin tehokkaampi, julkaisemme laajennetun kehotteiden välimuistin, joka säilyttää tiedot jopa 24 tuntia, mikä nopeuttaa vastauksia seurantakysymyksiin ja alentaa kustannuksia. Priority Processing(avautuu uudessa ikkunassa) -asiakkaamme saavat myös huomattavasti nopeamman suorituskyvyn GPT‑5.1:llä verrattuna GPT‑5:een.

Koodaamisen osalta olemme tehneet tiivistä yhteistyötä Cursorin, Cognitionin, Augment Coden, Factoryn ja Warpin kaltaisten startup-yritysten kanssa parantaaksemme GPT‑5.1:n koodaustyyliä, ohjattavuutta ja koodin laatua. Yleisesti ottaen GPT‑5.1 tuntuu intuitiivisemmalta koodaamiseen ja kommunikoivammalta käyttäjälle suunnatuilla päivityksillä tehtäviä suorittaessaan.

Lopuksi esittelemme kaksi uutta työkalua GPT‑5.1:n yhteydessä: apply_patch-työkalun, joka on suunniteltu koodin luotettavampaan muokkaamiseen, ja shell-työkalun, jonka avulla malli voi suorittaa shell-komentoja.

GPT‑5.1 on seuraava edistyssaskel GPT‑5‑sarjassa, ja aiomme jatkaa investointeja entistä älykkäämpiin ja suorituskykyisempiin malleihin, jotta kehittäjät voivat rakentaa luotettavia agenttityönkulkuja.

Tehokas päättely eri tehtävissä

Sopeutuva päättely

GPT‑5.1:n nopeuttamiseksi uudistimme sen ajattelun koulutustavan. Yksinkertaisissa tehtävissä GPT‑5.1 käyttää vähemmän tokeneja ajatteluun, mikä mahdollistaa nopeammat tuotekokemukset ja pienemmät token-kustannukset. Vaikeissa tehtävissä, jotka vaativat ylimääräistä ajattelua, GPT‑5.1 etsii sinnikkäästi vaihtoehtoja ja tarkistaa työtään luotettavuuden maksimoimiseksi.

Balyasny Asset Managementin(avautuu uudessa ikkunassa) mukaan GPT‑5.1 "suoriutui paremmin kuin sekä GPT‑4.1 että GPT‑5 koko dynaamisessa arviointipaketissamme ja toimi 2–3 kertaa nopeammin kuin GPT‑5." Sen mukaan myös työkaluja paljon vaativissa päättelytehtävissä GPT‑5.1 ”käytti johdonmukaisesti noin puolet vähemmän tokeneja kuin johtavat kilpailijat vastaavalla tai paremmalle laadulla”. Samoin tekoälyvakuutusten liiketoimintaprosessien ulkoistaja Pace(avautuu uudessa ikkunassa) testasi mallia ja sanoi, että sen agentit toimivat "50 % nopeammin GPT‑5.1:llä ja ylittävät GPT‑5:n ja muiden johtavien mallien tarkkuuden arvioinneissamme".

GPT‑5.1 vaihtelee ajatteluaikaansa dynaamisemmin kuin GPT‑5. ChatGPT‑tehtävien edustavassa jakaumassa GPT‑5.1 on paljon nopeampi helpommissa tehtävissä, jopa vaativissa päättelytehtävissä.

Esimerkiksi, kun siltä kysytään ”näytä npm-komento, jolla luetellaan globaalisti asennetut paketit”, GPT‑5.1 vastaa 2 sekunnissa 10 sekunnin sijaan.

GPT-5 (Medium) käsittelee noin 250 tokenia (noin 10 sekuntia)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) käsittelee noin 50 tokenia (~2 sekuntia)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

Uusi ”ei päättelyä” -tila

Kehittäjät voivat nyt käyttää GPT‑5.1:tä ilman päättelyä asettamalla reasoning_effort-arvoksi "none". Tämä saa mallin toimimaan ei-päätelmällisen mallin tavoin viiveherkissä käyttötapauksissa, GPT‑5.1:n korkean älykkyyden ja suorituskykyisen työkalujen kutsumisen lisäedun kanssa. Verrattuna GPT‑5:een, jonka päättelykyky on ”minimaalinen”, GPT‑5.1, jolla ei ole päättelykykyä, on parempi rinnakkaisten työkalukutsujen suorittamisessa (mikä itsessään lisää tehtävien suoritusnopeutta päästä päähän), koodauksessa, ohjeiden noudattamisessa ja hakutyökalujen käytössä – ja tukee verkkohakua(avautuu uudessa ikkunassa) API-alustallamme. Sierra(avautuu uudessa ikkunassa) kertoi, että GPT‑5.1 "ei päättelyä" -tilassa osoitti "20 %:n parannuksen matalan viiveen työkalukutsujen suorituskykyyn verrattuna GPT‑5:n minimaaliseen päättelyyn" yrityksen todellisissa arvioissa.

Kun "none" on otettu käyttöön arvona reasoning_effortissa, kehittäjät voivat nyt entistä joustavammin ja tarkemmin hallita nopeuden, kustannusten ja älykkyyden välistä tasapainoa käyttötapauksissaan. GPT‑5.1:n oletus on "none", mikä on ihanteellinen viiveherkille työkuormille. Suosittelemme, että kehittäjät valitsevat asetukseksi ”low” tai "medium" monimutkaisemmille tehtäville ja ”high”, kun älykkyys ja luotettavuus ovat nopeutta tärkeämpiä.

Laajennettu kehotteen välimuisti

Laajennettu välimuisti parantaa päättelytehokkuutta, koska se mahdollistaa kehotteiden pysymisen aktiivisina välimuistissa jopa 24 tuntia nykyisen muutaman minuutin sijaan. Pidemmän säilytysajan ansiosta useammat seurantapyynnöt voivat hyödyntää välimuistiin tallennettua kontekstia, mikä pienentää viivettä, alentaa kustannuksia ja sujuvoittaa suorituskykyä pitkäkestoisissa vuorovaikutuksissa, kuten monivaiheisessa keskustelussa, koodausistunnoissa tai tiedonhakutyönkuluissa.

Kehotteen välimuistin hinnoittelu pysyy ennallaan, ja välimuistissa olevat syötetokenit ovat 90 % halvempia kuin välimuistittomat tokenit, eikä välimuistiin kirjoittamisesta tai tallennuksesta peritä lisämaksua. Jos haluat käyttää laajennettua välimuistitallennusta GPT‑5.1:n kanssa, lisää parametri “prompt_cache_retention=‘24h’” kohteeseen Vastaukset tai Keskustelun loppuunpäättämisen API. Katso lisätietoja kohdasta kehotteiden välimuistidokumentaatio(avautuu uudessa ikkunassa).

Koodaus

GPT‑5.1 perustuu GPT‑5:n koodausominaisuuksiin, mutta siinä on paremmin ohjattava koodauspersoonallisuus, vähemmän ylimääräistä ajattelua, parempi koodin laatu, paremmin käyttäjälle suunnatut päivitysviestit (johdannot) työkalukutsujen aikana ja toimivammat käyttöliittymäsuunnittelut – erityisesti vähäisellä päättelytyöllä.

Yksinkertaisemmissa koodaustehtävissä, kuten nopeissa koodinmuokkauksissa, GPT‑5.1:n suurempi nopeus helpottaa edestakaista iterointia. GPT‑5.1:n nopeampi suorituskyky yksinkertaisissa tehtävissä ei heikennä suorituskykyä vaikeissa tehtävissä. SWE-bench Verified -testissä GPT‑5.1 toimii jopa pidempään kuin GPT‑5 ja saavuttaa 76,3 %.

SWE-bench Verifiedissa⁠, mallille annetaan koodivarasto ja ongelman kuvaus, ja sen on luotava korjauspäivitys ongelman ratkaisemiseksi. Tunnisteet osoittavat päättelykyvyn. Tarkkuus on laskettu kaikkien 500 ongelman keskiarvona. Kaikissa malleissa käytettiin JSON-pohjaista apply_patch-työkalua.

Saimme varhaista palautetta GPT‑5.1:stä muutamalta koodausyritykseltä. Tässä ovat heidän vaikutelmansa:

  • Augment Code(avautuu uudessa ikkunassa) kutsui GPT‑5.1:tä ”tarkemmaksi, vähemmän turhia toimia sisältäväksi, tehokkaammaksi päättelykyvyltään ja paremmin tehtävään keskittyväksi”, ja he ovat havainneet ”tarkempia muutoksia, sujuvampia pull-pyyntöjä ja nopeampia iteraatioita usean tiedoston projekteissa".
  • Cline(avautuu uudessa ikkunassa) kertoi arvioinneissaan, että ”GPT‑5.1 saavutti SOTA-tason diff-muokkausvertailussa 7 %:n parannuksella, mikä osoittaa poikkeuksellista luotettavuutta monimutkaisissa koodaustehtävissä.”
  • CodeRabbit(avautuu uudessa ikkunassa) kutsui GPT‑5.1:tä "PR-arvostelujen ykkösvalinnaksi".
  • Cognition(avautuu uudessa ikkunassa) sanoi, että GPT‑5.1 "ymmärtää huomattavasti paremmin, mitä pyydät, ja työskentelee kanssasi saadakseen sen tehtyä".
  • Factoryn(avautuu uudessa ikkunassa) mukaan: ”GPT‑5.1 tarjoaa huomattavasti nopeammat vastaukset ja mukauttaa päättelynsä syvyyden tehtävään, mikä vähentää ylimääräistä ajattelua ja parantaa kehittäjän kokonaiskokemusta.”
  • Warp(avautuu uudessa ikkunassa) on asettanut GPT‑5.1:n uusien käyttäjien oletukseksi ja sanoo, että se "perustuu GPT‑5‑sarjan vaikuttaviin älykkyysparannuksiin ja on samalla huomattavasti reagoivampi malli".
"GPT 5.1 ei ole vain yksi LLM-malli muiden joukossa – se on aidosti agenttinen, luonnollisin autonominen malli, jonka olen koskaan testannut. Se kirjoittaa kuten sinä, koodaa kuten sinä, noudattaa vaivattomasti monimutkaisia ohjeita ja on erinomainen front-end-tehtävissä, sopien saumattomasti olemassa olevaan koodipohjaasi. Voit todella hyödyntää sen koko potentiaalin Responses API:ssa, ja olemme innoissamme voidessamme tarjota sitä IDE:ssämme."
-Denis Shiryaev, AI DevTools Ecosystem, JetBrainsin pääjohtaja

Uudet työkalut GPT‑5.1:ssä

Esittelemme kaksi uutta työkalua GPT‑5.1:n kanssa, joiden avulla kehittäjät voivat hyödyntää mallia vastausten API:ssa parhaalla mahdollisella tavalla: vapaamuotoinen apply_patch -työkalu, joka tekee koodin muokkaamisesta entistä luotettavampaa ilman JSON-merkkejä, ja shell-työkalu, jonka avulla malli voi kirjoittaa komentoja suoritettavaksi paikallisella koneellasi.

Apply_patch-työkalu

Vapaamuotoinen apply_patch-työkalu antaa GPT‑5.1:n luoda, päivittää ja poistaa tiedostoja koodipohjassa käyttämällä jäsenneltyjä diff-tiedostoja. Sen sijaan, että malli vain ehdottaisi muokkauksia, se tuottaa korjausoperaatioita, joita sovellus soveltaa ja joista se raportoi takaisin, mikä mahdollistaa iteratiiviset, monivaiheiset koodinmuokkaustyönkulut.

Voit käyttää Responses API:n apply_patch-työkalua lisäämällä sen työkalujen joukkoon seuraavasti: ”tools”: [{“type”: “apply_patch”}]. Lisää joko tiedoston sisältö syötteeseesi tai anna mallille työkalut vuorovaikutukseen tiedostojärjestelmäsi kanssa. Malli luo apply_patch_call -kohteita tiedostojen luomiseen, päivittämiseen tai poistamiseen, jotka sisältävät tiedostojärjestelmään soveltamasi diff-tiedostot. Lisätietoja apply_patch-työkalun integroinnista on kehittäjädokumentaatiossamme(avautuu uudessa ikkunassa).

Shell-työkalu

Shell-työkalun avulla malli voi olla vuorovaikutuksessa paikallisen tietokoneen kanssa hallitun komentoriviliittymän kautta. Malli ehdottaa komentorivikomentoja; kehittäjän integraatio suorittaa ne ja palauttaa tuotokset. Tämä luo yksinkertaisen suunnitelma-suoritus-silmukan, jonka avulla mallit voivat tarkastaa järjestelmän, suorittaa apuohjelmia ja kerätä tietoja, kunnes ne voivat suorittaa tehtävän loppuun.

Jos haluat käyttää shell-työkalua Responses API:ssa, kehittäjät voivat sisällyttää sen työkaluryhmään seuraavasti: "tools": [{”type”: ”shell”}]. API luo "shell_call" -kohteita, jotka sisältävät suoritettavat shell-komennot. Kehittäjät suorittavat komennot paikallisessa ympäristössä ja palauttavat suoritustulokset "shell_call_output" -kohdassa seuraavassa API-pyynnössä. Lue lisää kehittäjädokumentaatiostamme(avautuu uudessa ikkunassa).

Hinnoittelu ja saatavuus

GPT‑5.1 ja gpt-5.1-chat-latest ovat kehittäjien käytettävissä kaikilla API:n maksullisilla tasoilla. Hinnoittelu ja hintarajoitukset(avautuu uudessa ikkunassa) ovat samat kuin GPT‑5:ssä. Julkaisemme myös gpt-5.1-codexin. ja gpt-5.1-codex-minin API:ssa. Vaikka GPT‑5.1 suoriutuu useimmista koodaustehtävistä erinomaisesti, gpt-5.1-codex -mallit on optimoitu pitkäkestoisiin, agenttipohjaisiin koodaustehtäviin Codexissa tai Codexin kaltaisissa ympäristöissä.

Kehittäjät voivat aloittaa rakentamisen käyttämällä GPT‑5.1 kehittäjädokumentaatiota(avautuu uudessa ikkunassa) ja mallikehoteopasta(avautuu uudessa ikkunassa). Emme tällä hetkellä aio poistaa GPT‑5:tä API:sta, ja ilmoitamme kehittäjille etukäteen, jos ja kun päätämme tehdä niin.

Mitä seuraavaksi

Olemme sitoutuneet ottamaan käyttöön toistuvasti tehokkaimmat ja luotettavimmat mallit todelliseen agenttityöhön ja koodaustyöhön – mallit, jotka ajattelevat tehokkaasti, iteroivat nopeasti ja käsittelevät monimutkaisia tehtäviä pitäen kehittäjät työn virrassa. GPT‑5.1 on suunniteltu auttamaan kehittämään vähemmällä vaivalla mukautuvan päättelyn, tehokkaamman koodaussuorituskyvyn, selkeämpien käyttäjille suunnattujen päivitysten ja uusien työkalujen, kuten apply_patch ja shell, ansiosta. Jatkamme voimakasta panostamista tähän: tulevina viikkoina ja kuukausina on odotettavissa entistä tehokkaampia agentti- ja koodausmalleja.

Liite: Mallien arvioinnit

Arviointi

GPT‑5.1 (high)

GPT‑5 (high)

SWE-bench-vahvistettu
(kaikki 500 tehtävää)

76,3 %

72,8 %

GPQA Diamond
(ei työkaluja)

88,1 %

85,7 %

AIME 2025
(ei työkaluja)

94,0 %

94,6 %

FrontierMath
(Python-työkalulla)

26,7 %

26,3 %

MMMU

85,4 %

84,2 %

Tau2-bench Lentoyhtiö

67,0 %

62,6 %

Tau2-bench Televiestintä*

95,6 %

96,7 %

Tau2-bench Vähittäiskauppa

77,9 %

81,1 %

BrowseComp Long konteksti 128k

90,0 %

90,0 %

* Tau2-bench Televiestinnässä annoimme GPT‑5.1:lle lyhyen, yleisesti hyödyllisen kehotteen parantaaksemme sen suorituskykyä.

Tekijä

OpenAI