Fara beint í aðalefni
OpenAI

23. apríl 2026

VaraSlepping

Við kynnum GPT‑5.5

Ný tegund greindar fyrir raunveruleg verkefni

Hleður inn...

Uppfærsla 24. apríl 2026: GPT‑5.5 og GPT‑5.5 Pro eru nú aðgengileg í API. Kerfiskortið hefur einnig verið uppfært til að lýsa þeim viðbótaröryggisráðstöfunum sem eiga við.


Við erum að gefa út GPT‑5.5, snjallasta og notendavænasta líkan okkar hingað til, og þetta er næsta skref í átt að nýrri leið til að koma verkum í verk í tölvu.

GPT‑5.5 skilur hraðar hvað þú ert að reyna að gera og getur sjálft tekið að sér stærri hluta verksins. Það skarar fram úr í að skrifa og kemba kóða, rannsaka á netinu, greina gögn, búa til skjöl og töflureikna, nota hugbúnað og skipta á milli verkfæra þar til verkefni er lokið. Í stað þess að stýra hverju skrefi af kostgæfni geturðu falið GPT‑5.5 flókið, margþætt verkefni og treyst því til að skipuleggja, nota verkfæri, yfirfara eigin vinnu, rata í gegnum óvissu og halda áfram.

Ávinningurinn er sérstaklega mikill í fulltrúadrifinni kóðun, tölvunotkun, þekkingarvinnu og á fyrstu stigum vísindarannsókna – sviðum þar sem framfarir ráðast af því að beita rökum út frá samhengi og grípa til aðgerða yfir tíma. GPT‑5.5 skilar þessu framfaraskrefi í greind án þess að fórna hraða: stærri og öflugri líkön eru oft hægari í afgreiðslu, en GPT‑5.5 jafnast á við GPT‑5.4 í leynd á hvern tóka við afgreiðslu í raunverulegri notkun, á sama tíma og það skilar afköstum á mun hærra greindarstigi. Það notar einnig marktækt færri tóka til að ljúka sömu Codex-verkefnum, sem gerir það bæði skilvirkara og öflugra.

Við erum að gefa út GPT‑5.5 með öflugustu öryggisráðstöfunum okkar hingað til, sem eru ætlaðar til að draga úr misnotkun um leið og aðgangur fyrir gagnlega vinnu er varðveittur. Við mátum þetta líkan út frá öllu safni öryggis- og viðbúnaðarramma okkar, unnum með innri og ytri rauðteymum, bættum við markvissum prófunum fyrir háþróaða getu á sviði netöryggis og líffræði og söfnuðum endurgjöf um raunveruleg notkunartilvik frá tæplega 200 traustum samstarfsaðilum með snemmbúinn aðgang áður en það var gefið út.

Í dag hefst innleiðing GPT‑5.5 fyrir Plus, Pro, Business og Enterprise notendur í ChatGPT og Codex, og innleiðing GPT‑5.5 Pro fyrir Pro, Business og Enterprise notendur í ChatGPT. Innleiðing API krefst ólíkra öryggisráðstafana og við vinnum náið með samstarfsaðilum og viðskiptavinum að öryggis- og verndarkröfum fyrir þjónustu í stórum mæli. Við munum gera GPT‑5.5 og GPT‑5.5 Pro aðgengileg í API mjög fljótlega.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82,7%

75,1%

-

-

69,4%

68,5%

Expert-SWE (Internal)

73,1%

68,5%

-

-

-

-

GDPval (wins or ties)

84,9%

83,0%

82,3%

82,0%

80,3%

67,3%

OSWorld-Verified

78,7%

75,0%

-

-

78,0%

-

Toolathlon

55,6%

54,6%

-

-

-

48,8%

BrowseComp

84,4%

82,7%

90,1%

89,3%

79,3%

85,9%

FrontierMath stig 1–3

51,7%

47,6%

52,4%

50,0%

43,8%

36,9%

FrontierMath stig 4

35,4%

27,1%

39,6%

38,0%

22,9%

16,7%

CyberGym

81,8%

79,0%

-

-

73,1%

-

Líkangeta

OpenAI er að byggja upp alþjóðlega innviði fyrir gervigreindarfulltrúa og gerir fólki og fyrirtækjum um allan heim kleift að ljúka verkum með gervigreind. Á síðasta ári höfum við séð gervigreind flýta verulega fyrir hugbúnaðarverkfræði. Með GPT‑5.5 í Codex og ChatGPT er sama umbreyting farin að ná til vísindarannsókna og víðtækari vinnu sem fólk vinnur á tölvum.

Á öllum þessum sviðum er GPT‑5.5 ekki aðeins greindara; það er einnig skilvirkara í því hvernig það vinnur úr viðfangsefnum og nær oft meiri gæðum í úttaki með færri tókum og færri endurtekningum. Á Coding Index hjá Artificial Analysis býður GPT‑5.5 upp á háþróaða greind á helmingi lægri kostnaði en samkeppnishæf framarlega kóðunarlíkön.

Artificial Analysis Intelligence Index(opnast í nýjum glugga) er vegið meðaltal 10 mati sem framkvæmd eru af utanaðkomandi aðila: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Fulltrúakóðun

GPT‑5.5 er öflugasta fulltrúalíkan okkar hingað til. Á Terminal-Bench 2.0, sem prófar flókin skipanalínuvinnuflæði sem krefjast áætlanagerðar, ítrekunar og samhæfingar verkfæra, nær það 82,7% nákvæmni, sem er nýjasta tækni. Á SWE-Bench Pro, sem metur úrlausn raunverulegra GitHub-vandamála, nær það 58,6% árangri og leysir fleiri verkefni frá upphafi til enda í einni atrennu en fyrri líkön. Á Expert-SWE, innra framarlega mati okkar á langtíma kóðunarverkefnum með áætlaðan miðgildisverklokatíma upp á 20 klukkustundir, stendur GPT‑5.5 einnig framar GPT‑5.4.

Í öllum þremur matanna bætir GPT‑5.5 frammistöðu GPT‑5.4. á meðan það notar færri tóka.

Styrkleikar líkansins í kóðun koma sérstaklega skýrt fram í Codex, þar sem það getur sinnt verkfræðivinnu sem nær frá innleiðingu og endurskipulagningu til villuleitar, prófana og staðfestingar. Fyrstu prófanir benda til að GPT‑5.5 sé betra í þeim þáttum sem raunveruleg verkfræðivinna byggir á, eins og að halda samhengi í stórum kerfum, að nota rök við óljósar bilanir, að sannreyna forsendur með verkfærum og að fylgja breytingum eftir í nærliggjandi kóðagrunni.

Ferillinn sem birtist notar NASA/JPL Horizons-vigurgögn fyrir Orion, tunglið og sólina, með skjástærðarbreytingu beittri til að bæta læsileika.

Kvaðning: [meðfylgjandi mynd] Útfærðu þetta sem nýtt app með webgl og vite með raunverulegum gögnum úr Artemis II-leiðangrinum. Gakktu úr skugga um að prófa appið vandlega þar til það er fullkomlega virkt og lítur út eins og appið á myndinni. Gefðu sérstakan gaum að framsetningu reikistjarnanna og flugleiðum þeirra. Ég vil geta átt samskipti við þrívíddarmyndgerðina. Tryggðu að hún hafi raunsætt brautarfræði.

Umfram viðmið sögðu fyrstu prófarar að GPT‑5.5 sýni meiri hæfni til að skilja uppbyggingu kerfis: hvers vegna eitthvað bilar, hvar lagfæringin þarf að eiga sér stað og hvað annað í kóðagrunninum yrði fyrir áhrifum.

alt

„Fyrsta kóðunarlíkanið sem ég hef notað sem býr yfir verulegum hugtakaskýrleika.“

Dan Shipper, stofnandi og forstjóri hjá Every, lýsti GPT‑5.5 sem „fyrsta forritunarlíkaninu sem ég hef notað sem hefur raunverulegan hugmyndalegan skýrleika.“

Eftir að hafa sett app í loftið eyddi hann dögum í að leysa vandamál sem kom upp eftir útgáfu áður en hann fékk einn af sínum bestu verkfræðingum til að endurskrifa hluta af kerfinu. Til að prófa GPT‑5.5 sneri hann í raun klukkunni til baka: gat líkanið skoðað bilaða stöðu og búið til sams konar endurgerð og verkfræðingurinn ákvað að lokum að fara með? GPT‑5.4 gat það ekki. GPT‑5.5 gat það.

alt

„Mér finnst í alvöru eins og ég sé að vinna með æðri greind, og það er næstum eins og maður finni fyrir virðingu.“

Pietro Schirano, forstjóri MagicPath, sá svipað stökk fram á við þegar GPT‑5.5 sameinaði grein með hundruðum breytinga á framenda og endurskipulagningarbreytinga inn í aðalgrein sem hafði einnig breyst verulega og leysti verkið ein-skots á um 20 mínútum.

Reyndir verkfræðingar sem prófuðu líkanið sögðu að GPT‑5.5 væri greinilega sterkara en GPT‑5.4 og Claude Opus 4.7 í rök og sjálfstæði, greindi vandamál fyrirfram og sæi fyrir prófunar- og yfirferðarþarfir án skýrra kvaðninga. Í einu tilviki bað verkfræðingur það um að endurhanna athugasemdakerfi í samvinnumiðuðum Markdown-ritli og kom aftur að 12 diffa stafla sem var næstum því tilbúinn. Aðrir sögðust þurfa furðu litlar leiðréttingar við innleiðingu og treystu meira á áætlanir GPT‑5.5 en GPT‑5.4.

Einn verkfræðingur hjá NVIDIA sem hafði snemmbúinn aðgang að líkaninu gekk svo langt að segja: „Að missa aðgang að GPT‑5.5 er eins og að missa útlim.”

„GPT-5.5 er greinilega snjallara og þrautseigara en GPT-5.4, með sterkari frammistöðu í forritun og áreiðanlegri notkun verkfæra. Það heldur áfram að sinna verkefninu í mun lengri tíma án þess að hætta of snemma, sem skiptir mestu máli fyrir þá flóknu, langvarandi vinnu sem notendur okkar fela Cursor.“
— Michael Truell, meðstofnandi og forstjóri Cursor

Þekkingarvinna

Sömu styrkleikar og gera GPT‑5.5 frábært í forritun gera það einnig öflugt fyrir daglega vinnu í tölvu. Vegna þess að líkanið er betra í að skilja ásetning getur það farið eðlilegar í gegnum allt ferlið í þekkingarvinnu: að finna upplýsingar, skilja hvað skiptir máli, nota verkfæri, yfirfara frálagið og breyta hráefni í eitthvað nytsamlegt.

Í Codex er GPT‑5.5 betra en GPT‑5.4 í að búa til skjöl, töflureikna og glærukynningar. Alfaprófarar sögðu að það stæði sig betur en eldri líkön í verkefnum á borð við rekstrarrannsóknir, töflureiknalíkön og að breyta óskipulögðum viðskiptainntökum í áætlanir. Þegar það er sameinað færni Codex í tölvunotkun færir GPT‑5.5 okkur nær þeirri tilfinningu að líkanið geti í raun notað tölvuna með þér: sjái það sem er á skjánum, smelli, slái inn, flakki um viðmót og færi sig milli verkfæra af nákvæmni.

Teymi hjá OpenAI nota nú þegar þessa styrkleika í raunverulegum vinnuflæðum. Í dag nota meira en 85% fyrirtækisins Codex í hverri viku í hlutverkum á borð við hugbúnaðarverkfræði, fjármál, samskipti, markaðsmál, gagnafræði og vörustjórnun. Í Comms notaði teymið GPT‑5.5 í Codex til að greina sex mánaða gögn um beiðnir um framkomu, byggja upp mats- og áhætturamma og sannreyna sjálfvirkan Slack-fulltrúa svo hægt væri að afgreiða lágáhættubeiðnir sjálfkrafa á meðan beiðnir með meiri áhættu væru enn vísaðar áfram til mannlegrar yfirferðar. Í fjármáladeildinni notaði teymið Codex til að fara yfir 24.771 K-1 skattaskjöl, samtals 71.637 blaðsíður, með vinnuflæði sem útilokaði persónuupplýsingar og hjálpaði teyminu að ljúka verkefninu tveimur vikum fyrr en árið áður. Í fara-á-markað teyminu sjálfvirknivæddi starfsmaður gerð vikulegra viðskiptaskýrslna og sparaði þannig 5-10 klukkustundir á viku.

Í ChatGPT veitir GPT‑5.5 Thinking hraðari aðstoð við erfiðari verkefni, með snjallari og hnitmiðaðri svörum sem hjálpa þér að vinna flókin verkefni á skilvirkari hátt. Það skarar fram úr í faglegum verkefnum eins og kóðun, rannsóknum, samþættingu upplýsinga og greiningu, og verkefnum sem byggja mikið á skjölum, sérstaklega þegar viðbætur eru notaðar.

Í GPT‑5.5 Pro sjá fyrstu prófunaraðilar verulegar framfarir bæði hvað varðar flækjustig og gæði þeirra verkefna sem ChatGPT getur tekið að sér, ásamt framförum í biðtíma sem gera það mun hagnýtara fyrir krefjandi verkefni. Í samanburði við GPT‑5.4 Pro töldu prófunaraðilar svör GPT‑5.5 Pro vera marktækt ítarlegri, betur uppbyggð, nákvæmari, viðeigandi og gagnlegri, með sérlega sterka frammistöðu á sviði viðskipta, lögfræði, menntunar og gagnavísinda.

GPT‑5.5 nær framúrskarandi árangri á mörgum viðmiðum sem endurspegla þessa tegund vinnu. Á GDPval, mati sem prófar hæfni fulltrúa til að skila vel skilgreindri þekkingarvinnu yfir 44 starfsgreinar, fær GPT‑5.5 84,9%. Á OSWorld-Verified, sem mælir hvort líkan geti starfað sjálfstætt í raunverulegum tölvuumhverfum, nær það 78,7%. Og á Tau2-bench Telecom, sem prófar flókna verkferla í þjónustuveri, nær það 98,0% án fínstillingar á kvaðningu. GPT‑5.5 stendur sig einnig vel á öðrum viðmiðum fyrir þekkingarvinnu: 60,0% á FinanceAgent, 88,5% á innri verkefnum í líkanagerð fyrir fjárfestingabanka og 54,1% á OfficeQA Pro.

Tau2-bench Telecom var keyrt án kvaðningarfínstillingar (og með GPT‑4.1 sem líkan). GPT‑5.5 skilur tilgang verkefnisins betur og er hagkvæmari í notkun tóka en forverar þess.

„GPT-5.5 skilar þeirri viðvarandi frammistöðu sem krafist er fyrir vinnuálag sem krefst mikillar framkvæmdar.“ Smíðað og keyrt á NVIDIA GB200 NVL72 kerfum gerir líkanið teymum okkar kleift að afhenda heildstæða eiginleika út frá kvaðningum á náttúrulegu máli, stytta villuleitartíma úr mörgum dögum í klukkustundir og breyta margra vikna tilraunavinnu í framfarir á einni nóttu í flóknum kóðagrunnum. „Meira en bara hraðari kóðun — þetta er nýr vinnumáti sem hjálpar fólki að starfa á allt öðrum hraða.“
— Justin Boitano, varaforseti gervigreindar fyrir fyrirtæki hjá NVIDIA

Vísindarannsókn

GPT‑5.5 sýnir einnig framfarir í vísindalegum og tæknilegum rannsóknarvinnuflæðum, sem krefjast meira en þess að svara erfiðri spurningu. Rannsakendur þurfa að kanna hugmynd, safna gögnum, prófa forsendur, túlka niðurstöður og ákveða hvað á að reyna næst. GPT‑5.5 er betra í að halda áfram í gegnum þá lykkju en önnur líkön.

Athyglisvert er að GPT‑5.5 sýnir skýrar framfarir umfram GPT‑5.4 á GeneBench(opnast í nýjum glugga), nýju mati sem beinist að fjölþrepa vísindalegri gagnagreiningu í erfðafræði og megindlegri líffræði. Þessi verkefni krefjast þess að líkön íhugi gögn sem kunna að vera tvíræð eða gölluð með lágmarks handleiðslu, takist á við raunhæfar hindranir eins og falda blendniþætti eða bilanir í gæðaeftirliti og innleiði og túlki nútímalegar tölfræðilegar aðferðir á réttan hátt. Frammistaða líkansins er sláandi í ljósi þess að verkefnin hér samsvara oft margra daga verkefnum fyrir vísindasérfræðinga.

Á sama hátt náði GPT‑5.5 á BixBench(opnast í nýjum glugga), viðmiði sem er hannað út frá raunverulegum verkefnum í lífupplýsingafræði og gagnagreiningu, bestu frammistöðu meðal líkana með birtar niðurstöður. Vísindaleg geta líkansins er nú orðin nægilega sterk til að flýta fyrir framförum á framarlega sviði líflæknisfræðilegra rannsókna sem raunverulegur samstarfsmaður í vísindum.

Í öðru dæmi hjálpaði innri útgáfa af GPT‑5.5 með sérsniðnum stoðbúnaði að uppgötva nýja sönnun(opnast í nýjum glugga) um Ramsey-tölur, eitt af lykilhugtökunum í talningarfræði. Talningarfræði rannsakar hvernig stakstæð fyrirbæri tengjast: gröf, net, mengi og mynstur. Ramsey-tölur fjalla í grófum dráttum um hversu stórt net þarf að vera til að tryggja að einhvers konar regla komi fram. Niðurstöður á þessu sviði eru sjaldgæfar og oft tæknilega flóknar. Hér fann GPT‑5.5 sönnun á þekktri asymptótískri staðreynd um Ramsey-tölur utan hornalínu, sem síðar var staðfest í Lean. Niðurstaðan er áþreifanlegt dæmi um hvernig GPT‑5.5 leggur sitt af mörkum, ekki aðeins með kóða eða skýringum, heldur einnig með óvæntri og gagnlegri stærðfræðilegri röksemdafærslu á lykilsviði rannsókna.

Fyrstu prófunaraðilar notuðu GPT‑5.5 Pro í ChatGPT minna eins og ein-skots svaravél og meira eins og rannsóknarfélaga: að fara yfir handrit ítrekað með gagnrýnum hætti, prófa tæknileg rök undir álagi, leggja til greiningar og vinna með kóða, glósur og samhengi úr PDF-skjölum. Sameiginlegi þráðurinn er sá að GPT‑5.5 er betra í að hjálpa rannsakendum að komast frá spurningu yfir í tilraun og niðurstöðu.

Derya Unutmaz, prófessor í ónæmisfræði og rannsakandi við Jackson rannsóknarstofunni fyrir erfðalækningar, notaði GPT‑5.5 Pro til að greina gagnasafn um genatjáningu með 62 sýnum og tæplega 28.000 genum og bjó til ítarlega rannsóknarskýrslu sem dró ekki aðeins saman niðurstöðurnar heldur dró einnig fram lykilspurningar og mikilvæga innsýn — verk sem hann sagði að hefði tekið teymi hans mánuði.

Bartosz Naskręcki, dósent í stærðfræði við Adam Mickiewicz háskólann í Poznań, Póllandi, notaði GPT‑5.5 í Codex til að þróa forrit fyrir algebrulega rúmfræði út frá einni kvaðningu á 11 mínútum. Forritið sýnir sjónrænan skurðpunkt annars stigs flata og umbreytir ferlinum í Weierstrass-líkan.

Hann bætti síðar við forritið stöðugri myndrænni framsetningu á sérstöðum og nákvæmum stuðlum sem hægt er að nota aftur í frekari vinnu. Fyrir hann er stærsta breytingin sú að Codex getur nú hjálpað til við að innleiða sérsniðin verkflæði fyrir stærðfræðilega myndræna framsetningu og tölvualgebru sem áður kröfðust sérhæfðra verkfæra. Saman sýna þessi dæmi hvernig GPT‑5.5 breytir ásetningi sérfræðinga í virk rannsóknarverkfæri og greiningar.

""

Heimild: Bartosz Naskręcki(opnast í nýjum glugga)

Kvaðning: # Skurður flata í algebrulegri rúmfræði

Búðu til app sem teiknar tvo annars stigs fleti og litar skurðferilinn rauðan. Notaðu reiknanlega Riemann-Roch-setningu til að umbreyta þessu í Weierstrass-feril.

## Aðalgluggi

Tveir litaðir fletir með örlítið gagnsærri skyggingu og hágæða myndgerð skerast eftir rauðri algebrulegri kúrfu.

Snúningur með músinni í báðar áttir, fullur klípibúnaður fyrir aðdrátt, snertiskyn til að sýna litlu valmyndina með sleðum til að breyta stuðlum hvers yfirborðs; greining í gegnum Z-biðminnisstig

## Hægri hliðargluggi

Stutt Weierstrass-jafna (yfir Q eða fjórðungsútvíkkun sviðs) reiknuð á ferðinni með formúlum úr skilvirkri Riemann-Roch setningu

## Umhverfishamur þar sem allar stýringar eru faldar og notandinn getur notið fegurðar formanna

## Tæknilýsingar

Appið keyrir í vafranum, létt útfærsla með nýjustu full stack söfnum, færanlegt og auðvelt að dreifa

## Skjöl

Git-geymsla, dagbók, áætlun (Markdown-skrár)

„Það er ótrúlega hvetjandi að nota nýja GPT-5.5 líkan OpenAI í prófunarumhverfi okkar, láta það vinna úr gríðarstórum lífefnafræðilegum gagnasöfnum til að spá fyrir um áhrif lyfja á fólk og sjá það síðan skila verulegum nákvæmnisaukningum í erfiðustu matsverkefnum okkar í lyfjaþróun.“ Ef OpenAI heldur áfram að standa sig svona vel munu undirstöður lyfjauppgötvunar breytast fyrir árslok.“
— Brandon White, meðstofnandi og forstjóri Axiom Bio

Skilvirkni næstu kynslóðar ályktunar

Að keyra GPT‑5.5 með töf GPT‑5.4 krafðist þess að endurhugsa ályktunarvinnslu sem samþætt kerfi frekar en safn einangraðra hagræðinga. GPT‑5.5 var hannað fyrir, þjálfað með og keyrt á NVIDIA GB200 og GB300 NVL72 kerfum. Codex og GPT‑5.5 gegndu lykilhlutverki í því hvernig við náðum frammistöðumarkmiðum okkar. Codex hjálpaði teyminu að vinna hraðar frá hugmynd að samanburðarhæfri innleiðingu, með því að móta nálganir, setja upp tilraunir og hjálpa til við að greina hvaða bestanir væru þess virði að fjárfesta í. GPT‑5.5 hjálpaði til við að finna og innleiða mikilvægar umbætur í kerfislaginu sjálfu. Líkanið hjálpaði einfaldlega til við að bæta innviði þess sem þjóna því.

Ein slík úrbót var álagsjöfnun og leiðbeinandi reglur fyrir skiptingu. Fyrir GPT‑5.5 skiptum við beiðnum á hraðli í fastan fjölda hluta til að jafna vinnu á milli reiknikjarna, þannig að bæði stórar og litlar beiðnir gætu keyrt á sama GPU. Hins vegar er fyrirfram ákveðinn fjöldi fastra hluta ekki hentugur fyrir allar gerðir umferðar. Til að nýta GPU-einingar betur greindi Codex umferðarmynstur í framleiðslu yfir margar vikur og þróaði sérsniðin leitnireiknirit til að skipta vinnu á sem hagkvæmastan hátt og jafna álag. Átakið hafði veruleg áhrif og jók hraða við myndun tóka um meira en 20%.

Framfarir í netöryggi öllum til öryggis

Að undirbúa heiminn fyrir líkön sem eru mjög fær í að finna og lagfæra öryggisveikleika er samstarfsverkefni sem krefst þess að allt vistkerfið leggi sig fram við að byggja upp seiglu, með lýðræðisvæddum aðgangi að líkönum og ítrekaðri dreifingu fyrir næstu kynslóð netvarna.

Framarleg líkön verða sífellt hæfari í netöryggi. Sú hæfni verður víða aðgengileg og við teljum að besta leiðin fram á við sé að tryggja að hægt sé að nýta hana til að flýta fyrir netvörnum og styrkja vistkerfið.

GPT‑5.5 er stigvaxandi en mikilvægt skref í átt að gervigreind sem getur leyst sumar af erfiðustu áskorunum heims, svo sem netöryggi. Með GPT‑5.2 í desember innleiddum við fyrirbyggjandi nauðsynlegar netöryggisráðstafanir til að takmarka mögulega netmisnotkun á líkönum okkar; nú með GPT‑5.5 erum við að innleiða strangari flokkara fyrir mögulega netáhættu, sem sumum notendum kann í fyrstu að þykja hvimleitt, á meðan við fínstillum þá með tímanum.

Við höfum um árabil skilgreint netöryggi sem flokk í undirbúningsramma(opnast í nýjum glugga) okkar, þar sem líkön okkar hafa smám saman batnað, á meðan við þróum og stillum mótvægisaðgerðir í áföngum til að geta gefið út líkön með marktæka netöryggisgetu með ábyrgum hætti.

  • Við erum að innleiða öryggisráðstafanir sem eru leiðandi í greininni fyrir þetta stig netöryggisgetu. Við kynntum fyrst sértækar netöryggisráðstafanir með GPT‑5.2(opnast í nýjum glugga) á síðasta ári og höfum síðan haldið áfram að prófa, betrumbæta og þróa þær í síðari innleiðingum. Fyrir GPT‑5.5 hönnuðum við strangara eftirlit með starfsemi sem felur í sér meiri áhættu, viðkvæmum netöryggisbeiðnum og bættum við verndarráðstöfunum gegn endurtekinni misnotkun. Víðtækur aðgangur er tryggður með fjárfestingum okkar í öryggi líkana, auðkenndri notkun og eftirliti með óheimilli notkun. Við höfum unnið með utanaðkomandi sérfræðingum mánuðum saman að þróun, prófun og endurbótum á styrkleika þessara öryggisráðstafana. Með GPT‑5.5 tryggjum við að forritarar geti auðveldlega tryggt kóða sinn, á sama tíma og við setjum strangari skorður við netöryggisverkferli sem líklegust eru til að valda skaða af hálfu illgjarnra aðila.
  • Við erum að auka aðgang til að flýta fyrir netvörnum á öllum stigum. Við gerum líkön með rýmri heimildum til netöryggisnotkunar aðgengileg í gegnum Trusted Access for Cyber, og byrjum á Codex, sem veitir aukinn aðgang að háþróaðri netöryggisgetu GPT‑5.5 með færri takmörkunum fyrir staðfesta notendur sem uppfylla ákveðin traustviðmið(opnast í nýjum glugga) við upphaf. Stofnanir sem bera ábyrgð á að vernda mikilvæga innviði geta sótt um aðgang að líkönum með rýmri heimildum til netöryggisnotkunar, eins og GPT‑5.4‑Cyber, að því gefnu að þær uppfylli strangar öryggiskröfur til að nota þessi líkön til að tryggja innri kerfi sín. Þetta veitir fjölbreyttum hópi staðfestra varnaraðila öflugri verkfæri fyrir lögmætt öryggisstarf með minni óþarfa hindrunum, til að tryggja lýðræðislegan aðgang að mikilvægri varnargetu. Notendur geta sótt um traustan aðgang á chatgpt.com/cyber(opnast í nýjum glugga) til að draga úr óþarfa synjunum þegar GPT‑5.5 er notað í staðfest varnarstarf.
  • Við vinnum með samstarfsaðilum í stjórnsýslu að því að stuðla að vernd mikilvægra innviða fyrir almenning. Saman könnum við hvernig háþróuð gervigreind getur stutt við varnarstarf traustra embættismanna sem bera ábyrgð á kerfum sem fólk treystir á, allt frá stafrænum kerfum sem vernda mikilvæg skattagögn til raforkukerfisins og vatnsveitna í nærsamfélögum.

Við erum að meðhöndla líffræðilega/efnafræðilega getu og netgetu GPT‑5.5 sem háa samkvæmt undirbúningsramma(opnast í nýjum glugga) okkar. Þó að GPT‑5.5 hafi ekki náð mikilvægu stigi netöryggisgetu, sýndu mat okkar og prófanir að netöryggisgeta þess sé skref upp frá GPT‑5.4.

Auk þess fór GPT‑5.5 í gegnum fullt öryggis- og stjórnarferli okkar áður en það var gefið út, þar á meðal viðbúnaðarmat, sértækar prófanir á tilteknum sviðum, ný markviss mat á háþróaðri getu á sviði líffræði og netöryggis og ítarlegar prófanir með utanaðkomandi sérfræðingum. Við deilum frekari upplýsingum í GPT‑5.5 kerfiskortinu(opnast í nýjum glugga).

Þessi vinna endurspeglar víðtækari nálgun okkar að seiglu gervigreindar, sem við teljum nauðsynlega eftir því sem geta líkana eykst. Við viljum að öflug gervigreind sé aðgengileg þeim sem nota hana til að verja kerfi, stofnanir og almenning. Færa leiðin er traustur aðgangur, öflugar öryggisráðstafanir sem vaxa í takt við getu og rekstrargeta til að greina og bregðast við alvarlegri misnotkun.

Aðgengi og verð

Í dag hefst innleiðing GPT‑5.5 fyrir Plus, Pro, Business og Enterprise notendur í ChatGPT og Codex, og innleiðing GPT‑5.5 Pro fyrir Pro, Business og Enterprise notendur í ChatGPT. Við munum gera GPT‑5.5 og GPT‑5.5 Pro aðgengileg í API mjög fljótlega.

Í ChatGPT er GPT‑5.5 Thinking í boði fyrir Plus-, Pro-, Business- og Enterprise-notendur. GPT‑5.5 Pro, hannað fyrir enn erfiðari spurningar og vinnu sem krefst meiri nákvæmni, er í boði fyrir Pro-, Business- og Enterprise-notendur.

Í Codex er GPT‑5.5 í boði fyrir Plus-, Pro-, Business-, Enterprise-, Edu- og Go-áskriftir með 400.000 samhengisglugga. GPT‑5.5 er einnig í boði í hraðstillingu og myndar tóka 1,5x hraðar fyrir 2,5x meiri kostnað.

Fyrir API-forritara verður gpt-5.5 brátt fáanlegt í Responses API og API fyrir spjalllok á 5 USD fyrir hverja 1 milljón inntakstóka og 30 USD fyrir hverja 1 milljón úttakstóka, með 1 milljón tóka samhengisglugga. Verðlagning fyrir Batch og Flex er í boði á helmingi staðlaðs API-verðs, en forgangsvinnsla er í boði á 2,5-földu staðlaða verðinu. Við munum einnig gefa út gpt-5.5-pro í API fyrir enn meiri nákvæmni, á verði 30 USD fyrir hverja 1 milljón inntakstóka og 180 USD fyrir hverja 1 milljón úttakstóka. Skoðaðu verðlagningarsíðuna til að fá nánari upplýsingar.

Þó að GPT‑5.5 sé verðlagt hærra en GPT‑5.4 er það bæði greindara og mun hagkvæmara í tókanotkun. Í Codex höfum við fínstillt upplifunina vandlega þannig að GPT‑5.5 skilar betri niðurstöðum með færri tókum en GPT‑5.4 fyrir flesta notendur, um leið og við höldum áfram að bjóða upp á rausnarlegt notkunarmagn á öllum áskriftarleiðum.

Möt

Kóðun

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (Public) *

58,6%

57,7%

-

-

64,3%

54,2%

Terminal-Bench 2.0

82,7%

75,1%

-

-

69,4%

68,5%

Expert-SWE (Internal)

73,1%

68,5%

-

-

-

-

*Rannsóknarstofur hafa tekið eftir vísbendingum um minnisfesti(opnast í nýjum glugga) í þessu mati

Faglegur

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (wins or ties)

84,9%

83,0%

82,3%

82,0%

80,3%

67,3%

FinanceAgent v1.1

60,0%

56,0%

-

61,5%

64,4%

59,7%

Verkefni í líkanagerð fyrir fjárfestingabanka (innri)

88,5%

87,3%

88,6%

83,6%

-

-

OfficeQA Pro

54,1%

53,2%

-

-

43,6%

18,1%

Notkun á tölvu og sýn

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld-Verified

78,7%

75,0%

-

-

78,0%

-

MMMU Pro (án verkfæra)

81,2%

81,2%

-

-

-

80,5%

MMMU Pro (með verkfærum)

83,2%

82,1%

-

-

-

-

Notkun verkfæra

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84,4%

82,7%

90,1%

89,3%

79,3%

85,9%

MCP Atlas**

75,3%

70,6%

-

-

79,1%

78,2%

Toolathlon

55,6%

54,6%

-

-

-

48,8%

Tau2-bench Telecom***
(upprunalegar kvaðningar)

98,0%

92,8%

-

-

-

-

** MCP Atlas: niðurstöður frá Scale AI eftir nýjustu uppfærsluna í apríl 2026. 
*** Tau2-bench telecom: niðurstöður fyrir 5,5 og 5,4 með upprunalegum kvaðningum, þ.e. engin aðlögun á kvaðningum Þetta sleppir niðurstöðum frá öðrum rannsóknarstofum sem voru metnar með aðlögun kvaðninga.

Akademískt

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25,0%

19,0%

33,2%

25,6%

-

-

FrontierMath stig 1–3

51,7%

47,6%

52,4%

50,0%

43,8%

36,9%

FrontierMath stig 4

35,4%

27,1%

39,6%

38,0%

22,9%

16,7%

BixBench

80,5%

74,0%

-

-

-

-

GPQA Diamond

93,6%

92,8%

-

94,4%

94,2%

94,3%

Humanity's Last Exam (engin verkfæri)

41,4%

39,8%

43,1%

42,7%

46,9%

44,4%

Humanity's Last Exam (með verkfærum)

52,2%

52,1%

57,2%

58,7%

54,7%

51,4%

Netöryggi

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Capture-the-Flags áskorunarverkefni (innri)****

88,1%

83,7%

-

-

-

-

CyberGym

81,8%

79,0%

-

-

73,1%

-

**** Útvíkkun á erfiðustu CTF-verkefnunum sem notuð eru í kerfiskortum með viðbótar erfiðum áskorunum.

Langt samhengi

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256 þús. f1

73,7%

62,5%

-

-

76,9%

-

Graphwalks BFS 1 mil f1

45,4%

9,4%

-

-

41,2% (Opus 4.6)

-

Graphwalks parents 256 þús. f1

90,1%

82,8%

-

-

93,6%

-

Graphwalks parents 1 mil f1

58,5%

44,4%

-

-

72,0% (Opus 4.6)

-

OpenAI MRCR v2 8-needle 4 þús.-8 þús.

98,1%

97,3%

-

-

-

-

OpenAI MRCR v2 8-needle 8 þús.-16 þús.

93,0%

91,4%

-

-

-

-

OpenAI MRCR v2 8-needle 16 þús.-32 þús.

96,5%

97,2%

-

-

-

-

OpenAI MRCR v2 8-needle 32 þús.-64 þús.

90,0%

90,5%

-

-

-

-

OpenAI MRCR v2 8-needle 64 þús.-128 þús.

83,1%

86,0%

-

-

-

-

OpenAI MRCR v2 8-needle 128 þús.-256 þús.

87,5%

79,3%

-

-

59,2%

-

OpenAI MRCR v2 8-needle 256 þús.-512 þús.

81,5%

57,5%

-

-

-

-

OpenAI MRCR v2 8-needle 512 þús.-1 mil

74,0%

36,6%

-

-

32,2%

-

Abstrakt hugsun

Mat

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGG-1 (Verified)

95,0%

93,7%

-

94,5%

93,5%

98,0%

ARC-AGG-2 (Verified)

85,0%

73,3%

-

83,3%

75,8%

77,1%

Mat á GPT var keyrt með rök stilltum á xhigh og framkvæmt í rannsóknarumhverfi, sem getur í sumum tilfellum skilað örlítið frábrugðnu úttaki miðað við framleiðsluútgáfu ChatGPT.

Höfundur

OpenAI