Posodobitev z dne 24. aprila 2026: GPT‑5.5 in GPT‑5.5 Pro sta zdaj na voljo v API-ju. Sistemski dokument je bil prav tako posodobljen, da opisuje dodatne zaščitne ukrepe, ki veljajo.
Predstavljamo GPT‑5.5, naš doslej najpametnejši in najintuitivnejši model za uporabo ter naslednji korak k novemu načinu opravljanja dela z računalnikom.
GPT‑5.5 hitreje razume, kaj želite narediti, in lahko sam opravi več dela. Odlikuje se pri pisanju in razhroščevanju kode, spletnem raziskovanju, analiziranju podatkov, ustvarjanju dokumentov in preglednic, uporabi programske opreme ter prehajanju med orodji, dokler naloga ni dokončana. Namesto da bi skrbno upravljali vsak korak, lahko modelu GPT‑5.5 prepustite neurejeno, večdelno nalogo in mu zaupate, da bo načrtoval, uporabljal orodja, preverjal svoje delo, se znašel v dvoumnih okoliščinah in nadaljeval z delom.
Napredek je še posebej izrazit pri agentskem kodiranju, uporabi računalnika, miselnem delu in zgodnjih fazah znanstvenega raziskovanja – na področjih, kjer je napredek odvisen od sklepanja na podlagi konteksta in izvajanja dejanj skozi čas. GPT‑5.5 prinaša ta napredek v inteligenci brez kompromisov pri hitrosti: večji in zmogljivejši modeli so pogosto počasnejši pri odzivanju, vendar GPT‑5.5 v produkcijskem okolju dosega enako latenco na žeton kot GPT‑5.4, pri tem pa deluje na bistveno višji ravni inteligence. Prav tako uporablja bistveno manj žetonov za dokončanje istih nalog v Codexu, zaradi česar je učinkovitejši in zmogljivejši.
Objavljamo model GPT‑5.5 z našim doslej najmočnejšim naborom varovalnih mehanizmov, zasnovanih za zmanjšanje zlorab in hkrati ohranjanje dostopa za koristno delo. Pred izdajo smo ta model ocenili v okviru našega celotnega nabora okvirov za varnost in pripravljenost, sodelovali z notranjimi in zunanjimi strokovnjaki za preskušanje napadov, izvedli ciljno usmerjeno testiranje za napredne zmogljivosti na področju kibernetske varnosti in biologije ter zbrali povratne informacije o dejanskih primerih uporabe od skoraj 200 zaupanja vrednih partnerjev z zgodnjim dostopom.
Danes se GPT‑5.5 uvaja za uporabnike različic Plus, Pro, Business in Enterprise v ChatGPT‑ju in Codexu, medtem ko se GPT‑5.5 Pro uvaja za uporabnike različic Pro, Business in Enterprise v ChatGPT‑ju. Uvajanje API-ja zahteva posebne zaščitne ukrepe, zato tesno sodelujemo s partnerji in strankami pri varnostnih in zaščitnih zahtevah za njegovo uporabo v velikem obsegu. GPT‑5.5 in GPT‑5.5 Pro bomo kmalu omogočili v API-ju.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82,7% | 75,1 % | - | - | 69,4 % | 68,5 % |
Expert-SWE (interno) | 73,1 % | 68,5 % | - | - | - | - |
GDPval (zmage ali neodločeni izidi) | 84,9 % | 83,0% | 82,3 % | 82,0 % | 80,3 % | 67,3 % |
OSWorld-Verified | 78,7 % | 75,0% | - | - | 78,0 % | - |
Toolathlon | 55,6 % | 54,6 % | - | - | - | 48,8 % |
BrowseComp | 84,4 % | 82,7% | 90,1 % | 89,3 % | 79,3 % | 85,9 % |
FrontierMath stopnje 1–3 | 51,7 % | 47,6 % | 52,4 % | 50,0 % | 43,8 % | 36,9 % |
FrontierMath stopnja 4 | 35,4 % | 27,1 % | 39,6 % | 38,0 % | 22,9 % | 16,7 % |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
OpenAI gradi globalno infrastrukturo za agente umetne inteligence, kar ljudem in podjetjem po vsem svetu omogoča, da z umetno inteligenco opravijo svoje delo. V preteklem letu smo opazili, da umetna inteligenca močno pospešuje programski inženiring. Z GPT‑5.5 v Codexu in ChatGPT‑ju se ta ista preobrazba začenja širiti tudi na znanstveno raziskovanje in širše naloge, ki jih ljudje opravljajo na računalnikih.
Na vseh teh področjih GPT‑5.5 ni le inteligentnejši, temveč tudi učinkovitejši pri reševanju problemov ter pogosto dosega kakovostnejše rezultate z manj žetoni in manj ponovnimi poskusi. Na indeksu Coding Index podjetja Artificial Analysis GPT‑5.5 zagotavlja najsodobnejšo inteligenco za polovico nižjo ceno od konkurenčnih prelomnih modelov za kodiranje.
Indeks analize umetne inteligence (Artificial Analysis Intelligence Index)(odpre se v novem oknu) je tehtano povprečje 10 evalvacij, ki jih je izvedla zunanja organizacija: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 je naš najmočnejši agentski model za kodiranje doslej. Na Terminal-Bench 2.0, ki preizkuša kompleksne poteke dela v ukazni vrstici, ki zahtevajo načrtovanje, iteracijo in usklajevanje orodij, dosega najsodobnejšo natančnost 82,7 %. Na merilu SWE-Bench Pro, ki ocenjuje reševanje resničnih težav v GitHubu, dosega 58,6 % in v enem samem prehodu od začetka do konca reši več nalog kot prejšnji modeli. Na Expert-SWE, našem internem prelomnem ocenjevanju za dolgotrajne naloge kodiranja z ocenjeno mediano človeškega časa dokončanja 20 ur, GPT‑5.5 prav tako presega GPT‑5.4.
Pri vseh treh vrednotenjih GPT‑5.5 izboljšuje rezultate modela GPT‑5.4. z uporabo manjšega števila žetonov.
Prednosti modela pri kodiranju se jasno pokažejo v Codexu, kjer lahko prevzame inženirsko delo, od implementacije in preoblikovanja kode do odpravljanja napak, testiranja in validacije. Zgodnje testiranje kaže, da je GPT‑5.5 boljši pri vedenjih, od katerih je odvisno resnično inženirsko delo, kot so ohranjanje konteksta v obsežnih sistemih, sklepanje ob dvoumnih napakah, preverjanje predpostavk z orodji in prenašanje sprememb skozi okoliško kodo.
Izrisana trajektorija uporablja vektorske podatke NASA/JPL Horizons za Orion, Luno in Sonce. Merilo prikaza je prilagojeno za boljšo berljivost.
Poziv: [priložena slika] Implementiraj to kot novo aplikacijo z uporabo WebGL in Vite ter resničnih podatkov iz misije Artemis II. Poskrbi, da aplikacijo temeljito preizkusiš, dokler ne bo popolnoma delujoča in videti kot aplikacija na sliki. Bodi posebej pozoren na upodabljanje planetov in poti leta. 3D-upodobitev naj bo interaktivna. Poskrbi, da ima aplikacija realistično orbitalno mehaniko.
Poleg meril so zgodnji preizkuševalci povedali, da GPT‑5.5 kaže večjo sposobnost razumeti zgradbo sistema: zakaj nekaj ne deluje, kam je treba umestiti popravek in kaj vse drugega v kodni zbirki bi bilo prizadeto.

»Prvi model za kodiranje, ki sem ga uporabil in ima resnično konceptualno jasnost.«
Dan Shipper, ustanovitelj in izvršni direktor podjetja Every, je GPT‑5.5 opisal kot »prvi model za kodiranje, ki sem ga uporabljal in ki premore resno konceptualno jasnost«.
Po zagonu aplikacije je več dni odpravljal napake pri težavi po zagonu, nato pa je pritegnil enega svojih najboljših inženirjev, da na novo napiše del sistema. Da bi preizkusil GPT‑5.5, je dejansko zavrtel čas nazaj: ali bi model lahko pogledal pokvarjeno stanje in ustvaril enako vrsto predelave, za katero se je inženir nazadnje odločil? GPT‑5.4 tega ni mogel. GPT‑5.5 je lahko.

»Resnično se zdi, kot da sodelujem z višjo inteligenco, in skoraj čutim neko spoštovanje.«
Pietro Schirano, glavni izvršni direktor podjetja MagicPath, je opazil podoben preskok, ko je model GPT‑5.5 združil vejo s stotinami sprememb v uporabniškem vmesniku in refaktorizaciji v glavno vejo, ki se je prav tako bistveno spremenila, pri čemer je vse opravil naenkrat v približno 20 minutah.
Višji inženirji, ki so testirali model, so povedali, da je bil GPT‑5.5 opazno boljši od GPT‑5.4 in Claude Opus 4.7 pri sklepanju in avtonomnosti, saj je vnaprej zaznal težave in predvidel potrebe po testiranju ter pregledu brez izrecnega pozivanja. V enem primeru je inženir prosil, naj preoblikuje arhitekturo sistema komentarjev v sodelovalnem urejevalniku markdowna. Ko se je vrnil, ga je pričakal sklop 12 razlik, ki je bil skoraj dokončan. Drugi so povedali, da so potrebovali presenetljivo malo popravkov pri implementaciji in da so bolj zaupali načrtom GPT‑5.5 v primerjavi z GPT‑5.4.
Eden od inženirjev pri NVIDIA, ki je imel zgodnji dostop do modela, je šel celo tako daleč, da je dejal: »Izguba dostopa do GPT‑5.5 je, kot da bi mi amputirali ud.«
»GPT-5.5 je opazno pametnejši in vztrajnejši od GPT-5.4, z večjo zmogljivostjo pri kodiranju in zanesljivejšo uporabo orodij. Ostane osredotočen na nalogo precej dlje, ne da bi predčasno prenehal, kar je najpomembnejše pri kompleksnem, dolgotrajnem delu, ki ga naši uporabniki dodelijo Cursorju.«
Iste prednosti, zaradi katerih je GPT‑5.5 odličen pri kodiranju, ga naredijo zmogljivo orodje za vsakodnevno delo na računalniku. Ker model bolje razume namero, se lahko bolj naravno premika skozi celoten krog miselnega dela: iskanje informacij, razumevanje pomembnega, uporaba orodij, preverjanje rezultatov in pretvarjanje surovih podatkov v nekaj uporabnega.
V Codexu je GPT‑5.5 boljši od GPT‑5.4 pri ustvarjanju dokumentov, preglednic in predstavitev diapozitivov. Alfa preizkuševalci so povedali, da presega pretekle modele pri nalogah, kot so operacijske raziskave, modeliranje preglednic in pretvarjanje neurejenih poslovnih vhodnih podatkov v načrte. V kombinaciji s Codexovimi zmožnostmi uporabe računalnika nas GPT‑5.5 približa občutku, da lahko model dejansko uporablja računalnik skupaj z vami: vidi, kaj je na zaslonu, klika, tipka, krmari po vmesnikih in se natančno premika med orodji.
Ekipe pri OpenAI že uporabljajo te prednosti v resničnih delovnih tokovih. Danes več kot 85 % podjetja vsak teden uporablja Codex v različnih funkcijah, vključno s programskim inženiringom, financami, komunikacijami, trženjem, podatkovno znanostjo in vodenjem produktov. V ekipi za komuniciranje so uporabili GPT‑5.5 v Codexu za analizo šestmesečnih podatkov o zahtevah za govorne nastope, vzpostavitev okvira za točkovanje in oceno tveganj ter validacijo avtomatiziranega agenta v Slacku. Zahteve z nizkim tveganjem so se lahko obravnavale samodejno, medtem ko so zahteve z višjim tveganjem še vedno usmerjene v človeški pregled. V finančnem oddelku je ekipa uporabila Codex za pregled 24.771 davčnih obrazcev K-1 v skupnem obsegu 71.637 strani. Uporabili so delovni tok, ki je izključeval osebne podatke, in nalogo zaključili dva tedna hitreje kot v prejšnjem letu. V ekipi s strategijo lansiranja na trg je zaposleni avtomatiziral pripravo tedenskih poslovnih poročil, s čimer je prihranil 5–10 ur na teden.
V ChatGPT‑ju model GPT‑5.5 Thinking omogoča hitrejšo pomoč pri zahtevnejših problemih s pametnejšimi in jedrnatejšimi odgovori, ki vam pomagajo učinkoviteje opraviti kompleksno delo. Odlikuje se pri strokovnem delu, kot so kodiranje, raziskovanje, sinteza informacij in analiza ter naloge z obsežno dokumentacijo, zlasti pri uporabi vtičnikov.
Pri GPT‑5.5 Pro zgodnji preizkuševalci opažajo občuten napredek tako pri zahtevnosti kot kakovosti nalog, ki jih lahko prevzame ChatGPT, skupaj z izboljšavami zakasnitve, zaradi katerih je veliko bolj praktičen za zahtevnejše naloge. V primerjavi z modelom GPT‑5.4 Pro so preizkuševalci ugotovili, da so bili odgovori GPT‑5.5 Pro bistveno bolj celoviti, bolje strukturirani, natančnejši, ustreznejši in uporabnejši, pri čemer so se še posebej dobro odrezali na področjih poslovanja, prava, izobraževanja in podatkovne znanosti.
GPT‑5.5 dosega vrhunske rezultate na več primerjalnih testih, ki odražajo tovrstno delo. Na merilu GDPval, ki preizkuša sposobnosti agentov za izvajanje jasno opredeljenih nalog s strokovnim znanjem v 44 poklicih, GPT‑5.5 doseže 84,9 %. Na OSWorld-Verified, ki meri, ali lahko model samostojno upravlja resnična računalniška okolja, doseže 78,7 %. Na Tau2-bench Telecom, ki preizkuša kompleksne poteke dela v službi za pomoč strankam, doseže 98,0 % brez prilagajanja poziva. GPT‑5.5 se odlično odreže tudi pri drugih primerjalnih testih za delo, ki temelji na znanju: 60,0 % pri FinanceAgent, 88,5 % pri internih nalogah modeliranja v investicijskem bančništvu in 54,1 % pri OfficeQA Pro.
Tau2-bench Telecom je bil izveden brez prilagoditve pozivov (z GPT‑4.1 kot uporabniškim modelom). GPT‑5.5 bolje razume namen naloge in je učinkovitejši pri rabi žetonov kot njegovi predhodniki.
»GPT-5.5 zagotavlja trajno zmogljivost, potrebno za delo, ki zahteva veliko izvajanja. Model, zgrajen in nameščen na sistemih NVIDIA GB200 NVL72, našim ekipam omogoča uvajanje funkcionalnosti od začetka do konca na podlagi pozivov v naravnem jeziku, skrajšanje časa odpravljanja napak z dni na ure ter spreminjanje večtedenskega eksperimentiranja v napredek čez noč v kompleksnih kodnih zbirkah. To je več kot le hitrejše kodiranje – to je nov način dela, ki ljudem pomaga delovati s temeljno drugačno hitrostjo.«
GPT‑5.5 prav tako kaže napredek pri znanstvenih in tehničnih raziskovalnih delovnih procesih, ki zahtevajo več kot zgolj odgovor na zahtevno vprašanje. Raziskovalci morajo raziskati idejo, zbrati dokaze, preveriti predpostavke, interpretirati rezultate in se odločiti, kaj poskusiti naslednje. GPT‑5.5 se bolje obnese pri vztrajanju skozi to zanko kot drugi modeli.
Predvsem GPT‑5.5 kaže jasno izboljšanje v primerjavi z GPT‑5.4 pri GeneBench(odpre se v novem oknu), novem vrednotenju, ki se osredotoča na večstopenjsko znanstveno analizo podatkov v genetiki in kvantitativni biologiji. Ti problemi zahtevajo, da modeli sklepajo o potencialno dvoumnih ali napačnih podatkih ob minimalnem nadzornem usmerjanju, obravnavajo realistične ovire, kot so skriti moteči dejavniki ali napake pri kontroli kakovosti, in pravilno implementirajo ter interpretirajo sodobne statistične metode. Učinkovitost modela je osupljiva, še posebej glede na to, da naloge tukaj pogosto ustrezajo večdnevnim projektom za znanstvene strokovnjake.
Podobno je na BixBenchu(odpre se v novem oknu), merilu, zasnovanem na resnični bioinformatiki in analizi podatkov, GPT‑5.5 dosegel vodilno zmogljivost med modeli z objavljenimi rezultati. Znanstvene zmogljivosti modela so zdaj dovolj močne, da kot pravi soznanstvenik smiselno pospešujejo napredek na prelomnih področjih biomedicinskih raziskav.
V drugem primeru je interna različica GPT‑5.5 s prilagojenim ogrodjem pomagala odkriti nov dokaz(odpre se v novem oknu) o Ramseyjevih številih, ki so eden ključnih pojmov v kombinatoriki. Kombinatorika proučuje, kako se diskretni objekti med seboj povezujejo: grafi, omrežja, množice in vzorci. Ramseyjeva števila v grobem opisujejo, kako veliko mora biti omrežje, da se v njem zagotovo pojavi neka vrsta reda. Rezultati na tem področju so redki in pogosto tehnično zahtevni. Tukaj je GPT‑5.5 našel dokaz dolgo znanega asimptotičnega dejstva o izven-diagonalnih Ramseyjevih številih, ki so ga pozneje preverili v Leanu. Rezultat je konkreten primer, kako GPT‑5.5 prispeva ne samo k kodi ali razlagi, temveč tudi k presenetljivemu in uporabnemu matematičnemu argumentu na osrednjem raziskovalnem področju.
Zgodnji preizkuševalci so GPT‑5.5 Pro v ChatGPT uporabljali manj kot učenje iz enega primera in bolj kot raziskovalnega partnerja: podajal je pripombe k rokopisom v več iteracijah, preverjal tehnične argumente, predlagal analize ter delal s kodo, zapiski in PDF kontekstom. Skupna nit je, da GPT‑5.5 bolje podpira raziskovalce pri prehodu od vprašanja do eksperimenta in rezultatov.
Derya Unutmaz, profesor imunologije in raziskovalec na laboratoriju Jackson za genomiko in medicino, je uporabil GPT‑5.5 Pro za analizo nabora podatkov o izražanju genov z 62 vzorci in skoraj 28.000 geni ter pripravil podrobno raziskovalno poročilo, ki ugotovitev ni le povzelo, temveč je tudi izpostavilo ključna vprašanja in spoznanja – za delo, za katero je po njegovih besedah njegova ekipa potrebovala več mesecev.
Bartosz Naskręcki, docent matematike na Univerzi Adama Mickiewicza v Poznanju na Poljskem, je uporabil GPT‑5.5 v Codexu, da je v 11 minutah iz enega samega poziva ustvaril aplikacijo za algebraično geometrijo, ki vizualizira presek kvadratnih ploskev in pretvori nastalo krivuljo v Weierstrassov model.
Pozneje je aplikacijo razširil s stabilnejšo vizualizacijo singularnosti in natančnimi koeficienti, ki jih je mogoče ponovno uporabiti pri nadaljnjem delu. Zanj je večji premik to, da lahko Codex zdaj pomaga vzpostaviti prilagojene tokove za matematično vizualizacijo in računalniško algebro, za katere so bila prej potrebna namenska orodja. Ti primeri skupaj kažejo GPT‑5.5, ki strokovne namene pretvarja v delujoča raziskovalna orodja in analize.

Zasluge: Bartosz Naskręcki(odpre se v novem oknu)
Poziv: # Presek ploskev v algebraični geometriji
Ustvari aplikacijo, ki nariše dve kvadratni ploskvi in presečno krivuljo obarva rdeče. Uporabi Riemann-Rochov računski izrek, da to pretvoriš v Weierstrassovo krivuljo.
## Glavno okno
Dve obarvani ploskvi z rahlo prosojnim senčenjem, visokokakovostna upodobitev, se sekata vzdolž rdeče obarvane algebraične krivulje
Vrtenje z miško v obe smeri, polna podpora ščipanju za povečavo, haptični pritisk za prikaz majhnega menija z drsniki za spreminjanje koeficientov posamezne površine; zaznavanje prek ravni Z-medpomnilnika.
## Okno na desni strani
Kratka Weierstrassova enačba (nad Q ali kvadratno razširvijo polja) izračunana v Go z uporabo formul efektivnega Riemann-Rochovega izreka.
## Ambientni način, kjer so vsi kontrolniki skriti in uporabnik lahko občuduje lepoto oblik
## Specifikacije
Aplikacija deluje v brskalniku, lahka implementacija z najnovejšimi knjižnicami za celoten sklad, prenosljiva in primerna za uvedbo
## Dokumenti
repozitorij Git, dnevnik, načrt (datoteke Markdown)
»Izjemno spodbudno je uporabljati novi model GPT-5.5 družbe OpenAI v našem ogrodju, omogočiti mu sklepanja na podlagi obsežnih biokemijskih podatkovnih zbirk za napovedovanje učinkov zdravil pri ljudeh in nato opaziti pomembne izboljšave natančnosti pri naših najzahtevnejših evalvacijah odkrivanja zdravil. Če bo OpenAI nadaljeval v tem tempu, se bodo temelji odkrivanja zdravil do konca leta bistveno spremenili.«
Zagotavljanje GPT‑5.5 z zakasnitvijo GPT‑5.4 je zahtevalo, da sklepanje na novo premislimo kot integriran sistem, ne kot skupek izoliranih optimizacij. GPT‑5.5 je bil sooblikovan, usposobljen in deluje na sistemih NVIDIA GB200 in GB300 NVL72. Codex in GPT‑5.5 sta imela ključno vlogo pri tem, kako smo dosegli naše cilje glede zmogljivosti. Codex je ekipi pomagal hitreje preiti od ideje do izvedbe, primerne za primerjalno vrednotenje, z začrtovanjem pristopov, vzpostavljanjem eksperimentov in pomočjo pri prepoznavanju, katere optimizacije so bile vredne dodatnega vlaganja. GPT‑5.5 je pomagal odkriti in uvesti ključne izboljšave v samem skladu. Preprosto povedano, model je pomagal izboljšati infrastrukturo, ki ga poganja.
Ena od takšnih izboljšav je bila uravnoteženje obremenitve in hevristike za razdelitev. Pred GPT‑5.5 smo zahteve na pospeševalniku razdelili na fiksno število segmentov, da smo uravnotežili delo med računskimi jedri in zagotovili, da so se velike in majhne zahteve lahko izvajale na istem GPU-ju. Vnaprej določeno število statičnih segmentov pa ni optimalno za vse oblike prometa. Za boljšo izrabo grafičnih procesorjev je Codex analiziral večtedenske vzorce produkcijskega prometa in pripravil hevristične algoritme po meri za optimalno razdelitev in uravnoteženje dela. To prizadevanje je imelo nesorazmerno velik vpliv, saj je povečalo hitrost generiranja žetonov za več kot 20 %.
Priprava sveta na modele, ki so zelo učinkoviti pri odkrivanju in odpravljanju varnostnih ranljivosti, je skupinsko prizadevanje. To bo zahtevalo veliko truda celotnega ekosistema za izgradnjo odpornosti, z demokratiziranim dostopom do modelov in postopnim uvajanjem za novo dobo kibernetske obrambe.
Prelomni modeli postajajo vse bolj zmogljivi na področju kibernetske varnosti. Te zmogljivosti bodo postale široko dostopne, zato verjamemo, da je najboljša pot naprej zagotoviti njihovo uporabo za pospeševanje kibernetske obrambe in krepitev ekosistema.
GPT‑5.5 je postopen, vendar pomemben korak na poti do UI, ki lahko reši nekatere najtežje svetovne izzive, kot je kibernetska varnost. Z modelom GPT‑5.2 smo decembra proaktivno uvedli potrebne kibernetske zaščite, da bi omejili morebitne kibernetske zlorabe naših modelov; zdaj pa z modelom GPT‑5.5 uvajamo strožje klasifikatorje za morebitno kibernetsko tveganje, ki se bodo nekaterim uporabnikom sprva morda zdeli nadležni, ko jih bomo sčasoma prilagajali.
Kibernetsko varnost že vrsto let prepoznavamo kot ključno kategorijo v našem okviru pripravljenosti(odpre se v novem oknu). Naši modeli so se postopoma izboljševali, medtem ko smo iterativno razvijali in prilagajali omilitvene ukrepe, da bi lahko odgovorno uvedli modele z naprednimi zmogljivostmi na področju kibernetske varnosti.
- Za to raven kibernetskih zmogljivosti uvajamo vodilne varovalne mehanizme v industriji. Zaščitne ukrepe za kibernetsko varnost smo prvič uvedli lani z GPT‑5.2(odpre se v novem oknu), nato pa smo jih v nadaljnjih uvajanjih še naprej preizkušali, izboljševali in nadgrajevali. Za model GPT‑5.5 smo zasnovali strožje kontrole za dejavnosti z večjim tveganjem, občutljive kibernetske zahtevke in dodali zaščite pred ponavljajočimi se zlorabami. Širok dostop omogočajo naše naložbe v varnost modela, preverjeno uporabo in spremljanje nedovoljene uporabe. Že več mesecev sodelujemo z zunanjimi strokovnjaki, da bi razvijali, testirali in izboljševali robustnost teh zaščitnih ukrepov. Z modelom GPT‑5.5 zagotavljamo, da lahko razvijalci zlahka zavarujejo svojo kodo, hkrati pa uvajamo strožji nadzor nad kibernetskimi delovnimi tokovi, ki jih zlonamerni akterji najverjetneje zlorabijo za povzročanje škode.
- Širimo dostop za pospešitev kibernetske obrambe na vseh ravneh. Naše kibernetsko manj omejene modele dajemo na voljo prek Zaupanja vrednega dostopa za kibernetsko varnost, začenši s Codexom, ki ob uvedbi vključuje razširjen dostop do naprednih zmogljivosti modela GPT‑5.5 za kibernetsko varnost z manj omejitvami za preverjene uporabnike, ki izpolnjujejo določene signale zaupanja(odpre se v novem oknu). Organizacije, ki so odgovorne za obrambo kritične infrastrukture, lahko zaprosijo za dostop do kibernetsko permisivnih modelov, kakršen je GPT‑5.4‑Cyber, če izpolnjujejo stroge varnostne zahteve za uporabo teh modelov za zaščito svojih notranjih sistemov. To širokemu krogu preverjenih branilcev omogoča zmogljivejša orodja za legitimno varnostno delo z manj nepotrebnimi ovirami, da zagotovimo demokratizacijo dostopa do pomembnih obrambnih zmogljivosti. Uporabniki lahko na chatgpt.com/cyber(odpre se v novem oknu) zaprosijo za zaupanja vreden dostop, da zmanjšajo nepotrebne zavrnitve med uporabo GPT‑5.5 za preverjeno obrambno delo.
- Sodelujemo z vladnimi partnerji, da pomagamo zaščititi kritično infrastrukturo za ljudi. Skupaj raziskujemo, kako lahko napredna umetna inteligenca podpira obrambne dejavnosti zaupanja vrednih uradnikov, ki so odgovorni za sisteme, od katerih so ljudje odvisni – od digitalnih sistemov, ki varujejo pomembne podatke davkoplačevalcev, do elektroenergetskega omrežja in oskrbe z vodo v lokalnih skupnostih.
Biološko-kemične in kibernetske zmogljivosti modela GPT‑5.5 obravnavamo kot visoke v okviru našega Okvira pripravljenosti(odpre se v novem oknu). Čeprav model GPT‑5.5 ni dosegel ravni kritičnih zmogljivosti na področju kibernetske varnosti, so naše evalvacije in testiranja pokazali, da njegove zmogljivosti na področju kibernetske varnosti pomenijo korak naprej v primerjavi z modelom GPT‑5.4.
Poleg tega je GPT‑5.5 pred izdajo prestal naš celoten postopek za varnost in upravljanje, vključno z evalvacijami pripravljenosti, testiranjem, specifičnim za posamezna področja, novimi ciljno usmerjenimi evalvacijami za napredne zmogljivosti na področju biologije in kibernetske varnosti ter temeljitim testiranjem z zunanjimi strokovnjaki. Več podrobnosti je na voljo v sistemskem dokumentu(odpre se v novem oknu) GPT‑5.5.
To delo odraža naš širši pristop k odpornosti umetne inteligence, za katerega menimo, da je potreben ob napredku zmogljivosti modelov. Želimo, da je zmogljiva umetna inteligenca na voljo ljudem, ki jo uporabljajo za obrambo sistemov, ustanov in javnosti. Smiselna pot je zaupanja vreden dostop, trdni varovalni mehanizmi, ki se krepijo sorazmerno z zmogljivostmi, ter operativna zmogljivost za zaznavanje resnih zlorab in odzivanje nanje.
Danes se GPT‑5.5 uvaja za uporabnike različic Plus, Pro, Business in Enterprise v ChatGPT‑ju in Codexu, medtem ko se GPT‑5.5 Pro uvaja za uporabnike različic Pro, Business in Enterprise v ChatGPT‑ju. GPT‑5.5 in GPT‑5.5 Pro bomo kmalu omogočili v API-ju.
V ChatGPT‑ju je funkcija GPT‑5.5 Thinking na voljo uporabnikom Plus, Pro, Business in Enterprise. GPT‑5.5 Pro, zasnovan za zahtevnejša vprašanja in natančnejše delo, je na voljo uporabnikom Pro, Business in Enterprise.
V Codexu je GPT‑5.5 na voljo za načrte Plus, Pro, Business, Enterprise, Edu in Go s kontekstnim oknom 400K. GPT‑5.5 je na voljo tudi v načinu Fast, ki ustvarja žetone 1,5-krat hitreje za 2,5-krat višjo ceno.
Za razvijalce API-jev bo model GPT‑5.5 kmalu na voljo v API-ju za odgovore in API-ju za dopolnitve klepeta po ceni 5 USD za 1 MIO vhodnih žetonov in 30 USD za 1 MIO izhodnih žetonov, s kontekstnim oknom velikosti 1 MIO. Na voljo so cene Batch in Flex po polovici standardne API tarife, medtem ko je Priority procesiranje na voljo po 2,5-kratniku standardne tarife. Prav tako bomo v API izdali gpt-5.5-pro za še večjo natančnost, po ceni 30 USD za 1 milijon vhodnih žetonov in 180 USD za 1 milijon izhodnih žetonov. Oglejte si stran s cenami za vse podrobnosti.
Čeprav je model GPT‑5.5 dražji od modela GPT‑5.4, je tako inteligentnejši kot tudi precej učinkovitejši pri uporabi žetonov. V Codexu smo skrbno prilagodili uporabniško izkušnjo, tako da GPT‑5.5 za večino uporabnikov zagotavlja boljše rezultate z manj žetoni kot GPT‑5.4, še naprej pa ponujamo velikodušno uporabo na vseh naročniških ravneh.
Programiranje
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (javno) * | 58,6 % | 57,7% | - | - | 64,3 % | 54,2 % |
Terminal-Bench 2.0 | 82,7% | 75,1 % | - | - | 69,4 % | 68,5 % |
Expert-SWE (interno) | 73,1 % | 68,5 % | - | - | - | - |
*Laboratoriji so opazili dokaze o pomnjenju(odpre se v novem oknu) pri tej oceni
Profesionalno
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (zmage ali neodločeni izidi) | 84,9 % | 83,0% | 82,3 % | 82,0 % | 80,3 % | 67,3 % |
FinanceAgent v1.1 | 60,0 % | 56,0 % | - | 61,5 % | 64,4 % | 59,7 % |
Naloge modeliranja v investicijskem bančništvu (Interno) | 88,5 % | 87,3 % | 88,6 % | 83,6 % | - | - |
OfficeQA Pro | 54,1 % | 53,2 % | - | - | 43,6 % | 18,1 % |
Uporaba računalnika in računalniški vid
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Verified | 78,7 % | 75,0% | - | - | 78,0 % | - |
MMMU Pro (brez orodij) | 81,2 % | 81,2 % | - | - | - | 80,5 % |
MMMU Pro (z orodji) | 83,2 % | 82,1 % | - | - | - | - |
Uporaba orodij
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84,4 % | 82,7% | 90,1 % | 89,3 % | 79,3 % | 85,9 % |
MCP Atlas** | 75,3 % | 70,6 % | - | - | 79,1 % | 78,2 % |
Toolathlon | 55,6 % | 54,6 % | - | - | - | 48,8 % |
Tau2-bench Telecom*** | 98,0 % | 92,8 % | - | - | - | - |
** MCP Atlas: rezultati družbe Scale AI po najnovejši posodobitvi iz aprila 2026.
*** Tau2-bench telecom: rezultati za 5.5 in 5.4 z izvirnimi pozivi, tj. brez prilagoditve pozivov. Pri tem so izpuščeni rezultati drugih laboratorijev, ki so bili ovrednoteni s prilagoditvami poziva.
Akademsko
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25,0 % | 19,0 % | 33,2 % | 25,6 % | - | - |
FrontierMath stopnje 1–3 | 51,7 % | 47,6 % | 52,4 % | 50,0 % | 43,8 % | 36,9 % |
FrontierMath stopnja 4 | 35,4 % | 27,1 % | 39,6 % | 38,0 % | 22,9 % | 16,7 % |
BixBench | 80,5 % | 74,0 % | - | - | - | - |
GPQA Diamond | 93,6 % | 92,8 % | - | 94,4 % | 94,2 % | 94,3 % |
Zadnji izpit človeštva (brez orodij) | 41,4 % | 39,8 % | 43,1 % | 42,7 % | 46,9 % | 44,4 % |
Zadnji izpit človeštva (z orodji) | 52,2 % | 52,1 % | 57,2 % | 58,7 % | 54,7 % | 51,4 % |
Kibernetska varnost
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Naloge z izzivi Capture-the-Flags (interno)**** | 88,1 % | 83,7 % | - | - | - | - |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
**** Razširitev najtežjih CTF-jev, uporabljenih v sistemskih karticah, z dodatnimi težjimi izzivi.
Dolg kontekst
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256k f1 | 73,7 % | 62,5 % | - | - | 76,9 % | - |
Graphwalks BFS 1 milijon f1 | 45,4 % | 9,4 % | - | - | 41,2 % (Opus 4.6) | - |
Graphwalks nadrejeni 256k f1 | 90,1 % | 82,8 % | - | - | 93,6 % | - |
Graphwalks parents 1mil f1 | 58,5 % | 44,4 % | - | - | 72,0 % (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4K–8K | 98,1 % | 97,3 % | - | - | - | - |
OpenAI MRCR v2 8-needle 8K–16K | 93,0 % | 91.4 % | - | - | - | - |
OpenAI MRCR v2 8-needle 16K–32K | 96,5 % | 97,2 % | - | - | - | - |
OpenAI MRCR v2 8-needle 32K–64K | 90,0% | 90,5 % | - | - | - | - |
OpenAI MRCR v2 8-needle 64K–128K | 83,1 % | 86,0 % | - | - | - | - |
OpenAI MRCR v2 8-needle 128K–256K | 87,5 % | 79,3 % | - | - | 59,2 % | - |
OpenAI MRCR v2 8-needle 256K–512K | 81,5 % | 57,5 % | - | - | - | - |
OpenAI MRCR v2 8-needle 512K–1M | 74,0 % | 36,6 % | - | - | 32,2 % | - |
Abstraktno razmišljanje
Evalvacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-SUI-1 (preverjeno) | 95,0 % | 93,7 % | - | 94,5 % | 93,5 % | 98,0 % |
ARC-SUI-2 (preverjeno) | 85,0 % | 73,3 % | - | 83,3 % | 75,8 % | 77,1 % |
Ocene GPT so bile izvedene z nastavljeno stopnjo sklepanja xhigh in v raziskovalnem okolju, kar lahko v nekaterih primerih prinese nekoliko drugačne rezultate kot v produkcijskem ChatGPT‑ju.








