Ažuriranje od 24. travnja 2026.: GPT‑5.5 i GPT‑5.5 Pro sada su dostupni u API-ju. Dokument o sustavu također je ažuriran kako bi opisao dodatne zaštitne mjere koje se primjenjuju.
Predstavljamo GPT‑5.5, naš dosad najpametniji i najintuitivniji model, koji predstavlja sljedeći korak prema novom načinu obavljanja posla na računalu.
GPT‑5.5 brže razumije što želite postići i može samostalno preuzeti veći dio posla. Izvrsno se snalazi u pisanju i otklanjanju pogrešaka u kôdu, istraživanju na internetu, analizi podataka, izradi dokumenata i proračunskih tablica, radu sa softverom i prelasku između alata dok zadatak ne bude dovršen. Umjesto da pažljivo upravljate svakim korakom, modelu GPT‑5.5 možete zadati složen, višedijelni zadatak i prepustiti mu da planira, koristi alate, provjerava svoj rad, snalazi se u nejasnoćama i nastavlja dalje.
Pomaci su posebno izraženi u agentskom kodiranju, upotrebi računala, intelektualnom radu i ranim fazama znanstvenih istraživanja – područjima u kojima napredak ovisi o rasuđivanju kroz kontekst i poduzimanju radnji tijekom vremena. GPT‑5.5 donosi ovaj iskorak u inteligenciji bez kompromisa kad je riječ o brzini: veći i sposobniji modeli često sporije odgovaraju, no GPT‑5.5 u stvarnim uvjetima rada postiže jednaku latenciju po tokenu kao GPT‑5.4, uz znatno višu razinu inteligencije. Također upotrebljava znatno manje tokena za izvršavanje istih zadataka u Codexu, što ga čini učinkovitijim i sposobnijim.
Objavljujemo GPT‑5.5 s dosad najsnažnijim skupom zaštitnih mjera, osmišljenih za smanjenje zlouporabe uz očuvanje pristupa za korisne primjene. Ovaj smo model procijenili kroz cijeli skup naših okvira za sigurnost i pripravnost, surađivali s internim i vanjskim timovima za red-team testiranje (simulirani sigurnosni napadi), dodali ciljana testiranja za napredne sposobnosti u području kibernetičke sigurnosti i biologije te prije objave prikupili povratne informacije o stvarnim slučajevima upotrebe od gotovo 200 pouzdanih partnera s ranim pristupom.
Danas se GPT‑5.5 uvodi za korisnike planova Plus, Pro, Business i Enterprise u ChatGPT‑u i Codexu, a GPT‑5.5 Pro uvodi se za korisnike planova Pro, Business i Enterprise u ChatGPT‑u. Implementacije API-ja zahtijevaju različite zaštitne mjere, a blisko surađujemo s partnerima i korisnicima na sigurnosnim i zaštitnim zahtjevima za njegovu primjenu u velikom opsegu. GPT‑5.5 i GPT‑5.5 Pro uskoro ćemo uvesti u API.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82,7 % | 75,1 % | - | - | 69,4 % | 68,5 % |
SWE stručnjak (interni) | 73,1 % | 68,5 % | - | - | - | - |
GDPval (pobjede ili neriješeni rezultati) | 84,9% | 83 % | 82,3 % | 82,0 % | 80,3 % | 67,3 % |
OSWorld-Verified | 78,7 % | 75 % | - | - | 78,0 % | - |
Toolathlon | 55,6 % | 54,6 % | - | - | - | 48,8 % |
BrowseComp | 84,4 % | 82,7 % | 90,1 % | 89,3 % | 79,3 % | 85,9 % |
FrontierMath razine 1 do 3 | 51,7 % | 47,6 % | 52,4 % | 50,0 % | 43,8 % | 36,9 % |
FrontierMath Razina 4 | 35,4 % | 27,1 % | 39,6 % | 38,0 % | 22,9 % | 16,7 % |
CyberGym | 81,8 % | 79 % | - | - | 73,1 % | - |
OpenAI razvija globalnu infrastrukturu za agentski AI, čime ljudima i tvrtkama diljem svijeta omogućuje da obavljaju posao uz pomoć AI-ja. Tijekom protekle godine svjedočili smo kako umjetna inteligencija značajno ubrzava razvoj softvera. Uz GPT‑5.5 u Codexu i ChatGPT‑u, ta transformacija počinje se širiti na znanstvena istraživanja i širi spektar poslova koje ljudi obavljaju na računalima.
U svim tim područjima GPT‑5.5 nije samo inteligentniji već i učinkovitiji u načinu rješavanja problema, pri čemu često postiže kvalitetnije rezultate s manje tokena i manje ponovnih pokušaja. Na indeksu Coding Index tvrtke Artificial Analysis, GPT‑5.5 pruža vrhunsku inteligenciju uz upola niži trošak u usporedbi s konkurentskim graničnim modelima za kodiranje.
Artificial Analysis Intelligence Index(otvara se u novom prozoru) ponderirani je prosjek 10 evaluacija koje je proveo vanjski subjekt: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 naš je dosad najjači agentski model za kodiranje. Na alatu Terminal-Bench 2.0, koji testira složene tijekove rada u naredbenom retku, a koji zahtijevaju planiranje, iteraciju i koordinaciju alata, postiže vrhunsku točnost od 82,7 %. Na SWE-Bench Pro, koji procjenjuje rješavanje stvarnih GitHub prijava problema, doseže 58,6 % te u jednom pokušaju rješava više zadataka od početka do kraja nego prijašnji modeli. Na Expert-SWE, našoj internoj graničnoj procjeni za dugoročne zadatke kodiranja, za koje je procijenjeno da je medijan vremena dovršetka za čovjeka 20 sati, GPT‑5.5 također nadmašuje GPT‑5.4.
U sve tri procjene, GPT‑5.5 nadmašuje GPT‑5.4 u pogledu rezultata, uz korištenje manje tokena.
Snage modela u kodiranju posebno jasno dolaze do izražaja u Codexu, gdje može preuzeti inženjerske zadatke u rasponu od implementacije i refaktoriranja do otklanjanja pogrešaka, testiranja i validacije. Rana testiranja upućuju na to da je GPT‑5.5 bolji u ponašanjima o kojima ovisi stvarni inženjerski rad, kao što su zadržavanje konteksta u velikim sustavima, rasuđivanje o dvosmislenim kvarovima, provjeravanje pretpostavki pomoću alata i provođenje promjena kroz okolnu bazu kôda.
Prikazana putanja koristi vektorske podatke NASA-e/JPL Horizonsa za Orion, Mjesec i Sunce, uz primijenjeno skaliranje prikaza radi bolje čitljivosti.
Upit: [priložena slika] Implementirajte ovo kao novu aplikaciju koristeći WebGL i Vite te stvarne podatke iz misije Artemis II. Svakako temeljito testirajte aplikaciju dok ne bude u potpunosti funkcionalna i dok ne bude izgledala kao aplikacija na slici. Obratite posebnu pozornost na prikaz planeta i putanje leta. Želim moći ostvarivati interakciju s 3D prikazom. Vodite računa da ima realističnu orbitalnu mehaniku.
Osim mjerila, rani ispitivači rekli su da GPT‑5.5 pokazuje veću sposobnost razumijevanja oblika sustava: zašto nešto ne funkcionira, gdje treba primijeniti ispravak i na što bi još u bazi kôda to utjecalo.

„Prvi model za kodiranje koji sam koristio, a koji ima ozbiljnu konceptualnu jasnoću.”
Dan Shipper, osnivač i izvršni direktor tvrtke Every, opisao je GPT‑5.5 kao „prvi model za programiranje koji sam koristio i koji ima ozbiljnu konceptualnu jasnoću”.
Nakon pokretanja aplikacije, danima je ispravljavao problem koji se pojavio nakon lansiranja, prije nego što je angažirao jednog od svojih najboljih inženjera da prepravi dio sustava. Kako bi testirao GPT‑5.5, zapravo je vratio vrijeme unatrag: može li model analizirati pokvareno stanje i napraviti istu vrstu prerade za koju se inženjer na kraju odlučio? GPT‑5.4 nije mogao. GPT‑5.5 može.

„Doista imam osjećaj kao da radim s višom inteligencijom, a gotovo se javlja i osjećaj poštovanja.”
Pietro Schirano, glavni izvršni direktor tvrtke MagicPath, primijetio je sličan skokovit pomak kada je GPT‑5.5 spojio granu sa stotinama izmjena frontenda i refaktorizacije u glavnu granu koja se također znatno promijenila, rješavajući posao učenje s jednim primjerom za otprilike 20 minuta.
Iskusni inženjeri koji su testirali model izjavili su da je GPT‑5.5 bio primjetno bolji od modela GPT‑5.4 i Claude Opus 4.7 u rasuđivanju i autonomiji, pri čemu je unaprijed prepoznavao probleme i predviđao potrebe za testiranjem i pregledom bez izričitog poticanja. U jednom slučaju, inženjer je zatražio redizajn sustava komentara u suradničkom markdown uređivaču, a kad se vratio, dočekao ga je niz od 12 diffova koji je bio gotovo dovršen. Drugi su naveli da je bilo potrebno iznenađujuće malo korekcija pri implementaciji te da su imali više povjerenja u planove modela GPT‑5.5 nego u planove modela GPT‑5.4.
Jedan inženjer iz NVIDIA-e koji je imao rani pristup modelu opisao je to ovako: „Ako izgubim pristup GPT‑5.5, imam osjećaj kao da sam ostao bez ruke.”
“GPT-5.5 je osjetno pametniji i uporniji od modela GPT-5.4, uz snažnije performanse kodiranja i pouzdaniju uporabu alata. Ostaje usmjeren na zadatak znatno dulje bez preranog zaustavljanja, što je najvažnije za složen posao koji traje dugo i koji naši korisnici delegiraju Cursoru.”
Iste prednosti koje GPT‑5.5 čine izvrsnim u programiranju također ga čine moćnim za svakodnevni rad na računalu. Budući da model bolje razumije namjeru, može se prirodnije kretati kroz cijeli ciklus rada s informacijama: pronalaženje informacija, razumijevanje onoga što je važno, upotrebu alata, provjeru rezultata i pretvaranje sirovog materijala (podataka) u nešto korisno.
U Codexu je GPT‑5.5 bolji od modela GPT‑5.4 u generiranju dokumenata, proračunskih tablica i prezentacija sa slajdovima. Alfa testeri rekli su da je nadmašio prethodne modele u zadacima kao što su operacijska istraživanja, modeliranje u proračunskim tablicama i pretvaranje neuređenih poslovnih ulaznih podataka u planove. U kombinaciji s Codexovim vještinama korištenja računala, GPT‑5.5 približava nas osjećaju da model doista može koristiti računalo zajedno s vama: vidjeti što je na zaslonu, klikati, tipkati, kretati se sučeljima i precizno prelaziti između alata.
Timovi u OpenAI-ju već upotrebljavaju te prednosti u stvarnim tijekovima rada. Danas više od 85 % tvrtke upotrebljava Codex svaki tjedan u različitim funkcijama, uključujući softversko inženjerstvo, financije, komunikacije, marketing, podatkovnu znanost i upravljanje proizvodima. U Commsu je tim upotrijebio GPT‑5.5 u Codexu za analizu podataka o zahtjevima za govorne angažmane tijekom šest mjeseci, izradu okvira za bodovanje i procjenu rizika te validaciju automatiziranog Slack agenta kako bi se niskorizični zahtjevi mogli automatski obrađivati, dok bi se zahtjevi višeg rizika i dalje usmjeravali na ljudski pregled. U odjelu financija, tim je upotrebljavao Codex za pregled 24771 poreznih obrazaca K-1, ukupno 71637 stranica, primjenjujući radni tijek koji je isključivao osobne podatke i pomogao timu da izvršavanje zadatka ubrza za dva tjedna u odnosu na prethodnu godinu. U timu za strategiju izlaska na tržište jedan je zaposlenik automatizirao izradu tjednih poslovnih izvješća, štedeći 5 do 10 sati tjedno.
U ChatGPT‑u, GPT‑5.5 Thinking omogućuje bržu pomoć pri rješavanju težih problema, uz pametnije i sažetije odgovore koji vam pomažu da učinkovitije obavljate složen posao. Posebno se ističe u profesionalnom radu kao što su programiranje, istraživanje, sinteza i analiza informacija te zadaci s mnogo dokumenata, osobito pri uporabi dodataka.
U modelu GPT‑5.5 Pro rani testeri bilježe velik iskorak i u složenosti i u kvaliteti zadataka koje ChatGPT može preuzeti, uz poboljšanja latencije koja ga čine znatno praktičnijim za zahtjevne zadatke. U usporedbi s modelom GPT‑5.4 Pro, testeri su utvrdili da su odgovori modela GPT‑5.5 Pro znatno sveobuhvatniji, strukturiraniji, točniji, relevantniji i korisniji, uz posebno moćne rezultate u poslovanju, pravu, obrazovanju i podatkovnoj znanosti.
GPT‑5.5 postiže vrhunske rezultate na više referentnih testova koji odražavaju tu vrstu rada. Na referentnom testu GDPval, koji provjerava sposobnost agenata da proizvedu jasno definirane rezultate rada temeljenog na znanju u 44 zanimanja, GPT‑5.5 postiže 84,9 %. Na OSWorld-Verified, koji mjeri može li model samostalno raditi u stvarnim računalnim okruženjima, rezultat je 78,7 %. A na Tau2-bench Telecom, koji testira složene tijekove rada korisničke podrške, rezultat je 98,0 % bez finog podešavanja uputa/upita. GPT‑5.5 također postiže snažne rezultate na drugim referentnim testovima rada temeljenog na znanju: 60,0 % na FinanceAgent, 88,5 % na zadacima modeliranja u investicijskom bankarstvu (interno) i 54,1 % na OfficeQA Pro.
Tau2-bench Telecom pokrenut je bez prilagodbe upita (i uz GPT‑4.1 kao korisnički model). GPT‑5.5 bolje razumije namjeru zadatka i učinkovitiji je u potrošnji tokena od svojih prethodnika.
„GPT-5.5 pruža kontinuirane performanse potrebne za rad koji zahtijeva intenzivno izvršavanje. Izrađen i korišten na sustavima NVIDIA GB200 NVL72, model našim timovima omogućuje da isporučuju funkcionalnosti od početka do kraja na temelju upita na prirodnom jeziku, skraćuje vrijeme otklanjanja pogrešaka s dana na sate i pretvara tjedne eksperimentiranja u napredak ostvaren preko noći u složenim bazama kôda. To je više od bržeg programiranja — to je novi način rada koji pomaže ljudima da iz temelja rade drugačijim tempom."
GPT‑5.5 također pokazuje poboljšanja u znanstvenim i tehničkim istraživačkim radnim tijekovima, za koje je potrebno više od odgovora na teško pitanje. Istraživači trebaju istražiti ideju, prikupiti dokaze, testirati pretpostavke, protumačiti rezultate i odlučiti što sljedeće pokušati. GPT‑5.5 bolje ustrajava kroz taj ciklus od drugih modela.
GPT‑5.5 osobito pokazuje jasno poboljšanje u odnosu na GPT‑5.4 na GeneBenchu(otvara se u novom prozoru), novoj evaluaciji koja se fokusira na višefaznu znanstvenu analizu podataka u genetici i kvantitativnoj biologiji. Ti zadaci zahtijevaju od modela da rasuđuju o potencijalno dvosmislenim podacima ili podacima s pogreškama uz minimalne smjernice, da se nose s realnim preprekama poput skrivenih zbunjujućih čimbenika ili neuspjeha kontrole kvalitete te da ispravno primjenjuju i tumače suvremene statističke metode. Rezultati modela posebno su dojmljivi s obzirom na to da ti zadaci često odgovaraju višednevnim projektima znanstvenih stručnjaka.
Slično tome, na BixBenchu(otvara se u novom prozoru), referentnom testu osmišljenom na temelju stvarnih zadataka iz bioinformatike i analize podataka, GPT‑5.5 postigao je vodeći rezultat među modelima s objavljenim rezultatima. Znanstvene sposobnosti modela sad su dovoljno snažne da kao stvarni partner u istraživanju značajno ubrzaju napredak na granicama biomedicinskih istraživanja.
U još jednom primjeru, interna verzija modela GPT‑5.5 s prilagođenim okvirom pomogla je otkriti novi dokaz(otvara se u novom prozoru) o Ramseyjevim brojevima, jednom od ključnih objekata u kombinatorici. Kombinatorika proučava kako se diskretni objekti uklapaju: grafovi, mreže, skupovi i uzorci. Ramseyevi brojevi, ugrubo, pitaju koliko velika mreža mora biti prije nego zajamčeno pojavi neka vrsta reda. Rezultati u ovom području rijetki su i često tehnički teško ostvarivi. Ovdje je GPT‑5.5 pronašao dokaz dugo poznate asimptotske činjenice o nedijagonalnim Ramseyjevim brojevima, koji je kasnije provjeren u Leanu. Rezultat je konkretan primjer GPT‑5.5 koji doprinosi ne samo kôdom ili objašnjenjem, nego i iznenađujućim i korisnim matematičkim argumentom u temeljnom istraživačkom području.
Rani testeri upotrebljavali su GPT‑5.5 Pro u ChatGPT‑u manje kao alat za jednokratne odgovore, a više kao istraživačkog partnera: za višekratno kritičko pregledavanje rukopisa, testiranje tehničkih argumenata pod opterećenjem, predlaganje analiza te rad s kodom, bilješkama i kontekstom iz PDF-ova. Zajednički nazivnik jest da GPT‑5.5 bolje pomaže istraživačima prijeći put od pitanja preko eksperimenta do rezultata.
Derya Unutmaz, profesor imunologije i istraživač u Jacksonovom laboratoriju za genomsku medicinu, upotrijebio je GPT‑5.5 Pro za analizu skupa podataka o ekspresiji gena sa 62 uzorka i gotovo 28.000 gena, pri čemu je izrađeno detaljno istraživačko izvješće koje ne samo da je saželo nalaze nego je i istaklo ključna pitanja i uvide — posao za koji je rekao da bi njegovu timu oduzeo mjesece.
Bartosz Naskręcki, docent matematike na Sveučilištu Adama Mickiewicza u Poznanju, Poljska, koristi GPT‑5.5 u Codexu za izradu aplikacije za algebarsku geometriju iz jednog upita u 11 minuta, vizualizira sjecište kvadratnih ploha i pretvara dobivenu krivulju u Weierstrassov model.
Kasnije je proširio aplikaciju stabilnijom vizualizacijom singularnosti i preciznim koeficijentima koji se mogu ponovno koristiti u daljnjem radu. Za njega je veća promjena to što Codex sada može pomoći u implementaciji prilagođenih radnih tokova za matematičku vizualizaciju i računalnu algebru, za koje su prije bili potrebni namjenski alati. Zajedno, ovi primjeri pokazuju kako GPT‑5.5 pretvara stručne namjere u praktične istraživačke alate i analize.

Priznanje: Bartosz Naskręcki(otvara se u novom prozoru)
Uputa: # Presjek ploha u algebarskoj geometriji
Izradi aplikaciju koja crta dvije kvadratne plohe i crveno oboji krivulju presjeka. Upotrijebi računalni Riemann-Rochov teorem za pretvaranje ovog u Weierstrassovu krivulju.
## Glavni prozor
Dvije obojene plohe s blago prozirnim sjenčanjem i visokokvalitetnim prikazom sijeku se duž crveno obojene algebarske krivulje
Rotacija mišem u oba smjera, potpuno zumiranje gestom širenja/skupljanja prstiju, haptički pritisak za prikaz malog izbornika s klizačima za promjenu koeficijenata svake površine; detekcija preko razine Z-buffera
## Desni bočni prozor
Kratka Weierstrassova jednadžba (nad Q ili kvadratnim proširenjem polja) izračunata Go primjenom formula efektivnog teorema Riemann-Rocha
## Ambijentalni način rada u kojem su sve kontrole skrivene, a korisnik se može diviti ljepoti oblika
## Specifikacije
Aplikacija se pokreće u pregledniku, lagana implementacija s najnovijim bibliotekama za cijeli sustav, prenosiva i spremna za implementaciju
## Dokumenti
Git repozitorij, dnevnik, plan (datoteke u Markdown formatu)
„Upotreba novog OpenAI-jevog modela GPT-5.5 u našem sustavu izuzetno je poticajna: promatrati kako analizira goleme biokemijske skupove podataka kako bi se predvidjeli ishodi korištenja lijekova kod ljudi, a zatim vidjeti kako model postiže značajna poboljšanja točnosti u našim najzahtjevnijim evaluacijama otkrivanja lijekova. Ako OpenAI nastavi ovako dobro funkcionirati, temelji otkrivanja lijekova promijenit će se do kraja godine."
Za isporuku GPT‑5.5 uz latenciju modela GPT‑5.4 bilo je potrebno iznova osmisliti inferenciju kao integrirani sustav, a ne kao skup izoliranih optimizacija. GPT‑5.5 zajednički je razvijen za sustave NVIDIA GB200 i GB300 NVL72 , treniran na njima te se na njima i izvršava. Codex i GPT‑5.5 imali su ključnu ulogu u postizanju naših ciljeva performansi. Codex je pomogao timu da brže prijeđe put od ideje do implementacije mjerljive referentnim testovima – predlagao je pristupe, postavljao eksperimente i pomagao utvrditi u koje se optimizacije isplati dodatno ulagati. GPT‑5.5 pomogao je pronaći i implementirati ključna poboljšanja u samom sustavu. Jednostavno rečeno, model je pomogao unaprijediti infrastrukturu koja ga pokreće.
Jedno takvo poboljšanje bila je raspodjela opterećenja i heuristike particioniranja. Prije modela GPT‑5.5 dijelili smo zahtjeve na akceleratoru na fiksan broj dijelova kako bismo ravnomjerno rasporedili rad među računalnim jezgrama, osiguravajući da se veliki i mali zahtjevi mogu izvršavati na istom GPU-u. Međutim, unaprijed određen broj statičnih segmenata nije optimalan za sve oblike prometa. Kako bi bolje iskoristio GPU-ove, Codex je analizirao višetjedne obrasce produkcijskog prometa i napisao prilagođene heurističke algoritme za optimalnu raspodjelu i uravnoteženje rada. Taj je napor imao nerazmjerno velik utjecaj, povećavši brzinu generiranja tokena za više od 20 %.
Priprema svijeta za modele koji su iznimno učinkoviti u otkrivanju i uklanjanju sigurnosnih ranjivosti zahtijeva timski rad i od cijelog ekosustava traži velik trud u izgradnji otpornosti, uz demokratizirani pristup modelima i postupno uvođenje za sljedeću eru kibernetičke obrane.
Frontier modeli postaju sve sposobniji u području kibernetičke sigurnosti. Te će mogućnosti postati široko dostupne, a vjerujemo da je najbolji put naprijed osigurati njihovu primjenu za ubrzavanje kibernetičke obrane i jačanje ekosustava.
GPT‑5.5 predstavlja postupan, ali važan korak prema umjetnoj inteligenciji koja može pomoći u rješavanju nekih od najtežih svjetskih izazova, poput kibernetičke sigurnosti. U prosincu smo s modelom GPT‑5.2 uveli potrebne zaštitne mjere za kibernetičku sigurnost kako bismo ograničili moguću zlouporabu u kibernetičkom prostoru povezanom s našim modelima; sada s GPT‑5.5 uvodimo strože klasifikatore za potencijalni kibernetički rizik, što bi nekim korisnicima u početku moglo biti iritantno, ali ćemo ih s vremenom dodatno prilagođavati.
Već godinama prepoznajemo kibernetičku sigurnost kao kategoriju u našem Okviru pripravnosti(otvara se u novom prozoru), usporedo s postupnim poboljšavanjem naših modela, dok iterativno razvijamo i prilagođavamo mjere ublažavanja, kako bismo mogli odgovorno objavljivati modele sa značajnim sposobnostima na području kibernetičke sigurnosti.
- Uvodimo zaštitne mjere vodeće u industriji za ovu razinu kibernetičkih sposobnosti. Prošle smo godine prvi put uveli zaštitne mjere specifične za kibernetičku sigurnost uz GPT‑5.2(otvara se u novom prozoru), koje smo nastavili testirati, usavršavati i nadograđivati u kasnijim implementacijama. Za GPT‑5.5 smo osmislili strože kontrole za aktivnosti višeg rizika, osjetljive kibernetičke zahtjeve i dodali zaštite za slučajeve ponovljene zlouporabe. Širok pristup omogućen je našim ulaganjima u sigurnost modela, autentificirano korištenje i praćenje nedopuštenog korištenja. Već mjesecima surađujemo s vanjskim stručnjacima kako bismo razvili, testirali i iterativno poboljšavali robusnost ovih zaštitnih mjera. Uz GPT‑5.5 osiguravamo da programeri mogu s lakoćom zaštititi svoj kôd, a istodobno uvodimo snažnije kontrole nad kibernetičkim radnim procesima koji, kada ih zlonamjerni akteri upotrijebe, najvjerojatnije mogu uzrokovati štetu.
- Proširujemo pristup kako bismo ubrzali kibernetičku obranu na svim razinama. Naše modele s blažim ograničenjima u području kibernetike stavljamo na raspolaganje putem Pouzdanog pristupa za kibernetiku, počevši s Codexom, koji omogućuje prošireni pristup naprednim mogućnostima kibernetičke sigurnosti GPT‑5.5, uz manje ograničenja za provjerene korisnike koji pri pokretanju ispunjavaju određene signale povjerenja(otvara se u novom prozoru). Organizacije odgovorne za obranu kritične infrastrukture mogu se prijaviti za pristup modelima s blažim ograničenjima na području kibernetike, poput GPT‑5.4‑Cyber, uz ispunjavanje strogih sigurnosnih zahtjeva za njihovu uporabu u zaštiti internih sustava. Time se širokom rasponu provjerenih branitelja pružaju napredniji alati za legitiman sigurnosni rad uz manje nepotrebnih prepreka kako bi se osiguralo demokratiziranje pristupa važnim obrambenim sposobnostima. Korisnici se mogu prijaviti za pouzdani pristup na chatgpt.com/cyber(otvara se u novom prozoru) kako bi smanjili nepotrebna odbijanja pri upotrebi modela GPT‑5.5 za provjereni obrambeni rad.
- Surađujemo s državnim partnerima kako bismo pomogli zaštititi ključnu infrastrukturu o kojoj javnost ovisi. Zajedno istražujemo kako napredni AI može poduprijeti obrambeni rad pouzdanih dužnosnika odgovornih za sustave na koje se ljudi oslanjaju – od digitalnih sustava koji štite važne podatke poreznih obveznika do elektroenergetske mreže i opskrbe vodom u lokalnim zajednicama.
Biološke/kemijske i kibernetičke sposobnosti modela GPT‑5.5 tretiramo kao visoke prema našem Okviru pripravnosti(otvara se u novom prozoru). Iako GPT‑5.5 nije dosegnuo kritičnu razinu sposobnosti na području kibernetičke sigurnosti, naše evaluacije i testiranja pokazala su da njegove sposobnosti na području kibernetičke sigurnosti predstavljaju iskorak u odnosu na GPT‑5.4.
Osim toga, GPT‑5.5 prošao je naš cjeloviti postupak sigurnosti i upravljanja prije objave, uključujući procjene pripravnosti, testiranje specifično za domenu, nove ciljane procjene naprednih sposobnosti u biologiji i kibernetičkoj sigurnosti te temeljito testiranje s vanjskim stručnjacima. Više pojedinosti dijelimo u dokumentu o sustavu GPT‑5.5(otvara se u novom prozoru).
Ovaj rad odražava naš širi pristup otpornosti umjetne inteligencije, za koji vjerujemo da je potreban kako mogućnosti modela napreduju. Želimo da moćna umjetna inteligencija bude dostupna ljudima koji je koriste za obranu sustava, institucija i javnosti. Održiv put jest pouzdani pristup, snažne zaštitne mjere koje rastu s razinom sposobnosti i operativni kapacitet za otkrivanje i odgovor na ozbiljnu zlouporabu.
Danas se GPT‑5.5 uvodi za korisnike planova Plus, Pro, Business i Enterprise u ChatGPT‑u i Codexu, a GPT‑5.5 Pro uvodi se za korisnike planova Pro, Business i Enterprise u ChatGPT‑u. GPT‑5.5 i GPT‑5.5 Pro uskoro ćemo uvesti u API.
U ChatGPT‑u, GPT‑5.5 Thinking dostupan je korisnicima pretplata Plus, Pro, Business i Enterprise. GPT‑5.5 Pro, osmišljen za još teža pitanja i rad koji zahtijeva veću točnost, dostupan je korisnicima pretplata Pro, Business i Enterprise.
U Codexu je GPT‑5.5 dostupan u planovima Plus, Pro, Business, Enterprise, Edu i Go s kontekstnim prozorom od 400K. GPT‑5.5 dostupan je i u načinu rada Fast te generira tokene 1,5 puta brže uz 2,5 puta višu cijenu.
Za razvojne programere koji rade s API-jem, gpt-5.5 uskoro će biti dostupan na Responses API-ju i API-ju za dovršavanje razgovora po cijeni od 5 USD po 1 milijun ulaznih tokena i 30 USD po 1 milijun izlaznih tokena, uz kontekstni prozor od 1 milijun. Cijene za Batch i Flex dostupne su po polovici standardne stope API-ja, dok je Prioritetna obrada dostupna po 2,5 puta višoj stopi od standardne. Objavit ćemo i gpt-5.5-pro u API-ju za još veću točnost, po cijeni od 30 USD po 1 milijun ulaznih tokena i 180 USD po 1 milijun izlaznih tokena. Za sve pojedinosti pogledajte stranicu s cijenama.
Iako je GPT‑5.5 skuplji od GPT‑5.4, istodobno je inteligentniji i znatno učinkovitiji u korištenju tokena. U Codexu smo pažljivo prilagodili iskustvo kako bi GPT‑5.5 za većinu korisnika pružao bolje rezultate uz manje tokena nego GPT‑5.4, uz nastavak izdašne upotrebe na svim razinama pretplate.
Kodiranje
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (javni) * | 58,6 % | 57,7 % | - | - | 64,3 % | 54,2 % |
Terminal-Bench 2.0 | 82,7 % | 75,1 % | - | - | 69,4 % | 68,5 % |
SWE stručnjak (interni) | 73,1 % | 68,5 % | - | - | - | - |
*Labs je zabilježio dokaze memoriranja(otvara se u novom prozoru) na ovoj evaluaciji
Profesionalno
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (pobjede ili neriješeni rezultati) | 84,9 % | 83 % | 82,3 % | 82,0 % | 80,3 % | 67,3 % |
FinanceAgent v1.1 | 60 % | 56,0 % | - | 61,5 % | 64,4 % | 59,7 % |
Zadaci modeliranja u investicijskom bankarstvu (interno) | 88,5 % | 87,3 % | 88,6 % | 83,6 % | - | - |
OfficeQA Pro | 54,1 % | 53,2 % | - | - | 43,6 % | 18,1% |
Korištenje računala i vid
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Verified | 78,7 % | 75 % | - | - | 78,0 % | - |
MMMU Pro (bez alata) | 81,2 % | 81,2 % | - | - | - | 80,5% |
MMMU Pro (s alatima) | 83,2 % | 82,1 % | - | - | - | - |
Korištenje alata
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84,4 % | 82,7 % | 90,1 % | 89,3 % | 79,3 % | 85,9 % |
MCP Atlas** | 75,3 % | 70,6 % | - | - | 79,1 % | 78,2 % |
Toolathlon | 55,6 % | 54,6 % | - | - | - | 48,8 % |
Tau2-bench Telecom*** | 98,0% | 92,8 % | - | - | - | - |
** MCP Atlas: rezultati tvrtke Scale AI nakon najnovijeg ažuriranja iz travnja 2026.
*** Tau2-bench Telecom: rezultati za 5.5 i 5.4 s izvornim upitima, tj. bez prilagodbe upita. Ovo izostavlja rezultate drugih laboratorija koji su procijenjeni uz prilagodbe upita.
Akademski
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25 % | 19,0 % | 33,2 % | 25,6 % | - | - |
FrontierMath razine 1 do 3 | 51,7% | 47,6 % | 52,4 % | 50,0 % | 43,8 % | 36,9 % |
FrontierMath Razina 4 | 35,4 % | 27,1 % | 39,6 % | 38,0 % | 22,9 % | 16,7 % |
BixBench | 80,5% | 74,0 % | - | - | - | - |
GPQA Diamond | 93,6 % | 92,8 % | - | 94,4 % | 94,2 % | 94,3 % |
Humanity's Last Exam (bez alata) | 41,4 % | 39,8 % | 43,1 % | 42,7 % | 46,9 % | 44,4 % |
Humanity's Last Exam (s alatima) | 52,2 % | 52,1 % | 57,2 % | 58,7 % | 54,7 % | 51,4 % |
Kibernetička sigurnost
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Zadaci izazova Capture-the-Flags (interno)**** | 88,1 % | 83,7 % | - | - | - | - |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
**** Proširenje najtežih CTF-ova korištenih u sistemskim karticama s dodatnim teškim izazovima.
Dugi kontekst
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256k f1 | 73,7 % | 62,5 % | - | - | 76,9 % | - |
Graphwalks BFS 1 mil f1 | 45,4 % | 9,4 % | - | - | 41,2% (Opus 4.6) | - |
Graphwalks parents 256k f1 | 90,1 % | 82,8 % | - | - | 93,6 % | - |
Graphwalks - nadređeni 1 milijun f1 | 58,5 % | 44,4 % | - | - | 72,0 % (Opus 4.6) | - |
OpenAI MRCR v2 s 8 igala 4 000 — 8 000 | 98,1 % | 97,3 % | - | - | - | - |
OpenAI MRCR v2 s 8 igala 8K — 16K | 93,0 % | 91,4 % | - | - | - | - |
OpenAI MRCR v2 s 8 igala 16 000 — 32 000 | 96,5 % | 97,2 % | - | - | - | - |
OpenAI MRCR v2 s 8 igala 32 000 — 64 000 | 90,0 % | 90,5 % | - | - | - | - |
OpenAI MRCR v2 s 8 igala 64 000 — 128 000 | 83,1 % | 86,0 % | - | - | - | - |
OpenAI MRCR v2 s 8 igala 128 000 — 256 000 | 87,5 % | 79,3 % | - | - | 59,2 % | - |
OpenAI MRCR v2 s 8 igala 256 000 — 512 000 | 81,5 % | 57,5 % | - | - | - | - |
OpenAI MRCR v2 s 8 igala 512 000 — 1 000 000 | 74,0 % | 36,6 % | - | - | 32,2 % | - |
Apstraktno prosuđivanje
Evaluacija | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (verificiran) | 95,0% | 93,7 % | - | 94,5 % | 93,5 % | 98 % |
ARC-AGI-2 (verificiran) | 85 % | 73,3 % | - | 83,3 % | 75,8% | 77,1 % |
Evaluacije GPT‑a pokrenute su s naporom u rasuđivanju postavljenim na xhigh i provedene su u istraživačkom okruženju, što može rezultirati neznatno drugačijim izlazom u odnosu na produkcijski ChatGPT u nekim slučajevima.








