2026 m. balandžio 23 d.

Pristatome GPT‑5.5

Nauja intelekto klasė realiam darbui

Įkeliama...

2026 m. balandžio 24 d. atnaujinimas: API jau galima naudotis GPT‑5.5 ir „GPT‑5.5 Pro“. Sistemos kortelė taip pat buvo atnaujinta, nurodant taikomas papildomas saugumo priemones.

Išleidžiame GPT‑5.5 – mūsų kol kas išmaniausią ir intuityviausiai naudojamą modelį bei kitą žingsnį naujo darbo kompiuteriu būdo link.

GPT‑5.5 greičiau supranta, ką bandote padaryti, ir gali savarankiškai atlikti daugiau darbo. Jis puikiai rašo ir derina kodą, atlieka paiešką internete, analizuoja duomenis, kuria dokumentus ir skaičiuokles, valdo programinę įrangą bei naršo per įvairius įrankius, kol užduotis bus baigta. Užuot atidžiai valdę kiekvieną žingsnį, galite pateikti GPT‑5.5 painią, iš kelių dalių susidedančią užduotį ir pasitikėti, kad jis pats suplanuos, panaudos įrankius, patikrins savo darbą, išlaviruos neaiškumuose ir tęs darbą.

Prieaugis ypač didelis agentų atliekamame kodo rašyme, kompiuterių naudojime, žiniomis grįstame darbe ir ankstyvuosiuose moksliniuose tyrimuose – srityse, kuriose pažanga priklauso nuo gebėjimo protauti atsižvelgiant į kontekstą ir imtis nuoseklių veiksmų. GPT‑5.5 suteikia šį intelekto šuolį nemažinant greičio: didesni, galingesni modeliai dažnai veikia lėčiau, tačiau GPT‑5.5 realioje aplinkoje prilygsta „GPT‑5.4“ vėlavimui tenkančiam vienam žetonui, o jo intelekto lygis yra kur kas aukštesnis. Jis taip pat sunaudoja gerokai mažiau žetonų toms pačioms „Codex“ užduotims atlikti, todėl yra ne tik pajėgesnis, bet ir efektyvesnis.

Išleidžiame GPT‑5.5 su iki šiol stipriausiu apsaugos priemonių rinkiniu, skirtu sumažinti piktnaudžiavimą, tuo pačiu išsaugant prieigą naudingam darbui. Prieš išleisdami, įvertinome šį modelį taikydami visą savo saugos ir pasirengimo sistemų rinkinį, bendradarbiavome su vidaus bei išorės saugumo testuotojais, pridėjome tikslinį pažangių kibernetinio saugumo ir biologijos galimybių testavimą bei surinkome beveik 200 patikimų išankstinės prieigos partnerių atsiliepimus apie realius pritaikymo scenarijus.

Šiandien GPT‑5.5 pristatomas „Plus“, „Pro“, „Business“ ir „Enterprise“ naudotojams „ChatGPT“ bei „Codex“ platformose, o „GPT‑5.5 Pro“ pristatomas „Pro“, „Business“ ir „Enterprise“ naudotojams platformoje „ChatGPT“. API diegimams reikalingos kitokios apsaugos priemonės, todėl glaudžiai bendradarbiaujame su partneriais bei klientais dėl saugos ir saugumo reikalavimų, skirtų modelio teikimui dideliu mastu. GPT‑5.5 ir „GPT‑5.5 Pro“ pasieks API labai greitai.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82,7 %	75,1 %	-	-	69,4 %	68,5 %
Expert-SWE (vidinė)	73,1 %	68,5 %	-	-	-	-
„GDPval“ (pergalės arba lygiosios)	84,9 %	83,0 %	82,3 %	82,0 %	80,3 %	67,3 %
„OSWorld-Verified“	78,7 %	75,0 %	-	-	78,0 %	-
Toolathlon	55,6 %	54,6 %	-	-	-	48,8 %
BrowseComp	84,4 %	82,7 %	90,1 %	89,3 %	79,3 %	85,9 %
FrontierMath Tier 1–3	51,7 %	47,6 %	52,4 %	50,0 %	43,8 %	36,9 %
FrontierMath Tier 4	35,4 %	27,10 %	39,6 %	38,0 %	22,9 %	16,7 %
CyberGym	81,8 %	79,0 %	-	-	73,1 %	-

Modelio galimybės

„OpenAI“ kuria pasaulinę agentų DI infrastruktūrą, suteikiančią galimybę žmonėms ir įmonėms visame pasaulyje atlikti darbus pasitelkiant DI. Per pastaruosius metus matėme, kaip DI smarkiai paspartino programinės įrangos inžineriją. Įdiegus GPT‑5.5 sistemose „Codex“ ir „ChatGPT“, tokia pati transformacija pradeda plisti į mokslinius tyrimus bei platesnius darbus, kuriuos žmonės atlieka kompiuteriais.

Šiose srityse GPT‑5.5 yra ne tik išmanesnis – jis efektyviau sprendžia problemas, dažnai pasiekdamas aukštesnės kokybės rezultatus sunaudodamas mažiau žetonų ir atlikdamas mažiau bandymų. Remiantis „Artificial Analysis“ „Coding Index“, GPT‑5.5 užtikrina aukščiausio lygio intelektą perpus pigiau nei konkuruojantys priešakiniai kodo rašymo modeliai.

„Artificial Analysis Intelligence“ indeksas⁠(atsidaro naujame lange) yra 10-ies išorės šalies atliktų vertinimų svertinis vidurkis: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity's Last Exam, IFBench, SciCode, Terminal-Bench Hard, Tau2-Bench Telecom.

Agentų atliekamas kodo rašymas

GPT‑5.5 yra mūsų iki šiol stipriausias agentų atliekamo kodo rašymo modelis. Atliekant vertinimą su Terminal-Bench 2.0, kuriame testuojami sudėtingi komandinės eilutės darbo procesai, reikalaujantys planavimo, iteracijų ir įrankių koordinavimo, jis pasiekia aukščiausio lygio 82,7 % tikslumą. SWE-Bench Pro vertinime, kuriame analizuojamas realus „GitHub“ problemų sprendimas, jis pasiekia 58,6 proc. – vienu bandymu nuo pradžios iki galo išsprendžia daugiau užduočių nei ankstesni modeliai. Vertinime Expert-SWE – mūsų vidiniame priešakiniame ilgo laikotarpio kodo rašymo užduočių teste, kuriam atlikti žmogui vidutiniškai prireiktų 20 valandų, – GPT‑5.5 taip pat lenkia GPT‑5.4.

Visuose trijuose vertinimuose GPT‑5.5 pagerina GPT‑5.4 rezultatus, sunaudodamas mažiau žetonų.

Modelio stiprybės rašant kodą ypač išryškėja „Codex“ platformoje, kurioje jis gali atlikti inžinerinius darbus nuo diegimo ir kodo pertvarkymo iki klaidų taisymo, testavimo bei patvirtinimo. Ankstyvieji testai rodo, kad GPT‑5.5 geriau atlieka veiksmus, nuo kurių priklauso realus inžinerinis darbas, pavyzdžiui, išlaiko kontekstą didelėse sistemose, logiškai sprendžia neaiškias klaidas, tikrina prielaidas naudojant įrankius ir pritaiko pakeitimus visoje susijusioje kodo bazėje.

Atvaizduota trajektorija naudoja NASA/JPL „Horizons“ vektorių duomenis „Orion“ erdvėlaiviui, Mėnuliui ir Saulei, o dėl geresnio įskaitomumo buvo pritaikytas vaizdo mastelis.

Užklausa: „[attached image] Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.“ ([pridėtas vaizdas] Įgyvendink tai kaip naują programą naudodamas „WebGL“ ir „Vite“ su realiais duomenimis iš „Artemis II“ misijos. Būtinai nuodugniai ištestuok programą, kol ji pradės visiškai veikti ir atrodys taip, kaip pavaizduota nuotraukoje. Atkreipk ypatingą dėmesį į planetų ir skrydžio maršrutų atvaizdavimą. Noriu turėti galimybę sąveikauti su 3D atvaizdavimu. Užtikrink realistišką orbitos mechaniką.)

Be geresnių testų rezultatų, ankstyvieji bandytojai teigė, kad GPT‑5.5 geriau supranta sistemos sandarą: kodėl atsiranda klaida, kurioje vietoje reikia pritaikyti taisymą ir kas dar kodo bazėje bus paveikta.

„Pirmasis mano naudotas kodo rašymo modelis, pasižymintis rimtu konceptualiu aiškumu.“

Dan Shipper, „Every“ įkūrėjas ir generalinis direktorius, apibūdino GPT‑5.5 kaip „pirmąjį mano naudotą kodo rašymo modelį, pasižymintį rimtu konceptualiu aiškumu.“

Po programos išleidimo jis kelias dienas taisė klaidas, iškilusias po pristatymo, kol galiausiai pasikvietė vieną iš geriausių savo inžinierių, kad šis perrašytų dalį sistemos. Norėdamas išbandyti GPT‑5.5, jis, vaizdžiai tariant, atsuko laiką atgal: ar modelis galėtų peržiūrėti sugedusią sistemą ir pasiūlyti tokį patį perrašymą, kokiam galiausiai ryžosi inžinierius? GPT‑5.4 to padaryti negalėjo. GPT‑5.5 – galėjo.

„Išties apima jausmas, kad dirbu su aukštesniu intelektu, ir jam netgi atsiranda savotiška pagarba.“

Pietro Schirano, „MagicPath“ generalinis direktorius, pastebėjo panašų ryškų pokytį, kai GPT‑5.5 sujungė atšaką su šimtais naudotojo sąsajos bei kodo pertvarkymo pakeitimų į pagrindinę atšaką, kuri taip pat buvo gerokai pasikeitusi – ir šį darbą jis išsprendė vienu bandymu maždaug per 20 minučių.

Modelį testavę vyresnieji inžinieriai teigė, kad GPT‑5.5 protavimu ir savarankiškumu pastebimai lenkė GPT‑5.4 bei „Claude Opus 4.7“ – jis iš anksto fiksavo problemas bei numatė testavimo ir peržiūros poreikius net negavęs aiškių užklausų. Vienu atveju inžinierius paprašė jo perkurti komentarų sistemą bendrai naudojamoje „Markdown“ redagavimo priemonėje ir grįžęs rado beveik užbaigtą 12-kos kodo skirtumų rinkinį. Kiti teigė, kad prireikė stebėtinai mažai diegimo pataisymų ir, lyginant su GPT‑5.4, jautėsi užtikrinčiau dėl GPT‑5.5 planų.

Vienas NVIDIA inžinierius, turėjęs ankstyvą prieigą prie modelio, netgi pasakė: „Prarasti prieigą prie GPT‑5.5 – tai tarsi netekti galūnės.“

GPT-5.5 yra pastebimai išmanesnis ir nuoseklesnis už GPT-5.4, pasižymintis geresniais kodo rašymo rezultatais ir patikimesniu įrankių naudojimu. Jis žymiai ilgiau lieka sutelkęs dėmesį į užduotį ir nesustoja per anksti, o tai yra svarbiausia atliekant sudėtingą, ilgalaikį darbą, kurį mūsų naudotojai patiki „Cursor“.“

– Michael Truell, „Cursor“ bendraįkūrėjis ir generalinis direktorius

Protinis darbas

Tos pačios stiprybės, kurios paverčia GPT‑5.5 puikiu koduojant, taip pat daro jį galingą kasdieniame darbe kompiuteriu. Kadangi modelis geriau supranta ketinimus, jis gali natūraliau atlikti visą žiniomis grįsto darbo ciklą: rasti informaciją, suprasti tai, kas svarbu, naudoti įrankius, tikrinti išvestį ir paversti pirminius duomenis kažkuo naudingu.

„Codex“ platformoje GPT‑5.5 geriau nei GPT‑5.4 generuoja dokumentus, skaičiuokles ir skaidrių pristatymus. „Alpha“ versijos bandytojai teigė, kad jis lenkia ankstesnius modelius tokiose srityse kaip operacijų tyrimai, modeliavimas skaičiuoklėse ir painių verslo duomenų pavertimas planais. Kartu su „Codex“ kompiuterio naudojimo įgūdžiais, GPT‑5.5 priartina mus prie pojūčio, kad modelis išties gali naudotis kompiuteriu kartu su jumis: matyti, kas yra ekrane, spustelėti, rašyti, naršyti sąsajose ir tiksliai judėti tarp įvairių įrankių.

„OpenAI“ komandos jau naudoja šias stiprybes realiuose darbo procesuose. Šiandien daugiau nei 85 proc. įmonės darbuotojų kas savaitę naudoja „Codex“ įvairioms funkcijoms, įskaitant programinės įrangos inžineriją, finansus, komunikaciją, rinkodarą, duomenų mokslą ir produktų valdymą. Komunikacijos skyriuje komanda naudojo GPT‑5.5 platformoje „Codex“, kad išanalizuotų šešių mėnesių duomenis apie prašymus pasisakyti, sukurtų vertinimo ir rizikos sistemą bei patvirtintų automatizuotą „Slack“ agentą. Tokiu būdu mažos rizikos prašymai galėtų būti tvarkomi automatiškai, o didesnės rizikos – toliau nukreipiami žmogaus peržiūrai. Finansų skyriuje komanda naudojo „Codex“ norėdama peržiūrėti 24 771 K-1 mokesčių formą (iš viso 71 637 puslapius), taikydama darbo procesą, kuris pašalino asmeninę informaciją ir padėjo komandai atlikti užduotį dviem savaitėmis greičiau nei praėjusiais metais. Patekimo į rinką strategijos komandoje darbuotojas automatizavo kassavaitinių verslo ataskaitų generavimą ir taip sutaupo 5–10 valandų per savaitę.

Naudojant „ChatGPT“, „GPT‑5.5 Mąstantis“ (angl. „GPT‑5.5 Thinking“) atrakina greitesnę pagalbą sprendžiant sudėtingesnes problemas ir pateikia išmanesnius bei glaustesnius atsakymus, padedančius efektyviau atlikti sudėtingus darbus. Jis puikiai atlieka tokius profesionalius darbus kaip kodo rašymas, tyrimai, informacijos sintezė bei analizė ir daug dokumentų apimančios užduotys, ypač kai naudojami papildiniai.

Naudodami „GPT‑5.5 Pro“, ankstyvieji bandytojai pastebi reikšmingą „ChatGPT“ atliekamo darbo sudėtingumo ir kokybės šuolį bei vėlavimo patobulinimus, dėl kurių šis modelis tampa kur kas praktiškesnis atliekant sudėtingas užduotis. Palyginti su „GPT‑5.4 Pro“, bandytojams „GPT‑5.5 Pro“ atsakymai pasirodė kur kas išsamesni, geriau susisteminti, tikslesni, aktualesni ir naudingesni, o ypač gerus rezultatus pademonstravo verslo, teisės, švietimo ir duomenų mokslo srityse.

Šio pobūdžio darbą atspindinčiuose vertinimuose GPT‑5.5 pasiekia pačius aukščiausius rezultatus. Atliekant testą GDPval⁠⁠, kurio metu tikrinami agentų gebėjimai kurti gerai apibrėžtą žinių reikalaujantį darbą 44 profesijose, GPT‑5.5 rezultatas siekia 84,9 proc. OSWorld-Verified teste, matuojančiame modelio gebėjimą savarankiškai valdyti realias kompiuterių aplinkas, jis pasiekia 78,7 proc. O Tau2-bench Telecom vertinime, testuojančiame sudėtingus klientų aptarnavimo darbo procesus, jis pasiekia 98,0 % be jokio užklausų koregavimo. GPT‑5.5 taip pat demonstruoja puikius rezultatus kituose žinių reikalaujančio darbo etaloniniuose testuose: 60,0 % atliekant FinanceAgent testą, 88,5 proc. atliekant vidines investicinės bankininkystės modeliavimo užduotis ir 54,1 proc. atliekant OfficeQA Pro testą.

„Tau2-bench Telecom“ buvo vykdomas be užklausų koregavimo (naudojant „GPT‑4.1“ kaip naudotojo modelį). GPT‑5.5 geriau supranta užduoties tikslą ir efektyviau naudoja žetonus nei jo pirmtakai.

GPT-5.5 užtikrina nuolatinį našumą, reikalingą daug resursų reikalaujančiam darbui. Sukurtas ir veikiantis NVIDIA GB200 NVL72 sistemose, šis modelis leidžia mūsų komandoms diegti visapusiškas funkcijas naudojant natūraliosios kalbos užklausas, sutrumpinti klaidų taisymo laiką nuo dienų iki valandų ir savaites trukusius eksperimentus paversti per naktį pasiekta pažanga sudėtingose kodo bazėse. Tai ne tik greitesnis kodo rašymas – tai naujas darbo būdas, padedantis žmonėms veikti iš esmės kitokiu greičiu.“

– Justin Boitano, įmonėms skirto DI viceprezidentas bendrovėje NVIDIA

Moksliniai tyrimai

GPT‑5.5 taip pat demonstruoja pažangą mokslinių ir techninių tyrimų darbo procesuose, kuriuose reikia daugiau nei tik atsakyti į sudėtingą klausimą. Tyrėjams reikia išnagrinėti idėją, surinkti įrodymus, patikrinti prielaidas, interpretuoti rezultatus ir nuspręsti, ką bandyti toliau. GPT‑5.5 geriau nei kiti modeliai geba nuosekliai veikti šiame cikle.

Verta paminėti, kad GPT‑5.5 rodo aiškų pranašumą prieš GPT‑5.4 atliekant GeneBench⁠(atsidaro naujame lange) – naujame vertinime, orientuotame į daugiapakopę mokslinių duomenų analizę genetikoje ir kiekybinėje biologijoje. Norint išspręsti šias problemas, modeliai turi logiškai vertinti potencialiai dviprasmiškus ar klaidingus duomenis gaunant minimalų priežiūros nurodymą, įveikti realistiškas kliūtis, tokias kaip paslėpti klaidinantys kintamieji ar kokybės kontrolės trūkumai, ir teisingai įgyvendinti bei interpretuoti šiuolaikinius statistinius metodus. Modelio našumas yra stebėtinai geras turint omenyje tai, kad čia esančios užduotys dažnai prilygsta kelių dienų trukmės mokslinių ekspertų projektams.

Panašiai ir „BixBench“⁠(atsidaro naujame lange) – vertinime, sukurtame remiantis realia bioinformatika bei duomenų analize, – GPT‑5.5 pasiekė geriausių rezultatų tarp modelių, kurių vertinimai yra viešai paskelbti. Modelio moksliniai pajėgumai dabar yra pakankamai stiprūs, kad jis galėtų reikšmingai paspartinti pažangą priešakinėse biomedicininių tyrimų ribose, veikdamas kaip visavertis mokslininkas-kolega.

Kitame pavyzdyje vidinė GPT‑5.5 versija su specialiai pritaikyta infrastruktūra padėjo atrasti naują įrodymą⁠(atsidaro naujame lange) apie Ramzio (Ramsey) skaičius – vieną pagrindinių kombinatorikos objektų. Kombinatorika nagrinėja, kaip dera tarpusavyje diskretieji objektai: grafai, tinklai, aibės ir modeliai. Ramzio skaičiai apytiksliai nusako, kokio dydžio turi būti tinklas, kad jame garantuotai atsirastų tam tikra tvarka. Rezultatai šioje srityje yra reti ir dažnai techniškai sudėtingi. Čia GPT‑5.5 rado seniai nagrinėjamo asimptotinio fakto apie neįstrižuosius Ramzio skaičius įrodymą, kuris vėliau buvo patvirtintas sistemoje „Lean“. Šis rezultatas – tai konkretus pavyzdys, kaip GPT‑5.5 pateikia ne tik kodą ar paaiškinimą, bet ir netikėtą bei naudingą matematinį argumentą vienoje pagrindinių tyrimų sričių.

Ankstyvieji bandytojai „ChatGPT“ platformoje „GPT‑5.5 Pro“ naudojo mažiau kaip atsakymų variklį, veikiantį vieno klausimo principu, ir labiau kaip tyrimų partnerį: po kelis kartus kritiškai vertino rankraščius, tikrino techninius argumentus, siūlė analizes bei dirbo su kodu, užrašais ir PDF kontekstu. Bendras vardiklis yra tas, kad GPT‑5.5 geriau padeda tyrėjams pereiti nuo klausimo prie eksperimento ir galiausiai – rezultato.

Derya Unutmaz, imunologijos profesorius ir Džeksono genominės medicinos laboratorijos tyrėjas, pasitelkė „GPT‑5.5 Pro“, kad išanalizuotų genų ekspresijos duomenų rinkinį, kurį sudarė 62 mėginiai ir beveik 28 tūkst. genų. Jis parengė išsamią tyrimo ataskaitą, kuri ne tik apibendrino išvadas, bet ir iškėlė svarbiausius klausimus bei įžvalgas – darbą, kuris, pasak jo, komandai būtų užtrukęs kelis mėnesius.

Bartosz Naskręcki, Adomo Mickevičiaus universiteto Poznanėje (Lenkija) matematikos docentas, naudojo GPT‑5.5 platformoje „Codex“, kad per 11 minučių iš vienos užklausos sukurtų algebrinės geometrijos programą, vizualizuojančią kvadratinių paviršių sankirtą ir paverčiančią gautą kreivę Vejerštraso (Weierstrass) modeliu.

Vėliau jis išplėtė programą įtraukdamas stabilesnį singuliarumo vizualizavimą ir tikslius koeficientus, kuriuos galima naudoti tolesniame darbe. Jam didesnis pokytis yra tas, kad dabar „Codex“ gali padėti įgyvendinti specialius matematinės vizualizacijos ir kompiuterinės algebros darbo procesus, kuriems anksčiau reikėdavo specializuotų įrankių. Kartu šie pavyzdžiai rodo, kaip GPT‑5.5 paverčia eksperto ketinimus į veikiančius tyrimų įrankius bei analizes.

Šaltinis: Bartosz Naskręcki⁠(atsidaro naujame lange)

Užklausa: „# Algebraic geometry surface intersection

Make an app which draws two quadratic surfaces and colors in red the intersection curve. Use computational Riemann-Roch theorem to convert this into Weierstrass curve.

## Main window

Two tinted surfaces with a slightly transparent shading, high quality rendering intersect along a red colored algebraic curve

Rotation with mouses in both directions, full pinch mechanism for zoom, haptic press to show the little menu with sliders for changing the coefficients of each surface; detection via Z-buffor level

## Side right window

Short Weierstrass equation (over Q or quadratic field extension) computed on the go via effective Riemann-Roch theorem formulas

## Ambient mode where all the controls are hidden and the user can admire the beauty of the shapes

## Specs

App is running in the browser, light-weight implementation with full stack newest libraries, portable, deployable

## Docs

Git repo, journal, plan (Markdown files)“ (# Algebrinės geometrijos paviršių sankirta. Sukurk programą, kuri nupiešia du kvadratinius paviršius ir raudonai nuspalvina sankirtos kreivę. Naudok skaičiuojamąją Rymano ir Rocho (Riemann-Roch) teoremą, kad paverstum tai Vejerštraso kreive. ## Pagrindinis langas. Du tamsinti paviršiai su šiek tiek permatomu šešėliavimu, aukštos kokybės atvaizdavimu susikerta išilgai raudonos algebrinės kreivės. Pasukimas pele abiem kryptimis, priartinimas suėmimo gestu, haptinis paspaudimas iškviečia mažą meniu su slankikliais kiekvieno paviršiaus koeficientams keisti; aptikimas per Z-buferio lygį. ## Dešinysis šoninis langas. Trumpa Vejerštraso lygtis (virš Q arba kvadratinio lauko plėtinio), apskaičiuojama realiuoju laiku pagal efektyvias Rymano ir Rocho teoremos formules. ## Fono režimas, kuriame visi valdikliai paslėpti ir naudotojas gali gėrėtis formų grožiu. ## Specifikacijos. Programa veikia naršyklėje, lengvas įgyvendinimas naudojant naujausias viso steko (angl. full stack) bibliotekas, nešiojama, lengvai įdiegiama. ## Dokumentacija. „Git“ saugykla, žurnalas, planas („Markdown“ failai).)

„Nepaprastai įkvepia tai, kad naudodami naująjį „OpenAI“ modelį GPT-5.5 savo infrastruktūroje matome, kaip jis logiškai analizuoja milžiniškus biocheminius duomenų rinkinius, kad nuspėtų vaistų poveikį žmogui, ir po to užtikrina reikšmingą tikslumo padidėjimą sudėtingiausiuose mūsų vaistų atradimo vertinimuose. Jei „OpenAI“ ir toliau demonstruos tokius rezultatus, iki metų pabaigos vaistų atradimo pagrindai visiškai pasikeis.“

– Brandon White, „Axiom Bio“ bendraįkūrėjis ir generalinis direktorius

Naujos kartos modelio vykdymo efektyvumas

Norint teikti GPT‑5.5 išlaikant GPT‑5.4 vėlavimą, prireikė pergalvoti modelio vykdymą kaip integruotą sistemą, o ne atskirų optimizacijų rinkinį. GPT‑5.5 buvo kartu kuriamas, mokomas ir teikiamas naudojant NVIDIA GB200 ir GB300 NVL72 sistemas. „Codex“ ir GPT‑5.5 atliko esminį vaidmenį siekiant mūsų užsibrėžtų našumo tikslų. „Codex“ padėjo komandai greičiau pereiti nuo idėjos prie išmatuojamo diegimo, planuojant metodus, derinant eksperimentus ir padedant nustatyti, į kurias optimizacijas verta investuoti daugiau. GPT‑5.5 padėjo rasti ir įgyvendinti pagrindinius patobulinimus pačiame dėkle. Paprasčiau tariant, modelis padėjo patobulinti jį patį aptarnaujančią infrastruktūrą.

Vienas iš tokių patobulinimų buvo apkrovos balansavimas ir padalijimo euristika. Prieš atsirandant GPT‑5.5, užklausas greitintuve dalijome į nustatytą skaičių dalių, kad subalansuotume skaičiavimo branduolių darbą ir užtikrintume, jog didelės bei mažos užklausos galėtų veikti tame pačiame vaizdo procesoriuje (GPU). Tačiau iš anksto nustatytas statinis dalių skaičius nėra optimalus visiems srauto pobūdžiams. Siekiant geriau išnaudoti vaizdo procesorius (GPU), „Codex“ išanalizavo kelių savaičių realių sąlygų srauto tendencijas ir parašė specialius euristinius algoritmus, skirtus optimaliai padalyti bei subalansuoti darbą. Šios pastangos turėjo didžiulį poveikį – žetonų generavimo greitis padidėjo daugiau nei 20 %.

Kibernetinio saugumo pažanga visų mūsų saugumui

Pasaulio paruošimas modeliams, kurie puikiai randa ir ištaiso saugumo pažeidžiamumus, yra komandinis žaidimas, reikalausiantis visos ekosistemos sunkaus darbo kuriant atsparumą, kartu užtikrinant demokratizuotą prieigą prie modelių ir iteracinį diegimą, pritaikytą naujajai kibernetinės gynybos erai⁠.

Priešakiniai modeliai kibernetinio saugumo srityje tampa vis galingesni. Šios galimybės taps plačiai prieinamos, todėl tikime, kad geriausias kelias į priekį – užtikrinti, jog jos būtų naudojamos kibernetinei gynybai spartinti ir ekosistemai stiprinti.

GPT‑5.5 yra laipsniškas, bet svarbus žingsnis link DI, galinčio išspręsti pačius sudėtingiausius pasaulio iššūkius, tokius kaip kibernetinis saugumas. Kartu su GPT‑5.2 pasirodymu gruodžio mėnesį, mes iniciatyviai įdiegėme būtinas kibernetines apsaugos priemones⁠, kad apribotume galimą piktnaudžiavimą kibernetinėje erdvėje naudojant mūsų modelius; o dabar, su GPT‑5.5, diegiame griežtesnius potencialios kibernetinės rizikos klasifikatorius, kurie iš pradžių, kol mes juos palaipsniui tiksliname, kai kuriems naudotojams gali pasirodyti erzinantys.

Nuolat tobulėjant mūsų modeliams, jau ne vienerius metus savo Pasirengimo sistemoje⁠(atsidaro naujame lange) esame išskyrę kibernetinį saugumą kaip atskirą kategoriją. Tuo pat metu iteraciškai kuriame ir kalibruojame rizikos mažinimo priemones, kad galėtume atsakingai išleisti modelius, pasižyminčius reikšmingomis kibernetinio saugumo galimybėmis.

Diegiame pramonėje lyderiaujančias apsaugos priemones tokio lygio kibernetinėms galimybėms. Pirmąsias specialiai su kibernetiniu saugumu susijusias apsaugos priemones pristatėme kartu su GPT‑5.2⁠(atsidaro naujame lange) praėjusiais metais ir toliau jas testavome, tobulinome bei pritaikėme vėlesniuose diegimuose. Skirdami GPT‑5.5, sukūrėme griežtesnę didesnės rizikos veiklos ir jautrių kibernetinių užklausų kontrolę bei pridėjome apsaugos priemones nuo pakartotinio piktnaudžiavimo. Plati prieiga įmanoma dėl mūsų investicijų į modelių saugą, patvirtintą naudojimą ir neleistino naudojimo stebėjimą. Jau kelis mėnesius bendradarbiaujame su išorės ekspertais kurdami, testuodami ir tobulindami šių apsaugos priemonių patikimumą. Su GPT‑5.5 mes užtikriname, kad kūrėjai galėtų lengvai apsaugoti savo kodą, ir tuo pat metu taikome griežtesnę kontrolę tiems kibernetiniams darbo procesams, kuriais piktavaliai veikėjai labiausiai tikėtina gali padaryti žalos.
Plečiame prieigą, kad paspartintume kibernetinę gynybą visuose lygiuose. Savo kibernetinėms užduotims lankstesnius modelius padarome prieinamus per „Trusted Access for Cyber“⁠ programą. Pradedame nuo „Codex“, kuris pristatymo metu suteikia išplėstinę prieigą prie pažangių GPT‑5.5 kibernetinio saugumo galimybių su mažesniais apribojimais patvirtintiems naudotojams, atitinkantiems tam tikrus pasitikėjimo signalus⁠(atsidaro naujame lange). Organizacijos, atsakingos už kritinės infrastruktūros apsaugą⁠, gali pateikti paraišką gauti prieigą prie kibernetinėms užduotims lankstesnių modelių, tokių kaip „GPT‑5.4‑Cyber“, ir atitikusios griežtus saugumo reikalavimus, naudoti šiuos modelius savo vidinių sistemų apsaugai. Tai suteikia plačiam patvirtintų gynėjų ratui pajėgesnius įrankius teisėtam saugumo darbui, sumažinant nereikalingus trukdžius ir užtikrinant demokratizuotą prieigą prie svarbių gynybinių galimybių. Naudotojai gali pateikti paraišką dėl patikimos prieigos svetainėje chatgpt.com/cyber⁠(atsidaro naujame lange), kad sumažintų nereikalingų atmetimų skaičių naudojant GPT‑5.5 patvirtintam gynybiniam darbui.
Bendradarbiaujame su vyriausybės partneriais, kad padėtume apsaugoti kritinę infrastruktūrą visuomenės labui. Kartu analizuojame, kaip pažangus DI gali padėti patikimiems pareigūnams ginti sistemas, kuriomis žmonės kliaujasi: nuo skaitmeninių sistemų, saugančių svarbius mokesčių mokėtojų duomenis, iki vietos bendruomenių elektros tinklų bei vandens tiekimo sistemų.

Remdamiesi savo Pasirengimo sistema⁠(atsidaro naujame lange), GPT‑5.5 biologines, chemines ir kibernetinio saugumo galimybes vertiname kaip „aukštas“. Nors GPT‑5.5 nepasiekė „kritinio“ kibernetinio saugumo galimybių lygio, mūsų vertinimai ir bandymai parodė, kad jo kibernetinio saugumo galimybės yra žingsniu priekyje, lyginant su GPT‑5.4.

Be to, prieš išleidžiant GPT‑5.5, jis praėjo visą mūsų saugos ir valdymo procesą, įskaitant pasirengimo vertinimus, specifinius sričių testavimus, naujus tikslinius vertinimus, skirtus pažangioms biologijos bei kibernetinio saugumo galimybėms nustatyti, ir patikimą testavimą su išorės ekspertais. Daugiau informacijos pateikiame GPT‑5.5 sistemos kortelėje⁠(atsidaro naujame lange).

Šis darbas atspindi mūsų platesnį požiūrį į DI atsparumą, kuris, mūsų nuomone, yra būtinas tobulėjant modelių galimybėms. Norime, kad galingas DI būtų prieinamas žmonėms, kurie jį naudoja sistemų, institucijų ir visuomenės apsaugai. Perspektyvus kelias yra patikima prieiga, patikimos apsaugos priemonės, kurios plečiasi augant galimybėms, ir operatyviniai pajėgumai, leidžiantys aptikti rimtus piktnaudžiavimo atvejus bei į juos reaguoti.

Prieinamumas ir kainos

„ChatGPT“ platformoje „GPT‑5.5 Mąstantis“ (angl. „GPT‑5.5 Thinking“) pasiekiamas „Plus“, „Pro“, „Business“ ir „Enterprise“ naudotojams. „GPT‑5.5 Pro“, skirtas dar sudėtingesniems klausimams ir aukštesnio tikslumo darbui, pasiekiamas „Pro“, „Business“ ir „Enterprise“ naudotojams.

„Codex“ platformoje GPT‑5.5 pasiekiamas „Plus“, „Pro“, „Business“, „Enterprise“, „Edu“ ir „Go“ planuose su 400 tūkst. žetonų konteksto langu. GPT‑5.5 taip pat pasiekiamas sparčiuoju režimu, kuris generuoja žetonus 1,5 k. greičiau už 2,5 k. didesnę kainą.

API kūrėjams GPT‑5.5 netrukus bus pasiekiamas atsakymų ir pokalbių užbaigimo API už 5 USD už 1 mln. įvesties žetonų ir 30 USD už 1 mln. išvesties žetonų su 1 mln. žetonų konteksto langu. Masinių užklausų („Batch“) ir kintamo prioriteto („Flex“) apdorojimui taikoma perpus mažesnė kaina nei standartinis API tarifas, tuo tarpu prioritetinis apdorojimas kainuoja 2,5 k. brangiau nei standartinis tarifas. API taip pat išleisime „gpt-5.5-pro“, skirtą dar didesniam tikslumui, kurio kaina sieks 30 USD už 1 mln. įvesties žetonų ir 180 USD už 1 mln. išvesties žetonų. Daugiau informacijos rasite kainodaros puslapyje⁠.

Nors GPT‑5.5 kaina didesnė nei GPT‑5.4, jis yra ir išmanesnis, ir kur kas efektyvesnis žetonų naudojimo atžvilgiu. „Codex“ platformoje kruopščiai suderinome naudojimo patirtį, kad GPT‑5.5 daugumai naudotojų užtikrintų geresnius rezultatus sunaudojant mažiau žetonų nei GPT‑5.4, tuo pačiu ir toliau siūlydami dideles naudojimo apimtis visuose prenumeratų lygmenyse.

Vertinimai

Programavimas

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (vieša)*	58,6 %	57,7 %	-	-	64,3 %	54,2 %
Terminal-Bench 2.0	82,7 %	75,1 %	-	-	69,4 %	68,5 %
Expert-SWE (vidinė)	73,1 %	68,5 %	-	-	-	-

^* ^{Laboratorijos pastebėjo}^{įsiminimo įrodymų}⁠(atsidaro naujame lange)^{atliekant šį vertinimą}

Profesionalus

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
„GDPval“ (pergalės arba lygiosios)	84,9 %	83,0 %	82,3 %	82,0 %	80,3 %	67,3 %
FinanceAgent v1.1	60,0 %	56,0 %	-	61,5 %	64,4 %	59,7 %
Investicinės bankininkystės modeliavimo užduotys (vidinės)	88,5 %	87,3 %	88,6 %	83,6 %	-	-
OfficeQA Pro	54,1 %	53.2%	-	-	43,6 %	18,1 %

Kompiuterio naudojimas ir rega

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
„OSWorld-Verified“	78,7 %	75,0 %	-	-	78,0 %	-
„MMMU Pro“ (be įrankių)	81,2 %	81,2 %	-	-	-	80,5 %
„MMMU Pro“ (su įrankiais)	83,2 %	82,1 %	-	-	-	-

Įrankių naudojimas

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84,4 %	82,7 %	90,1 %	89,3 %	79,3 %	85,9 %
MCP Atlas**	75,3 %	70,6 %	-	-	79,1 %	78,2 %
Toolathlon	55,6 %	54,6 %	-	-	-	48,8 %
Tau2-bench Telecom*** (originalios užklausos)	98,0 %	92,8 %	-	-	-	-

^{** „MCP Atlas“: „Scale AI“ rezultatai po naujausio 2026 m. balandžio mėn. atnaujinimo.
*** „Tau2-bench telecom“: 5.5 ir 5.4 versijų rezultatai naudojant originalias užklausas, t. y. be jokio užklausos koregavimo. Čia nepateikiami rezultatai iš kitų laboratorijų, kurios buvo vertinamos naudojant užklausų koregavimus.}

Akademinis

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25,0 %	19,0 %	33,2 %	25,6 %	-	-
FrontierMath Tier 1–3	51,7 %	47,6 %	52,4 %	50,0 %	43,8 %	36,9 %
FrontierMath Tier 4	35,4 %	27,10 %	39,6 %	38,0 %	22,9 %	16,7 %
BixBench	80,5 %	74,0 %	-	-	-	-
GPQA Diamond	93,6 %	92,8 %	-	94,4 %	94,2 %	94,3 %
„Humanity's Last Exam“ (be įrankių)	41,4 %	39,8 %	43,1 %	42,7 %	46,9 %	44,4 %
„Humanity's Last Exam“ (su įrankiais)	52,2 %	52,1 %	57,2 %	58,7 %	54,7 %	51,4 %

Kibernetinis saugumas

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
„Capture-the-Flags“ iššūkio užduotys (vidinės)****	88,1 %	83,7 %	-	-	-	-
CyberGym	81,8 %	79,0 %	-	-	73,1 %	-

^{**** Sunkiausių CTF (angl. Capture-the-Flag), naudotų sistemos kortelėse, papildymas naujais sudėtingais iššūkiais.}

Ilgas kontekstas

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73,7 %	62,5 %	-	-	76,9 %	-
Graphwalks BFS 1mil f1	45,4 %	9,4 %	-	-	41,2 % (Opus 4.6)	-
Graphwalks parents 256k f1	90,1 %	82,8 %	-	-	93,6 %	-
Graphwalks parents 1mil f1	58,5 %	44,4 %	-	-	72,0 % (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98,1 %	97,3 %	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93,0 %	91,4 %	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96,5%	97,2 %	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90,0 %	90,5 %	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83,1 %	86,0 %	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87,5 %	79,3 %	-	-	59,2 %	-
OpenAI MRCR v2 8-needle 256K-512K	81,5 %	57,5 %	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74,0 %	36,6 %	-	-	32,20 %	-

Abstraktus samprotavimas

Įvert.	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (patvirtinta)	95,0 %	93,7 %	-	94,5 %	93,5 %	98,0 %
ARC-AGI-2 (patvirtinta)	85,0%	73,3 %	-	83,3 %	75,8 %	77,1 %

GPT vertinimai buvo atlikti tyrimų aplinkoje, nustačius itin dideles (angl. „xhigh“) protavimo pastangas, todėl kai kuriais atvejais rezultatai gali šiek tiek skirtis nuo realiomis sąlygomis veikiančio „ChatGPT“.