Preskočiť na hlavný obsah
OpenAI

23. apríla 2026

ProduktVydanie

Predstavujeme GPT‑5.5

Nová trieda inteligencie pre skutočnú prácu

Načítava sa…

Aktualizácia z 24. apríla 2026: GPT‑5.5 a GPT‑5.5 Pro sú teraz dostupné v API. Systémová karta bola tiež aktualizovaná, aby opisovala ďalšie súvisiace ochranné opatrenia.


Uvádzame na trh GPT‑5.5, náš doteraz najinteligentnejší model s najintuitívnejším používaním, a ďalší krok k novému spôsobu práce na počítači.

GPT‑5.5 rýchlejšie chápe, čo sa snažíš urobiť, a dokáže samo zvládnuť viac práce. Vyniká v písaní a ladení kódu, online výskume, analýze údajov, vytváraní dokumentov a tabuliek, práci so softvérom a prechádzaní medzi nástrojmi až do dokončenia úlohy. Namiesto starostlivého riadenia každého kroku môžeš GPT‑5.5 zadať neusporiadanú, viacdielnu úlohu a dôverovať mu, že naplánuje postup, použije nástroje, skontroluje svoju prácu, zorientuje sa v nejednoznačnosti a bude pokračovať.

Prínosy sú obzvlášť výrazné v agentickom kódovaní, používaní počítača, znalostnej práci a ranom vedeckom výskume – oblastiach, v ktorých pokrok závisí od uvažovania naprieč kontextom a vykonávania akcií v čase. GPT‑5.5 prináša tento posun v inteligencii bez kompromisov v rýchlosti: väčšie a schopnejšie modely sa často nasadzujú pomalšie, no GPT‑5.5 pri nasadení v reálnych podmienkach dosahuje rovnakú latenciu na token ako GPT‑5.4, pričom dosahuje oveľa vyššiu úroveň inteligencie. Na dokončenie rovnakých úloh v Codexe tiež používa výrazne menej tokenov, vďaka čomu je efektívnejší aj schopnejší.

Uvádzame GPT‑5.5 s naším doteraz najsilnejším súborom ochranných opatrení, ktoré sú navrhnuté tak, aby obmedzili zneužitie a zároveň umožnili prístup na užitočnú prácu. Pred vydaním sme tento model vyhodnotili v rámci celého súboru našich rámcov bezpečnosti a pripravenosti, spolupracovali sme s internými aj externými red teamermi, pridali sme cielené testovanie pokročilých schopností v oblasti kybernetickej bezpečnosti a biológie a zhromaždili sme spätnú väzbu na reálne prípady použitia od takmer 200 dôveryhodných partnerov s predbežným prístupom.

Dnes sa GPT‑5.5 začína zavádzať pre používateľov Plus, Pro, Business a Enterprise v ChatGPT a Codex a GPT‑5.5 Pro sa začína zavádzať pre používateľov Pro, Business a Enterprise v ChatGPT. Nasadenia API si vyžadujú odlišné ochranné opatrenia a úzko spolupracujeme s partnermi a zákazníkmi na požiadavkách na bezpečnosť a zabezpečenie pri jeho poskytovaní vo veľkom rozsahu. GPT‑5.5 a GPT‑5.5 Pro sprístupníme v API už čoskoro.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82,7 %

75,1 %

-

-

69,4 %

68,5 %

Expert-SWE (Interné)

73,1 %

68,5 %

-

-

-

-

GDPval (víťazstvá alebo remízy)

84,9 %

83,0 %

82,3 %

82,0 %

80,3 %

67,3 %

OSWorld-Verified

78,7 %

75,0 %

-

-

78,0 %

-

Toolathlon

55,6 %

54,6 %

-

-

-

48,8 %

BrowseComp

84,4 %

82,7 %

90,1 %

89,3 %

79,3 %

85,9 %

FrontierMath úroveň 1–3

51,7 %

47,6 %

52,4 %

50,0 %

43,8 %

36,9 %

FrontierMath úroveň 4

35,4 %

27,1 %

39,6 %

38,0 %

22,9 %

16,7 %

CyberGym

81,8 %

79,0 %

-

-

73,1 %

-

Funkcie modelu

OpenAI buduje globálnu infraštruktúru pre agentickú umelú inteligenciu, vďaka čomu môžu ľudia a firmy na celom svete vykonávať prácu s pomocou umelej inteligencie. Za posledný rok sme videli, ako AI výrazne urýchľuje softvérové inžinierstvo. S GPT‑5.5 v Codex a ChatGPT sa tá istá transformácia začína rozširovať aj do vedeckého výskumu a širšej práce, ktorú ľudia vykonávajú na počítačoch.

Vo všetkých týchto oblastiach nie je GPT‑5.5 len inteligentnejší – je aj efektívnejší v spôsobe, akým rieši problémy, pričom často dosahuje kvalitnejšie výstupy s menším počtom tokenov a menším počtom opakovaných pokusov. V indexe Coding Index od spoločnosti Artificial Analysis poskytuje GPT‑5.5 najmodernejšiu inteligenciu za polovičné náklady v porovnaní s konkurenčnými prelomovými kódovacími modelmi.

Artificial Analysis Intelligence Index(otvorí sa v novom okne) je vážený priemer 10 hodnotení vykonaných externou stranou: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Agentné kódovanie

GPT‑5.5 je náš doteraz najsilnejší agentický kódovací model. V Terminal-Bench 2.0, ktorý testuje komplexné pracovné postupy v príkazovom riadku vyžadujúce plánovanie, iteráciu a koordináciu nástrojov, dosahuje špičkovú presnosť 82,7 %. V SWE-Bench Pro, ktorý hodnotí riešenie skutočných problémov na GitHube, dosahuje 58,6 %, pričom na jedno spracovanie od začiatku do konca vyrieši viac úloh než predchádzajúce modely. V Expert-SWE, našom internom prelomovom hodnotení pre dlhodobé úlohy kódovania s mediánom odhadovaného času dokončenia človekom 20 hodín, GPT‑5.5 tiež prekonáva GPT‑5.4.

Vo všetkých troch hodnoteniach dosahuje GPT‑5.5 lepšie výsledky než GPT‑5.4, a to pri nižšej spotrebe tokenov.

Silné stránky modelu pri kódovaní sa prejavujú obzvlášť jasne najmä v Codexe, kde dokáže zvládať inžiniersku prácu od implementácie a refaktoringu až po ladenie, testovanie a validáciu. Prvé testovania naznačujú, že GPT‑5.5 je lepší v správaní, od ktorého závisí skutočná inžinierska práca, ako je udržanie kontextu naprieč rozsiahlymi systémami, uvažovanie pri nejednoznačných zlyhaniach, overovanie predpokladov pomocou nástrojov a premietanie zmien do okolitej kódovej základne.

Vykreslená trajektória využíva vektorové dáta NASA/JPL Horizons pre Orion, Mesiac a Slnko s použitím mierky zobrazenia pre lepšiu čitateľnosť.

Príkaz: [priložený obrázok] Implementuj to ako novú aplikáciu pomocou webgl a vite s použitím reálnych údajov z misie Artemis II. Uisti sa, že aplikáciu dôkladne otestuješ, kým nebude plne funkčná a nebude vyzerať ako aplikácia na obrázku. Venuj zvýšenú pozornosť vykresleniu planét a letovým dráham. Chcem byť schopný interagovať s 3D vykresľovaním. Uisti sa, že má realistickú orbitálnu mechaniku.

Okrem benchmarkov prví testeri uviedli, že GPT‑5.5 vykazuje lepšiu schopnosť pochopiť fungovanie systému: prečo niečo zlyháva, kam treba opravu nasadiť a čo ďalšie v kódovej základni by to ovplyvnilo.

alt

„Prvý kódovací model, aký som použil, ktorý má skutočne jasné koncepčné uvažovanie.“

Dan Shipper, zakladateľ a výkonný riaditeľ spoločnosti Every, opísal GPT‑5.5 ako „prvý model na programovanie, ktorý som používal a ktorý má skutočne výraznú konceptuálnu jasnosť“.

Po spustení aplikácie strávil niekoľko dní ladením problému po spustení, než prizval jedného zo svojich najlepších inžinierov, aby prepísal časť systému. Na otestovanie GPT‑5.5 v podstate „vrátil čas späť“: dokázal sa model pozrieť na poškodený stav a vytvoriť rovnaký typ prepracovania, pre ktorý sa inžinier napokon rozhodol? GPT‑5.4 to nedokázal. GPT‑5.5 to dokázal.

alt

„Úprimne mám pocit, že pracujem s vyššou inteligenciou, a takmer z toho mám aj pocit rešpektu.“

Pietro Schirano, CEO MagicPathu, zaznamenal podobný výrazný posun, keď GPT‑5.5 zlúčil vetvu so stovkami zmien vo frontende a refaktoringu do hlavnej vetvy, ktorá sa medzitým tiež výrazne zmenila, pričom túto úlohu vyriešil naraz približne za 20 minút.

Skúsení inžinieri, ktorí testovali model, uviedli, že GPT‑5.5 bol v porovnaní s GPT‑5.4 a Claude Opus 4.7 citeľne lepší v uvažovaní a autonómii, dokázal vopred odhaliť problémy a predvídať potreby testovania a kontroly aj bez explicitných pokynov. V jednom prípade ho inžinier požiadal, aby prepracoval architektúru systému komentárov v kolaboratívnom markdown editore, a po návrate našiel 12-dielny balík zmien, ktorý bol takmer hotový. Ďalší uviedli, že potrebovali prekvapivo málo opráv implementácie a cítili väčšiu dôveru v plány GPT‑5.5 v porovnaní s GPT‑5.4.

Jeden inžinier zo spoločnosti NVIDIA, ktorý mal skorý prístup k modelu, zašiel až tak ďaleko, že povedal: „Strata prístupu ku GPT‑5.5 je, akoby mi amputovali končatinu.“

„GPT-5.5 je výrazne inteligentnejší a vytrvalejší než GPT-5.4, so silnejším výkonom pri programovaní a spoľahlivejším používaním nástrojov. Drží sa zadania výrazne dlhšie bez predčasného zastavenia, čo je najdôležitejšie pri zložitej, dlhodobej práci, ktorú naši používatelia delegujú na Cursor.“
— Michael Truell, spoluzakladateľ a generálny riaditeľ spoločnosti Cursor

Práca so znalosťami

Tie isté silné stránky, vďaka ktorým GPT‑5.5 vyniká pri programovaní, z neho robia výkonný nástroj na každodennú prácu na počítači. Keďže model lepšie rozumie zámeru, dokáže prirodzenejšie prechádzať celým cyklom znalostnej práce: vyhľadávať informácie, chápať, na čom záleží, používať nástroje, kontrolovať výstup a premieňať surový materiál na niečo užitočné.

V Codexe je GPT‑5.5 lepší ako GPT‑5.4 pri generovaní dokumentov, tabuliek a prezentácií. Alfa testeri uviedli, že prekonáva predchádzajúce modely pri úlohách, ako sú operačný výskum, tabuľkové modelovanie a premieňanie neprehľadných obchodných vstupov na plány. V kombinácii so schopnosťami Codexu pracovať s počítačom nás GPT‑5.5 posúva bližšie k pocitu, že model dokáže počítač skutočne používať spolu s vami: vidí, čo je na obrazovke, kliká, píše, orientuje sa v rozhraniach a presne sa pohybuje medzi nástrojmi.

Tímy v OpenAI už využívajú tieto silné stránky v reálnych pracovných postupoch. Dnes viac ako 85 % spoločnosti používa Codex každý týždeň v rôznych oblastiach, vrátane softvérového inžinierstva, financií, komunikácie, marketingu, dátovej vedy a produktového manažmentu. V oddelení komunikácie tím použil GPT‑5.5 v Codexe na analýzu údajov o žiadostiach o vystúpenia za šesť mesiacov, vytvorenie hodnotiaceho a rizikového rámca a overenie automatizovaného Slack agenta, aby sa požiadavky s nízkym rizikom mohli spracovať automaticky, zatiaľ čo požiadavky s vyšším rizikom sa naďalej smerovali na ľudské posúdenie. Vo finančnom oddelení tím použil Codex na kontrolu 24 771 daňových formulárov K-1 s celkovým rozsahom 71 637 strán pomocou pracovného postupu, ktorý vylučoval osobné údaje a pomohol tímu urýchliť túto úlohu o dva týždne v porovnaní s predchádzajúcim rokom. V tíme pre uvedenie na trh zamestnanec zautomatizoval generovanie týždenných obchodných správ, čím ušetril 5 až 10 hodín týždenne.

V ChatGPT prináša GPT‑5.5 Thinking rýchlejšiu pomoc pri náročnejších problémoch, s inteligentnejšími a stručnejšími odpoveďami, ktoré vám pomôžu efektívnejšie zvládať komplexnú prácu. Vyniká v profesionálnej práci, ako je programovanie, výskum, syntéza a analýza informácií a úlohy náročné na prácu s dokumentmi, najmä pri používaní pluginov.

V GPT‑5.5 Pro prví testeri zaznamenávajú výrazný posun vpred v náročnosti aj kvalite úloh, ktoré dokáže ChatGPT zvládnuť, spolu so zlepšeniami latencie, vďaka ktorým je oveľa praktickejší na náročné úlohy. V porovnaní s GPT‑5.4 Pro testeri zistili, že odpovede GPT‑5.5 Pro sú výrazne komplexnejšie, lepšie štruktúrované, presnejšie, relevantnejšie a užitočnejšie, s mimoriadne silnými výsledkami v oblasti biznisu, práva, vzdelávania a dátovej vedy.

GPT‑5.5 dosahuje špičkový výkon vo viacerých benchmarkoch, ktoré odrážajú tento typ práce. V benchmarku GDPval, ktorý testuje schopnosti agentov vykonávať dobre špecifikovanú znalostnú prácu naprieč 44 povolaniami, GPT‑5.5 dosahuje skóre 84,9 %. V OSWorld-Verified, ktorý meria, či model dokáže samostatne pracovať v reálnych počítačových prostrediach, dosahuje 78,7 %. A v Tau2-bench Telecom, ktorý testuje komplexné pracovné postupy zákazníckeho servisu, dosahuje 98,0 % aj bez ladenia príkazov. GPT‑5.5 si vedie veľmi dobre aj v ďalších benchmarkoch znalostnej práce: 60,0 % na FinanceAgent, 88,5 % na interných úlohách modelovania v investičnom bankovníctve a 54,1 % na OfficeQA Pro.

Tau2-bench Telecom sa spustil bez ladenia príkazu (a s GPT‑4.1 ako používateľským modelom). GPT‑5.5 lepšie chápe zámer úlohy a je efektívnejší z hľadiska tokenov než jeho predchodcovia.

„GPT-5.5 poskytuje trvalý výkon potrebný na prácu náročnú na vykonávanie. Model, vytvorený a fungujúci na systémoch NVIDIA GB200 NVL72, umožňuje našim tímom dodávať komplexné funkcie na základe príkazov v prirodzenom jazyku, skrátiť čas ladenia z dní na hodiny a premeniť týždne experimentovania na pokrok dosiahnutý cez noc v zložitých kódových základniach. Je to viac než len rýchlejšie kódovanie – je to nový spôsob práce, ktorý pomáha ľuďom fungovať zásadne odlišným tempom.“
— Justin Boitano, viceprezident pre podnikovú umelú inteligenciu v spoločnosti NVIDIA

Vedecký výskum

GPT‑5.5 tiež vykazuje zlepšenia vo vedeckých a technických výskumných pracovných postupoch, ktoré si vyžadujú viac než len zodpovedanie náročnej otázky. Výskumníci potrebujú skúmať nápad, zhromažďovať dôkazy, testovať predpoklady, interpretovať výsledky a rozhodnúť sa, čo skúsiť ďalej. GPT‑5.5 je lepší než ostatné modely v udržiavaní kontinuity v tomto cykle.

Je pozoruhodné, že GPT‑5.5 vykazuje jasné zlepšenie oproti GPT‑5.4 v GeneBench(otvorí sa v novom okne), novom hodnotení zameranom na viacstupňovú vedeckú analýzu údajov v genetike a kvantitatívnej biológii. Tieto problémy vyžadujú, aby modely uvažovali o potenciálne nejednoznačných alebo chybných údajoch s minimálnym usmernením pri dohľade, riešili realistické prekážky, ako sú skryté mätúce premenné alebo zlyhania kontroly kvality, a správne implementovali a interpretovali moderné štatistické metódy. Výkonnosť modelu je pozoruhodná vzhľadom na to, že tunajšie úlohy často zodpovedajú viacdňovým projektom pre vedeckých odborníkov.

Podobne na BixBench(otvorí sa v novom okne), benchmarku navrhnutom na základe reálnej bioinformatiky a analýzy dát, GPT‑5.5 dosiahol vedúci výkon medzi modelmi so zverejnenými výsledkami. Vedecké schopnosti modelu sú teraz dostatočne silné na to, aby ako skutočný spoluvedec zmysluplne urýchľoval pokrok na prelomových hraniciach biomedicínskeho výskumu.

V ďalšom príklade interná verzia GPT‑5.5 s vlastným testovacím rámcom pomohla objaviť nový dôkaz(otvorí sa v novom okne) o Ramseyho číslach, ktoré patria medzi ústredné objekty kombinatoriky. Kombinatorika skúma, ako do seba diskrétne objekty zapadajú: grafy, siete, množiny a vzory. Ramseyho čísla sa zhruba pýtajú, aká veľká musí byť sieť, aby sa v nej zaručene objavil určitý druh usporiadania. Výsledky v tejto oblasti sú zriedkavé a často technicky náročné. Tu GPT‑5.5 našiel dôkaz dlhodobo známeho asymptotického tvrdenia o mimodiagonálnych Ramseyho číslach, ktorý bol neskôr overený v Lean. Výsledok je konkrétnym príkladom toho, že GPT‑5.5 prispieva nielen kódom alebo vysvetlením, ale aj prekvapivým a užitočným matematickým argumentom v kľúčovej oblasti výskumu.

Prví testeri používali GPT‑5.5 Pro v ChatGPT nie ani tak ako stroj na jednopríkladové odpovede, ale skôr ako výskumného partnera: pri kritickom posudzovaní rukopisov vo viacerých kolách, záťažovom testovaní technických argumentov, navrhovaní analýz a práci s kódom, poznámkami a kontextom z PDF súborov. Spoločným menovateľom je, že GPT‑5.5 lepšie pomáha výskumníkom prejsť od otázky cez experiment až k výstupu.

Derya Unutmaz, profesor imunológie a výskumník v Jacksonovom laboratóriu pre genomickú medicínu, použil GPT‑5.5 Pro na analýzu datasetu expresie génov so 62 vzorkami a takmer 28 000 génmi. Vytvoril podrobnú výskumnú správu, ktorá nielen zhrnula zistenia, ale aj odhalila kľúčové otázky a poznatky. Podľa jeho slov by táto práca jeho tímu trvala celé mesiace.

Bartosz Naskręcki, odborný asistent matematiky na univerzite Adama Mickiewicza v Poznani, Poľsko, použil GPT‑5.5 v Codexe na vytvorenie aplikácie pre algebraickú geometriu z jediného príkazu za 11 minút. Táto aplikácia vizualizuje prienik kvadratických plôch a prevádza výslednú krivku na Weierstrassov model.

Neskôr rozšíril aplikáciu o stabilnejšiu vizualizáciu singularít a presné koeficienty, ktoré sa dajú opätovne použiť v ďalšej práci. Pre neho je väčšou zmenou to, že Codex teraz dokáže pomáhať pri implementácii prispôsobených pracovných postupov pre matematickú vizualizáciu a počítačovú algebru, ktoré si predtým vyžadovali špecializované nástroje. Tieto príklady ukazujú, ako GPT‑5.5 premieňa odborné zámery na funkčné výskumné nástroje a analýzy.

""

Zdroj: Bartosz Naskręcki(otvorí sa v novom okne)

Príkaz: # Prienik plôch v algebraickej geometrii

Vytvor aplikáciu, ktorá vykreslí dve kvadratické plochy a červenou farbou vyznačí ich prienikovú krivku. Na prevod na Weierstrassovu krivku použi výpočtovú verziu Riemannovej–Rochovej vety.

## Hlavné okno

Dve zafarbené plochy s mierne priehľadným tieňovaním a vysokokvalitným vykreslením sa pretínajú pozdĺž červenej algebraickej krivky

Otáčanie myšou v oboch smeroch, plnohodnotné gesto priblíženia roztiahnutím prstov, haptické stlačenie na zobrazenie malého menu s posuvníkmi na zmenu koeficientov každého povrchu. Detekcia na základe úrovne Z-bufferu.

## Pravé bočné okno

KrátkaWeierstrassova rovnica (nad Q alebo kvadratickým rozšírením poľa) vypočítavaná priebežne pomocou efektívnych vzorcov Riemannovej–Rochovej vety

## Ambientný režim, v ktorom sú všetky ovládacie prvky skryté a používateľ môže obdivovať krásu tvarov

## Špecifikácie

Aplikácia beží v prehliadači, ide o ľahkú implementáciu s využitím najnovších full-stack knižníc, prenosnú a ľahko nasaditeľnú

## Dokumenty

Repozitár Git, denník, plán (súbory Markdown)

„Je neuveriteľne vzrušujúce použiť v našich službách nový model GPT-5.5 od OpenAI, nechať ho analyzovať rozsiahle biochemické súbory údajov na predpovedanie výsledkov liečby liekov u ľudí a potom vidieť, ako prináša významné zvýšenie presnosti v našich najnáročnejších hodnoteniach objavovania liekov. Ak bude OpenAI pokračovať v takomto tempe, základy objavovania liekov sa do konca roka zmenia.“
— Brandon White, spoluzakladateľ a generálny riaditeľ spoločnosti Axiom Bio

Efektivita inferencie novej generácie

Poskytovanie GPT‑5.5 s latenciou GPT‑5.4 si vyžadovalo prehodnotenie inferencie ako integrovaného systému, nie ako súboru izolovaných optimalizácií. GPT‑5.5 bol spoločne navrhnutý pre systémy NVIDIA GB200 a GB300 NVL72, s nimi bol natrénovaný a fungoval na nich. Codex a GPT‑5.5 zohrali kľúčovú úlohu pri dosahovaní našich výkonnostných cieľov. Codex pomohol tímu napredovať rýchlejšie od nápadu k implementácii, ktorú možno porovnať pomocou benchmarkov, navrhoval prístupy, prepájal experimenty a pomáhal identifikovať, do ktorých optimalizácií sa oplatilo investovať viac. GPT‑5.5 pomohol nájsť a zaviesť kľúčové zlepšenia v samotnej vrstve. Jednoducho povedané, model pomohol zlepšiť infraštruktúru, ktorá ho obsluhuje.

Jedným z takýchto zlepšení bolo vyvažovanie záťaže a heuristika rozdeľovania. Pred GPT‑5.5 sme na akcelerátore rozdeľovali požiadavky na pevný počet blokov, aby sme rovnomerne rozložili prácu medzi výpočtové jadrá a zabezpečili, že veľké aj malé požiadavky môžu bežať na tom istom GPU. Avšak vopred určený počet statických blokov nie je optimálny pre všetky druhy prevádzky. Aby bolo možné lepšie využívať GPU, Codex analyzoval niekoľkotýždňové vzorce produkčnej prevádzky a napísal vlastné heuristické algoritmy na optimálne rozdelenie a vyváženie práce. Toto úsilie malo neprimerane veľký vplyv a zvýšilo rýchlosť generovania tokenov o viac ako 20 %.

Zvyšovanie kybernetickej bezpečnosti pre bezpečnosť všetkých

Príprava sveta na modely, ktoré sú skvelé v nachádzaní a opravovaní bezpečnostných zraniteľností, je tímová práca a bude si vyžadovať, aby celý ekosystém intenzívne pracoval na budovaní odolnosti prostredníctvom demokratizovaného prístupu k modelom a iteratívneho nasadenia pre novú éru kybernetickej obrany.

Prelomové modely sú v oblasti kybernetickej bezpečnosti čoraz schopnejšie. Tieto možnosti sa široko rozšíria a veríme, že najlepším ďalším postupom je zabezpečiť, aby ich bolo možné využiť na urýchlenie kybernetickej obrany a posilnenie ekosystému.

GPT‑5.5 predstavuje postupný, ale dôležitý krok smerom k umelej inteligencii, ktorá dokáže riešiť niektoré z najnáročnejších svetových výziev, ako je kybernetická bezpečnosť. S GPT‑5.2 sme v decembri proaktívne nasadili potrebné kybernetické ochranné opatrenia, aby sme obmedzili potenciálne kybernetické zneužívanie našich modelov. Teraz s GPT‑5.5 nasadzujeme prísnejšie klasifikátory potenciálneho kybernetického rizika. Niektorým používateľom to môže byť spočiatku nepríjemné, keďže ich budeme postupne dolaďovať.

Kybernetickú bezpečnosť už roky zaraďujeme ako kategóriu do nášho Rámca pripravenosti(otvorí sa v novom okne). Popri tom, ako sa naše modely postupne zlepšujú, iteratívne vyvíjame a ladíme zmierňujúce opatrenia, aby sme mohli zodpovedne vydávať modely so zmysluplnými schopnosťami v oblasti kybernetickej bezpečnosti.

  • Nasadzujeme špičkové ochranné opatrenia pre túto úroveň kybernetických schopností. Prvýkrát sme zaviedli kybernetické špecifické ochranné opatrenia s GPT‑5.2(otvorí sa v novom okne) minulý rok, ktoré sme v nasledujúcich nasadeniach naďalej testovali, zdokonaľovali a ďalej na nich stavali. Pre GPT‑5.5 sme navrhli prísnejšie kontroly pre rizikovejšie aktivity, citlivé kybernetické žiadosti a pridali ochranné opatrenia proti opakovanému zneužívaniu. Široký prístup je umožnený vďaka našim investíciám do bezpečnosti modelov, overeného používania a monitorovania neprípustného používania. Už celé mesiace spolupracujeme s externými odborníkmi na vývoji, testovaní a priebežnom zlepšovaní odolnosti týchto ochranných opatrení. S GPT‑5.5 zabezpečujeme, aby vývojári mohli jednoducho zabezpečiť svoj kód, a zároveň zavádzame prísnejšie kontroly pre kybernetické pracovné postupy, pri ktorých je najväčšia pravdepodobnosť zneužitia škodlivými aktérmi.
  • Rozširujeme prístup, aby sme urýchlili kybernetickú obranu na každej úrovni. Naše modely s voľnejšími obmedzeniami sprístupňujeme cez Dôveryhodný prístup v oblasti kybernetickej bezpečnost (Trusted Access for Cyber – TAC), počnúc Codexom, ktorý zahŕňa rozšírený prístup k pokročilým schopnostiam GPT‑5.5 s menším počtom obmedzení pre overených používateľov, ktorí spĺňajú určité signály dôvery(otvorí sa v novom okne). Organizácie zodpovedné za obranu kritickej infraštruktúry môžu požiadať o prístup k modelom, ako je GPT‑5.4‑Cyber, pričom musia spĺňať prísne bezpečnostné požiadavky na ich použitie na zabezpečenie interných systémov. To dáva širokému okruhu overených obrancov výkonnejšie nástroje na legitímnu bezpečnostnú prácu s menšími zbytočnými prekážkami, aby sme zabezpečili demokratizáciu prístupu k dôležitým obranným schopnostiam. Požiadaj o dôveryhodný prístup na chatgpt.com/cyber(otvorí sa v novom okne), aby si znížil počet zbytočných odmietnutí pri používaní GPT‑5.5 na overenú obrannú prácu.
  • Spolupracujeme s vládnymi partnermi, aby sme pomohli chrániť kritickú infraštruktúru pre verejnosť. Spoločne skúmame, ako môže pokročilá umelá inteligencia podporovať obrannú prácu dôveryhodných predstaviteľov zodpovedných za systémy, na ktoré sa ľudia spoliehajú – od digitálnych systémov, ktoré chránia dôležité údaje daňovníkov, až po elektrickú sieť a zásobovanie vodou v miestnych komunitách.

V našom Rámci pripravenosti(otvorí sa v novom okne) považujeme biologické/chemické a kybernetické spôsobilosti GPT‑5.5 za vysoké spôsobilosti. Hoci GPT‑5.5 nedosiahol kritickú úroveň kybernetických schopností, naše hodnotenia a testovanie ukázali, že jeho schopnosti v oblasti kybernetickej bezpečnosti predstavujú posun vpred v porovnaní s GPT‑5.4.

Okrem toho GPT‑5.5 pred uvedením prešiel naším kompletným procesom bezpečnosti a riadenia vrátane hodnotení pripravenosti, testovania špecifického pre jednotlivé domény, nových cielených hodnotení pre pokročilé schopnosti v oblasti biológie a kyberbezpečnosti a dôkladného testovania s externými odborníkmi. Viac podrobností je uvedených v systémovej karte(otvorí sa v novom okne) GPT‑5.5.

Táto práca odráža náš širší prístup k odolnosti AI, ktorý považujeme za nevyhnutný s rastúcimi schopnosťami modelov. Chceme, aby bola výkonná umelá inteligencia dostupná ľuďom, ktorí ju používajú na ochranu systémov, inštitúcií a verejnosti. Schodnou cestou je dôveryhodný prístup, spoľahlivé ochranné opatrenia, ktoré sa zvyšujú úmerne schopnostiam, a operačná kapacita odhaľovať závažné zneužitie a reagovať naň.

Dostupnosť a ceny

Dnes sa GPT‑5.5 začína zavádzať pre používateľov Plus, Pro, Business a Enterprise v ChatGPT a Codex a GPT‑5.5 Pro sa začína zavádzať pre používateľov Pro, Business a Enterprise v ChatGPT. GPT‑5.5 a GPT‑5.5 Pro sprístupníme v API už čoskoro.

V ChatGPT je GPT‑5.5 Thinking k dispozícii používateľom Plus, Pro, Business a Enterprise. GPT‑5.5 Pro, navrhnutý pre ešte náročnejšie otázky a prácu s vyššou presnosťou, je k dispozícii pre používateľov Pro, Business a Enterprise.

V Codex je GPT‑5.5 k dispozícii v rámci plánov Plus, Pro, Business, Enterprise, Edu a Go s kontextovým oknom s veľkosťou 400K. GPT‑5.5 je k dispozícii aj v režime Fast a generuje token 1,5x rýchlejšie za 2,5x vyššiu cenu.

Vývojárom API bude gpt-5.5 čoskoro k dispozícii v rozhraniach Responses API a API na dokončovanie četu za cenu 5 USD za 1 milión vstupných tokenov a 30 USD za 1 milión výstupných tokenov, s kontextovým oknom 1 milión tokenov. Ceny pre Batch a Flex sú k dispozícii za polovicu štandardnej sadzby rozhrania API, zatiaľ čo Prioritné spracovanie je k dispozícii za 2,5-násobok štandardnej sadzby. Uvedieme tiež gpt-5.5-pro v rozhraní API pre ešte vyššiu presnosť, pričom cena bude 30 USD za 1 milión vstupných tokenov a 180 USD za 1 milión výstupných tokenov. Pozri si stránku s cenami s podrobnými informáciami.

Zatiaľ čo je GPT‑5.5 drahší ako GPT‑5.4, je inteligentnejší a oveľa efektívnejší v práci s tokenmi. V Codex sme starostlivo vyladili používateľské prostredie tak, aby GPT‑5.5 prinášal lepšie výsledky s menším počtom tokenov než GPT‑5.4 pre väčšinu používateľov, pričom naďalej ponúkame štedré limity používania na všetkých úrovniach predplatného.

Vyhodnotenia

Programovanie

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (Public) *

58,6 %

57,7 %

-

-

64,3 %

54,2 %

Terminal-Bench 2.0

82,7 %

75,1 %

-

-

69,4 %

68,5 %

Expert-SWE (Interné)

73,1 %

68,5 %

-

-

-

-

*Laboratóriá zaznamenali dôkazy memorovania(otvorí sa v novom okne) v tomto hodnotení

Professional

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (víťazstvá alebo remízy)

84,9 %

83,0 %

82,3 %

82,0 %

80,3 %

67,3 %

FinanceAgent v1.1

60,0 %

56,0 %

-

61,5 %

64,4%

59,7 %

Úlohy modelovania investičného bankovníctva (Interné)

88,5 %

87,3 %

88,6 %

83,6 %

-

-

OfficeQA Pro

54,1 %

53,2 %

-

-

43,6 %

18,1 %

Používanie počítača a videnie

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld-Verified

78,7 %

75,0 %

-

-

78,0 %

-

MMMU Pro (bez nástrojov)

81,2 %

81,2 %

-

-

-

80,5 %

MMMU Pro (s nástrojmi)

83,2 %

82,1 %

-

-

-

-

Používanie nástrojov

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84,4 %

82,7 %

90,1 %

89,3 %

79,3 %

85,9 %

MCP Atlas**

75,3 %

70,6 %

-

-

79,1 %

78,2 %

Toolathlon

55,6 %

54,6 %

-

-

-

48,8 %

Tau2-bench Telecom***
(pôvodné príkazy)

98,0 %

92,8 %

-

-

-

-

** MCP Atlas: výsledky od Scale AI po najnovšej aktualizácii z apríla 2026. 
*** Tau2-bench Telecom: výsledky pre 5.5 a 5.4 s pôvodnými príkazmi, t. j. bez úpravy príkazov. Toto nezahŕňa výsledky z iných laboratórií, ktoré boli vyhodnotené s úpravami príkazu.

Akademický

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25,0 %

19,0 %

33,2 %

25,6 %

-

-

FrontierMath úroveň 1–3

51,7 %

47,6 %

52,4 %

50,0 %

43,8 %

36,9 %

FrontierMath úroveň 4

35,4 %

27,1 %

39,6 %

38,0 %

22,9 %

16,7 %

BixBench

80,5 %

74,0 %

-

-

-

-

GPQA Diamond

93,6 %

92,8 %

-

94,4 %

94,2 %

94,3 %

Posledná skúška ľudstva (bez nástrojov)

41,4 %

39,8 %

43,1 %

42,7 %

46,9 %

44,4 %

Posledná skúška ľudstva (s nástrojmi)

52,2 %

52,1 %

57,2 %

58,7 %

54,7 %

51,4 %

Kybernetická bezpečnosť

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Úlohy výziev Capture-the-Flags (Interné)****

88,1 %

83,7 %

-

-

-

-

CyberGym

81,8 %

79,0 %

-

-

73,1 %

-

**** Rozšírenie najťažších CTF používaných v systémových kartách o ďalšie náročné výzvy.

Dlhý kontext

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256k f1

73,7 %

62,5 %

-

-

76,9 %

-

Graphwalks BFS 1 mil. f1

45,4 %

9,4 %

-

-

41,2 % (Opus 4.6)

-

Graphwalks parents 256k f1

90,1 %

82,8 %

-

-

93,6 %

-

Graphwalks parents 1mil f1

58,5 %

44,4 %

-

-

72,0 % (Opus 4.6)

-

OpenAI MRCR v2 8 ihiel 4 tis.–8 tis.

98,1 %

97,3 %

-

-

-

-

OpenAI MRCR v2 8 ihiel 8 tis.–16 tis.

93,0 %

91,4 %

-

-

-

-

OpenAI MRCR v2 8 ihiel 16 tis.–32 tis.

96,5 %

97,2 %

-

-

-

-

OpenAI MRCR v2 8 ihiel 32 tis.–64 tis.

90,0 %

90,5%

-

-

-

-

OpenAI MRCR v2 8 ihiel 64 tis.–128 tis.

83,1 %

86,0 %

-

-

-

-

OpenAI MRCR v2 8 ihiel 128 tis.–256 tis.

87,5 %

79,3 %

-

-

59,2 %

-

OpenAI MRCR v2 8 ihiel 256 tis.–512 tis.

81,5 %

57,5 %

-

-

-

-

OpenAI MRCR v2 8 ihiel 512 tis.–1 mil.

74,0 %

36,6 %

-

-

32,2 %

-

Abstraktné myslenie

Hodnotenie

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (Overené)

95,0 %

93,7 %

-

94,5 %

93,5 %

98,0 %

ARC-AGI-2 (Overené)

85,0 %

73.3%

-

83,3%

75,8 %

77,1 %

Evaly GPT boli spustené s úsilím na uvažovanie nastaveným na xhigh a boli vykonané vo výskumnom prostredí, čo môže v niektorých prípadoch poskytnúť mierne odlišný výstup od produkčného ChatGPT.

Autor

OpenAI