Přeskoč na hlavní obsah
OpenAI

23. dubna 2026

ProduktVydání

Představujeme GPT‑5.5

Nová třída inteligence pro skutečnou práci

Načítání…

Aktualizace k 24. dubnu 2026: Modely GPT‑5.5 a GPT‑5.5 Pro jsou v rozhraní API nyní k dispozici. Systémová karta byla také aktualizována tak, aby popisovala další použitá ochranná opatření.


Vydáváme GPT‑5.5, náš dosud nejchytřejší a nejintuitivnější model, a další krok k novému způsobu práce na počítači.

GPT‑5.5 rychleji pochopí, co se snažíš udělat, a zvládne více práce sám. Vyniká v psaní a ladění kódu, online vyhledávání, analýze dat, vytváření dokumentů a tabulek, ovládání softwaru a přecházení mezi nástroji, dokud není úkol dokončen. Namísto pečlivého řízení každého kroku můžeš GPT‑5.5 zadat neuspořádaný vícedílný úkol a důvěřovat mu, že jej naplánuje, použije nástroje, zkontroluje svou práci, zorientuje se v nejednoznačnosti a bude pokračovat.

Přínosy jsou obzvlášť výrazné v agentním programování, práci s počítačem, znalostní práci a raném vědeckém výzkumu, tedy v oblastech, kde pokrok závisí na uvažování v rámci kontextu a na provádění akcí v čase. GPT‑5.5 přináší tento posun v inteligenci, aniž by to bylo na úkor rychlosti: větší a schopnější modely jsou často při obsluze pomalejší, ale GPT‑5.5 v reálném provozu odpovídá latencí na token modelu GPT‑5.4, zatímco podává výkon na mnohem vyšší úrovni inteligence. K splnění stejných úloh v Codexu také používá výrazně méně tokenů, díky čemuž je efektivnější i schopnější.

Vydáváme GPT‑5.5 s naší dosud nejsilnější sadou ochranných opatření, která byla navržena tak, aby omezila zneužití a zároveň zachovala přístup k užitečné práci. Tento model jsme vyhodnotili v rámci celé naší sady rámců bezpečnosti a připravenosti, spolupracovali jsme s interními i externími členy Redteamu, přidali jsme cílené testování pokročilých funkcí v oblasti kybernetické bezpečnosti a biologie a před vydáním jsme shromáždili zpětnou vazbu k reálným případům použití od téměř 200 důvěryhodných partnerů s předběžným přístupem.

Dnes se GPT‑5.5 zavádí pro uživatele Plus, Pro, Business a Enterprise v ChatGPT a Codexu a GPT‑5.5 Pro se zavádí pro uživatele Pro, Business a Enterprise v ChatGPT. Nasazení API vyžaduje odlišná ochranná opatření a úzce spolupracujeme s partnery a zákazníky na požadavcích na bezpečnost a zabezpečení pro jeho poskytování ve velkém měřítku. GPT‑5.5 a GPT‑5.5 Pro již velmi brzy zpřístupníme v API.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82,7 %

75.1%

-

-

69,4 %

68,5 %

Expert-SWE (Interní)

73,1 %

68,5 %

-

-

-

-

GDPval (výhry nebo remízy)

84,9 %

83,0 %

82,3 %

82,0 %

80,3 %

67,3 %

OSWorld-Verified

78,7 %

75,0 %

-

-

78,0 %

-

Toolathlon

55,6 %

54,6 %

-

-

-

48,8 %

BrowseComp

84,4 %

82,7 %

90,1 %

89,3 %

79,3 %

85,9 %

FrontierMath úroveň 1–3

51,7 %

47,6 %

52,4 %

50,0 %

43,8 %

36,9 %

FrontierMath úroveň 4

35,4 %

27,1 %

39,6 %

38,0 %

22,9 %

16,7 %

CyberGym

81,8 %

79,0 %

-

-

73,1 %

-

Schopnosti modelů

OpenAI buduje globální infrastrukturu pro agentickou AI a umožňuje tak lidem i firmám po celém světě odvádět práci s pomocí AI. V posledním roce jsme byli svědky toho, jak AI výrazně urychlila softwarové inženýrství. S GPT‑5.5 v Codexu a ChatGPT se tatáž proměna začíná rozšiřovat do vědeckého výzkumu i širší práce, kterou lidé na počítačích vykonávají.

Ve všech těchto oblastech není GPT‑5.5 jen inteligentnější, ale také efektivnější v tom, jak řeší problémy, a často dosahuje kvalitnějších výstupů s menším počtem tokenů a opakovaných pokusů. V žebříčku Coding Index od Artificial Analysis poskytuje GPT‑5.5 špičkovou inteligenci za poloviční cenu oproti konkurenčním průkopnickým modelům pro programování.

Artificial Analysis Intelligence Index(otevře se v novém okně) je vážený průměr 10 hodnocení provedených externí stranou: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Agentní kódování

GPT‑5.5 je náš dosud nejsilnější model pro agentní kódování. V rámci Terminal-Bench 2.0, který testuje komplexní pracovní postupy v příkazovém řádku vyžadující plánování, iteraci a koordinaci nástrojů, dosahuje špičkové přesnosti 82.7 %. V SWE-Bench Pro, který hodnotí řešení skutečných problémů na GitHubu, dosahuje 58,6 % a v jediném průchodu vyřeší více úloh end-to-end než předchozí modely. V našem interním průkopnickém hodnocení Expert-SWE zaměřeném na dlouhodobé úlohy programování, u nichž je medián odhadované doby dokončení člověkem 20 hodin, GPT‑5.5 také překonává GPT‑5.4.

Ve všech třech hodnoceních GPT‑5.5 zlepšuje výsledky modelu GPT‑5.4. skóre při použití méně tokenů.

Silné stránky modelu při práci s kódem se obzvlášť jasně projevují v Codexu, kde dokáže zvládat vývojářskou práci od implementace a refaktorování po ladění, testování a validaci. První testování naznačuje, že GPT‑5.5 je lepší v chováních, na kterých závisí skutečná inženýrská práce, jako je udržování kontextu napříč rozsáhlými systémy, uvažování nejednoznačných selhání, ověřování předpokladů pomocí nástrojů a provádění změn v okolní kódové základně.

Vykreslená trajektorie používá vektorová data NASA/JPL Horizons pro Orion, Měsíc a Slunce, přičemž je pro lepší čitelnost použito škálování zobrazení.

Prompt: [přiložený obrázek] Implementuj to jako novou aplikaci pomocí WebGL a Vite s využitím reálných dat z mise Artemis II. Ujisti se, že aplikaci důkladně otestuješ, dokud nebude plně funkční a nebude vypadat jako aplikace na obrázku. Věnuj zvláštní pozornost vykreslení planet a letovým drahám. Chci mít možnost interagovat s 3D vizualizací. Zajisti, aby měla realistickou orbitální mechaniku.

Kromě srovnávacích testů první testeři uvedli, že GPT‑5.5 vykazuje lepší schopnost porozumět struktuře systému: proč něco selhává, kam je třeba opravu nasadit, a co dalšího v kódové základně by to ovlivnilo.

alt

„První kódovací model, který jsem použil, má skutečně jasné koncepční uvažování.“

Dan Shipper, zakladatel a generální ředitel společnosti Every, popsal GPT‑5.5 jako „první model pro programování, který jsem použil a který má skutečně jasné konceptuální uvažování.“

Po spuštění aplikace strávil několik dní laděním problému po spuštění, než si přizval jednoho ze svých nejlepších vývojářů, aby přepsal část systému. Aby otestoval GPT‑5.5, prakticky vrátil čas: mohl by model podívat na poškozený stav a přepsat kód tak, jak se to nakonec udělal vývojář? GPT‑5.4 to nedokázal. GPT‑5.5 ano.

alt

„Opravdu mám pocit, jako bych pracoval s vyšší inteligencí, a je tam téměř pocit respektu.“

Pietro Schirano, CEO společnosti MagicPath, zaznamenal podobný výrazný posun, když GPT‑5.5 sloučil větev se stovkami změn frontendu a refaktoringových změn do hlavní větve, která se také výrazně změnila, a tuto práci vyřešil na jednom příkladu za přibližně 20 minut.

Vedoucí inženýři, kteří model testovali, uvedli, že GPT‑5.5 byl znatelně silnější než GPT‑5.4 a Claude Opus 4.7 v oblasti uvažování a autonomie, dokázal předem odhalovat problémy a předvídat potřeby testování a kontroly bez explicitního zadání. V jednom případě vývojář požádal o přepracování architektury systému komentářů v kolaborativním editoru Markdownu a když se vrátil, čekala na něj téměř hotová sada 12 diffů. Další uvedli, že potřebovali překvapivě málo oprav implementace a měli větší důvěru v plány GPT‑5.5 než GPT‑5.4.

Jeden z vývojářů ze společnosti NVIDIA, který měl k modelu předběžný přístup, šel dokonce tak daleko, že řekl: „Ztráta přístupu k modelu GPT‑5.5 je, jako by mi amputovali ruku.“

„GPT-5.5 je znatelně chytřejší a vytrvalejší než GPT-5.4, s vyšším výkonem při programování a spolehlivějším používáním nástrojů. Věnuje se úkolu výrazně déle, aniž by předčasně skončil, což je nejdůležitější u komplexní, dlouhodobé práce, kterou naši uživatelé delegují na Cursor.“
– Michael Truell, spoluzakladatel a generální ředitel Cursor

Práce se znalostmi

Stejné přednosti, díky nimž se GPT‑5.5 skvěle hodí na programování, z něj také dělají výkonného pomocníka pro každodenní práci na počítači. Protože model lépe rozumí záměru, může přirozeněji procházet celým cyklem znalostní práce: vyhledáváním informací, pochopením toho, na čem záleží, používáním nástrojů, kontrolou výstupu a proměnou surového materiálu v něco užitečného.

V Codexu je GPT‑5.5 lepší než GPT‑5.4 při generování dokumentů, tabulek a prezentací. Alfa testeři uvedli, že překonává předchozí modely v úkolech, jako je operační výzkum, modelování tabulek a převod nepřehledných obchodních vstupů na plány. Ve spojení se schopnostmi používání počítače, které má Codex, nás GPT‑5.5 přibližuje pocitu, že model může počítač skutečně používat spolu s tebou: vidí, co je na obrazovce, kliká, píše, naviguje v rozhraních a přesně přechází mezi nástroji.

Týmy v OpenAI už využívají tyto silné stránky v reálných pracovních postupech. Dnes Codex každý týden používá víc než 85 % zaměstnanců napříč funkcemi, včetně softwarového inženýrství, financí, komunikace, marketingu, datové vědy a produktového managementu. V Comms tým použil GPT‑5.5 v Codexu k analýze dat o žádostech o vystoupení za posledních šest měsíců, k vytvoření rámce pro skórování a vyhodnocování rizik a k otestování automatizovaného agenta ve Slacku, aby se žádosti s nízkým rizikem vyřizovaly automaticky, zatímco žádosti s vyšším rizikem dál mířily k lidskému posouzení. Ve finančním oddělení tým použil Codex ke kontrole 24 771 daňových formulářů K-1 (formulář K-1) v celkovém rozsahu 71 637 stran. Pracovní postup vylučoval osobní údaje a pomohl týmu zrychlit práci o dva týdny oproti předchozímu roku. V týmu pro strategii uvedení na trh jeden zaměstnanec zautomatizoval vytváření týdenních obchodních reportů a ušetřil tak 5–10 hodin týdně.

V ChatGPT GPT‑5.5 Thinking přináší rychlejší pomoc při řešení složitějších problémů a chytřejší a stručnější odpovědi, které ti pomohou zvládat složitou práci efektivněji. Vyniká v profesionální práci, jako je programování, výzkum, syntéza a analýza informací a úkoly náročné na práci s dokumenty, zejména při používání pluginů.

V GPT‑5.5 Pro první testeři zaznamenávají výrazné zlepšení v náročnosti i kvalitě práce, kterou ChatGPT zvládá, spolu se zlepšením latence, díky čemuž je mnohem praktičtější pro náročné úkoly. Ve srovnání s GPT‑5.4 Pro testeři zjistili, že odpovědi GPT‑5.5 Pro jsou výrazně komplexnější, lépe strukturované, přesnější, relevantnější a užitečnější. Obzvlášť dobře si vedly v oblasti byznysu, práva, vzdělávání a datové vědy.

GPT‑5.5 dosahuje špičkového výkonu napříč několika benchmarky, které odrážejí tento druh práce. V rámci hodnocení GDPval⁠, které testuje schopnosti agentů nabídnout dobře specifikovanou práci se znalostmi napříč 44 povoláními, dosahuje model GPT‑5.5 skóre 84,9 %. V OSWorld-Verified, který měří, zda model dokáže samostatně pracovat ve skutečných počítačových prostředích, dosahuje 78,7 %. A na Tau2-bench Telecom, který testuje komplexní pracovní postupy zákaznického servisu, dosahuje 98,0 % i bez ladění promptů. GPT‑5.5 si vede velmi dobře také napříč dalšími benchmarky práce s vědomostmi: 60,0 % ve FinanceAgent, 88,5 % v interních úlohách modelování investičního bankovnictví a 54,1 % v OfficeQA Pro.

Tau2-bench Telecom byl spuštěn bez úpravy promptů (a s GPT‑4.1 jako uživatelským modelem). GPT‑5.5 lépe chápe záměr úkolu a je efektivnější z hlediska tokenů než jeho předchůdci.

„GPT-5.5 poskytuje trvalý výkon potřebný pro náročnou práci. Model, postavený a provozovaný na systémech NVIDIA GB200 NVL72, umožňuje našim týmům dodávat komplexní funkce z promptů v přirozeném jazyce, zkrátit dobu ladění z dnů na hodiny a proměnit týdny experimentování v okamžitý pokrok v komplexních kódových bázích. Nejde jen o rychlejší programování, je to nový způsob práce, který pomáhá lidem pracovat zásadně jiným tempem.“
– Justin Boitano, viceprezident pro podnikovou umělou inteligenci ve společnosti NVIDIA

Vědecký výzkum

GPT‑5.5 také vykazuje zlepšení ve vědeckých a technických výzkumných pracovních postupech, které vyžadují víc než jen zodpovězení obtížné otázky. Výzkumní pracovníci potřebují prozkoumat nějaký nápad, shromáždit důkazy, otestovat předpoklady, interpretovat výsledky a rozhodnout, co vyzkoušet dál. GPT‑5.5 je v této smyčce lepší než jiné modely.

Za zmínku stojí, že GPT‑5.5 vykazuje jasné zlepšení oproti GPT‑5.4 v rámci GeneBench(otevře se v novém okně), nového hodnocení zaměřeného na vícestupňovou vědeckou analýzu dat v genetice a kvantitativní biologii. Tyto problémy vyžadují, aby modely uvažovaly o potenciálně nejednoznačných nebo chybných datech s minimálním metodickým vedením, řešily realistické překážky, jako jsou skryté matoucí proměnné nebo selhání kontroly kvality, a správně implementovaly a interpretovaly moderní statistické metody. Výkonnost modelu je pozoruhodná vzhledem k tomu, že zdejší úkoly často odpovídají vícedenním projektům pro vědecké odborníky.

Podobně na BixBench,(otevře se v novém okně) což je benchmark navržený pro reálnou bioinformatiku a analýzu dat, dosáhl GPT‑5.5 špičkového výkonu mezi modely se zveřejněnými výsledky. Vědecké schopnosti modelu jsou nyní natolik silné, že mohou významně urychlit pokrok na hranicích biomedicínského výzkumu jako skutečný spolupracující vědec.

V dalším příkladu pomohla interní verze GPT‑5.5 s vlastním frameworkem objevit nový důkaz(otevře se v novém okně) o Ramseyových číslech, jednom z ústředních objektů kombinatoriky. Kombinatorika studuje, jak do sebe zapadají diskrétní objekty: grafy, sítě, množiny a vzory. Ramseyova čísla se zhruba zabývají tím, jak velká musí být síť, aby bylo zaručeno, že se objeví nějaký druh uspořádání. Výsledky v této oblasti jsou vzácné a často technicky obtížné. Zde GPT‑5.5 nalezl důkaz dlouho známého asymptotického tvrzení o mimodiagonálních Ramseyových číslech, později ověřeného v systému Lean. Výsledek je konkrétním příkladem toho, že GPT‑5.5 přispívá nejen kódem nebo vysvětlením, ale také překvapivým a užitečným matematickým argumentem v klíčové oblasti výzkumu.

První testeři používali GPT‑5.5 Pro v ChatGPT méně jako nástroj na jednom příkladu a více jako výzkumného partnera: kritizovali rukopisy v několika kolech, prováděli zátěžové testy technických argumentů, navrhovali analýzy a pracovali s kódem, poznámkami a kontextem z PDF. Společným jmenovatelem je, že GPT‑5.5 lépe pomáhá výzkumníkům přejít od otázky k experimentu a k výsledku.

Derya Unutmaz, profesorka imunologie a výzkumnice v Jackson Laboratory for Genomic Medicine, použila GPT‑5.5 Pro k analýze datové sady expresních profilů genů se 62 vzorky a téměř 28 000 geny, čímž vznikla podrobná výzkumná zpráva, která zjištění nejen shrnula, ale také odhalila klíčové otázky a poznatky, práci, která by podle jejích slov jejímu týmu zabrala měsíce.

Bartosz Naskręcki, odborný asistent matematiky na Univerzitě Adama Mickiewicze v Poznani v Polsku, pomocí GPT‑5.5 v Codexu vytvořil z jediného promptu za 11 minut aplikaci pro algebraickou geometrii, která vizualizuje průnik kvadratických ploch a převádí výslednou křivku na Weierstrassův model.

Později aplikaci rozšířil o stabilnější vizualizaci singularity a přesné koeficienty, které lze znovu použít v budoucí práci. Pro něj je větší posun v tom, že Codex nyní může pomáhat s implementací vlastních pracovních postupů pro matematickou vizualizaci a počítačovou algebru, které dříve vyžadovaly specializované nástroje. Celkově tyto příklady ukazují, jak GPT‑5.5 převádí záměry odborníků na funkční nástroje pro výzkum a analýzy.

""

Autorství: Bartosz Naskręcki(otevře se v novém okně)

Prompt: # Průnik ploch v algebraické geometrii

Vytvoř aplikaci, která vykreslí dvě kvadratické plochy a průnikovou křivku obarví červeně. Použij výpočetní větu Riemann-Rochovu k převodu na Weierstrassovu křivku.

## Hlavní okno

Dvě zabarvené plochy s mírně průhledným stínováním se ve vysoce kvalitním vykreslení protínají podél červeně zbarvené algebraické křivky

Otáčení myší v obou směrech, plnohodnotné gesto sevření/roztažení pro přiblížení, haptický stisk pro zobrazení malého menu s posuvníky pro úpravu koeficientů jednotlivých povrchů; detekce pomocí úrovně Z-bufferu

## Pravá strana okna

Krátká Weierstrassova rovnice (nad Q nebo kvadratickým rozšířením tělesa) počítaná za pochodu pomocí efektivních vzorců vycházejících z Riemannovy–Rochovy věty

## Ambientní režim, ve kterém jsou skryté všechny ovládací prvky a uživatel může obdivovat krásu tvarů

## Specifikace

Aplikace běží v prohlížeči, odlehčená implementace s nejnovějšími knihovnami pro kompletní stack, přenositelná a snadno nasaditelná

## Dokumentace

Repozitář Git, deník, plán (soubory Markdown)

„Je neuvěřitelně povzbudivé používat v našem testovacím prostředí nový model GPT-5.5 od OpenAI, nechat ho analyzovat obrovské biochemické datové sady za účelem předpovídání účinků léčiv u lidí a potom sledovat, jak přináší výrazné zlepšení přesnosti v našich nejnáročnějších hodnoceních zaměřených na objevování léčiv. Bude-li OpenAI pokračovat v takovém tempu, základy objevování léčiv se do konce roku změní.“
– Brandon White, spoluzakladatel a generální ředitel ve společnosti Axiom Bio

Efektivita inference nové generace

Poskytování GPT‑5.5 s latencí GPT‑5.4 vyžadovalo přehodnocení inference jako integrovaného systému, nikoli jako sady izolovaných optimalizací. GPT‑5.5 byl navržen pro systémy NVIDIA GB200 a GB300 NVL72, byl s nimi trénován a pracoval na nich. Codex a GPT‑5.5 sehrály klíčovou roli v dosažení našich výkonnostních cílů. Codex pomohl týmu rychleji přejít od nápadu k implementaci, kterou lze porovnávat pomocí benchmarků, navrhnout přístupy, propojit experimenty a určit, do kterých optimalizací se vyplatí více investovat. GPT‑5.5 pomohl najít a implementovat klíčová vylepšení v samotném stacku. Jednoduše řečeno, model pomohl zlepšit infrastrukturu, která jej obsluhuje.

Jedním z takových vylepšení bylo vyvažování zátěže a heuristika dělení. Před GPT‑5,5 jsme na akcelerátoru rozdělovali požadavky na pevný počet částí, abychom vyvážili zátěž mezi výpočetní jádra a zajistili, že na stejném GPU mohly běžet velké i malé požadavky. Nicméně předem stanovený počet statických částí není optimální pro všechny typy provozu. Aby bylo možné lépe využít GPU, Codex analyzoval vzorce produkčního provozu za několik týdnů a vytvořil vlastní heuristické algoritmy, které optimálně rozdělovaly a vyvažovaly práci. Toto úsilí mělo nadprůměrný dopad a zvýšilo rychlost generování tokenů o více než 20 %.

Pokrok v kybernetické bezpečnosti pro bezpečnost všech

Příprava světa na modely, které jsou velmi dobré ve vyhledávání a opravování bezpečnostních zranitelností, je týmová záležitost a bude vyžadovat, aby celý ekosystém usilovně pracoval na budování odolnosti, s demokratizovaným přístupem k modelům a iterativním zaváděním pro další éru kybernetické obrany.

Průkopnické modely jsou stále schopnější v oblasti kybernetické bezpečnosti. Tyto schopnosti budou široce dostupné a věříme, že nejlepší cestou vpřed je zajistit jejich využití k urychlení kybernetické obrany a posílení ekosystému.

GPT‑5.5 je postupný, ale důležitý krok směrem k umělé inteligenci, která dokáže řešit některé z nejnáročnějších světových výzev, jako je kybernetická bezpečnost. S GPT‑5.2 jsme v prosinci proaktivně zavedli nezbytná ochranná opatření v oblasti kybernetické bezpečnosti, abychom omezili potenciální kybernetické zneužití našich modelů; nyní s GPT‑5.5 zavádíme přísnější klasifikátory pro potenciální kybernetická rizika, které mohou některým uživatelům zpočátku připadat obtěžující, jak je budeme v průběhu času dolaďovat.

Kybernetickou bezpečnost jsme již řadu let identifikovali jako kategorii v našem Rámci připravenosti(otevře se v novém okně), protože se naše modely postupně zlepšovaly. Průběžně jsme vyvíjeli a kalibrovali opatření ke zmírnění rizik, abychom mohli odpovědně vydávat modely s významnými schopnostmi v oblasti kybernetické bezpečnosti.

  • Pro tuto úroveň kybernetických schopností zavádíme špičková ochranná opatření. Poprvé jsme loni zavedli ochranná opatření zaměřená na kybernetickou oblast s modelem GPT‑5.2(otevře se v novém okně) a v dalších nasazeních jsme je dál testovali, ladili a rozvíjeli. U GPT‑5.5 jsme navrhli přísnější kontroly u rizikovějších aktivit a citlivých kybernetických požadavků a přidali ochranu proti opakovanému zneužívání. Široký přístup umožňují naše investice do bezpečnosti modelů, ověřeného používání a monitorování nepovoleného zneužití. Už několik měsíců spolupracujeme s externími odborníky na vývoji, testování a průběžném vylepšování robustnosti těchto ochranných opatření. S GPT‑5.5 zajišťujeme, aby si vývojáři mohli snadno zabezpečit kód, a zároveň zavádíme přísnější kontroly u kybernetických postupů, které útočníci nejčastěji zneužívají k páchání škod.
  • Rozšiřujeme přístup, abychom urychlili kybernetickou obranu na všech úrovních. Naše kyberneticky benevolentní modely zpřístupňujeme prostřednictvím programu Trusted Access for Cyber, počínaje Codexem, který při spuštění zahrnuje rozšířený přístup k pokročilým schopnostem GPT‑5.5 v oblasti kybernetické bezpečnosti s menším počtem omezení pro ověřené uživatele splňující určité signály důvěry(otevře se v novém okně). Organizace, které jsou odpovědné za ochranu kritické infrastruktury, mohou požádat o přístup ke kyberneticky tolerantním modelům, jako je GPT‑5.4‑Cyber, pokud splní přísné bezpečnostní požadavky pro používání těchto modelů k zabezpečení svých interních systémů. To poskytuje široké škále ověřených obránců pokročilejší nástroje pro legitimní bezpečnostní práci s menší zbytečnou zátěží, aby se zajistil demokratický přístup k důležitým obranným schopnostem. Uživatelé mohou požádat o důvěryhodný přístup na chatgpt.com/cyber(otevře se v novém okně), aby se snížil počet zbytečných odmítnutí při používání GPT‑5.5 pro ověřenou obrannou práci.
  • Spolupracujeme s partnery ze státní správy, abychom pomohli chránit kritickou infrastrukturu pro veřejnost. Společně zkoumáme, jak může pokročilá umělá inteligence podporovat obrannou práci důvěryhodných představitelů odpovědných za systémy, na které se lidé spoléhají, od digitálních systémů, které chrání důležitá data daňových poplatníků, až po elektrickou síť a dodávky vody v místních komunitách.

GPT‑5.5 považujeme za model s vysokou úrovní biologických/chemických a kybernetických schopností podle našeho rámce připravenosti(otevře se v novém okně). Ačkoli GPT‑5.5 nedosáhl kritické úrovně schopností v oblasti kybernetické bezpečnosti, naše vyhodnocení a testování ukázaly, že jeho schopnosti v oblasti kybernetické bezpečnosti představují posun oproti GPT‑5.4.

Kromě toho GPT‑5.5 před vydáním prošel naším úplným procesem bezpečnosti a správy, včetně hodnocení připravenosti, testování specifického pro jednotlivé oblasti, nových cílených hodnocení pokročilých schopností v oblasti biologie a kybernetické bezpečnosti a důkladného testování s externími odborníky. Další informace uvádíme na systémové kartě GPT‑5.5(otevře se v novém okně).

Tato práce odráží náš širší přístup k odolnosti umělé inteligence, který považujeme za nezbytný, protože schopnosti modelů se dále rozvíjejí. Chceme, aby výkonná umělá inteligence byla dostupná těm, kteří ji používají k ochraně systémů, institucí a veřejnosti. Životaschopnou cestou je důvěryhodný přístup, robustní ochranná opatření, která se rozšiřují úměrně schopnostem, a operační kapacita odhalovat závažné zneužití a reagovat na něj.

Dostupnost a cenová politika

Dnes se GPT‑5.5 zavádí pro uživatele Plus, Pro, Business a Enterprise v ChatGPT a Codexu a GPT‑5.5 Pro se zavádí pro uživatele Pro, Business a Enterprise v ChatGPT. GPT‑5.5 a GPT‑5.5 Pro již velmi brzy zpřístupníme v API.

V ChatGPT je funkce GPT‑5.5 Thinking dostupná uživatelům Plus, Pro, Business a Enterprise. GPT‑5.5 Pro, navržený pro ještě složitější otázky a práci vyžadující vyšší přesnost, je dostupný uživatelům Pro, Business a Enterprise.

V Codexu je GPT‑5.5 dostupný pro plány Plus, Pro, Business, Enterprise, Edu a Go s kontextovým oknem o velikosti 400K. GPT‑5.5 je také k dispozici v režimu Fast a generuje tokeny 1,5x rychleji za 2,5násobnou cenu.

Pro vývojáře API bude gpt-5.5 brzy dostupný v rozhraních Responses API a API na dokončování chatu za cenu 5 USD za 1 milion vstupních tokenů a 30 USD za 1 milion výstupních tokenů, s kontextovým oknem o velikosti 1 milionu tokenů. Ceny pro Batch a Flex jsou k dispozici za polovinu standardní sazby API, zatímco prioritní zpracování je k dispozici za 2,5násobek standardní sazby. V rozhraní API také uvedeme gpt-5.5-pro pro ještě vyšší přesnost za cenu 30 $ za 1M vstupních tokenů a 180 $ za 1M výstupních tokenů. Podívejte se na stránku s cenami pro všechny, kde najdete všechny údaje.

Zatímco GPT‑5.5 má vyšší cenu než GPT‑5.4, je zároveň inteligentnější a mnohem efektivnější z hlediska tokenů. V Codexu jsme prostředí pečlivě vyladili tak, aby GPT‑5.5 přinášel většině uživatelů lepší výsledky s menším počtem tokenů než GPT‑5.4, a zároveň i nadále nabízel štědré limity používání napříč úrovněmi předplatného.

Hodnocení

Programování

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (veřejná verze) *

58,6 %

57,7 %

-

-

64,3 %

54,2 %

Terminal-Bench 2.0

82,7 %

75.1%

-

-

69,4 %

68,5 %

Expert-SWE (Interní)

73,1 %

68,5 %

-

-

-

-

*Laboratoře zaznamenaly známky memorizace(otevře se v novém okně) v tomto vyhodnocení

Profesionální

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (výhry nebo remízy)

84,9 %

83,0 %

82,3 %

82,0 %

80,3 %

67,3 %

FinanceAgent v1.1

60,0 %

56,0 %

-

61,5 %

64,4 %

59,7 %

Úlohy modelování investičního bankovnictví (Internal)

88,5 %

87,3 %

88,6 %

83,6 %

-

-

OfficeQA Pro

54,1 %

53,2 %

-

-

43,6 %

18,1 %

Používání počítače a počítačové vidění

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld-Verified

78,7 %

75,0 %

-

-

78,0 %

-

MMMU Pro (bez nástrojů)

81,2 %

81,2 %

-

-

-

80,5 %

MMMU Pro (s nástroji)

83,2 %

82,1 %

-

-

-

-

Používání nástrojů

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84,4 %

82,7 %

90,1 %

89,3 %

79,3 %

85,9 %

MCP Atlas**

75,3 %

70,6 %

-

-

79,1 %

78,2 %

Toolathlon

55,6 %

54,6 %

-

-

-

48,8 %

Tau2-bench Telecom***
(bez úpravy promptů)

98,0 %

92,8 %

-

-

-

-

** MCP Atlas: výsledky od Scale AI po nejnovější aktualizaci z dubna 2026. 
*** Tau2-bench Telecom: výsledky pro 5.5 a 5.4 s původními prompty, tj. bez úpravy promptů. To nezahrnuje výsledky z jiných laboratoří, které byly hodnoceny s úpravami promptů.

Akademický

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25,0 %

19,0 %

33,2 %

25,6 %

-

-

FrontierMath úroveň 1–3

51,7 %

47,6 %

52,4 %

50,0 %

43,8 %

36,9 %

FrontierMath úroveň 4

35,4 %

27,1 %

39,6 %

38,0 %

22,9 %

16,7 %

BixBench

80,5 %

74,0 %

-

-

-

-

GPQA Diamond

93,6 %

92,8 %

-

94,4 %

94,2 %

94,3 %

Humanity's Last Exam (bez nástrojů)

41,4 %

39,8 %

43,1 %

42,7 %

46,9 %

44,4 %

Humanity's Last Exam (s nástroji)

52,2 %

52,1 %

57,2 %

58,7 %

54,7 %

51.4 %

Kybernetická bezpečnost

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Úlohy Capture-the-Flags (interní)****

88,1 %

83,7 %

-

-

-

-

CyberGym

81,8 %

79,0 %

-

-

73,1 %

-

**** Rozšíření nejobtížnějších CTFů používaných v systémových kartách o další obtížné výzvy.

Dlouhý kontext

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256 000 f1

73,7 %

62,5 %

-

-

76,9 %

-

Graphwalks BFS 1 mil. f1

45,4 %

9,4 %

-

-

41,2 % (Opus 4.6)

-

Graphwalks parents 256k f1

90,1 %

82.8%

-

-

93,6 %

-

Graphwalks parents 1 mil f1

58,5 %

44,4 %

-

-

72,0 % (Opus 4.6)

-

OpenAI MRCR v2 8needle 4K-8K

98,1 %

97,3 %

-

-

-

-

OpenAI MRCR v2 8needle 8K-16K

93,0 %

91,4 %

-

-

-

-

OpenAI MRCR v2 8needle 16K-32K

96,5 %

97,2 %

-

-

-

-

OpenAI MRCR v2 8needle 32K-64K

90,0 %

90,5 %

-

-

-

-

OpenAI MRCR v2 8needle 64K-128K

83,1 %

86,0 %

-

-

-

-

OpenAI MRCR v2 8needle 128K-256K

87,5 %

79,3 %

-

-

59,2 %

-

OpenAI MRCR v2 8-needle 256K-512K

81,5 %

57,5 %

-

-

-

-

OpenAI MRCR v2 8needle 512K-1M

74,0 %

36,6 %

-

-

32,2 %

-

Abstraktní uvažování

Hodnocení

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (ověřeno)

95,0 %

93,7 %

-

94,5%

93,5 %

98,0 %

ARC-AGI-2 (ověřeno)

85,0 %

73,3 %

-

83,3 %

75,8 %

77,1 %

Srovnání modelu GPT byla provedena s hloubkou uvažování nastavenou na xhigh a byla provedena ve výzkumném prostředí, které může v některých případech poskytovat mírně odlišné výstupy než ChatGPT v produkčním prostředí.

Autor

OpenAI