Перейти до основного вмісту
OpenAI

23 квітня 2026 р.

ПродуктВипуск

Представляємо GPT‑5.5

Новий рівень інтелекту для реальної роботи

Завантаження…

Оновлення від 24 квітня 2026 р.: GPT‑5.5 та GPT‑5.5 Pro тепер доступні в API. Системну картку також було оновлено: додано опис додаткових заходів безпеки, що було застосовано.


Ми випускаємо GPT‑5.5 — нашу найрозумнішу та найбільш інтуїтивну у використанні модель на сьогодні, яка є наступним кроком до нового способу виконання комп’ютерних завдань.

GPT‑5.5 швидше розуміє, що ви намагаєтеся зробити, і може самостійно виконувати більшу частину роботи. Модель чудово справляється з написанням і налагодженням коду, онлайн-дослідженнями, аналізом даних, створенням документів і електронних таблиць, роботою з програмним забезпеченням і перемиканням між інструментами, доки завдання не буде виконано. Замість того щоб ретельно керувати кожним кроком, можна доручити GPT‑5.5 нечітко сформульоване багатоскладове завдання й довірити їй спланувати роботу, скористатися інструментами, перевірити власну роботу, зорієнтуватися в неоднозначностях і продовжувати рухатися далі.

Особливі покращення спостерігаються в агентному програмуванні, використанні комп’ютера, інтелектуальній роботі та на ранніх етапах наукових досліджень — у сферах, де прогрес залежить від міркування в межах контексту та виконання дій у часі. GPT‑5.5 забезпечує цей крок уперед в інтелекті без компромісів у швидкості: більші й потужніші моделі часто працюють повільніше, але GPT‑5.5 аналогічна GPT‑5.4 за затримкою на токен в реальних умовах, та водночас демонструє значно вищий рівень інтелекту. Вона також використовує значно менше токенів для виконання тих самих завдань у Codex, що робить її не лише ефективнішою, а й потужнішою.

Ми випускаємо GPT‑5.5 із нашим найпотужнішим на сьогодні комплексом заходів безпеки, спрямованих на зменшення ризику зловживань і збереження доступу для корисної діяльності. Перед випуском ми оцінили цю модель за всіма нашими системами безпеки та готовності, співпрацювали з експертами внутрішніх і зовнішніх «червоних команд», провели цільове тестування розширених можливостей у сфері кібербезпеки та біології, а також зібрали відгуки про реальні сценарії використання від майже 200 довірених партнерів із раннім доступом.

Відсьогодні GPT‑5.5 стає доступним для користувачів Plus, Pro, Business та Enterprise у ChatGPT і Codex, а GPT‑5.5 Pro — для користувачів Pro, Business та Enterprise у ChatGPT. Розгортання API потребують інших заходів захисту, тож ми тісно співпрацюємо з партнерами та клієнтами щодо вимог до безпечності та захисту для його масштабного надання. Невдовзі ми додамо GPT‑5.5 і GPT‑5.5 Pro в API.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82,7%

75,1%

-

-

69,4%

68,5%

Expert-SWE (внутрішній)

73,1%

68,5%

-

-

-

-

GDPval (перемоги або нічиї)

84,9%

83,0%

82,3%

82,0%

80,3%

67,3%

OSWorld Verified

78,7%

75,0%

-

-

78,0%

-

Toolathlon

55,6%

54,6%

-

-

-

48,8%

BrowseComp

84,4%

82,7%

90,1%

89,3%

79,3%

85,9%

FrontierMath, рівень 1–3

51,7%

47,6%

52,4%

50,0%

43,8%

36,9%

FrontierMath, рівень 4

35,4%

27,1%

39,6%

38,0%

22,9%

16,7%

CyberGym

81,8%

79,0%

-

-

73,1%

-

Можливості моделі

OpenAI створює глобальну інфраструктуру для агентного ШІ, що дає змогу людям і компаніям у всьому світі виконувати роботу за допомогою ШІ. За останній рік ми побачили, як ШІ суттєво прискорив розробку програмного забезпечення. Із появою GPT‑5.5 у Codex і ChatGPT ця сама трансформація починає поширюватися на наукові дослідження та ширший спектр завдань, які люди виконують на комп’ютерах.

У всіх цих сферах GPT‑5.5 не просто розумніша; вона також ефективніше працює над розв’язанням проблем, часто досягаючи результатів вищої якості з меншою кількістю токенів і меншою кількістю повторних спроб. В індексі Coding Index від Artificial Analysis GPT‑5.5 забезпечує передовий рівень інтелекту за вдвічі нижчою ціною, ніж конкурентні передові моделі для програмування.

Індекс Artificial Analysis Intelligence(відкривається у новому вікні) — це зважене середнє 10 оцінювань, проведених сторонньою організацією: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Агентне програмування

GPT‑5.5 — це наша найпотужніша модель агентного програмування на сьогодні. На Terminal-Bench 2.0, який тестує складні робочі процеси командного рядка, що потребують планування, ітерацій та координації інструментів, вона досягає передової точності 82,7%. На SWE-Bench Pro, що оцінює вирішення проблем GitHub у реальних умовах, вона досягає 58,6%, вирішуючи більше завдань наскрізно за один прогін, ніж попередні моделі. У Expert-SWE, нашому внутрішньому передовому оцінюванні для довготривалих завдань із програмування з медіанним оціненим часом виконання 20 годин, GPT‑5.5 також перевершила GPT‑5.4.

У всіх трьох оцінках GPT‑5.5 перевершує результати GPT‑5.4, використовуючи при цьому менше токенів.

Сильні сторони моделі в програмуванні особливо чітко проявляються в Codex, де вона може виконувати складну інженерну роботу — від реалізації та рефакторингу до налагодження, тестування та перевірки. Перші результати тестування свідчать, що GPT‑5.5 краще проявляє себе в аспектах, від яких залежить реальна інженерна робота: утримання контексту в межах великих систем, міркування через неоднозначні збої, перевірка припущень за допомогою інструментів і внесення змін у пов’язану кодову базу.

Відтворена траєкторія використовує векторні дані NASA/JPL Horizons для Оріону, Місяця та Сонця із застосованим масштабуванням відображення для зручності читання.

Запит: [прикріплене зображення] Реалізуй це як новий додаток за допомогою webgl та vite, використовуючи реальні дані з місії «Artemis II». Обов’язково ретельно протестуй застосунок, доки він не стане повністю функціональним і не виглядатиме як застосунок на зображенні. Зверни особливу увагу на рендеринг планет і траєкторії польоту. Я хочу мати змогу взаємодіяти з 3D-рендерингом. Переконайся, що рендеринг має реалістичну орбітальну механіку.

Окрім бенчмарків, ранні тестувальники зазначили, що GPT‑5.5 краще розуміє структуру системи: чому щось не працює, де саме потрібно внести виправлення і на що ще в кодовій базі це вплине.

альтернативний опис

«Це перша модель програмування, якою я користувався, що має чітку концептуальну ясність.»

Ден Шиппер, засновник та генеральний директор Every, описав GPT‑5.5 як «першу модель для програмування, якою я користувався, що має справді чітке концептуальне мислення».

Після запуску програми він кілька днів усував проблему, перш ніж залучив одного зі своїх найкращих інженерів для переписування частини системи. Щоб протестувати GPT‑5.5, він фактично відмотав час назад, аби перевірити: чи зможе модель, поглянувши на проблему, запропонувати такий самий варіант виправлення, на якому зрештою зупинився розробник? На відміну від GPT‑5.4, GPT‑5.5 це вдалося.

альтернативний опис

«У мене справді таке відчуття, ніби я працюю з вищим інтелектом, і навіть виникає певне відчуття поваги.»

П’єтро Шірано, генеральний директор MagicPath, зауважив подібний якісний прорив, коли GPT‑5.5 об’єднала гілку із сотнями змін у фронтенді та рефакторингу з основною гілкою, яка також зазнала суттєвих змін, виконавши всю цю роботу з одним прикладом приблизно за 20 хвилин.

Старші інженери, які тестували модель, зазначили, що GPT‑5.5 була помітно сильнішою за GPT‑5.4 і Claude Opus 4.7 у міркуваннях та автономності, заздалегідь виявляючи проблеми та прогнозуючи потреби тестування й перевірки без явних підказок. В одному випадку інженер попросив переробити архітектуру системи коментарів у редакторі Markdown для спільної роботи, а коли повернувся, його вже чекав стек із 12 diff, який був майже завершений. Інші зазначили, що їм знадобилося на диво мало виправлень під час реалізації, і вони більше довіряли планам GPT‑5.5 у порівнянні з GPT‑5.4.

Один інженер NVIDIA, який отримав ранній доступ до моделі, навіть сказав: «Втратити доступ до GPT‑5.5 — це ніби мені ампутували кінцівку».

«GPT-5.5 помітно розумніша та наполегливіша за GPT-5.4, має покращену продуктивність у програмуванні та демонструє більш упевнене використання інструментів. Вона не відволікається від завдання значно довше й не припиняє роботу завчасно, а це найважливіше для складної, довготривалої роботи, яку наші користувачі делегують Cursor.»
— Майкл Труелл, співзасновник і генеральний директор Cursor

Інтелектуальна праця

Ті самі сильні сторони, завдяки яким GPT‑5.5 чудово справляється з програмуванням, також роблять його потужним інструментом для щоденної роботи за комп’ютером. Оскільки модель краще розуміє наміри, вона може природніше проходити весь повний цикл інтелектуальної праці: знаходити інформацію, розуміти, що має значення, використовувати інструменти, перевіряти результат і перетворювати неопрацьований матеріал на щось корисне.

У Codex GPT‑5.5 краще за GPT‑5.4 створює документи, електронні таблиці та презентації. Альфа-тестери зазначили, що вона перевершує попередні моделі у таких завданнях, як операційні дослідження, моделювання електронних таблиць і трансформація неструктурованих бізнес-даних у плани. У поєднанні з навичками використання комп’ютера від Codex, GPT‑5.5 наближає нас до відчуття, що модель дійсно може користуватися комп’ютером разом із вами: бачити, що на екрані, натискати, вводити текст, орієнтуватися в інтерфейсах і точно перемикатися між інструментами.

Команди в OpenAI вже використовують ці сильні сторони у реальних робочих процесах. Сьогодні понад 85% співробітників компанії щотижня використовують Codex у різних функціональних напрямах, включаючи розробку програмного забезпечення, фінанси, комунікації, маркетинг, науку про дані та управління продуктом. У команді комунікацій GPT‑5.5 було використано у Codex, щоб проаналізувати дані за шість місяців щодо запитів на виступи, розробити систему оцінювання та структуру оцінки ризиків, а також валідувати автоматизованого Slack-агента, щоб запити з низьким рівнем ризику можна було обробляти автоматично, тоді як запити з вищим рівнем ризику й надалі спрямовувалися на перевірку людиною. У фінансовому відділі команда використала Codex для перевірки 24 771 податкових форм K-1 загальним обсягом 71 637 сторінок, використовуючи робочий процес, у якому було виключено персональну інформацію, що допомогло команді виконати це завдання на два тижні швидше, ніж попереднього року. У команді зі стратегії виходу на ринок один співробітник автоматизував створення щотижневих бізнес-звітів, заощадивши 5–10 годин на тиждень.

У ChatGPT GPT‑5.5 Thinking відкриває швидший доступ до допомоги у розв’язанні складніших завдань, пропонуючи розумніші та лаконічніші відповіді, щоб ви могли ефективніше працювати над складними завданнями. Вона особливо добре справляється з професійними завданнями, як-от програмування, дослідження, синтез та аналіз інформації, а також завданнями, пов’язаними з великим обсягом документів, особливо під час використання плагінів.

У GPT‑5.5 Pro ранні тестувальники відзначають значний прогрес як у складності, так і в якості завдань, які може виконувати ChatGPT, а також зменшення затримки, що робить її набагато практичнішою для вимогливих завдань. Порівняно з GPT‑5.4 Pro, тестувальники виявили, що відповіді GPT‑5.5 Pro є значно більш вичерпними, добре структурованими, точними, релевантними й корисними, з особливо високими результатами в бізнесі, юриспруденції, освіті та науці про дані.

GPT‑5.5 демонструє найвищі результати на багатьох тестах, які відображають цей тип роботи. У GDPval⁠, оцінці, що перевіряє здатність агентів виконувати чітко визначені завдання в межах інтелектуальної роботи в 44 професіях, GPT‑5.5 набирає 84,9%. У OSWorld-Verified, що оцінює, чи може модель самостійно працювати в реальних комп’ютерних середовищах, вона досягає позначки в 78,7%. А на Tau2-bench Telecom, який тестує складні робочі процеси обслуговування клієнтів, вона досягає аж 98,0% без коригування запиту. GPT‑5.5 також демонструє високі результати на інших бенчмарках інтелектуальної праці: 60,0% на FinanceAgent, 88,5% на внутрішніх завданнях із моделювання в інвестиційному банкінгу і 54,1% на OfficeQA Pro.

Tau2-bench Telecom було запущено без коригування запитів (модель користувача — GPT‑4.1). GPT‑5.5 краще розуміє намір завдання та є ефективнішою у використанні токенів, ніж її попередники.

«GPT-5.5 забезпечує стабільну продуктивність, необхідну для виконання складних завдань. Створена та розгорнута на системах NVIDIA GB200 NVL72, модель дозволяє нашим командам впроваджувати наскрізні функції на основі запитів природною мовою, скорочувати час налагодження з днів до годин і перетворювати тижні експериментів на прогрес за одну ніч у складних кодових базах. Це вже більше, ніж просто швидше програмування: це новий спосіб роботи, який допомагає людям працювати на принципово іншій швидкості.»
— Джастін Бойтано, віце-президент з корпоративного ШІ в NVIDIA

Наукові дослідження

GPT‑5.5 також демонструє покращення в науково-технічних дослідницьких процесах, які вимагають більше, ніж просто відповідь на складне запитання. Дослідникам потрібно досліджувати ідею, збирати докази, перевіряти припущення, інтерпретувати результати та вирішувати, що робити далі. GPT‑5.5 у цьому циклі працює краще, ніж інші моделі.

Зокрема, GPT‑5.5 демонструє явне покращення порівняно з GPT‑5.4 у новому тесті GeneBench(відкривається у новому вікні), що зосереджений на багатоступеневому науковому аналізі даних у генетиці та кількісній біології. Завдання тесту вимагають, щоб моделі аналізували потенційно неоднозначні або помилкові дані за мінімального наглядового супроводу, долали реалістичні перешкоди, як-от приховані змішувальні чинники або збої контролю якості, а також коректно реалізовували й інтерпретували сучасні статистичні методи. Ефективність моделі вражає, враховуючи, що завдання тут часто відповідають багатоденним проєктам, які виконують наукові експерти.

Так само в BixBench(відкривається у новому вікні), наборі тестів, створеному на основі реальних завдань біоінформатики та аналізу даних, модель GPT‑5.5 продемонструвала найкращі результати серед моделей із опублікованими показниками. Наукові можливості моделі тепер достатньо потужні, аби суттєво прискорювати прогрес на передових рубежах біомедичних досліджень як справжній співдослідник.

В іншому прикладі внутрішня версія GPT‑5.5 зі спеціальним середовищем допомогла знайти новий доказ(відкривається у новому вікні) про числа Ремзі, один із центральних об’єктів комбінаторики. Комбінаторика вивчає, як поєднуються дискретні об’єкти: графи, мережі, множини та патерни. Числа Ремзі, грубо кажучи, відповідають на запитання, наскільки великою має бути мережа, щоб у ній гарантовано з’явився певний порядок. Результати в цій сфері трапляються рідко й часто є технічно складними. Тут GPT‑5.5 знайшла доказ давнього асимптотичного факту про позадіагональні числа Ремзі, який згодом перевірили в Lean. Цей результат є конкретним прикладом того, як GPT‑5.5 зробила внесок не лише кодом чи поясненнями, а й несподіваним і корисним математичним аргументом в одній з ключових галузей досліджень.

Перші тестувальники використовували GPT‑5.5 Pro у ChatGPT не стільки як механізм відповідей з одним прикладом, скільки як партнера в дослідженнях, який критикував рукописи за кілька проходів, перевіряв технічні аргументи, пропонував аналізи та працював із кодом, нотатками й контекстом із PDF-файлів. Спільною рисою є те, що GPT‑5.5 краще допомагає дослідникам переходити від питання до експерименту та результату.

Дер’я Унутмаз, професор імунології та дослідник Джексоновської лабораторії геномної медицини, використав GPT‑5.5 Pro для аналізу набору даних з експресії генів із 62 зразками та майже 28 000 генів, створивши докладний дослідницький звіт, який не лише підсумував результати, а й виявив ключові питання та важливі висновки — за його словами, ця робота забрала б у його команди місяці.

Бартош Наскрецький, доцент кафедри математики Університету імені Адама Міцкевича в Познані (Польща), використав GPT‑5.5 у Codex, щоб за 11 хвилин створити застосунок з алгебраїчної геометрії на основі одного запиту. Цей застосунок візуалізує перетин квадричних поверхонь і перетворює отриману криву на модель Веєрштрасса.

Згодом він розширив функціональність програми, додавши стабільнішу візуалізацію сингулярності та точні коефіцієнти, які можна повторно використовувати в подальшій роботі. Для нього найсуттєвіша зміна полягає в тому, що Codex тепер може допомагати впроваджувати користувацькі робочі процеси для математичної візуалізації та комп’ютерної алгебри, які раніше потребували спеціалізованих інструментів. У сукупності ці приклади показують, як GPT‑5.5 перетворює експертний задум на дієві дослідницькі інструменти й аналітичні матеріали.

«»

Авторство: Бартош Наскрецький(відкривається у новому вікні)

Запит: # Перетин поверхонь в алгебраїчній геометрії

Створи застосунок, який будує дві квадратичні поверхні та виділяє червоним кольором криву перетину. Використай обчислювальну теорему Рімана-Роха, щоб перетворити це на криву Веєрштраса.

## Основне вікно

Дві тоновані поверхні зі злегка прозорим затіненням і високоякісним рендерингом перетинаються вздовж червоної алгебраїчної кривої.

Можливості: обертання мишею в обох напрямках, повноцінний жест щипка для масштабування, тактильне натискання для показу невеликого меню з повзунками для зміни коефіцієнтів кожної поверхні; визначення за рівнем Z-буфера

## Праве бокове вікно

Коротке рівняння Веєрштраса (над Q або квадратичним розширенням поля), обчислене на ходу за ефективними формулами теореми Рімана-Роха

## Режим Ambient, у якому всі елементи керування приховано, і користувач може просто милуватися красою форм

## Специфікації

Застосунок працює в браузері; легка реалізація з найновішими бібліотеками для повного стеку, портативність, придатність до розгортання.

## Документи

Git-репозиторій, журнал, план (файли розмітки)

«Неймовірно надихає використовувати нову модель GPT-5.5 від OpenAI у нашому середовищі тестування, доручати їй аналізувати величезні набори біохімічних даних для прогнозування результатів дії лікарських засобів на організм людини, а потім бачити, як вона забезпечує значне підвищення точності в наших найскладніших оцінюваннях у сфері розробки лікарських засобів. Якщо OpenAI продовжить працювати в такому темпі, основи відкриття ліків зміняться вже до кінця року».
— Брендон Вайт, співзасновник і генеральний директор Axiom Bio

Ефективність інференсу наступного покоління

Забезпечення роботи GPT‑5.5 із затримкою на рівні GPT‑5.4 вимагало переосмислення інференсу як цілісної системи, а не набору ізольованих оптимізацій. GPT‑5.5 було спільно спроєктовано, навчено й розгорнуто на системах NVIDIA GB200 і GB300 NVL72. Codex і GPT‑5.5 відіграли ключову роль у досягненні наших цільових показників продуктивності. Codex допоміг команді швидше переходити від ідеї до реалізації, яку можна оцінювати за бенчмарками, розробляти підходи, налаштовувати експерименти та визначати, які оптимізації варті глибших інвестицій. GPT‑5.5 допоміг виявити та впровадити ключові покращення у самому стеку. Простіше кажучи, модель допомогла вдосконалити інфраструктуру, яка забезпечує її роботу.

Одним із таких удосконалень було балансування навантаження та евристичні методи розподілу. До GPT‑5.5 ми розбивали запити на акселераторі на фіксовану кількість фрагментів, щоб збалансувати навантаження між обчислювальними ядрами та забезпечити виконання великих і малих запитів на тому самому GPU. Однак заздалегідь визначена кількість статичних фрагментів не є оптимальною для всіх типів трафіку. Аби ефективніше використовувати графічні процесори, Codex проаналізував закономірності виробничого трафіку за кілька тижнів і створив спеціальні евристичні алгоритми для оптимального розподілу та балансування навантаження. Ці зусилля мали значний вплив і дозволили підвищити швидкість генерації токенів більш ніж на 20%.

Посилення кібербезпеки заради безпеки кожного

Підготовка світу до моделей, які дуже добре знаходять і допомагають усувати вразливості безпеки, — це командна справа, і для цього потрібно, щоб уся екосистема наполегливо працювала над розбудовою стійкості, забезпечуючи демократизований доступ до моделей і поетапне розгортання для нової епохи кіберзахисту.

Передові моделі стають дедалі більш здібними у сфері кібербезпеки. Ці можливості набуватимуть усе більшого поширення, і ми вважаємо, що найкраще рішення — забезпечити, щоб їх можна було використовувати для посилення кіберзахисту та зміцнення екосистеми.

GPT‑5.5 — це невеликий, але важливий крок на шляху до ШІ, здатного розв’язувати деякі з найскладніших світових викликів, як-от кібербезпека. Із виходом GPT‑5.2 у грудні ми проактивно розгорнули необхідні засоби кіберзахисту для обмеження потенційних кіберзловживань за допомогою наших моделей. Тепер із GPT‑5.5 ми розгортаємо суворіші класифікатори для виявлення потенційного кіберризику, що спочатку може дратувати деяких користувачів, поки ми з часом їх налаштуємо.

Протягом багатьох років поступового вдосконалення наших моделей ми визначали кібербезпеку як категорію в нашій рамковій системі готовності(відкривається у новому вікні). Ми ітеративно розробляємо та калібруємо заходи пом’якшення, щоб відповідально випускати моделі зі значущими можливостями у сфері кібербезпеки.

  • Ми впроваджуємо провідні в галузі заходи безпеки для цього рівня кіберможливостей. Минулого року ми вперше запровадили спеціальні засоби кіберзахисту з GPT‑5.2(відкривається у новому вікні), які ми продовжували тестувати, вдосконалювати й розвивати в наступних розгортаннях. Для GPT‑5.5 ми розробили суворіші механізми контролю щодо діяльності з підвищеним рівнем ризику, кіберзапитів, що стосуються конфіденційної інформації, а також додали додаткові заходи захисту від повторних зловживань. Широкий доступ став можливим завдяки нашим інвестиціям у безпеку моделей, автентифіковане використання та моніторинг неприпустимого використання. Протягом кількох місяців ми співпрацювали із зовнішніми експертами, щоб розробити, протестувати та вдосконалити надійність цих заходів безпеки. Завдяки GPT‑5.5 ми надаємо розробникам можливість легко захищати свій код, водночас запроваджуючи суворіші механізми контролю для кіберпроцесів, які зловмисники найімовірніше можуть використати для заподіяння шкоди.
  • Ми розширюємо доступ для оптимізації кіберзахисту на всіх рівнях. Ми відкриваємо доступ до наших кібервідкритих моделей через програму Trusted Access for Cyber, починаючи з Codex. Це дає розширений доступ до передових можливостей GPT‑5.5 у сфері кібербезпеки з меншими обмеженнями для перевірених користувачів, які на момент запуску відповідають певним сигналам довіри(відкривається у новому вікні). Організації, відповідальні за захист критичної інфраструктури, можуть подати заявку на доступ до кібервідкритих моделей, таких як GPT‑5.4‑Cyber, якщо дотримуються суворих вимог безпеки для захисту своїх внутрішніх систем. Це надає широкому колу перевірених захисників потужніші інструменти для законної роботи у сфері безпеки з меншими зайвими перешкодами, щоб забезпечити демократизацію доступу до важливих захисних можливостей. Користувачі можуть подати заявку на довірений доступ на chatgpt.com/cyber(відкривається у новому вікні), щоб зменшити кількість непотрібних відмов під час використання GPT‑5.5 для підтвердженої роботи з захисту.
  • Ми співпрацюємо з державними партнерами, щоб допомогти захистити критичну інфраструктуру в інтересах суспільства. Разом ми досліджуємо, як передовий ШІ може підтримувати оборонну роботу посадових осіб, які користуються довірою та відповідають за системи, на які покладаються люди, — від цифрових систем, що захищають важливі дані платників податків, до електромереж і водопостачання в місцевих громадах.

Ми розглядаємо біологічні/хімічні та кібербезпекові можливості GPT‑5.5 як такі, що мають високий рівень у межах нашої рамкової системи готовності(відкривається у новому вікні). Хоча GPT‑5.5 не досяг критичного рівня можливостей у сфері кібербезпеки, наші оцінювання та тестування показали, що його можливості у сфері кібербезпеки є кроком уперед порівняно з GPT‑5.4.

Крім того, GPT‑5.5 пройшла повний процес перевірки безпеки та управління перед випуском, включаючи оцінювання готовності, спеціалізоване тестування, нові цільові оцінювання розширених можливостей у галузі біології та кібербезпеки, а також ретельне тестування із залученням зовнішніх експертів. Детальнішу інформацію можна знайти у картці системи GPT‑5.5(відкривається у новому вікні).

Ця робота відображає наш ширший підхід до стійкості ШІ, який, на нашу думку, є необхідним із розвитком можливостей моделей. Ми хочемо, щоб потужний ШІ був доступний людям, які використовують його для захисту систем, установ і суспільства. Найкращий напрямок подальшого розвитку — довірений доступ, надійні заходи захисту, що масштабуються разом із можливостями, та операційна спроможність виявляти серйозні зловживання й реагувати на них.

Доступ та ціни

Відсьогодні GPT‑5.5 стає доступним для користувачів Plus, Pro, Business та Enterprise у ChatGPT і Codex, а GPT‑5.5 Pro — для користувачів Pro, Business та Enterprise у ChatGPT. Невдовзі ми додамо GPT‑5.5 і GPT‑5.5 Pro в API.

У ChatGPT GPT‑5.5 Thinking доступна для користувачів Plus, Pro, Business та Enterprise. GPT‑5.5 Pro, створена для ще складніших запитань і роботи, що потребує вищої точності, доступна для користувачів Pro, Business та Enterprise.

У Codex GPT‑5.5 доступна в планах Plus, Pro, Business, Enterprise, Edu та Go із контекстним вікном 400K. GPT‑5.5 також доступна у Fast mode, де вона генерує токени у 1,5 рази швидше за 2,5x вартості.

Для розробників API модель gpt-5.5 незабаром буде доступна в API Responses і API завершення чатів за ціною 5 дол. США за 1 млн вхідних токенів і 30 дол. США за 1 млн вихідних токенів, із контекстним вікном на 1 млн. Ціни Batch і Flex доступні за половину стандартного тарифу API, тоді як Priority Processing доступний за тарифом, що у 2,5 раза перевищує стандартний. Ми також випустимо gpt-5.5-pro в API для ще вищої точності; вартість складатиме 30 дол. США за 1 млн вхідних токенів і 180 дол. США за 1 млн вихідних токенів. Докладнішу інформацію можна знайти на сторінці з цінами.

Хоча GPT‑5.5 коштує дорожче за GPT‑5.4, вона і розумніша, і значно ефективніша у використанні токенів. У Codex ми ретельно налаштували взаємодію так, щоб GPT‑5.5 забезпечувала кращі результати з меншою кількістю токенів, ніж GPT‑5.4, для більшості користувачів, водночас і надалі пропонуючи щедрі ліміти використання на всіх рівнях підписки.

Оцінювання

Програмування

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (Public) *

58,6%

57,7%

-

-

64,3%

54,2%

Terminal-Bench 2.0

82,7%

75,1%

-

-

69,4%

68,5%

Expert-SWE (внутрішній)

73,1%

68,5%

-

-

-

-

*Лабораторії виявили ознаки запам’ятовування(відкривається у новому вікні) в цьому оцінюванні

Професійний

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (перемоги або нічиї)

84,9%

83,0%

82,3%

82,0%

80,3%

67,3%

FinanceAgent v1.1

60,0%

56,0%

-

61,5%

64,4%

59,7%

Завдання з моделювання в інвестиційному банкінгу (внутрішнє)

88,5%

87,3%

88,6%

83,6%

-

-

OfficeQA Pro

54,1%

53,2%

-

-

43,6%

18,1%

Використання комп'ютера та візуал

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld Verified

78,7%

75,0%

-

-

78,0%

-

MMMU Pro (без інструментів)

81,2%

81,2%

-

-

-

80,5%

MMMU Pro (з інструментами)

83,2%

82,1%

-

-

-

-

Використання інструментів

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84,4%

82,7%

90,1%

89,3%

79,3%

85,9%

MCP Atlas**

75,3%

70,6%

-

-

79,1%

78,2%

Toolathlon

55,6%

54,6%

-

-

-

48,8%

Tau2-bench Telecom***
(оригінальний запит)

98,0%

92,8%

-

-

-

-

** MCP Atlas: результати від Scale AI після останнього оновлення за квітень 2026 року. 
*** Tau2-bench telecom: результати для 5.5 і 5.4 з оригінальними запитами, тобто без коригування. Це не включає результати з інших лабораторій, які оцінювалися з коригуванням запитів.

Академічність

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25,0%

19,0%

33,2%

25,6%

-

-

FrontierMath, рівень 1–3

51,7%

47,6%

52,4%

50,0%

43,8%

36,9%

FrontierMath, рівень 4

35,4%

27,1%

39,6%

38,0%

22,9%

16,7%

BixBench

80,5%

74,0%

-

-

-

-

GPQA Diamond

93,6%

92,8%

-

94,4%

94,2%

94,3%

Humanity's Last Exam (без інструментів)

41,4%

39,8%

43,1%

42,7%

46,9%

44,4%

Humanity's Last Exam (з інструментами)

52,2%

52,1%

57,2%

58,7%

54,7%

51,4%

Кібербезпека

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Завдання Capture-the-Flags (внутрішнє)

88,1 %

83,7%

-

-

-

-

CyberGym

81,8%

79,0%

-

-

73,1%

-

**** Розширення найскладніших CTF, що використовуються в картках системи, із додатковими складними завданнями.

Розширений контекст

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256k f1

73,7%

62,5%

-

-

76,9%

-

Graphwalks BFS 1mil f1

45,4%

9,4%

-

-

41,2% (Opus 4.6)

-

Батьківські вузли Graphwalks 256k f1

90,1%

82,8%

-

-

93,6%

-

Батьківські вузли Graphwalks 1mil f1

58,5%

44,4%

-

-

72,0% (Opus 4.6)

-

OpenAI MRCR v2 8-needle 4K-8K

98,1%

97,3%

-

-

-

-

OpenAI MRCR v2 8-needle 8K-16K

93,0%

91,4%

-

-

-

-

OpenAI MRCR v2 8-needle 16K-32K

96,5%

97,2%

-

-

-

-

OpenAI MRCR v2 8-needle 32K-64K

90,0 %

90,5%

-

-

-

-

OpenAI MRCR v2 8-needle 64K-128K

83,1%

86,0%

-

-

-

-

OpenAI MRCR v2 8-needle 128K-256K

87,5%

79,3%

-

-

59,2%

-

OpenAI MRCR v2 8-needle 256K-512K

81,5%

57,5%

-

-

-

-

OpenAI MRCR v2 8-needle 512K-1M

74,0%

36,6%

-

-

32,2%

-

Абстрактне мислення

Оцінка

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (Verified)

95,0%

93,7%

-

94,5%

93,5%

98,0%

ARC-AGI-2 (Verified)

85,0%

73,3%

-

83,3%

75,8%

77,1%

Оцінювання було запущено із зусиллям міркування на рівні xhigh; тестування проводилося в дослідницькому середовищі, яке в деяких випадках може давати дещо відмінні результати порівняно з роботою ChatGPT у продакшні.

Автор

OpenAI