23 април 2026 г.

Представяме GPT‑5.5

Нов клас интелигентност за реални задачи

Зареждане…

Актуализация от 24 април 2026 г.: GPT‑5.5 и GPT‑5.5 Pro вече са налични в API. Картата на системата също е актуализирана, като в нея са описани допълнителните предпазни мерки, които са в сила.

Пускаме GPT‑5.5, най-интелигентният и интуитивен за използване модел, който сме създавали досега, и следващата стъпка към нов начин за работа на компютър.

GPT‑5.5 разбира по-бързо какво се опитвате да направите и може да поеме по-голяма част от работата самостоятелно. Той се отличава в писането и отстраняването на грешки в кода, онлайн проучвания, анализиране на данни, създаване на документи и електронни таблици, работа със софтуер и преминаване между различни инструменти, докато задачата не бъде завършена. Вместо да управлявате внимателно всяка стъпка, можете да възложите на GPT‑5.5 сложна задача, състояща се от няколко части, и да му се доверите, че ще планира, ще използва инструменти, ще проверява работата си, ще се ориентира в неясни ситуации и ще продължава напред.

Ползите са особено големи при агентното кодиране, работата с компютър, работата с информация и ранните научни изследвания – области, в които напредъкът зависи от структурираното анализиране в различен контекст и предприемането на действия във времето. GPT‑5.5 осигурява тази повишена интелигентност, без да прави компромис със скоростта: по-големите и по-мощни модели често работят по-бавно, но GPT‑5.5 достига забавянето на GPT‑5.4 на токен при реално обслужване, като същевременно работи на много по-високо ниво на интелигентност. Освен това използва значително по-малко токени за изпълнение на същите задачи в Codex, което го прави едновременно по-ефективен и по-способен.

Пускаме GPT‑5.5 с най-строгия ни досега набор от предпазни мерки, които целят да намалят злоупотребите, като същевременно запазят достъпа за полезна работа. Оценихме този модел по целия ни набор от рамки за безопасност и готовност, работихме с вътрешни и външни „червени екипи“ за симулиране на атаки, добавихме целенасочени тестове за разширени възможности в областта на киберсигурността и биологията и събрахме обратна връзка за реални случаи на използване от близо 200 доверени партньори с ранен достъп преди пускането на модела.

От днес GPT‑5.5 ще е достъпен за потребителите на плановете Plus, Pro, Business и Enterprise в ChatGPT и Codex, а GPT‑5.5 Pro може да се използва от потребителите на Pro, Business и Enterprise в ChatGPT. Внедряването на API изисква различни предпазни мерки, затова работим в тясно сътрудничество с партньори и клиенти по изискванията за безопасност и сигурност, необходими за предоставянето му в голям мащаб. Съвсем скоро ще внедрим GPT‑5.5 и GPT‑5.5 Pro в API.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82,7%	75,1%	-	-	69,4%	68,5%
Expert-SWE (вътрешен)	73,1%	68,5%	-	-	-	-
GDPval (победи или равенства)	84,9%	83,0%	82,3%	82,0%	80,3%	67,3%
OSWorld-Verified	78,7%	75,0%	-	-	78,0%	-
Toolathlon	55,6%	54,6%	-	-	-	48,8%
BrowseComp	84,4%	82,7%	90,1%	89,3%	79,3%	85,9%
FrontierMath ниво 1–3	51,7%	47,6%	52,4%	50,0%	43,8%	36,9%
FrontierMath ниво 4	35,4%	27,1%	39,6%	38,0%	22,9%	16,7%
CyberGym	81,8%	79,0%	-	-	73,1%	-

Възможности на модела

OpenAI изгражда глобалната инфраструктура за агентен изкуствен интелект, която дава възможност на хората и бизнеса по целия свят да вършат повече работа с изкуствен интелект. През изминалата година станахме свидетели на това как изкуственият интелект значително ускори софтуерното инженерство. С GPT‑5.5 в Codex и ChatGPT същата трансформация започва да се разпростира и върху научните изследвания и по-широката работа на хората на компютър.

В тези области GPT‑5.5 е не просто по-интелигентен, но и по-ефективен в начина, по който решава проблеми, като често постига по-качествени резултати с по-малко токени и по-малко повторни опити. В индекса за кодиране на Artificial Analysis GPT‑5.5 демонстрира интелигентност от най-високо ниво на половината от цената на конкурентните авангардни модели за програмиране.

Индексът за интелигентност на Artificial Analysis⁠(отваря се в нов прозорец) е среднопретеглена стойност от 10 оценки, проведени от външна страна: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Агентно кодиране

GPT‑5.5 е нашият най-мощен модел за агентно кодиране до момента. В Terminal-Bench 2.0, който тества сложни работни процеси от командния ред, изискващи планиране, итерации и координация между инструменти, се постига водещата в индустрията точност от 82,7%. В SWE-Bench Pro, който оценява решаването на реални проблеми в GitHub, той достига 58,6%, като решава повече задачи от край до край с едно преминаване в сравнение с предишните модели. В Expert-SWE, наш авангарден вътрешен еталон за оценка на дългосрочни задачи по кодиране с медианно оценено време за изпълнение от човек от 20 часа, GPT‑5.5 също превъзхожда GPT‑5.4.

Във всичките три оценки GPT‑5.5 подобрява резултатите на GPT‑5.4, като същевременно се използват по-малко токени.

Силните страни на модела в областта на програмирането се проявяват особено ясно в Codex, където той може да поема инженерни задачи, вариращи от имплементация и рефакториране до отстраняване на грешки, тестване и валидиране. Ранните тестове показват, че GPT‑5.5 се справя по-добре с поведението, от което зависи реалната инженерна работа, като запазване на контекста в рамките на големи системи, структурирано анализиране на нееднозначни грешки, проверка на хипотези с помощта на инструменти и прилагане на промени в цялата кодова база.

Визуализираната траектория използва векторни данни от NASA/JPL Horizons за „Орион“, Луната и Слънцето, като е приложено мащабиране на визуализацията с цел по-добра четимост.

Подкана: [attached image] Имплементирай това като ново приложение, като използваш WebGL и Vite с реални данни от мисията „Артемида II“. Увери се, че си тествал приложението обстойно, докато не стане напълно функционално и не изглежда като приложението на изображението. Обърни специално внимание на визуализацията на планетите и траекториите на полета. Искам да мога да взаимодействам с 3D визуализацията. Увери се, че приложението има реалистична орбитална механика.

Отвъд еталоните ранните тестери посочват, че GPT‑5.5 демонстрира по-силна способност да разбира структурата на системата: защо нещо не работи, къде трябва да се приложи корекцията и какво друго в кода би било засегнато.

„Това е първият модел за програмиране, който съм използвал и който се отличава със сериозна концептуална яснота.“

Дан Шипър, основател и главен изпълнителен директор на Every, описва GPT‑5.5 като „първия модел за програмиране, който съм използвал и който се отличава със сериозна концептуална яснота.“

След стартирането на приложението той прекарва дни в отстраняване на грешки, свързани с проблем след стартирането, преди да привлече един от най-добрите си инженери, за да пренапише част от системата. За да тества GPT‑5.5, той на практика върна времето назад: може ли моделът да анализира повреденото състояние и да предложи същия вид преработка, която инженерът в крайна сметка избра? GPT‑5.4 не се справи със задачата. GPT‑5.5 успя.

„Наистина имам усещането, че работя с по-висша интелигентност, и почти изпитвам чувство на уважение.“

Пиетро Ширано, главен изпълнителен директор на MagicPath, отбеляза подобна коренна промяна, когато GPT‑5.5 обединява клон със стотици промени в потребителския интерфейс и рефакториране с основен клон, който също е бил значително променен, като разрешава задачата от един опит за около 20 минути.

Старши инженери, които тестваха модела, заявяват, че GPT‑5.5 е значително по-силен от GPT‑5.4 и Claude Opus 4.7 по отношение на структурираното анализиране и автономността, като открива проблеми предварително и предвижда нуждите от тестване и преглед без изрично подканване. В конкретен случай инженер е поискал от модела да преработи архитектурата на система за коментари в съвместен markdown редактор и е получил стек от 12 diff-а, който е бил почти завършен. Други споделят, че са им били необходими изненадващо малко на брой корекции по имплементацията и са се чувствали по-уверени в плановете на GPT‑5.5 в сравнение с GPT‑5.4.

Един инженер в NVIDIA, който е имал ранен достъп до модела, стигна дотам да каже: „Загубата на достъп до GPT‑5.5 се усеща сякаш са ми ампутирали крайник.“

„GPT-5.5 е значително по-интелигентен и устойчив от GPT-5.4, с по-висока производителност при създаването на код и по-надеждно използване на инструментите. Той остава фокусиран върху задачата значително по-дълго, без да спира преждевременно, което е от най-голямо значение за сложните и продължителни задачи, които нашите потребители възлагат на Cursor.“

– Майкъл Труел, съосновател и главен изпълнителен директор на Cursor

Интелектуален труд

Същите предимства, които правят GPT‑5.5 толкова добър при кодирането, го правят мощен и за ежедневна работа на компютър. Тъй като моделът разбира по-добре намеренията, той може да преминава по-естествено през целия цикъл на работата със знания: намиране на информация, разбиране на това какво е важно, използване на инструменти, проверка на резултата и превръщане на суровия материал в нещо полезно.

В Codex GPT‑5.5 се справя по-добре от GPT‑5.4 при създаването на документи, електронни таблици и презентации. Алфа-тестерите отбелязват, че той превъзхожда предишните модели при задачи като оперативни изследвания, моделиране на електронни таблици и превръщане на неструктурирани бизнес входни данни в планове. В комбинация с уменията на Codex за работа с компютър, GPT‑5.5 ни доближава до усещането, че моделът действително може да използва компютъра заедно с Вас: като вижда какво има на екрана, щраква, въвежда текст, навигира в интерфейси и преминава между инструменти с прецизност.

Екипи в OpenAI вече използват тези предимства в реални работни процеси. Днес над 85% от служителите на компанията използват Codex всяка седмица в различните отдели, включително отделите за софтуерно инженерство, финанси, комуникации, маркетинг, наука за данните и продуктов мениджмънт. В отдела за комуникации екипът използва GPT‑5.5 в Codex, за да анализира данни за заявки за изказвания за период от шест месеца, да създаде рамка за оценка и риск и да валидира автоматизиран агент на Slack, така че заявките с нисък риск да се обработват автоматично, докато тези с по-висок риск да продължават да се препращат за преглед от човек. Във финансовия отдел екипът използва Codex за прегледа на 24 771 данъчни формуляра K-1 с общ обем от 71 637 страници чрез работен процес, който изключва лична информация и помага на екипа да изпълни задачата две седмици по-бързо в сравнение с предходната година. В екипа „Пускане на пазара“ един служител автоматизира създаването на седмични бизнес отчети, спестявайки 5-10 часа седмично.

В ChatGPT моделът GPT‑5.5 Thinking осигурява по-бърза помощ при по-трудни проблеми с по-интелигентни и по-кратки отговори, за да Ви помогне да се справяте по-ефективно с комплексна работа. Той се отличава в професионална работа като кодиране, изследвания, синтез и анализ на информация, както и задачи с много документи, особено при използване на плъгини.

В GPT‑5.5 Pro ранните тестери отчитат значително подобрение както в сложността, така и в качеството на задачите, които ChatGPT може да изпълнява, както и подобрения в забавянето, които го правят значително по-практичен за сложни задачи. Тестерите установяват, че в сравнение с GPT‑5.4 Pro, отговорите на GPT‑5.5 Pro са значително по-изчерпателни, по-добре структурирани, по-точни, по-приложими и по-полезни, с особено добри резултати в бизнеса, правото, образованието и науката за данни.

GPT‑5.5 постига водещи резултати в редица еталонни тестове, които отразяват този вид работа. На GDPval⁠⁠, която тества способностите на агентите да изпълняват добре конкретизиран интелектуален труд в 44 професии, GPT‑5.5 постига резултат от 84,9%. В OSWorld-Verified, който измерва дали моделът може самостоятелно да работи в реални компютърни среди, той постига резултат от 78,7%. А в Tau2-bench Telecom, който тества сложни работни процеси в обслужването на клиенти, той постига 98,0% без настройване на подканите. GPT‑5.5 се представя стабилно и в други еталонни тестове за задачи, свързани със знания: 60% на FinanceAgent, 88,5% на вътрешни задачи за моделиране в инвестиционното банкиране и 54,1% на OfficeQA Pro.

Tau2-bench Telecom е изпълнен без настройване на подкани (и с GPT‑4.1 като потребителски модел). GPT‑5.5 разбира намерението на задачата по-добре и е по-ефективен по отношение на токените от своите предшественици.

„GPT-5.5 осигурява устойчивата производителност, необходима за задачи с интензивно изпълнение. Разработен и хостван на системи NVIDIA GB200 NVL72, моделът позволява на нашите екипи да внедряват цялостни функционалности въз основа на подкани на естествен език, да съкращават времето за отстраняване на грешки от дни на часове и да превръщат седмици на експериментиране в напредък в сложни кодови бази за една нощ. Това е много повече от по-бързо кодиране – това е нов начин на работа, който помага на хората да работят с коренно различна скорост.“

– Джъстин Бойтано, вицепрезидент по корпоративен изкуствен интелект в NVIDIA

Научни изследвания

GPT‑5.5 показва подобрения и при научни и технически изследователски работни процеси, които изискват повече от простото отговаряне на труден въпрос. Изследователите трябва да проучват дадена идея, да събират доказателства, да тестват предположения, да интерпретират резултатите и да решават какво да опитат след това. GPT‑5.5 се справя по-добре с този цикъл в сравнение с останалите модели.

По-специално, GPT‑5.5 показва ясно подобрение спрямо GPT‑5.4 в GeneBench⁠(отваря се в нов прозорец), нова оценка, фокусирана върху многоетапен научен анализ на данни в генетиката и количествената биология. Тези проблеми изискват моделите да разсъждават върху потенциално двусмислени или съдържащи грешки данни с минимални насоки за надзор, да се справят с реалистични пречки като скрити смесващи фактори или неуспехи при контрола на качеството и правилно да прилагат и интерпретират съвременни статистически методи. Представянето на модела е впечатляващо предвид факта, че задачите тук често съответстват на многодневни проекти на научни експерти.

По същия начин, в BixBench⁠(отваря се в нов прозорец), еталон, проектиран около реални задачи по биоинформатика и анализ на данни, GPT‑5.5 постигна водеща производителност сред моделите с публикувани резултати. Научните възможности на модела вече са достатъчно мощни, за да могат значително да ускорят напредъка в авангардните области на биомедицинските изследвания като истински научен сътрудник.

В друг пример, вътрешна версия на GPT‑5.5 с персонализирана система помага за откриването на ново доказателство⁠(отваря се в нов прозорец) за числата на Рамзи, един от централните обекти в комбинаториката. Комбинаториката изучава как дискретните обекти се съчетават: графи, мрежи, множества и модели. Най-общо казано числата на Рамзи поставят въпроса колко голяма трябва да бъде една мрежа, преди да е гарантирано, че ще се появи някакъв ред. Резултатите в тази област са редки и често технически трудни. Тук GPT‑5.5 намери доказателство за дългогодишен асимптотичен факт относно недиагоналните числа на Рамзи, което по-късно беше проверено в Lean. Резултатът е конкретен пример за това как GPT‑5.5 допринася не само с код или обяснение, но и с изненадващ и полезен математически аргумент в основна изследователска област.

Ранните тестери използваха GPT‑5.5 Pro в ChatGPT не толкова като машина за еднократни отговори, а по-скоро като изследователски партньор: критикувайки ръкописи през множество прегледи, подлагайки технически аргументи на стрес тестове, предлагайки анализи и работейки с код, бележки и контекст от PDF файлове. Общото е, че GPT‑5.5 се справя по-добре с подпомагането на изследователите да преминават от въпроса към експеримента и накрая към резултата.

Дерия Унутмаз, професор по имунология и изследовател в Лабораторията за геномна медицина „Джаксън“, използва GPT‑5.5 Pro, за да анализира набор от данни за генна експресия с 62 проби и близо 28 000 гена, като създава подробен изследователски доклад, който не само обобщава резултатите, но и извежда на преден план ключови въпроси и изводи – работа, която според него би отнела на екипа му месеци.

Бартош Наскренцки, главен асистент по математика в Университета „Адам Мицкевич“ в Познан, Полша, използва GPT‑5.5 в Codex, за да създаде приложение по алгебрична геометрия от една-единствена подкана за 11 минути, визуализирайки пресичането на квадрични повърхнини и преобразувайки получената крива в модел на Вайерщрас.

След това разширява приложението с по-стабилна визуализация на сингулярностите и точни коефициенти, които могат да бъдат използвани повторно в бъдеща работа. За него по-голямата промяна е, че Codex вече може да помага за внедряването на персонализирани работни потоци за математическа визуализация и компютърна алгебра, за които преди са били необходими специализирани инструменти. Взети заедно, тези примери показват как GPT‑5.5 превръща експертните намерения в работещи изследователски инструменти и анализи.

Източник: Бартош Наскренцки⁠(отваря се в нов прозорец)

Подкана: # Пресичане на повърхнини в алгебричната геометрия

Създай приложение, което начертава две квадратични повърхнини и оцветява в червено кривата на пресичане. Използвай изчислителната теорема на Риман-Рох, за да преобразуваш резултата в крива на Вайерщрас.

## Главен прозорец

Две оцветени повърхности с леко прозрачно щриховане и висококачествено изобразяване се пресичат по червена алгебрична крива

Въртене с мишката в двете посоки, пълен механизъм за мащабиране чрез прищипване, хаптично натискане за показване на малко меню с плъзгачи за промяна на коефициентите на всяка повърхнина; засичане чрез Z-буферно ниво

## Десен страничен прозорец

Кратко уравнение на Вайерщрас (над Q или квадратично разширение на полето), изчислено по време на изпълнение чрез ефективни формули на теоремата на Риман-Рох

## Амбиентен режим, при който всички контроли са скрити и потребителят може да се наслади на красотата на формите

## Спецификации

Приложението работи в браузъра, с олекотена реализация и най-новите библиотеки за пълния стек, преносимо и готово за внедряване

## Документи

Git хранилище, дневник, план (Markdown файлове)

„Изключително вдъхновяващо е да използваме новия модел GPT-5.5 на OpenAI в нашата платформа, да го накараме да анализира огромни биохимични масиви от данни, за да прогнозира резултатите от лекарствата върху човека, и след това да наблюдаваме как постига значителни подобрения в точността при най-трудните ни оценки за откриване на лекарства. Ако OpenAI продължи да работи по този начин, до края на годината ще сме свидетели на промяна на основите на откриването на лекарства.“

– Брандън Уайт, съосновател и главен изпълнителен директор на Axiom Bio

Ефективност на инференса от следващо поколение

За да гарантираме работата на GPT‑5.5 със същото закъснение като това на GPT‑5.4, трябваше да преосмислим инференса като интегрирана система, а не като набор от изолирани оптимизации. GPT‑5.5 беше съвместно проектиран, обучен и използван на системи NVIDIA GB200 и GB300 NVL72. Codex и GPT‑5.5 бяха от ключово значение за постигането на нашите цели за производителност. Codex помогна на екипа да премине по-бързо от идеята към реализация, подлежаща на сравнителен анализ, като очертаваше подходи, организираше експерименти и помагаше да се определи кои оптимизации заслужават по-задълбочени инвестиции. GPT‑5.5 помогна за откриването и внедряването на ключови подобрения в самия стек. Най-просто казано, моделът помогна за подобряването на инфраструктурата, която го обслужва.

Едно от тези подобрения беше балансирането на натоварването и евристиките за партициониране. Преди GPT‑5.5 разделяхме заявките на ускорител на фиксиран брой сегменти, за да балансираме натоварването между изчислителните ядра, така че големи и малки заявки да могат да се изпълняват на един и същ GPU. Въпреки това предварително определеният брой статични сегменти не е оптимален за всички модели на трафика. За да използва по-ефективно GPU, Codex анализира модели на производствения трафик за период от няколко седмици и създаде персонализирани евристични алгоритми за оптимално разпределяне и балансиране на работата. Усилията имаха огромно въздействие, като увеличиха скоростта на генериране на токени с над 20%.

Напредък в киберсигурността за безопасността на всички

Подготвянето на света за модели, които са много добри в откриването и отстраняването на уязвимости в сигурността, е колективно усилие и ще изисква цялата екосистема да работи усилено за изграждане на устойчивост, като се осигури демократизиран достъп до модели и итеративно внедряване за следващата ера на киберзащитата⁠.

Авангардните модели стават все по-способни в областта на киберсигурността. Тези възможности ще станат широко разпространени и вярваме, че най-добрият път напред е да се уверим, че могат да бъдат използвани за ускоряване на киберзащитата и укрепване на екосистемата.

GPT‑5.5 е постепенна, но важна стъпка към изкуствен интелект, който може да решава някои от най-трудните предизвикателства в света, като например киберсигурността. С декемврийския GPT‑5.2 въведохме проактивно необходимите защитни мерки за киберсигурност⁠, за да ограничим потенциалните киберзлоупотреби с нашите модели. Сега с GPT‑5.5 внедряваме по-строги класификатори за потенциален киберриск, които някои потребители може първоначално да намират за досадни, докато ги настройваме с течение на времето.

От години определяме киберсигурността като категория в нашата Рамка за готовност⁠(отваря се в нов прозорец), тъй като моделите ни постепенно се усъвършенстват, докато разработваме и калибрираме мерки за смекчаване на риска поетапно, за да можем отговорно да пускаме модели със значими възможности в областта на киберсигурността.

Внедряваме водещи в индустрията защитни мерки за това ниво на кибер възможности. За първи път въведохме специализирани защитни мерки за киберсигурност с GPT‑5.2⁠(отваря се в нов прозорец) миналата година, които продължаваме да тестваме, усъвършенстваме и надграждаме в последващите внедрявания. За GPT‑5.5 разработихме по-строги механизми за контрол за дейности с по-висок риск, чувствителни заявки, свързани с киберсигурността, и добавихме допълнителни защити срещу повтаряща се злоупотреба. Широкият достъп е възможен благодарение на инвестициите ни в безопасността на модела, използването с удостоверяване и наблюдението за недопустима употреба. От месеци работим с външни експерти, за да разработим, тестваме и подобряваме устойчивостта на тези защитни мерки. С GPT‑5.5 гарантираме, че разработчиците могат лесно да защитават кода си, като същевременно въвеждаме по-строги механизми за контрол върху киберработните процеси, които най-вероятно ще бъдат използвани от злонамерени участници за причиняване на вреда.
Разширяваме достъпа, за да ускорим киберзащитата на всички нива. Предоставяме нашите модели чрез Доверен достъп за киберсигурност⁠, започвайки с Codex, който предлага разширен достъп до възможностите на GPT‑5.5 с по-малко ограничения за проверени потребители, отговарящи на определени сигнали за доверие⁠(отваря се в нов прозорец). Организациите, които отговарят за защитата на критична инфраструктура⁠, могат да кандидатстват за достъп до модели като GPT‑5.4‑Cyber, като спазват строги изисквания за сигурност за използването им за защита на вътрешните системи. Това предоставя по-мощни инструменти на широк кръг проверени специалисти по защита за легитимна работа в областта на сигурността с по-малко ненужни затруднения, за да гарантираме демократизиран достъп до важни възможности за защита. Потребителите могат да кандидатстват за доверен достъп на chatgpt.com/cyber⁠(отваря се в нов прозорец), за да намалят ненужните откази при използването на GPT‑5.5 за проверена защитна дейност.
Работим с партньори от правителството, за да помогнем за защитата на критичната инфраструктура в полза на обществото. Заедно проучваме как усъвършенстваният изкуствен интелект може да подпомогне защитната дейност, извършвана от доверени служители, които отговарят за системи, на които хората разчитат – от цифровите системи, които осигуряват сигурността на важни данни на данъкоплатците, до електроенергийната мрежа и водоснабдяването в местните общности.

Третираме способностите на GPT‑5.5 в областта на биологията/химията и киберсигурността като високи съгласно нашата рамка за готовност⁠(отваря се в нов прозорец). Макар GPT‑5.5 да не достига „критично“ ниво за способности в киберсигурността, нашите оценки и тестове показват, че неговите възможности в тази област са стъпка напред в сравнение с GPT‑5.4.

Освен това GPT‑5.5 премина през целия ни процес за безопасност и управление преди пускането му, включително оценки на готовността, тестване в конкретни области, нови целеви оценки за усъвършенствани способности в биологията и киберсигурността, както и задълбочено тестване с външни експерти. Споделяме повече подробности в картата на системата⁠(отваря се в нов прозорец) на GPT‑5.5.

Тази работа отразява нашия по-широк подход към устойчивостта на изкуствения интелект, който според нас е необходим с развитието на възможностите на модел. Искаме мощният изкуствен интелект да бъде достъпен за хората, които го използват за защита на системи, институции и обществеността. Реалистичният път е доверен достъп, строги предпазни мерки, които се разширяват заедно с възможностите, и оперативен капацитет за откриване и реагиране при сериозни злоупотреби.

Наличност и ценообразуване

В ChatGPT GPT‑5.5 Thinking е достъпен за потребителите на плановете Plus, Pro, Business и Enterprise. GPT‑5.5 Pro, създаден за още по-трудни въпроси и работа с по-висока точност, е достъпен за потребителите на плановете Pro, Business и Enterprise.

В Codex GPT‑5.5 е наличен за плановете Plus, Pro, Business, Enterprise, Edu и Go с контекстен прозорец от 400 000 токена. GPT‑5.5 се предлага и в режим Fast, като генерира токени 1,5 пъти по-бързо на 2,5 пъти по-висока цена.

За разработчиците на API, GPT‑5.5 скоро ще бъде достъпен в Responses API и API за завършване на чат на цена от 5 щатски долара за 1 млн. входящи токени и 30 щатски долара за 1 млн. изходящи токени, с контекстен прозорец от 1 млн. токена. Ценообразуването за Batch и Flex е налично на половината от стандартната тарифа за API, докато обработката в режим Priority е налична на 2,5 пъти стандартната тарифа за API. Ще пуснем GPT‑5.5‑pro и в API за още по-висока точност, на цена от 30 щатски долара за 1 млн. входни токена и 180 щатски долара за 1 млн. изходни токена. Вижте страницата с цените⁠ за подробна информация.

Въпреки че GPT‑5.5 е с по-висока цена от GPT‑5.4, той е както по-интелигентен, така и много по-ефективен по отношение на токените. В Codex внимателно оптимизирахме работата, така че GPT‑5.5 да постига по-добри резултати с по-малко токени от GPT‑5.4 за повечето потребители, като същевременно продължаваме да предлагаме щедри лимити за използване на всички абонаментни нива.

Оценки

Кодиране

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (публична версия) *	58,6%	57,7%	-	-	64,3%	54,2%
Terminal-Bench 2.0	82,7%	75,1%	-	-	69,4%	68,5%
Expert-SWE (вътрешен)	73,1%	68,5%	-	-	-	-

^*^{Лабораториите отбелязаха}^{доказателства за запаметяване}⁠(отваря се в нов прозорец)^{в тази оценка}

Професионално

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (победи или равенства)	84,9%	83,0%	82,3%	82,0%	80,3%	67,3%
FinanceAgent v1.1	60,0%	56,0%	-	61,5%	64,4%	59,7%
Задачи за моделиране в инвестиционното банкиране (Вътрешни)	88,5%	87,3%	88,6%	83,6%	-	-
OfficeQA Pro	54,1%	53,2%	-	-	43,6%	18,1%

Използване на компютър и зрение

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld-Verified	78,7%	75,0%	-	-	78.0%	-
MMMU Pro (без инструменти)	81,2%	81,2%	-	-	-	80,5%
MMMU Pro (с инструменти)	83,2%	82,1%	-	-	-	-

Използване на инструменти

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84,4%	82,7%	90,1%	89,3%	79,3%	85,9%
MCP Atlas**	75,3%	70,6%	-	-	79,1%	78,2%
Toolathlon	55,6%	54,6%	-	-	-	48,8%
Tau2-bench Telecom*** (оригинални подкани)	98,0%	92,8%	-	-	-	-

^{** MCP Atlas: резултати от Scale AI след последната актуализация от април 2026 г.
*** Tau2-bench telecom: резултати за 5.5 и 5.4 с оригиналните подкани, т.е. без коригиране на подканите. Изключва резултати от други лаборатории, които са оценени с коригиране на подканите.}

Академично

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25,0%	19,0%	33,2%	25,6%	-	-
FrontierMath ниво 1–3	51,7%	47,6%	52,4%	50,0%	43,8%	36,9%
FrontierMath ниво 4	35,4%	27,1%	39,6%	38,0%	22,9%	16,7%
BixBench	80,5%	74,0%	-	-	-	-
GPQA Diamond	93,6%	92,8%	-	94,4%	94,2%	94,3%
Последният изпит на човечеството (без инструменти)	41,4%	39,8%	43,1%	42,7%	46,9%	44,4%
„Последният изпит на човечеството“ (с инструменти)	52,2%	52,1%	57,2%	58,7%	54,7%	51,4%

Киберсигурност

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Задачи от предизвикателството „Capture-the-Flags“ (Вътрешно)****	88,1%	83,7%	-	-	-	-
CyberGym	81,8%	79,0%	-	-	73,1%	-

^{**** Разширение на най-трудните CTF задачи, използвани в карти на системата, с допълнителни сложни предизвикателства.}

Дълъг контекст

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k F1	73,7%	62,5%	-	-	76,9%	-
Graphwalks BFS 1mil F1	45,4%	9,4%	-	-	41,2% (Opus 4.6)	-
Graphwalks родители 256k F1	90,1%	82,8%	-	-	93,6%	-
Graphwalks родители 1mil F1	58,5%	44,4%	-	-	72,0% (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98,1%	97,3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93,0%	91,4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96,5%	97,2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90,0%	90,5%	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83,1%	86,0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87,5%	79,3%	-	-	59,2%	-
OpenAI MRCR v2 8-needle 256K-512K	81,5%	57,5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74,0%	36,6%	-	-	32,2%	-

Абстрактно разсъждаване

Оценка	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (Потвърдено)	95,0%	93,7%	-	94,5%	93,5%	98,0%
ARC-AGI-2 (Потвърдено)	85,0%	73,3%	-	83,3%	75,8%	77,1%

Оценките на GPT бяха направени с усилие за структурирано анализиране, зададено на xhigh, и бяха проведени в изследователска среда, което може да предостави леко различен резултат в сравнение с производствения ChatGPT в някои случаи.