Ажурирање од 24 април 2026: GPT‑5.5 и GPT‑5.5 Pro сега се достапни во API. Системска картичка исто така е ажурирана за да ги опише дополнителните заштитни мерки што се применуваат.
Го објавуваме GPT‑5.5, нашиот најпаметен и најинтуитивен модел за користење досега, и следниот чекор кон нов начин на завршување работа на компјутер.
GPT‑5.5 побрзо разбира што се обидуваш да направиш и може сам да заврши поголем дел од работата. Се истакнува во пишување и отстранување грешки во код, онлајн истражување, анализа на податоци, креирање документи и табеларни пресметки, работа со софтвер и движење низ алатки сè додека задачата не биде завршена. Наместо внимателно да управуваш со секој чекор, можеш да му дадеш на GPT‑5.5 неуредна, повеќеделна задача и да му веруваш дека ќе планира, користи алатки, ја проверува својата работа, се снаоѓа во двосмисленост и продолжува понатаму.
Подобрувањата се особено силни кај агентското кодирање, користењето компјутер, работа со знаење и раните научни истражувања - области каде што напредокот зависи од расудување со земање предвид на контекстот и преземање активности со текот на времето. GPT‑5.5 го носи ова унапредување во интелигенцијата без да ја жртвува брзината: поголемите и поспособни модели често се побавни за опслужување, но GPT‑5.5 се изедначува со латенцијата по токен на GPT‑5.4 во реална употреба, додека работи на многу повисоко ниво на интелигенција. Исто така, користи значително помалку токени за да ги заврши истите задачи во Codex, што го прави и поефикасен и поспособен.
Го објавуваме GPT‑5.5 со нашиот најсилен сет на заштитни мерки досега, дизајниран да ја намали злоупотребата, а притоа да го зачува пристапот за корисна работа. Го оценивме овој модел во рамките на нашиот целосен пакет рамки за безбедност и подготвеност, работевме со членови на внатрешни и надворешни тимови за симулација на напади (ред тим), додадовме насочено тестирање за напредните способности во сајбербезбедноста и биологијата, и собравме повратни информации за реални случаи на употреба од речиси 200 доверливи партнери со ран пристап пред објавувањето.
Денес, GPT‑5.5 се воведува за корисниците на Plus, Pro, Business и Enterprise во ChatGPT и Codex, а GPT‑5.5 Pro се воведува за корисниците на Pro, Business и Enterprise во ChatGPT. Имплементациите на API бараат различни заштитни мерки. Тесно соработуваме со партнерите и клиентите за да ги исполниме барањата за безбедност и сигурност при негово обезбедување во голем обем. Наскоро ќе ги воведеме GPT‑5.5 и GPT‑5.5 Pro во API.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82,7 % | 75,1% | - | - | 69,4 % | 68,5 % |
Експерт-SWE (внатрешен) | 73,1 % | 68,5 % | - | - | - | - |
GDPval (победи или нерешени резултати) | 84,9 % | 83,0 % | 82,3 % | 82,0 % | 80,3% | 67,3 % |
OSWorld Verified | 78,7 % | 75.0% | - | - | 78,0 % | - |
Toolathlon | 55,6% | 54,6 % | - | - | - | 48,8 % |
BrowseComp | 84,4 % | 82,7 % | 90,1 % | 89,3% | 79,3% | 85,9 % |
FrontierMath Ниво 1-3 | 51,7 % | 47,6 % | 52,4 % | 50,0 % | 43,8 % | 36,9 % |
FrontierMath Ниво 4 | 35,4 % | 27,1 % | 39,6 % | 38,0% | 22,9 % | 16,7 % |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
OpenAI ја гради глобалната инфраструктура за агентска вештачка интелигенција, овозможувајќи им на луѓето и компаниите ширум светот да ја завршуваат својата работа со помош на вештачка интелигенција. Во текот на изминатата година, забележавме дека вештачката интелигенција значително го забрза развојот на софтверското инженерство. Со GPT‑5.5 во Codex и ChatGPT, таа иста трансформација почнува да се проширува и во научните истражувања и пошироката работа што луѓето ја вршат на компјутерите.
Во сите овие домени, GPT‑5.5 не е само поинтелигентен; тој е и поефикасен во начинот на кој ги обработува проблемите, често постигнувајќи поквалитетни резултати со помалку токени и помалку повторни обиди. На индексот за кодирање на Artificial Analysis, GPT‑5.5 обезбедува најсовремена интелигенција по половина од цената на конкурентните гранични модели за кодирање.
Artificial Analysis Intelligence Index(се отвора во нов прозорец) е пондериран просек од 10 евалуации спроведени од надворешна страна: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 е нашиот најмоќен модел на агентско кодирање досега. На Terminal-Bench 2.0, кој тестира сложени работни текови на командна линија што бараат планирање, повторување и координација на алатки, постигнува најсовремена точност од 82.7%. На SWE-Bench Pro, кој ја оценува способноста за решавање GitHub issues од реалниот свет, достигнува 58,6%, решавајќи повеќе задачи од почеток до крај во едно извршување од претходните модели. На Expert-SWE, нашата интерна гранична евалуација за долгорочни задачи за кодирање со медијално проценето време за завршување од страна на човек од 20 часа, GPT‑5.5 исто така го надминува GPT‑5.4.
Низ сите три евалуации, GPT‑5.5 го подобрува напредокот на резултатите на GPT‑5.4 со користење помалку токени.
Силните страни на моделот во кодирањето особено јасно се гледаат во Codex, каде што може да преземе инженерска работа што опфаќа сè, од имплементација и рефакторирање до отстранување грешки, тестирање и валидација. Раното тестирање укажува дека GPT‑5.5 е подобар во однесувањата од кои зависи вистинската инженерска работа, како одржување контекст низ големи системи, расудување низ нејасни неуспеси, проверка на претпоставките со алатки и спроведување на промените низ околната база на код.
Прикажаната траекторија користи векторски податоци од NASA/JPL Horizons за Orion, Месечината и Сонцето, со применето скалирање на приказот за подобра читливост.
Промпт: [приложената слика] Имплементирај го ова како нова апликација користејќи webgl и vite со вистински податоци од мисијата Artemis II. Погрижи се темелно да ја тестираш апликацијата додека не биде целосно функционална и да изгледа како апликацијата на сликата. Обрни особено внимание на рендерирањето на планетите и патеките на летот. Сакам да можам да комуницирам со 3D-рендерот. Погрижи се да има реалистична орбитална механика.
Покрај реперите, првите тестери рекоа дека GPT‑5.5 покажува посилна способност да ја разбере структурата на еден систем: зошто нешто не успева, каде треба да се примени поправката и што друго во кодната база би било засегнато.

„Првиот модел за кодирање што сум го користел и што има сериозна концептуална јасност.“
Ден Шипер, основач и главен извршен директор на Every, го опиша GPT‑5.5 како „првиот модел за кодирање што сум го користел и кој има сериозна концептуална јасност.“
Откако лансираше апликација, тој помина денови дебагирајќи проблем по лансирањето пред да вклучи еден од своите најдобри инженери да преработи дел од системот. За да го тестира GPT‑5.5, тој ефективно го врати времето наназад: дали моделот може да ја погледне расипаната состојба и да произведе истиот вид преработка за која инженерот на крајот се одлучи? GPT‑5.4 не можеше. GPT‑5.5 можеше.

„Навистина имам чувство дека работам со повисока интелигенција, и речиси постои чувство на почит.“
Pietro Schirano, извршен директор на MagicPath, забележа сличен значителен исчекор кога GPT‑5.5 спои гранка со стотици промени во фронтендот и рефакторирањето во главна гранка што исто така беше значително променета, завршувајќи ја таа работа со промпт со еден пример за околу 20 минути.
Искусни инженери што го тестираа моделот рекоа дека GPT‑5.5 е забележливо посилен од GPT‑5.4 и Claude Opus 4.7 во расудување и автономија, дека однапред открива проблеми и ги предвидува потребите за тестирање и ревизија без изречно да му се побара. Во еден случај, инженер побара моделот да ја преработи архитектурата на систем за коментари во заеднички Markdown-уредувач и, кога се врати, го дочека стек од 12 разлики (diff) што беше речиси целосно готов. Други рекоа дека им биле потребни изненадувачки малку корекции при имплементацијата и дека имале поголема доверба во плановите на GPT‑5.5 во споредба со GPT‑5.4.
Еден инженер во NVIDIA кој имал ран пристап до моделот отиде дотаму што рече: „Губењето пристап до GPT‑5.5 е како да сум изгубил екстремитет.“
„GPT-5.5 е забележливо попаметен и поупорен од GPT-5.4, со посилни перформанси при кодирање и посигурна употреба на алатките. Останува фокусиран на задачата значително подолго без да запре предвреме, што е најважно за сложената, долготрајна работа што нашите корисници му ја делегираат на Cursor.”
Истите предности што го прават GPT‑5.5 одличен во програмирање, исто така го прават моќен и за секојдневна работа на компјутер. Бидејќи моделот е подобар во разбирањето на намерата, тој може поприродно да се движи низ целиот циклус на работа со знаење: пронаоѓање информации, разбирање што е важно, користење алатки, проверка на резултатите и претворање на суров материјал во нешто корисно.
Во Codex, GPT‑5.5 е подобар од GPT‑5.4 во создавање документи, табели и презентации со слајдови. Алфа тестерите рекоа дека ги надминува претходните модели во задачи како оперативни истражувања, моделирање табели и претворање неуредни деловни податоци во планови. Кога ќе се комбинира со способностите на Codex за користење компјутер, GPT‑5.5 нè доближува до чувството дека модел може навистина да го користи компјутерот заедно со вас: да гледа што има на екранот, да кликнува, да пишува, да се движи низ интерфејси и прецизно да преминува меѓу алатки.
Тимовите во OpenAI веќе ги користат овие предности во реални работни текови. Денес, повеќе од 85% од компанијата го користи Codex секоја недела во различни функции, вклучувајќи софтверско инженерство, финансии, комуникации, маркетинг, наука за податоци и управување со производи. Во комуникации, тимот го користеше GPT‑5.5 во Codex за да анализира податоци од шест месеци за барања за говорни ангажмани, да изгради рамка за бодување и ризик и да валидира автоматизиран агент во Slack, за барањата со низок ризик да може да се обработуваат автоматски, додека барањата со повисок ризик и понатаму се насочуваат кон човечка проверка. Во секторот за финансии, тимот го користеше Codex за да прегледа 24.771 даночни формулари K-1 со вкупно 71.637 страници, користејќи работен тек што исклучуваше лични информации и му помогна на тимот да ја заврши задачата две недели побрзо во споредба со претходната година. Во тимот за пласман на пазарот, еден вработен го автоматизираше генерирањето неделни деловни извештаи, заштедувајќи 5–10 часа неделно.
Во ChatGPT, GPT‑5.5 Thinking овозможува побрза помош за потешки проблеми, со попаметни и поконцизни одговори за да ти помогне поефикасно да се справуваш со сложена работа. Одличен е во професионална работа како кодирање, истражување, синтеза и анализа на информации и задачи со многу документи, особено при користење приклучоци.
Во GPT‑5.5 Pro, првите тестери забележуваат значително унапредување и во сложеноста и во квалитетот на работата што ChatGPT може да ја преземе, со подобрувања во латенцијата што го прават многу попрактичен за захтевни задачи. Во споредба со GPT‑5.4 Pro, тестерите утврдија дека одговорите на GPT‑5.5 Pro се значително сеопфатни, добро структурирани, точни, релевантни и корисни, со особено силни перформанси во бизнисот, правото, образованието и науката за податоци.
GPT‑5.5 постигнува врвни перформанси на повеќе репери кои го одразуваат овој вид на работа. На GDPval, евалуација која ги тестира способностите на агентите да произведуваат добро специфицирана работа со знаење низ 44 професии, GPT‑5.5 постигнува 84,9 %. На OSWorld-Verified, што мери дали еден модел може самостојно да управува со реални компјутерски околини, достигнува 78,7 %. И на Tau2-bench Telecom, кој тестира сложени работни текови за услуги на клиентите, достигнува 98,0 % без прилагодување на промптот. GPT‑5.5 исто така покажува силни резултати и на други репери за работа со знаење: 60,0 % на FinanceAgent, 88,5 % на интерни задачи за моделирање за инвестициско банкарство и 54,1 % на OfficeQA Pro.
Tau2-bench Telecom беше извршен без прецизирање на промптот (и со GPT‑4.1 како кориснички модел). GPT‑5.5 подобро ја разбира намерата на задачата и е поефикасен во користењето на токените од своите претходници.
„GPT-5.5 обезбедува одржливи перформанси потребни за работа што бара интензивно извршување. Изграден и извршуван на системите NVIDIA GB200 NVL72, моделот им овозможува на нашите тимови да испорачуваат функционалности од почеток до крај од промпт на природен јазик, да го скратат времето за отстранување грешки од денови на часови и да претворат повеќенеделно експериментирање во напредок преку ноќ во сложени кодни бази. Тоа е повеќе од само побрзо кодирање - тоа е нов начин на работа што им помага на луѓето да работат со суштински поинакво темпо.“
GPT‑5.5 исто така покажува напредок во научните и техничките истражувачки процеси, кои бараат повеќе од само одговор на тешко прашање. Истражувачите треба да истражат идеја, да соберат докази, да ги тестираат претпоставките, да ги толкуваат резултатите и да одлучат што да направат следно. GPT‑5.5 е подобар во истрајноста низ тој циклус во споредба со другите модели.
Забележително, GPT‑5.5 покажува јасно подобрување во однос на GPT‑5.4 на GeneBench(се отвора во нов прозорец), нова евалуација фокусирана на повеќестепена научна анализа на податоци во генетика и квантитативна биологија. Овие проблеми бараат моделите да расудуваат за потенцијално двосмислени или погрешни податоци со минимални супервизорски насоки, да се справуваат со реални пречки како што се скриени збунувачки фактори или неуспеси во контролата на квалитетот и правилно да ги имплементираат и толкуваат современите статистички методи. Изведбата на моделот е впечатлива ако се има предвид дека задачите тука често одговараат на повеќедневни проекти за научни експерти.
Слично, на BixBench(се отвора во нов прозорец), репер дизајниран за биоинформатика и анализа на податоци од реалниот свет, GPT‑5.5 постигна водечки перформанси меѓу моделите со објавени резултати. Научните способности на моделот сега се доволно силни за значајно да го забрзаат напредокот на најсовремените граници на биомедицинските истражувања како вистински сонаучник.
Во еден друг пример, внатрешна верзија на GPT‑5.5 со сопствена тест-рамка помогна да се открие нов доказ(се отвора во нов прозорец) за Ремзиеви броеви, еден од централните објекти во комбинаториката. Комбинаториката проучува како дискретните објекти се вклопуваат меѓусебно: графи, мрежи, множества и обрасци. Ремзиевите броеви, грубо кажано, одговараат на прашањето колку голема треба да биде една мрежа пред да биде загарантирано дека ќе се појави некаков ред. Резултатите во оваа област се ретки и често технички многу сложени. Тука GPT‑5.5 пронајде доказ за одамна познат асимптотски факт за вондијагоналните Ремзиеви броеви, кој подоцна беше потврден во Lean. Резултатот е конкретен пример дека GPT‑5.5 придонесува не само со код или објаснување, туку и со изненадувачки и корисен математички аргумент во клучна истражувачка област.
Првите тестери го користеа GPT‑5.5 Pro во ChatGPT не толку како машина за одговори од типот „промпт со еден пример“, туку повеќе како партнер за истражување: критикувајќи ракописи низ повеќе итерации, тестирајќи ја издржливоста на технички аргументи, предлагајќи анализи и работејќи со код, белешки и контекст од PDF-датотеки. Заедничката нишка е дека GPT‑5.5 е подобар во тоа да им помага на истражувачите да преминат од прашање до експеримент до резултат.
Дерја Унутмаз, професор по имунологија и истражувач во Лабораторијата за геномска медицина „Џексон“, го користеше GPT‑5.5 Pro за да анализира збир на податоци за експресија на гени со 62 примероци и речиси 28.000 гени, создавајќи детален истражувачки извештај што не само што ги сумираше наодите, туку и ги истакна клучните прашања и сознанија - работа за која, според него, на неговиот тим би му биле потребни месеци.
Бартош Накрецки, доцент по математика на Универзитетот „Адам Мицкевич“ во Познањ, Полска, го користеше GPT‑5.5 во Codex за да изгради апликација за алгебарска геометрија од еден промпт за 11 минути, визуелизирајќи го пресекот на квадратни површини и претворајќи ја добиената крива во Вајерштрасов модел.
Подоцна ја прошири апликацијата со постабилна визуелизација на сингуларност и точни коефициенти што може повторно да се користат во понатамошна работа. За него, поголемата промена е тоа што Codex сега може да помогне во имплементацијата на прилагодени работни текови за математичка визуелизација и компјутерска алгебра, за кои претходно беа потребни посебни алатки. Земени заедно, овие примери покажуваат како GPT‑5.5 ја претвора експертската намера во функционални алатки за истражување и анализи.

Кредит: Бартош Накрецки(се отвора во нов прозорец)
Промпт: бр. Пресек на површини во алгебарска геометрија
Направи апликација што исцртува две квадратни површини и ја обојува со црвена боја кривата на пресек. Користи компјутациска Риман-Рохова теорема за да го претвориш ова во Вајерштрасова крива.
## Главен прозорец
Две обоени површини со малку проѕирно засенчување и висококвалитетно рендерирање се пресекуваат по црвена алгебарска линија
Ротација со глувчето во двете насоки, целосен механизам за зумирање со штипнување, хаптички притисок за прикажување на малото мени со лизгачи за менување на коефициентите на секоја површина; детекција преку нивото на Z-buffer
## Десен страничен прозорец
Кратка Вајерштрасова равенка (над Q или квадратно проширување на поле), пресметана во тек преку формули од ефективната теорема на Риман–Рох
## Амбиентален режим каде што сите контроли се скриени и корисникот може да ужива во убавината на формите
## Спецификации
Апликацијата работи во прелистувачот, лесна имплементација со најнови библиотеки за целата стак-архитектура, пренослива, подготвена за воведување
## Документи
Git репозиториум, дневник, план (Markdown фајлови)
„Неверојатно е мотивирачки да го користиме новиот GPT-5.5 модел на OpenAI во нашата платформа, да анализира огромни биохемиски збирки на податоци за да ги предвиди исходите од лековите кај луѓето, а потоа да видиме како испорачува значителни подобрувања во точноста на нашите најтешки евалуации за откривање лекови. Ако OpenAI продолжи со вакво темпо, темелите на откривањето лекови ќе се променат до крајот на годината.“
Испорачувањето на GPT‑5.5 со латенција на GPT‑5.4 бараше преосмислување на инференцијата како интегриран систем, а не како збир од изолирани оптимизации. GPT‑5.5 беше кодизајниран, обучуван и извршуван на системите NVIDIA GB200 и GB300 NVL72. Codex и GPT‑5.5 беа клучни за тоа како ги постигнавме нашите цели за перформанси. Codex му помогна на тимот побрзо да премине од идеја до имплементација што може да се споредува со одредници, преку скицирање пристапи, поврзување експерименти и помош при утврдување кои оптимизации вредеа за подлабоко вложување. GPT‑5.5 помогна да се идентификуваат и имплементираат клучни подобрувања во самиот стек. Поедноставно кажано, моделот помогна да се подобри инфраструктурата што го опслужува.
Едно такво подобрување беше балансирањето на оптоварувањето и хеуристиките за поделба. Пред GPT‑5.5, ги делевме барањата на акцелератор на фиксен број делови за да ја балансираме работата низ пресметковните јадра, осигурувајќи дека и големите и малите барања можеа да се извршуваат на истиот GPU. Сепак, однапред утврден број на статични сегменти не е оптимален за сите форми на сообраќај. За подобро искористување на GPU, Codex анализираше обрасци на продукциски сообраќај од повеќе недели и напиша сопствени хеуристички алгоритми за оптимално распределување и балансирање на работата. Овој напор имаше значително влијание, зголемувајќи ја брзината на генерирање на токени за над 20 %.
Подготвувањето на светот за модели што се многу добри во пронаоѓање и закрпување на безбедносни ранливости е тимски напор и ќе бара целиот екосистем да работи напорно за да изгради отпорност, со демократизиран пристап до моделите и итеративно распоредување за следната ера на сајбер-одбраната.
Граничните модели стануваат сè поспособни во сајбербезбедноста. Тие способности ќе станат широко распространети и веруваме дека најдобриот пат напред е да се осигураме дека можат да се стават во употреба за забрзување на компјутерската одбрана и зајакнување на екосистемот.
GPT‑5.5 е постепен, но важен чекор кон вештачка интелигенција што може да решава некои од најтешките светски предизвици, како сајбербезбедноста. Со GPT‑5.2 во декември, проактивно ги воведовме неопходните сајберзаштитни мерки за да ја ограничиме можната злоупотреба на сајберпросторот со нашите модели; сега, со GPT‑5.5, воведуваме построги класификатори за потенцијални сајберризици, што на некои корисници можеби првично ќе им пречи, додека ги усовршуваме со текот на времето.
Со години ја имаме идентификувано сајбербезбедноста како категорија во нашата Рамка за подготвеност(се отвора во нов прозорец), додека нашите модели постепено се подобруваа, а ние итеративно развивавме и калибриравме мерки за ублажување, за да можеме одговорно да објавуваме модели со значајни способности за сајбербезбедност.
- Воведуваме водечки заштитни мерки во индустријата за ова ниво на сајберспособности. Првпат воведовме сајберзаштитни мерки со GPT‑5.2(се отвора во нов прозорец) минатата година, кои продолживме да ги тестираме, усовршуваме и надградуваме во последователните распоредувања. За GPT‑5.5, дизајниравме построги контроли околу активности со повисок ризик, чувствителни сајбер барања и дополнителни заштити од повторена злоупотреба. Широкиот пристап е овозможен преку нашите инвестиции во безбедноста на модел, автентицирана употреба и следење на недозволена употреба. Со месеци работиме со надворешни експерти за да ја развиеме, тестираме и унапредуваме робусноста на овие заштитни мерки. Со GPT‑5.5, обезбедуваме програмерите лесно да го обезбедат својот код, додека воведуваме построги контроли врз сајбер работните процеси кои најверојатно би можеле да бидат злоупотребени од злонамерни актери за предизвикување штета.
- Го прошируваме пристапот за да ја забрзаме сајберодбраната на секое ниво. Нашите модели со дозволен пристап за сајбер активности се достапни преку Доверлив пристап за сајбер, почнувајќи со Codex, кој овозможува проширен пристап до напредните способности за сајбербезбедност на GPT‑5.5 со помалку ограничувања за проверени корисници што исполнуваат одредени сигнали за доверба(се отвора во нов прозорец) при лансирањето. Организациите што се одговорни за одбрана на критичната инфраструктура можат да аплицираат за пристап до модели со дозволен пристап за сајбер активности, како што е GPT‑5.4‑Cyber, притоа исполнувајќи строги безбедносни барања за да ги користат овие модели за обезбедување на нивните внатрешни системи. Ова им дава на широк опсег проверени бранители поспособни алатки за легитимна безбедносна работа со помалку непотребни пречки, за да се осигуриме дека го демократизираме пристапот до важни одбранбени способности. Корисниците можат да аплицираат за доверлив пристап на chatgpt.com/cyber(се отвора во нов прозорец) за да ги намалат непотребните одбивања додека го користат GPT‑5.5 за проверена одбранбена работа.
- Работиме со владини партнери за да помогнеме во заштитата на критичната инфраструктура за јавноста. Заедно, истражуваме како напредната вештачка интелигенција може да ја поддржи одбранбената работа на доверливи службени лица одговорни за системите од кои луѓето зависат, од дигиталните системи што ги штитат важните податоци на даночните обврзници до електроенергетската мрежа и водоснабдувањето во локалните заедници.
Ги третираме биолошките/хемиските и сајбербезбедносните способности на GPT‑5.5 како високи според нашата Рамка за подготвеност(се отвора во нов прозорец). Иако GPT‑5.5 не достигна критично ниво на способност за сајбербезбедност, нашите проценки и тестирања покажаа дека неговите способности за сајбербезбедност претставуваат чекор напред во споредба со GPT‑5.4.
Дополнително, GPT‑5.5 помина низ нашиот целосен процес за безбедност и управување пред објавувањето, вклучувајќи проценки на подготвеноста, тестирање специфично за доменот, нови насочени евалуации за напредните способности во биологијата и сајбер-безбедноста и темелно тестирање со надворешни експерти. Споделуваме повеќе детали во системска картичка GPT‑5.5(се отвора во нов прозорец).
Оваа работа го одразува нашиот поширок пристап кон отпорноста на вештачката интелигенција, за кој веруваме дека е потребен како што напредува способноста на модел. Сакаме моќната вештачка интелигенција да биде достапна за луѓето кои ја користат за заштита на системите, институциите и јавноста. Одржливиот пат е доверлив пристап, цврсти заштитни мерки што се прилагодуваат на зголемените способности и оперативен капацитет за откривање и одговор на сериозна злоупотреба.
Денес, GPT‑5.5 се воведува за корисниците на Plus, Pro, Business и Enterprise во ChatGPT и Codex, а GPT‑5.5 Pro се воведува за корисниците на Pro, Business и Enterprise во ChatGPT. Наскоро ќе ги воведеме GPT‑5.5 и GPT‑5.5 Pro во API.
Во ChatGPT, GPT‑5.5 Thinking е достапно за корисниците на ChatGPT Plus, Pro, Business и Enterprise. GPT‑5.5 Pro, дизајниран за уште потешки прашања и попрецизна работа, е достапен за корисниците на Pro, Business и Enterprise.
Во Codex, GPT‑5.5 е достапен за плановите Plus, Pro, Business, Enterprise, Edu и Go со контекстен прозорец од 400 илјади. GPT‑5.5 е исто така достапен во режим Fast, генерирајќи токени 1,5 пати побрзо по 2,5 пати повисока цена.
За API развивачи, gpt-5.5 наскоро ќе биде достапен во Responses API и API за завршување на разговори по цена од $5 за 1 милион влезни токени и $30 за 1 милиони излезни токени, со контекстен прозорец од 1 милион. Цените за Batch и Flex се достапни по половина од стандардната API тарифа, додека Приоритетната обработка е достапна по 2,5 пати од стандардната тарифа. Исто така, ќе го објавиме gpt-5.5-pro во API за уште поголема точност, по цена од $30 за 1 милион токени за внесување и $180 за 1 милион токени за резултат. Погледни ја страницата со цени за целосни детали.
Иако GPT‑5.5 има повисока цена од GPT‑5.4, тој е и поинтелигентен и многу поефикасен во користењето на токени. Во Codex, внимателно го прилагодивме корисничкото искуство така што GPT‑5.5 испорачува подобри резултати со помалку токени од GPT‑5.4 за повеќето корисници, истовремено продолжувајќи да нудиме дарежлива употреба на сите нивоа на претплата.
Coding
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (јавен) * | 58,6 % | 57,7 % | - | - | 64,3 % | 54,2 % |
Terminal-Bench 2.0 | 82,7 % | 75,1% | - | - | 69,4 % | 68,5 % |
Експерт-SWE (внатрешен) | 73,1 % | 68,5 % | - | - | - | - |
*Лабораториите забележале докази за запомнување(се отвора во нов прозорец) на оваа проценка
Професионално
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (победи или нерешени резултати) | 84,9 % | 83,0 % | 82,3 % | 82,0 % | 80,3% | 67,3 % |
FinanceAgent v1.1 | 60,0 % | 56,0% | - | 61,5% | 64,4 % | 59,7 % |
Задачи за моделирање за инвестициско банкарство (Интерно) | 88,5 % | 87,3% | 88,6 % | 83,6 % | - | - |
OfficeQA Pro | 54,1 % | 53,2 % | - | - | 43,6 % | 18,1 % |
Користење компјутер и визија
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld Verified | 78,7 % | 75.0% | - | - | 78,0 % | - |
MMMU Pro (без алатки) | 81,2 % | 81,2 % | - | - | - | 80,5 % |
MMMU Pro (со алатки) | 83,2 % | 82,1 % | - | - | - | - |
Употреба на алатки
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84,4 % | 82,7 % | 90,1 % | 89,3% | 79,3% | 85,9 % |
MCP Atlas** | 75,3 % | 70,6 % | - | - | 79,1 % | 78,2 % |
Toolathlon | 55,6% | 54,6 % | - | - | - | 48,8 % |
Tau2-bench Telecom*** | 98,0 % | 92,8% | - | - | - | - |
** MCP Atlas: резултати од Scale AI по најновото ажурирање од април 2026 година.
*** Tau2-bench Telecom: резултати за 5.5 и 5.4 со оригинален промпт, т.е. без прилагодување на промптот. Ова ги изоставува резултатите од други лаборатории што беа евалуирани со прилагодувања на промптот.
Академско
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25,0 % | 19,0 % | 33,2 % | 25,6 % | - | - |
FrontierMath Ниво 1-3 | 51,7 % | 47,6 % | 52,4 % | 50,0 % | 43,8 % | 36,9 % |
FrontierMath Ниво 4 | 35,4 % | 27,1 % | 39,6 % | 38,0% | 22,9 % | 16,7 % |
BixBench | 80,5 % | 74,0 % | - | - | - | - |
GPQA Diamond | 93,6 % | 92,8% | - | 94,4 % | 94,2 % | 94,3 % |
Последниот испит на човештвото (без алатки) | 41,4 % | 39,8 % | 43,1 % | 42,7 % | 46,9 % | 44,4 % |
Последниот испит на човештвото (со алатки) | 52,2 % | 52,1% | 57,2 % | 58,7 % | 54,7 % | 51,4 % |
Сајбербезбедност
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Задачи за предизвици Capture-the-Flag (внатрешно) | 88,1% | 83,7 % | - | - | - | - |
CyberGym | 81,8 % | 79,0 % | - | - | 73,1 % | - |
**** Проширување на најтешките CTF задачи што се користат во системски картички со дополнителни тешки предизвици.
Долг контекст
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks bfs 256k f1 | 73,7% | 62,5 % | - | - | 76,9 % | - |
Graphwalks BFS 1 милион f1 | 45,4 % | 9,4 % | - | - | 41,2 % (Opus 4.6) | - |
Graphwalks надредени 256 илјади f1 | 90,1 % | 82,8 % | - | - | 93,6 % | - |
Graphwalks надредени 1 милион f1 | 58,5 % | 44,4 % | - | - | 72,0 % (Opus 4.6) | - |
OpenAI MRCR v2 8 игли 4–8 илјади | 98,1 % | 97,3% | - | - | - | - |
OpenAI MRCR v2 8 игли 8–16 илјади | 93,0 % | 91,4 % | - | - | - | - |
OpenAI MRCR v2 8 игли 16 илјади – 32 илјади | 96,5 % | 97,2 % | - | - | - | - |
OpenAI MRCR v2 8 игли 32 илјади – 64 илјади | 90,0% | 90,5 % | - | - | - | - |
OpenAI MRCR v2 8 игли 64–128 илјади | 83,1 % | 86,0 % | - | - | - | - |
OpenAI MRCR v2 8-игли 128 илјади – 256 илјади | 87,5 % | 79,3% | - | - | 59,2 % | - |
OpenAI MRCR v2 8-игли 256 илјади – 512 илјади | 81,5% | 57,5 % | - | - | - | - |
OpenAI MRCR v2 8 игли 512 илјади - 1 милион | 74,0 % | 36,6 % | - | - | 32,2 % | - |
Апстрактно расудување
Проценка | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (потврдено) | 95,0 % | 93,7 % | - | 94,5 % | 93,5 % | 98,0 % |
ARC-AGI-2 (потврдено) | 85,0 % | 73,3 % | - | 83,3 % | 75,8 % | 77,1 % |
Евалуациите на GPT беа спроведени со напор за расудување поставен на xhigh и беа извршени во истражувачка средина, што може да резултира со малку поинаков излез од производната верзија на ChatGPT во одредени случаи.








