Представяме нов модел, който отключва още повече от възможностите на Codex: GPT‑5.3‑Codex, най-способният модел за агентно кодиране досега. Моделът подобрява както авангардната производителност на GPT‑5.2‑Codex в кодирането, така и възможностите за структурирано анализиране и професионални знания на GPT‑5.2, обединени в един модел, който е също така с 25% по-бърз. Това му дава възможност да се заеме с дългосрочни задачи, които включват изследвания, използване на инструменти и сложно изпълнение. Подобно на колега, Вие можете да насочвате и взаимодействате с GPT‑5.3‑Codex, докато работи, без да губите контекста.
GPT‑5.3‑Codex е нашият първи модел, който изигра ключова роля в създаването на самия себе си. Екипът на Codex използваше ранни версии, за да отстранява грешки в собственото си обучение, да управлява собственото си внедряване и да диагностицира резултатите от тестове и оценките — нашият екип беше поразен от това колко много Codex успя да ускори собственото си развитие.
С GPT‑5.3‑Codex, Codex се превръща от агент, който може да пише и преглежда код, в агент, който може да прави почти всичко, което разработчиците и професионалистите могат да правят на компютър.
GPT‑5.3‑Codex поставя нов най-висок стандарт в индустрията на SWE-Bench Pro и Terminal-Bench и показва силно представяне на OSWorld и GDPval, четири бенчмарка, които използваме, за да измерваме възможностите за кодиране, работа с агенти и работа в реални условия.
GPT‑5.3‑Codex постига водещи резултати в SWE-Bench Pro, строга оценка на софтуерното инженерство в реални условия. Докато SWE‑bench Verified тества само Python, SWE‑Bench Pro обхваща четири езика и е по-устойчив на замърсяване, по-предизвикателен, по-разнообразен и по-значим за индустрията. Това също така значително надхвърля предишните най-съвременни резултати на Terminal-Bench 2.0, който измерва уменията за работа с терминал, от които се нуждае агент за кодиране като Codex. По-специално, GPT‑5.3‑Codex прави това с по-малко токени от всеки предишен модел, което позволява на потребителите да създават повече.
Съчетаването на възможности за кодиране от най-висок клас, подобрения в естетиката и компактността води до модел, който може да извършва впечатляваща работа, изграждайки от нулата изключително функционални и сложни игри и приложения в рамките на няколко дни. За да тестваме възможностите на модела за уеб разработка и дългосрочни агентни функции, помолихме GPT‑5.3‑Codex да създаде две игри за нас: втора версия на състезателната игра от стартирането на приложението Codex и игра за гмуркане. Използвайки умението develop-web-game и предварително подбрани, общи последващи подкани като „отстрани бъга“ или „подобри играта“, GPT‑5.3‑Codex самостоятелно подобряваше игрите в продължение на милиони токени. Гледайте трейлърите и играйте игрите сами, за да видите какво може да направи Codex.
Състезателна игра, включваща различни състезатели, осем карти и дори предмети, които можете да използвате с клавиша за интервал. Играйте сами тук(отваря се в нов прозорец)!
Игра за гмуркане, в която изследвате различни рифове, събирате ги, за да попълните своя сборник с риби, като същевременно управлявате кислорода, налягането и опасностите. Играйте сами тук(отваря се в нов прозорец)!
GPT‑5.3‑Codex също разбира по-добре Вашето намерение, когато го помолите да създава ежедневни уебсайтове, в сравнение с GPT‑5.2‑Codex. Простите или недостатъчно конкретизирани подкани вече по подразбиране насочват към сайтове с повече функционалност и разумни стойности по подразбиране, предоставяйки Ви по-силна отправна точка, за да реализирате идеите си.
Например ние помолихме GPT‑5.3‑Codex и GPT‑5.2‑Codex да създадат две целеви страници, които са показани по-долу. GPT‑5.3‑Codex автоматично показваше годишния план като намалена месечна цена, което правеше отстъпката да изглежда ясна и целенасочена, вместо да се умножава годишната обща сума. Това също така създаде автоматично прелистваща се галерия с отзиви с три отделни потребителски цитата вместо един, което води до страница, която по подразбиране се усеща по-завършена и готова за работа.
Подкана: Създай целева страница за Quiet KPI, седмичен дайджест с метрики, подходящ за основатели. Естетиката е мек SaaS, стъклени карти, градиент от лавандула към синьо, леко размазване. Раздели, хедър със събиране на имейли, решетка с примерни табла с отчети, ред с интеграции, галерия с отзиви, превключвател за цените месечно/годишно, ЧЗВ, футър.
- Шрифт Satoshi или подобен геометричен безсерифен шрифт.
- Бутони със заоблени ъгли, радиус 14 пиксела, силно изразени състояния на фокус.
- Добавете едно изискано разкриване при превъртане.
Софтуерните инженери, дизайнерите, продуктовите мениджъри и специалистите по данни правят много повече от просто генериране на код. GPT‑5.3‑Codex е създаден да поддържа цялата работа в жизнения цикъл на разработването на софтуер — отстраняване на грешки, внедряване, наблюдение, писане на PRD (Документи за продуктови изисквания), редактиране на текстове, потребителски проучвания, тестове, метрики и още. Възможностите на неговите агенти надхвърлят софтуера, като Ви помагат да изграждате каквото пожелаете — било то презентации или анализ на данни в таблици.
С персонализирани умения, подобни на тези, използвани за предишните ни резултати от GDPval, GPT‑5.3‑Codex също показва силно представяне в професионалната работа със знания, измерено чрез GDPval, съответстващо на GPT‑5.2. GDPval е оценка, която OpenAI пусна през 2025 г. и която измерва представянето на модела при добре дефинирани задачи за работа със знания в 44 професии. Тези задачи включват дейности като създаване на презентации, електронни таблици и други работни продукти.
По-долу са дадени няколко примера за работата, която агентът създаде.
Подкана + контекст на задачата
GPT-5.3-Codex output

OSWorld е бенчмарк за агенти за използване на компютър, при който агентът трябва да изпълнява задачи за продуктивност във визуална среда на настолен компютър. GPT‑5.3‑Codex демонстрира значително по-силни възможности за използване на компютър в сравнение с предишните модели на GPT.
В OSWorld-Verified моделите използват зрение, за да изпълняват разнообразни компютърни задачи. Хората постигат резултат от около 72%.
Тези резултати в областта на кодирането, фронтенда и използване на компютър и задачи от реалния свят показват, че GPT‑5.3‑Codex не е просто по-добър в отделни задачи, а бележи значителна промяна към един-единствен, универсален агент, който може да разсъждава, изгражда и изпълнява в целия спектър от техническа работа в реалния свят.
С нарастването на възможностите на моделите, разликата се измества от това, което агентите са способни да правят, към това колко лесно хората могат да взаимодействат, да управляват и контролират много от тях, работейки паралелно. Приложението Codex прави управлението и насочването на агенти много по-лесно, а сега с GPT‑5.3‑Codex е и по-интерактивно. С новия модел Codex предоставя чести актуализации, за да сте информирани за ключовите решения и напредъка, докато работи. Вместо да чакате окончателен резултат, можете да взаимодействате в реално време — да задавате въпроси, да обсъждате подходи и да насочвате към решението. GPT‑5.3‑Codex обяснява какво прави, реагира на обратната връзка и Ви държи в течение от началото до края.
Активирайте управлението, докато моделът работи в приложението в Настройки > Общи > Поведение при проследяване.
Скорошните бързи подобрения на Codex се основават на резултатите от изследователски проекти, обхващащи месеци или години в целия OpenAI. Тези изследователски проекти се ускоряват от Codex, като много изследователи и инженери в OpenAI описват днешната си работа като коренно различна от тази, която беше само преди два месеца. Дори ранните версии на GPT‑5.3‑Codex демонстрират изключителни възможности, позволявайки на нашия екип да работи с тези по-ранни версии, за да подобрим обучението и да подпомогнем внедряването на по-късни версии.
Codex е полезен за много широк спектър от задачи, което затруднява пълното изброяване на начините, по които помага на нашите екипи. Като примери, изследователският екип използва Codex, за да наблюдава и отстранява грешки в обучителния процес за това издание. Това ускори изследванията отвъд отстраняването на грешки в инфраструктурни проблеми: помогна за проследяване на модели по време на обучението, предостави задълбочен анализ на качеството на взаимодействието, предложи корекции и създаде богати приложения, за да могат изследователите да разберат точно как поведението на модела се различава от предишните модели.
Инженерният екип използва Codex, за да оптимизира и адаптира свръзката за GPT‑5.3‑Codex. Когато започнахме да наблюдаваме странни крайни случаи, които влияят на потребителите, членовете на екипа използваха Codex, за да идентифицират грешки при визуализирането на контекста и да установят основната причина за нисък процент на попадения в кеша. GPT‑5.3‑Codex продължава да подпомага екипа по време на цялото пускане, като динамично мащабира GPU клъстери, за да се адаптира към пиковете в трафика и поддържа стабилна латентност.
По време на алфа тестването един изследовател искал да разбере колко допълнителна работа се извършва по GPT‑5.3‑Codex на ход и свързаната с това разлика в производителността. GPT‑5.3‑Codex създаде няколко прости regex класификатора, за да оцени честотата на уточненията, положителните и отрицателните отговори на потребителя, напредъка по задачата, след което ги приложи в мащаб върху всички регистри на сесиите и изготви доклад със заключението си. Хората, които работеха с Codex, бяха по-щастливи, тъй като агентът разбираше по-добре техните намерения и постигаше повече напредък на ход с по-малко уточняващи въпроси.
Поради това, че GPT‑5.3‑Codex е толкова различен от своите предшественици, данните от алфа тестването показаха множество необичайни и противоречащи на интуицията резултати. Специалист по данни от екипа работи с GPT‑5.3‑Codex, за да създаде нови потоци от данни и да визуализира резултатите много по-подробно, отколкото позволяваха нашите стандартни инструменти за табла за управление. Резултатите бяха съвместно анализирани с Codex, който накратко обобщи ключовите изводи от хиляди данни за по-малко от три минути.
Поотделно всички тези задачи са интересни примери за това как Codex може да помогне на изследователите и създателите на продукти. Взети заедно установихме, че тези нови възможности доведоха до мощно ускоряване на продуктивността на нашите екипи по изследвания, инженерство и продукти.
През последните месеци наблюдаваме значителни подобрения в представянето на модела при задачи, свързани с киберсигурността, от които се възползват както разработчиците, така и специалистите по сигурността. Паралелно с това подготвяме засилени киберзащитни мерки за подкрепа на защитната употреба и по-широката устойчивост на екосистемата.
GPT‑5.3‑Codex е първият модел, който класифицираме като Високо способен за задачи, свързани с киберсигурността, в рамките на нашата Рамка за готовност, и първият, който сме обучили директно да идентифицира софтуерни уязвимости. Въпреки че нямаме категорични доказателства, че може да автоматизира кибератаки от край до край, ние възприемаме предпазлив подход и внедряваме най-всеобхватния ни досега стек за безопасност в областта на киберсигурността. Нашите мерки за смекчаване включват обучение по безопасност, автоматизирано наблюдение, доверен достъп за разширени възможности и канали за прилагане, включително разузнаване за заплахи.
Тъй като киберсигурността по своята същност е с двойна употреба, ние прилагаме основан на доказателства, итеративен подход, който ускорява способността на екипите по сигурността да откриват и отстраняват уязвимости, като същевременно забавя злоупотребата. Като част от това стартираме Доверен достъп за киберсигурност, пилотна програма за ускоряване на изследванията в областта на киберзащитата.
Инвестираме в мерки за защита на екосистемата, като разширяваме частната бета версия на Aardvark, нашия агент за изследвания на сигурността, като първото предложение в нашия пакет от продукти и инструменти Codex Security, и си партнираме с разработчици на проекти с отворен код, за да предоставим безплатно сканиране на кодовата база за широко използвани проекти като Next.js, където изследовател по сигурността използва Codex, за да открие уязвимости, разкрити(отваря се в нов прозорец) миналата седмица.
Надграждайки нашата програма за субсидии в областта на киберсигурността на стойност 1 милион долара, стартирана през 2023 г., ние също така отпускаме 10 млн. долара под формата на кредити за API, за да ускорим киберзащитата с нашите най-способни модели, особено за софтуер с отворен код и системи за критична инфраструктура. Организациите, ангажирани с добросъвестни изследвания в областта на сигурността, могат да кандидатстват за кредити за API и поддръжка чрез нашата Програма за субсидии за киберсигурност.
GPT‑5.3‑Codex е наличен с платени планове на ChatGPT навсякъде, където можете да използвате Codex: приложението, CLI, разширението за IDE и уеб. Работим по това скоро да осигурим безопасен достъп до API.
С тази актуализация вече изпълняваме и GPT‑5.3‑Codex с 25% по-бързо за потребителите на Codex, благодарение на подобренията в нашата инфраструктура и инференциален стек, което води до по-бързи взаимодействия и по-бързи резултати.
GPT‑5.3‑Codex беше съвместно проектиран, обучен и използван на системи NVIDIA GB200 NVL72. Благодарим на NVIDIA за тяхното партньорство.
С GPT‑5.3‑Codex, Codex надхвърля писането на код, като го използва като инструмент за управление на компютър и за завършване на работа от край до край. Като разширяваме границите на това, което един агент за кодиране може да прави, ние също така отключваме по-широк клас работа с знания — от изграждане и внедряване на софтуер до проучване, анализиране и изпълнение на сложни задачи. Това, което започна като фокус върху това да бъдем най-добрият агент за кодиране, се превърна в основата за по-общ сътрудник на компютъра, разширявайки както кой може да създава, така и какво е възможно с Codex.
GPT‑5.3‑Codex (свръхвисоко) | GPT‑5.2‑Codex (свръхвисоко) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (публично) | 56,8% | 56,4% | 55,6% |
Terminal-Bench 2.0 | 77,3% | 64,0% | 62,2% |
OSWorld-Verified | 64,7% | 38,2% | 37,9% |
GDPval (победи или равенства) | 70,9% | - | 70,9% (високо) |
Предизвикателства по киберсигурност тип Capture The Flag | 77,6% | 67,4% | 67,7% |
SWE-lancer IC Diamond | 81,4% | 76,0% | 74,6% |


