Преминаване към основното съдържание
OpenAI

Представяме GPT‑5.2‑Codex

Най-усъвършенстваният модел за агентно кодиране за професионално софтуерно инженерство и защитна киберсигурност.

$ npm i -g @openai/codex

Днес пускаме GPT‑5.2‑Codex, най-усъвършенстваният модел за агентно кодиране досега за сложни задачи в реалния свят на софтуерното инженерство. GPT‑5.2‑Codex е версия на GPT‑5.2, допълнително оптимизирана за агентно кодиране в Codex, включително подобрения в работата с дългосрочна перспектива чрез уплътняване на контекста, по-добра производителност при големи промени в кода като рефакторинг и миграции, подобрена производителност в среди с Windows и значително по-големи възможности за киберсигурност.

Докато нашите модели продължават да разширяват границите на интелекта, наблюдаваме как тези подобрения водят и до значително подобрени възможности в специализирани области като киберсигурността. Например само миналата седмица изследовател по сигурността, използващ GPT‑5.1‑Codex‑Max с Codex CLI откри и отговорно разкри(отваря се в нов прозорец) уязвимост в React, която може да доведе до разкриване на изходния код.

GPT‑5.2‑Codex има по-напреднали способности в киберсигурността от всички модели, които сме пускали до момента. Тези постижения могат да помогнат за укрепване на киберсигурността в голям мащаб, но също така пораждат нови рискове от двойна употреба, които изискват внимателно внедряване. Въпреки че GPT‑5.2‑Codex не достига „високо“ ниво на киберспособности според нашата Подготвителна рамка, ние проектираме нашия подход за внедряване с оглед на бъдещото развитие на способностите.

Пускаме GPT‑5.2‑Codex днес във всички интерфейси на Codex за платени потребители на ChatGPT и работим за безопасното предоставяне на достъп до GPT‑5.2‑Codex за ППИ потребители през следващите седмици. Едновременно с това стартираме пилотна програма за доверен достъп – само с покани – до бъдещи възможности и по-либерални модели за одобрени специалисти и организации, работещи в сферата на отбранителната киберсигурност. Вярваме, че този подход към внедряването ще постигне баланс между достъпност и безопасност.

Разширяване на границите на софтуерното инженерство в реалния свят

GPT‑5.2‑Codex надгражда върху силните страни на GPT‑5.2 в професионалната работа със знания и способностите на GPT‑5.1‑Codex‑Max за програмиране от най-висок клас и използване на терминал. GPT‑5.2‑Codex вече е по-добър в разбирането на дълъг контекст, надеждните заявки на инструменти, подобрената фактологичност и вградената компресия, което го прави по-надежден партньор за дълготрайни задачи за програмиране, като същевременно остава ефективен по отношение на токените в своите разсъждения.

GPT‑5.2‑Codex постига най-съвременни резултати в SWE-Bench Pro и Terminal-Bench 2.0 - бенчмаркове, предназначени за тестване на производителността на агентите при изпълнение на голямо разнообразие от задачи в реалистични терминални среди. Той също така е много по-ефективен и надежден при агентно кодиране в нативни среди с Windows, като надгражда възможностите, въведени в GPT‑5.1‑Codex‑Max.

С тези подобрения Codex е по-способен да работи в големи хранилища по време на продължителни сесии с пълен и непокътнат контекст. Той може по-надеждно да изпълнява сложни задачи като големи преработки, миграции на код и изграждане на функции, като продължи да итерира, без да губи посоката си, дори когато плановете се променят или опитите се провалят.

В SWE-Bench Pro⁠⁠⁠⁠ на модела се предоставя хранилище с код и той трябва да генерира пач, за да реши реалистична задача по софтуерно инженерство. Terminal-Bench 2.0 е еталон за тестване на ИИ агенти в реални терминални среди. Задачите включват компилиране на код, обучение на модели и настройка на сървъри.

По-силната визуална производителност позволява на GPT‑5.2‑Codex да интерпретира по-точно екранни снимки, технически диаграми, графики и потребителски интерфейси, споделени по време на сесиите за кодиране.

Codex може да вземе дизайнерски макети и бързо да ги превърне във функционални прототипи, а Вие можете да работите с Codex, за да пренесете тези прототипи в производство.

Дизайнерски макет
Дизайнерски макет, използван за генериране на уеб прототип с Codex-5.2
Прототип, генериран от GPT‑5.2‑Codex

Разширяване на кибер границата

Когато проследяваме производителността на една от нашите основни оценки за киберсигурност с течение на времето, забелязваме рязък скок в способностите, започвайки с GPT‑5‑Codex, последван от още един голям скок с GPT‑5.1‑Codex‑Max и сега трети скок с GPT‑5.2‑Codex. Очакваме, че предстоящите модели с изкуствен интелект ще продължат по този път. В подготовка за това ние планираме и оценяваме така, сякаш всеки нов модел може да достигне „високи“ нива на способност за киберсигурност, измерени чрез нашата Рамка за подготовка⁠(отваря се в нов прозорец). Докато GPT‑5.2‑Codex все още не е достигнал „високо“ ниво на киберспособност, ние се подготвяме за бъдещи модели, които ще преминат този праг. Поради увеличените кибер възможности, добавихме допълнителни предпазни мерки в модела и в продукта, които са описани в системната карта.

Оценката Professional Capture-the-Flag (CTF) измерва колко често моделът може да решава напреднали, многоетапни реални предизвикателства (изискващи професионално ниво на умения в киберсигурността) в среда с Linux.

Кибер възможности в реалния свят

Съвременното общество разчита на софтуера, а неговата надеждност зависи от силната киберсигурност—поддържане на критични системи в банковото дело, здравеопазването, комуникациите и основните услуги онлайн, защитата на чувствителните данни и осигуряването на доверие в софтуера, на който хората разчитат всеки ден. Уязвимостите могат да съществуват дълго преди някой да знае за тях, а тяхното откриване, валидиране и отстраняване често зависи от общност от инженери и независими изследователи по сигурността, оборудвани с подходящите инструменти.

На 11 декември 2025 г. екипът на React публикува три уязвимости в сигурността, засягащи приложения, изградени с React Server Components. Това, което направи това разкритие забележително, не бяха само самите уязвимости, но и начинът, по който те бяха разкрити.

Андрю Макферсън, главен инженер по сигурността в Privy (компания на Stripe), използваше GPT‑5.1‑Codex‑Max с Codex CLI и други агенти за кодиране, за да възпроизведе и проучи различна критична уязвимост на React, която бе разкрита седмица по-рано, и е известна като React2Shell(отваря се в нов прозорец) (CVE-2025-55182(отваря се в нов прозорец)). Неговата цел беше да оцени доколко ефективно моделът може да подпомогне изследванията на уязвимости в реалния свят.

Първоначално той опита няколко анализa без предварително обучение (zero-shot), като подтикна модела да разгледа пача и да идентифицира уязвимостта, която той отстранява. Когато това не даде резултати, той премина към подход с по-голям обем и итеративно подканване. Когато тези подходи не дадоха резултат, той проведе Codex през стандартни работни процеси за отбранителна сигурност — като създаде локална тестова среда, анализира потенциалните атакуващи повърхности и използва фъзинг, за да тества системата с некоректни входни данни. Докато се опитвахме да възпроизведем оригиналния проблем с React2Shell, Codex разкри неочаквани поведения, които изискваха по-задълбочено разследване. В рамките на една седмица този процес доведе до откриването на преди това неизвестни уязвимости, които бяха отговорно разкрити на екипа на React.

Блок-схема, озаглавена „Откриване на уязвимости с Codex: CVE-2025-55183“, показваща работен процес, който започва с Git хранилище и Codex, който сканира кода за уязвимости. Опитът с анализи без предварително обучение се проваля, последван от процес, ръководен от експерт, който изследва кодовата база, идентифицира възможни цели, изгражда хранилище и извършва фъзинг тестване срещу примерно приложение с повторна валидация. Резултатите се проверяват, за да се създаде доказателство за концепция, което води до отговорно разкриване и пач, който се прилага към хранилището.

Това показва как усъвършенстваните системи с изкуствен интелект могат значително да ускорят работата по отбранителната сигурност в широко използван софтуер в реална среда. В същото време възможностите, които помагат на експертите по защита да действат по-бързо, могат също така да бъдат използвани за злоупотреба от злонамерени лица.

С нарастването на способностите на агентните системи в задачи, свързани с киберсигурността, ние правим основен приоритет да гарантираме, че тези постижения се внедряват отговорно—съчетаваме всяко увеличение на способностите с по-силни защитни мерки, по-строги контроли за достъп и продължаващо сътрудничество с общността по сигурност.

Подсилване на киберзащитата чрез доверен достъп

Екипите по сигурността могат да се сблъскат с ограничения, когато се опитват да имитират действията на участници в заплахи, да анализират зловреден софтуер, за да подпомогнат възстановяването, или да проведат стрес тест на критична инфраструктура. Разработваме пилотен проект за доверен достъп, за да премахнем това препятствие за квалифицирани потребители и организации и да активираме надеждни експерти по защита да използват авангардни кибер възможности с изкуствен интелект за ускоряване на киберзащитата.

Първоначално пилотната програма ще бъде само с покани за проверени специалисти по сигурността с доказан опит в отговорното разкриване на уязвимости и за организации с ясна професионална употреба в областта на киберсигурността. Квалифицираните участници ще получат достъп до нашите най-способни модели за отбранителни случаи на употреба, за да активират легитимна двойна употреба.

Ако сте специалист по сигурността или част от организация, която извършва етична работа в областта на сигурността, като изследване на уязвимости или разрешено тестване чрез симулирани атаки (т.нар. ред тийминг), Ви каним да изразите интерес за присъединяване и да споделите обратна връзка за това, което бихте искали да видите от програмата тук(отваря се в нов прозорец).

Заключение

GPT‑5.2‑Codex представлява стъпка напред в това как усъвършенстваният изкуствен интелект може да поддържа реалното софтуерно инженерство и специализирани области като киберсигурността, помагайки на разработчиците и експертите по защита да се справят със сложни, дългосрочни задачи, както и укрепвайки наличните инструменти за отговорни изследвания в областта на сигурността.

Чрез въвеждане на GPT‑5.2‑Codex, постепенно внедряване, съчетано с предпазни мерки, и тясно сътрудничество с общността за сигурност, ние се стремим да увеличим максимално защитното въздействие, като същевременно намалим риска от злоупотреба. Това, което научим от тази версия, ще ни даде пряка представа как да разширим достъпа с течение на времето, докато софтуерът и кибер границите продължават да се развиват.

Автор

OpenAI