18 декември 2025 г.

Претставување на GPT‑5.2‑Codex

Најнапредниот модел на агентско кодирање за професионално софтверско инженерство и одбранбена сајбербезбедност.

Денес го објавуваме GPT‑5.2‑Codex, најнапредниот модел на агентско кодирање досега за комплексно, софтверско инженерство од реалниот свет. GPT‑5.2‑Codex е верзија на GPT‑5.2⁠ дополнително оптимизирана за агентско кодирање во Codex, вклучувајќи подобрувања во долгорочна работа преку компактирање на контекстот, посилни перформанси при големи промени во кодот, како што се рефакторирање и миграции, подобрени перформанси во Windows средини и значително посилни способности за сајбербезбедност.

Како што нашите модели продолжуваат да стануваат поинтелигентни, забележувме дека овие подобрувања исто така водат до скокови на способности во специјализирани домени, како што е сајбербезбедност⁠. На пример, само минатата седмица, истражувач за безбедност користејќи GPT‑5.1‑Codex‑Max со Codex CLI пронајде и одговорно откри⁠(се отвора во нов прозорец) ранливост во React која може да доведе до изложување на изворниот код.

GPT‑5.2‑Codex има посилни способности за сајбербезбедност од кој било модел што сме го објавиле досега. Овие напредоци можат да помогнат во зајакнување на сајбербезбедноста на големо ниво, но исто така покренуваат нови ризици од двојна употреба кои бараат внимателно распоредување. Иако GPT‑5.2‑Codex не достигнува „високо“ ниво на сајберспособност според нашата рамка за подготвеност, го дизајнираме нашиот пристап за распоредување⁠ имајќи го предвид идниот раст на способностите.

Го објавуваме GPT‑5.2‑Codex денес на сите Codex површини за платени корисници на ChatGPT, и работиме на безбедно овозможување пристап до GPT‑5.2‑Codex за API корисниците во наредните недели. Паралелно, пилотираме доверлив пристап само со покана до претстојните способности и попермисивни модели за проверени професионалци и организации фокусирани на одбранбена сајбербезбедност. Веруваме дека овој пристап кон распоредување ќе ја балансира достапноста со безбедноста.

Поместување на границите на реалното софтверско инженерство

GPT‑5.2‑Codex се надоврзува на силните страни на GPT‑5.2⁠ во професионалната работа со знаење и на најсовремени агентски способности за кодирање и користење на терминали на GPT‑5.1‑Codex‑Max⁠ . GPT‑5.2‑Codex сега е подобар во разбирањето на долг контекст, сигурно повикување на алатки, подобрена фактичност и природна компакција, што го прави понадежен партнер за долготрајни задачи за кодирање, додека останува ефикасен во однос на token во своето расудување.

GPT‑5.2‑Codex постигнува врвни перформанси на SWE-Bench Pro и Terminal-Bench 2.0, бенчмаркови дизајнирани за тестирање на агентски перформанси на широк спектар на задачи во реалистични терминални средини. Исто така, многу е поефикасен и понадежен во агентско кодирање во природни Windows средини, надградувајќи ги способностите воведени во GPT‑5.1‑Codex‑Max.

Со овие подобрувања, Codex е поспособен за работа во големи репозиториуми за време на продолжени сесии со целосен контекст зачуван. Може понадежно да заврши сложени задачи како што се големи преструктурирања, миграции на код и градење на функции – продолжувајќи итеративно да работи без да изгуби следење, дури и кога плановите се менуваат или обидите не успеваат.

Во SWE-Bench Pro, моделот добива репозиториум на код и треба да генерира закрпа за да реши реална задача за софтверско инженерство. Terminal-Bench 2.0 е бенчмарк за тестирање на AI агенти во реални терминални средини. Задачите вклучуваат компајлирање на код, обука на модели и поставување на сервери.

Посилните визуелни перформанси му овозможуваат на GPT‑5.2‑Codex поточно да ги толкува сликите на екранот, техничките дијаграми, табелите и корисничките интерфејси споделени за време на сесиите за кодирање.

Codex може да ги земе дизајн макетите и брзо да ги претвори во функционални прототипови, а можеш да се здружиш со Codex за да ги однесеш овие прототипови до продукција.

Дизајн макета

Прототип генериран од GPT‑5.2‑Codex

Поместување на сајберграниците

Кога ги прикажуваме перформансите на една од нашите основни евалуации за сајбербезбедност со текот на времето, забележуваме остар скок во способноста почнувајќи со GPT‑5‑Codex, уште еден голем скок со GPT‑5.1‑Codex‑Max и сега трет скок со GPT‑5.2‑Codex. Очекуваме дека идните модели на вештачка интелигенција ќе продолжат по оваа траекторија. Како подготовка, планираме и оценуваме како секој нов модел да може да достигне „високо“ ниво на способност за сајбербезбедност, како што е измерено според нашата Рамка за подготвеност⁠(се отвора во нов прозорец). Иако GPT‑5.2‑Codex сè уште не достигна „високо“ ниво на сајберспособност, ние се подготвуваме за идни модели кои ќе го преминат тој праг. Поради зголемените сајберспособности, додадовме дополнителни заштитни мерки во моделот и во производот, кои се опишани во системската картичка⁠.

Евалуацијата Professional Capture-the-Flag (CTF) мери колку често моделот може да реши напредни, повеќекратни реални предизвици (кои бараат професионални вештини за сајбербезбедност) во Linux околина.

Сајберспособности во реалниот свет

Современото општество функционира на софтвер, и неговата доверливост зависи од силната сајбер безбедност – одржување на критичните системи во банкарството, здравството, комуникациите и основните услуги онлајн, заштита на чувствителните податоци и осигурување дека луѓето можат да му веруваат на софтверот на кој се потпираат секој ден. Ранливостите може да постојат долго пред некој да дознае за нив, а нивното наоѓање, валидација и поправање често зависи од заедница на инженери и независни истражувачи за безбедност кои се опремени со соодветни алатки.

На 11 декември 2025 година, тимот React објави три безбедносни ранливости кои влијаат на апликациите изградени со React Server Components. Она што го направи ова откривање значајно не беа само самите ранливости, туку и начинот на кој беа откриени.

Ендру Мекферсон, главен инженер за безбедност во Privy (компанија на Stripe), го користеше GPT‑5.1‑Codex‑Max со Codex CLI и други агенти за кодирање за да репродуцираш и проучиш различна критична ранливост на React откриена претходната седмица, позната како React2Shell⁠(се отвора во нов прозорец) (CVE-2025-55182⁠(се отвора во нов прозорец)). Неговата цел беше да оцени колку добро моделот може да помогне во истражувањето на ранливостите во реалниот свет.

Тој првично се обиде со неколку zero-shot анализи, поттикнувајќи го моделот да ја испита закрпата и да ја идентификува ранливоста што ја адресираше. Кога тоа не даде резултати, тој се префрли на пристап со поголем обем и итеративно поттикнување. Кога тие пристапи не успеаја, тој го водеше Codex низ стандардните работни текови за одбранбена безбедност – поставување на локално тест опкружување, расудување низ потенцијалните површини на напад и користење на фазинг за да го испита системот со неправилни внесувања. Додека се обидувавме да го репродуцираме оригиналниот проблем React2Shell, Codex откри неочекувани однесувања што бараа подлабока истрага. Во текот на една седмица, овој процес доведе до откривање на претходно непознати ранливости, кои беа одговорно откриени на тимот на React.

Дијаграм на тек со наслов „Откривање на ранливости со Codex: CVE-2025-55183“ прикажува работен тек што започнува со Git репозиториум и Codex кој го скенира кодот за ранливости. Обидот zero-shot не успева, по што следи процес воден од експерт кој ја испитува базата на кодови, идентификува можни цели, гради хернес и изведува fuzz тестирање на примерна апликација со повторна валидација. Резултатите се потврдуваат за да се креира доказ за концепт, што води до одговорно објавување и закрпа која се применува назад во репозиториумот.

Ова покажува како напредните системи на вештачка интелигенција можат значително да го забрзаат одбранбеното безбедносно работење во широко користен, реален софтвер. Во исто време, способностите што им помагаат на бранителите да се движат побрзо, исто така можат да бидат злоупотребени од злонамерни актери.

Како што агентските системи стануваат поспособни во задачи поврзани со сајбербезбедност, нашиот основен приоритет е да се осигураме дека овој напредок се применува одговорно—спојувајќи го секое зголемување на способноста со посилни заштитни мерки, построги контроли на пристап и постојана соработка со безбедносната заедница.

Овозможување на сајберодбраната преку доверлив пристап

Безбедносните тимови може да се соочат со ограничувања кога се обидуваат да ги имитираат заканувачите, да анализираат малициозен софтвер за да го поддржат решавањето на проблеми или да ја тестираат критичната инфраструктура. Ние развиваме пилот-проект за доверлив пристап за да ја отстранува таа пречка за квалификуваните корисници и организации и да им овозможи на доверливите бранители да користат најсовремени сајберспособности со вештачка интелигенција за да ја забрзаат сајберодбраната.

Првично, пилот-програмата ќе биде само со покана за проверени безбедносни професионалци со историја на одговорно откривање на ранливости и организации со јасен професионален случај на употреба во сајбербезбедноста. Квалификуваните учесници ќе добијат пристап до нашите најспособни модели за одбранбени случаи на употреба за да овозможат легитимна двојна употреба.

Ако си професионалец за безбедност или дел од организација која се занимава со етичка безбедност како истражување на ранливости или овластено red-teaming, те покануваме да изразиш интерес за приклучување и да споделиш повратни информации за тоа што би сакал да видиш од програмата овде⁠(се отвора во нов прозорец).

Заклучок

GPT‑5.2‑Codex претставува чекор напред во тоа како напредната вештачка интелигенција може да поддржува реално софтверско инженерство и специјализирани домени како сајбербезбедност – помагајќи им на развивачи на софтвер и бранители да се справат со сложени, долгорочни задачи и зајакнувајќи ги алатките достапни за одговорно истражување на безбедноста.

Со постепено лансирање на GPT‑5.2‑Codex, комбинирање на примената со заштитни мерки и блиска соработка со безбедносната заедница, целиме да го максимизираме одбранбениот ефект додека го намалуваме ризикот од злоупотреба. Она што ќе го научиме од ова издание директно ќе информира како ќе го прошируваме пристапот со текот на времето, додека софтверските и сајбер границите продолжуваат да напредуваат.

Автор

OpenAI

Продолжи да читаш

Види ги сите

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 сега е претпочитаниот модел во Microsoft 365 Copilot

Производ9 јул. 2026 г.

ChatGPT сега е партнер за вашата најамбициозна работа

Производ9 јул. 2026 г.

GPT-5.6: Гранична интелигенција што расте со вашата амбиција

Производ9 јул. 2026 г.