18. децембар 2025.

Представљамо GPT‑5.2‑Codex

Најнапреднији агентски модел за кодирање за професионално софтверско инжењерство и одбрамбену сајбер-безбедност.

Данас објављујемо GPT‑5.2‑Codex, до сада најнапреднији агентски модел за кодирање за сложено софтверско инжењерство из стварног света. GPT‑5.2‑Codex је верзија модела GPT‑5.2⁠ додатно оптимизована за агентско кодирање у Codex-у, укључујући побољшања за дугорочни рад кроз сажимање контекста, боље перформансе при великим изменама кода као што су рефакторисање и миграције, побољшане перформансе у Windows окружењима и знатно снажније могућности сајбер-безбедности.

Како наши модели настављају да напредују дуж границе интелигенције, приметили смо да се ова побољшања такође претварају у скокове способности у специјализованим доменима као што је сајбер-безбедност⁠. На пример, већ прошле недеље је истраживач безбедности, користећи GPT‑5.1‑Codex‑Max са Codex CLI-јем, пронашао и одговорно пријавио⁠(отвара се у новом прозору) рањивост у React-у која је могла да доведе до излагања изворног кода.

GPT‑5.2‑Codex има снажније могућности сајбер-безбедности од било ког модела који смо до сада објавили. Овај напредак може да помогне у јачању сајбер-безбедности у великом обиму, али истовремено отвара и нове ризике двоструке намене који захтевају пажљиво увођење. Иако GPT‑5.2‑Codex не достиже ниво „High“ сајбер способности у оквиру нашег Оквира спремности, наш приступ увођењу⁠ осмишљавамо имајући у виду будући раст способности.

Данас објављујемо GPT‑5.2‑Codex на свим Codex површинама за ChatGPT кориснике који плаћају, и радимо на томе да у наредним недељама безбедно омогућимо приступ GPT‑5.2‑Codex‑у за API кориснике. Паралелно с тим, пилотирамо приступ по позиву од поверења за предстојеће могућности и попустљивије моделе за проверене стручњаке и организације усмерене на одбрамбени рад у сајбер-безбедности. Верујемо да ће овај приступ увођењу уравнотежити приступачност и безбедност.

Померање границе у софтверском инжењерству из стварног света

GPT‑5.2‑Codex се надовезује на снаге GPT‑5.2⁠ у професионалном раду са знањем и на граничне агентске способности кодирања и коришћења терминала модела GPT‑5.1‑Codex‑Max⁠. GPT‑5.2‑Codex је сада бољи у разумевању дугог контекста, поузданом позивању алата, побољшаној чињеничности и изворном сажимању, што га чини поузданијим партнером за дуготрајне задатке кодирања, док истовремено остаје ефикасан у погледу токена у свом резоновању.

GPT‑5.2‑Codex постиже најсавременије перформансе на SWE-Bench Pro и Terminal-Bench 2.0, мерилима осмишљеним да тестирају агентске перформансе на широком спектру задатака у реалистичним терминалским окружењима. Такође је много ефикаснији и поузданији у агентском кодирању у изворним Windows окружењима, надовезујући се на способности представљене у GPT‑5.1‑Codex‑Max.

Захваљујући овим побољшањима, Codex је способнији за рад у великим депоима током продужених сесија уз очуван пуни контекст. Може поузданије да завршава сложене задатке као што су велики рефакторинзи, миграције кода и израда функционалности — настављајући да итерира без губитка тока, чак и када се планови промене или покушаји не успеју.

У SWE-Bench Pro⁠⁠⁠⁠, модел добија депо кода и мора да генерише закрпу да би решио реалистичан задатак софтверског инжењерства. Terminal-Bench 2.0 је мерило за тестирање AI агената у стварним терминалским окружењима. Задаци укључују компајлирање кода, обучавање модела и подешавање сервера.

Снажније перформансе вида омогућавају моделу GPT‑5.2‑Codex да прецизније тумачи снимке екрана, техничке дијаграме, графиконе и UI површине дељене током сесија кодирања.

Codex може да преузме макете дизајна и брзо их претвори у функционалне прототипе, а можете радити у пару са Codex-ом да те прототипе доведете до продукције.

Макета дизајна

Прототип генерисан помоћу GPT‑5.2‑Codex

Напредак на сајбер граници

Када током времена пратимо перформансе на једној од наших основних евалуација сајбер-безбедности, видимо нагли скок способности почев од GPT‑5‑Codex‑а, још један велики скок са GPT‑5.1‑Codex‑Max и сада трећи скок са GPT‑5.2‑Codex‑ом. Очекујемо да ће се предстојећи AI модели наставити кретати овом путањом. У припреми, планирамо и процењујемо као да би сваки нови модел могао достићи нивое „High“ способности у сајбер-безбедности, мерено нашим Оквиром спремности⁠⁠(отвара се у новом прозору). Иако GPT‑5.2‑Codex још није достигао ниво „High“ сајбер способности, припремамо се за будуће моделе који пређу тај праг. Због повећаних сајбер способности, додали смо додатне заштитне мере у модел и производ, које су описане у системској картици⁠.

Евалуација Professional Capture-the-Flag (CTF) мери колико често модел може да реши напредне, вишекорачне изазове из стварног света (који захтевају професионални ниво вештина сајбер-безбедности) у Linux окружењу.

Сајбер способности у стварном свету

Савремено друштво почива на софтверу, а његова поузданост зависи од снажне сајбер-безбедности — одржавања критичних система у банкарству, здравству, комуникацијама и основним услугама онлајн, заштите осетљивих података и обезбеђивања да људи могу да верују софтверу на који се свакодневно ослањају. Рањивости могу постојати много пре него што било ко сазна за њих, а њихово проналажење, потврђивање и исправљање често зависи од заједнице инжењера и независних истраживача безбедности опремљених правим алатима.

Дана 11. децембра 2025, React тим је објавио три безбедносне рањивости које погађају апликације направљене уз React Server Components. Оно што је ово обелодањивање учинило значајним нису биле само саме рањивости, већ и начин на који су откривене.

Andrew MacPherson, главни инжењер безбедности у компанији Privy (компанија Stripe-а), користио је GPT‑5.1‑Codex‑Max са Codex CLI-јем и другим агентима за кодирање да репродукује и проучи другу критичну React рањивост обелодањену претходне недеље, познату као React2Shell⁠(отвара се у новом прозору) (CVE-2025-55182⁠(отвара се у новом прозору)). Његов циљ је био да процени колико добро модел може да помогне у истраживању рањивости из стварног света.

У почетку је покушао неколико анализа без покушаја, дајући моделу инструкције да испита закрпу и идентификује рањивост коју она исправља. Када то није дало резултате, прешао је на итеративни приступ са већим обимом инструкција. Када ни ти приступи нису успели, водио је Codex кроз стандардне одбрамбене безбедносне токове рада — постављање локалног тест окружења, резоновање о потенцијалним нападним површинама и коришћење fuzzing-а за испитивање система неисправним улазима. Док је покушавао да репродукује оригинални проблем React2Shell, Codex је указао на неочекивана понашања која су захтевала дубљу истрагу. Током само једне недеље, овај процес је довео до откривања раније непознатих рањивости, које су одговорно пријављене React тиму.

Дијаграм тока под насловом „Vulnerability Discovery with Codex: CVE-2025-55183“ који приказује ток рада који почиње Git депоом и Codex-ом који скенира код у потрази за рањивостима. Покушај без покушаја не успева, након чега следи процес вођен стручњаком који испитује базу кода, идентификује могуће мете, прави harness и спроводи fuzz тестирање над примером апликације уз поновну валидацију. Резултати се проверавају да би се направио proof of concept, што води до одговорног пријављивања и закрпе која се затим примењује назад у депо.

Ово показује како напредни AI системи могу материјално убрзати одбрамбени безбедносни рад у широко коришћеном софтверу из стварног света. У исто време, способности које помажу браниоцима да се крећу брже могу бити злоупотребљене и од стране злонамерних актера.

Како агентски системи постају способнији у задацима релевантним за сајбер-безбедност, као кључни приоритет постављамо да обезбедимо да се овај напредак уводи одговорно — упарујући сваки добитак у способности са јачим заштитним мерама, строжим контролама приступа и континуираном сарадњом са безбедносном заједницом.

Оснаживање сајбер одбране кроз приступ од поверења

Безбедносни тимови могу наићи на ограничења када покушавају да емулирају актере претњи, анализирају малвер ради подршке отклањању проблема или стресно тестирају критичну инфраструктуру. Развијамо пилот приступа од поверења како бисмо уклонили те препреке за квалификоване кориснике и организације и омогућили поузданим браниоцима да користе граничне AI сајбер способности за убрзавање сајбер одбране.

У почетку ће пилот програм бити доступан само по позиву за проверене безбедносне стручњаке са историјом одговорног обелодањивања рањивости и организације са јасним професионалним случајем употребе у сајбер-безбедности. Квалификовани учесници ће добити приступ нашим најспособнијим моделима за одбрамбене случајеве употребе како би се омогућио легитиман рад двоструке намене.

Ако сте безбедносни стручњак или део организације која се бави етичким безбедносним радом као што су истраживање рањивости или овлашћени red-teaming, позивамо вас да овде⁠(отвара се у новом прозору) изразите интересовање за придруживање и поделите повратне информације о томе шта бисте желели да видите од програма.

Закључак

GPT‑5.2‑Codex представља корак напред у томе како напредни AI може да подржи софтверско инжењерство из стварног света и специјализоване домене попут сајбер-безбедности — помажући програмерима и браниоцима да се ухвате у коштац са сложеним, дугорочним радом и јачајући алате доступне за одговорно безбедносно истраживање.

Постепеним увођењем GPT‑5.2‑Codex‑а, упаривањем увођења са заштитним мерама и блиском сарадњом са безбедносном заједницом, тежимо да максимизирамо одбрамбени утицај уз смањење ризика од злоупотребе. Оно што научимо из овог објављивања директно ће обликовати начин на који временом ширимо приступ, док границе софтвера и сајбер простора настављају да напредују.

Аутор

OpenAI

Наставите са читањем

Прикажи све

A scorecard for the AI age

Компанија17. јул 2026.

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 је сада преферирани модел у услузи Microsoft 365 Copilot

Производ9. јул 2026.

GPT-5.6: Гранична интелигенција која расте у складу са вашим амбицијама

Производ9. јул 2026.