Негізгі мазмұнға өту
OpenAI

2025 ж. 18 желтоқсан

ӨнімШығарылым

GPT‑5.2‑Codex таныстыру

Кәсіби бағдарламалық инженерия мен қорғаныстық киберқауіпсіздікке арналған ең озық агенттік кодтау моделі.

Бүгін біз күрделі, шынайы бағдарламалық инженерияға арналған ең озық агенттік кодтау моделі GPT‑5.2‑Codex‑ті шығарамыз. GPT‑5.2‑Codex — Codex ішіндегі агенттік кодтауға қосымша оңтайландырылған GPT‑5.2 нұсқасы; оған контексті ықшамдау арқылы ұзақ көкжиекті жұмысты жақсарту, рефакторинг пен миграция сияқты ірі код өзгерістерінде күштірек өнімділік, Windows орталарындағы жақсартылған өнімділік және айтарлықтай күшейтілген киберқауіпсіздік мүмкіндіктері кіреді.

Модельдеріміз интеллекттің озық шекарасы бойымен ілгерілеген сайын, бұл жақсартулардың киберқауіпсіздік сияқты маманданған салаларда да мүмкіндіктердің секірмелі өсуіне әкелетінін байқадық. Мысалы, дәл өткен аптада Codex CLI-мен бірге GPT‑5.1‑Codex‑Max қолданған қауіпсіздік зерттеушісі React-тегі бастапқы кодтың әшкереленуіне әкелуі мүмкін осалдықты тауып, оны жауапкершілікпен жариялады(жаңа терезеде ашылады).

GPT‑5.2‑Codex‑тің киберқауіпсіздік мүмкіндіктері біз осы уақытқа дейін шығарған кез келген модельден күштірек. Бұл ілгерілеулер киберқауіпсіздікті ауқымды түрде нығайтуға көмектесе алады, бірақ сонымен бірге мұқият енгізуді талап ететін жаңа қосарлы мақсаттағы тәуекелдерді де туындатады. GPT‑5.2‑Codex біздің Дайындық шеңбері бойынша кибер мүмкіндіктің «High» деңгейіне жетпесе де, біз енгізу тәсілімізді болашақтағы мүмкіндік өсімін ескере отырып жобалап жатырмыз.

Біз GPT‑5.2‑Codex‑ті бүгін ақылы ChatGPT пайдаланушыларына арналған барлық Codex беттерінде шығарып отырмыз және алдағы апталарда API пайдаланушылары үшін GPT‑5.2‑Codex‑ке қолжетімділікті қауіпсіз қосу бағытында жұмыс істеп жатырмыз. Сонымен қатар, біз қорғаныстық киберқауіпсіздікке бағытталған тексерілген мамандар мен ұйымдар үшін алдағы мүмкіндіктер мен анағұрлым еркін модельдерге тек шақыру арқылы сенімді қолжетімділікті сынақтан өткізіп жатырмыз. Бұл енгізу тәсілі қолжетімділік пен қауіпсіздік арасындағы тепе-теңдікті сақтайды деп сенеміз.

Шынайы бағдарламалық инженерияның озық шекарасын кеңейту

GPT‑5.2‑Codex кәсіби білім жұмысы бойынша GPT‑5.2‑нің артықшылықтарына және GPT‑5.1‑Codex‑Max моделінің озық агенттік кодтау мен терминалды пайдалану мүмкіндіктеріне сүйенеді. GPT‑5.2‑Codex енді ұзақ контексті түсінуде, құралдарды сенімді шақыруда, фактілік дәлдікте және жергілікті ықшамдауда жақсырақ, бұл оны ұзаққа созылатын кодтау тапсырмаларында анағұрлым сенімді серіктес етеді, сонымен бірге ой қорытуда токен жағынан үнемді болып қалады.

GPT‑5.2‑Codex SWE-Bench Pro және Terminal-Bench 2.0 бойынша үздік нәтижеге жетеді — бұл шынайы терминал орталарындағы сан алуан тапсырмаларда агенттік өнімділікті тексеруге арналған бенчмарктер. Сондай-ақ ол GPT‑5.1‑Codex‑Max‑та енгізілген мүмкіндіктерге сүйене отырып, жергілікті Windows орталарындағы агенттік кодтауда әлдеқайда тиімді және сенімді.

Осы жақсартулардың арқасында Codex толық контекст сақталған ұзақ сессиялар бойы ірі репозиторийлермен жұмыс істеуде қабілетті бола түсті. Ол ірі рефакторингтер, код миграциялары және функция құрастыру сияқты күрделі тапсырмаларды анағұрлым сенімді орындай алады — жоспарлар өзгерсе немесе әрекеттер сәтсіз болса да, бағдардан жаңылмай, итерацияны жалғастыра береді.

SWE-Bench Pro жүйесінде модельге код репозиторийі беріледі және ол шынайы бағдарламалық инженерия тапсырмасын шешу үшін патч жасауы керек. Terminal-Bench 2.0 — AI агенттерін нақты терминал орталарында сынауға арналған бенчмарк. Тапсырмаларға кодты компиляциялау, модельдерді жаттықтыру және серверлерді баптау кіреді.

Күшейтілген көру өнімділігі GPT‑5.2‑Codex‑ке кодтау сессиялары кезінде ортақ пайдаланылатын скриншоттарды, техникалық диаграммаларды, графиктерді және UI беттерін дәлірек түсіндіруге мүмкіндік береді.

Codex дизайн макеттерін алып, оларды тез арада функционалды прототиптерге айналдыра алады, әрі бұл прототиптерді өндіріске жеткізу үшін Codex-пен жұптаса жұмыс істей аласыз.

Дизайн макеті
Codex-5.2 көмегімен веб-прототип жасау үшін пайдаланылған дизайн макеті
GPT‑5.2‑Codex жасаған прототип

Кибердің озық шекарасын ілгерілету

Уақыт өте келе негізгі киберқауіпсіздік бағалауларымыздың біріндегі өнімділікті графикке түсіргенде, GPT‑5‑Codex‑тен бастап мүмкіндіктердің күрт өскенін, GPT‑5.1‑Codex‑Max‑пен тағы бір үлкен секіріс болғанын және енді GPT‑5.2‑Codex‑пен үшінші секірісті көреміз. Алдағы AI модельдері осы траекторияны жалғастырады деп күтеміз. Соған дайындық ретінде, біз әрбір жаңа модель киберқауіпсіздік мүмкіндігінің «High» деңгейіне жетуі мүмкін деген болжаммен жоспарлап, бағалап жатырмыз; бұл біздің Дайындық шеңбері⁠(жаңа терезеде ашылады) бойынша өлшенеді. GPT‑5.2‑Codex әлі кибер мүмкіндіктің «High» деңгейіне жетпегенімен, біз сол межеден асатын болашақ модельдерге дайындалып жатырмыз. Кибер мүмкіндіктердің артуына байланысты біз модельге де, өнімге де қосымша қорғаныс шараларын қостық; олар жүйе картасында сипатталған.

Professional Capture-the-Flag (CTF) бағалауы Linux ортасында модельдің күрделі, көпқадамды шынайы тапсырмаларды (кәсіби деңгейдегі киберқауіпсіздік дағдыларын қажет ететін) қаншалықты жиі шеше алатынын өлшейді.

Шынайы кибер мүмкіндіктер

Қазіргі қоғам бағдарламалық жасақтамаға сүйенеді, ал оның сенімділігі мықты киберқауіпсіздікке тәуелді — банк ісі, денсаулық сақтау, байланыс және маңызды қызметтердегі сыни жүйелердің онлайн болуын сақтау, сезімтал деректерді қорғау және адамдардың күн сайын сүйенетін бағдарламалық жасақтамаға сенуін қамтамасыз ету. Осалдықтар олар туралы біреу білгенге дейін көп уақыт бұрын болуы мүмкін, ал оларды табу, растау және түзету көбіне дұрыс құралдармен жарақтанған инженерлер мен тәуелсіз қауіпсіздік зерттеушілерінің қауымдастығына байланысты.

2025 жылғы 11 желтоқсанда React командасы React Server Components арқылы жасалған қолданбаларға әсер ететін үш қауіпсіздік осалдығын жариялады. Бұл жарияланымды ерекшелендірген нәрсе тек осалдықтардың өзі ғана емес, олардың қалай анықталғаны да болды.

Privy компаниясының (Stripe компаниясы) бас қауіпсіздік инженері Эндрю МакФерсон Codex CLI және басқа кодтау агенттерімен бірге GPT‑5.1‑Codex‑Max моделін қолданып, бір апта бұрын жарияланған React-тегі басқа бір сыни осалдықты — React2Shell(жаңа терезеде ашылады) (CVE-2025-55182(жаңа терезеде ашылады)) — қайта шығарып, зерттеп жүрген. Оның мақсаты модельдің шынайы осалдықтарды зерттеуге қаншалықты көмектесе алатынын бағалау болды.

Алғашында ол модельден патчты тексеріп, оның қандай осалдықты түзеткенін анықтауды сұрап, бірнеше мысалсыз талдау жасап көрді. Бұл нәтиже бермеген соң, ол көлемі жоғары, итеративті көмексөз тәсіліне көшті. Ол тәсілдер де сәтті болмағанда, Codex-ті стандартты қорғаныстық қауіпсіздік жұмыс ағындары арқылы бағыттады — жергілікті тест ортасын баптау, ықтимал шабуыл беттерін ой қорыту арқылы талдау және жүйені қате пішімделген енгізулермен тексеру үшін fuzzing қолдану. Түпнұсқа React2Shell мәселесін қайта шығаруға тырысқан кезде, Codex тереңірек зерттеуді қажет ететін күтпеген мінез-құлықтарды анықтады. Бір апта ішінде бұл үдеріс бұрын белгісіз болған осалдықтардың ашылуына әкелді, олар жауапкершілікпен React командасына жарияланды.

«Codex көмегімен осалдықты табу: CVE-2025-55183» атты ағын диаграммасы Git репозиторийінен басталатын және Codex-тің кодты осалдықтарға сканерлеуін көрсететін жұмыс үдерісін бейнелейді. Мысалсыз әрекет сәтсіз аяқталады, содан кейін код базасын зерттейтін, ықтимал нысаналарды анықтайтын, harness құратын және қайта тексерумен мысал қолданбаға қарсы fuzz тестілеу жүргізетін сарапшы жетекшілігіндегі үдеріс жүреді. Нәтижелер proof of concept жасау үшін тексеріліп, содан кейін жауапты түрде жариялау мен репозиторийге қайта қолданылатын патчқа әкеледі.

Бұл озық AI жүйелерінің кеңінен қолданылатын шынайы бағдарламалық жасақтамада қорғаныстық қауіпсіздік жұмысын елеулі түрде жеделдете алатынын көрсетеді. Сонымен бірге, қорғаушыларға жылдамырақ қозғалуға көмектесетін мүмкіндіктерді зиянкестер де теріс пайдалана алады.

Агенттік жүйелер киберқауіпсіздікке қатысты тапсырмаларда қабілеттірек болған сайын, біз бұл ілгерілеулердің жауапкершілікпен енгізілуін қамтамасыз етуді негізгі басымдыққа айналдырып отырмыз — мүмкіндіктің әрбір өсуін күштірек қорғаныс шараларымен, қатаңырақ қолжетімділік бақылауымен және қауіпсіздік қауымдастығымен үздіксіз ынтымақтастықпен ұштастырамыз.

Сенімді қолжетімділік арқылы киберқорғанысты күшейту

Қауіпсіздік командалары қауіп-қатер тудырушыларды еліктеуге, түзетуге қолдау көрсету үшін зиянды бағдарламаларды талдауға немесе сыни инфрақұрылымды стресс-тестілеуге тырысқанда шектеулерге тап болуы мүмкін. Біз талаптарға сай пайдаланушылар мен ұйымдар үшін осы кедергіні жою және сенімді қорғаушыларға озық AI кибер мүмкіндіктерін пайдаланып киберқорғанысты жеделдетуге мүмкіндік беру үшін сенімді қолжетімділік пилотын әзірлеп жатырмыз.

Бастапқыда пилоттық бағдарлама тек шақыру арқылы, осалдықтарды жауапкершілікпен жариялау тәжірибесі бар тексерілген қауіпсіздік мамандарына және кәсіби киберқауіпсіздікке қатысты нақты қолдану жағдайы бар ұйымдарға арналған болады. Талаптарға сай қатысушылар заңды қосарлы мақсаттағы жұмысты орындау үшін қорғаныстық қолдану жағдайларына арналған ең қабілетті модельдерімізге қол жеткізеді.

Егер сіз қауіпсіздік маманы болсаңыз немесе осалдықтарды зерттеу не рұқсат етілген red-teaming сияқты этикалық қауіпсіздік жұмысын атқаратын ұйымның мүшесі болсаңыз, қосылуға қызығушылық білдіруге және бағдарламадан не көргіңіз келетіні туралы пікіріңізді осында(жаңа терезеде ашылады) бөлісуге шақырамыз.

Қорытынды

GPT‑5.2‑Codex озық AI-дің шынайы бағдарламалық инженерияны және киберқауіпсіздік сияқты маманданған салаларды қалай қолдай алатынын ілгерілететін қадамды білдіреді — әзірлеушілер мен қорғаушыларға күрделі, ұзақ көкжиекті жұмысты еңсеруге көмектесіп, жауапты қауіпсіздік зерттеулеріне арналған құралдарды күшейтеді.

GPT‑5.2‑Codex‑ті біртіндеп енгізу, енгізуді қорғаныс шараларымен ұштастыру және қауіпсіздік қауымдастығымен тығыз жұмыс істеу арқылы біз теріс пайдалану қаупін азайта отырып, қорғаныстық әсерді барынша арттыруды мақсат етеміз. Осы шығарылымнан үйренетініміз бағдарламалық жасақтама мен кибердің озық шекаралары ілгерілеуді жалғастырған сайын, уақыт өте келе қолжетімділікті қалай кеңейтетінімізге тікелей әсер етеді.

Автор

OpenAI