GPT‑5.2‑Codex‑ийг танилцуулж байна
Мэргэжлийн програм хангамжийн инженерчлэл ба хамгаалалтын кибер аюулгүй байдалд зориулсан хамгийн дэвшилтэт агентлаг кодчиллын загвар.
Өнөөдөр бид бодит ертөнцийн нарийн төвөгтэй програм хангамжийн инженерчлэлд зориулсан одоог хүртэлх хамгийн дэвшилтэт агентлаг кодчиллын загвар болох GPT‑5.2‑Codex‑ийг гаргаж байна. GPT‑5.2‑Codex нь Codex дахь агентлаг кодчилолд илүү оновчлогдсон GPT‑5.2-ын хувилбар бөгөөд контекст шахалтаар урт хугацааны ажлыг сайжруулсан, дахин бүтэцлэлт ба шилжилт зэрэг томоохон кодын өөрчлөлт дээр илүү хүчтэй гүйцэтгэлтэй, Windows орчинд сайжирсан гүйцэтгэлтэй, мөн мэдэгдэхүйц илүү хүчтэй кибер аюулгүй байдлын чадамжтай.
Манай загварууд оюуны хил хязгаарын дагуу үргэлжлэн ахихын хэрээр эдгээр сайжруулалт нь кибер аюулгүй байдал зэрэг тусгай салбаруудад ч чадамжийн огцом үсрэлт болж хөрвөдгийг бид ажигласан. Жишээлбэл, өнгөрсөн долоо хоногт Codex CLI-тай GPT‑5.1‑Codex‑Max ашигласан аюулгүй байдлын судлаач React дахь эх код ил гарахад хүргэж болзошгүй эмзэг байдлыг илрүүлж, хариуцлагатайгаар мэдээлсэн(шинэ цонхонд нээгдэнэ).
GPT‑5.2‑Codex нь бидний өнөөг хүртэл гаргасан бүх загвараас илүү хүчтэй кибер аюулгүй байдлын чадамжтай. Эдгээр ахиц нь кибер аюулгүй байдлыг өргөн хэмжээнд бэхжүүлэхэд тусалж болох ч мөн болгоомжтой нэвтрүүлэлт шаардсан хоёрдмол хэрэглээний шинэ эрсдэлийг бий болгодог. GPT‑5.2‑Codex нь манай Preparedness Framework-ийн дагуу кибер чадамжийн ‘High’ түвшинд хүрээгүй ч бид ирээдүйн чадамжийн өсөлтийг харгалзан нэвтрүүлэх хандлагаа боловсруулж байна.
Өнөөдөр бид GPT‑5.2‑Codex‑ийг төлбөртэй ChatGPT хэрэглэгчдэд зориулсан бүх Codex сувгуудаар гаргаж байгаа бөгөөд ирэх долоо хоногуудад API хэрэглэгчдэд GPT‑5.2‑Codex‑д аюулгүй хандалт нээхээр ажиллаж байна. Үүнтэй зэрэгцэн бид хамгаалалтын кибер аюулгүй байдлын ажилд төвлөрсөн шалгагдсан мэргэжилтнүүд болон байгууллагуудад зориулж удахгүй гарах чадамжууд болон илүү уян загваруудад зөвхөн урилгаар олгох итгэмжлэгдсэн хандалтыг туршиж байна. Нэвтрүүлэх энэ арга барил нь хүртээмж ба аюулгүй байдлын тэнцвэрийг хадгална гэж бид үзэж байна.
GPT‑5.2‑Codex нь мэргэжлийн мэдлэгийн ажил дахь GPT‑5.2‑ын давуу талууд болон GPT‑5.1‑Codex‑Max-ийн хил хязгаарын агентлаг кодчилол, терминал ашиглах чадамж дээр суурилсан. GPT‑5.2‑Codex нь одоо урт контекст ойлголт, найдвартай хэрэгсэл дуудах, сайжирсан баримтат байдал, төрөлх шахалт дээр илүү сайн болсон тул урт хугацаанд үргэлжлэх кодчиллын даалгаварт илүү найдвартай түнш болж, сэтгэн бодохдоо токены хувьд үр ашигтай хэвээр байна.
GPT‑5.2‑Codex нь бодит терминал орчин дахь олон төрлийн даалгаварт агентлаг гүйцэтгэлийг шалгахаар бүтээгдсэн жишиг үзүүлэлтүүд болох SWE-Bench Pro болон Terminal-Bench 2.0 дээр салбарын тэргүүлэх гүйцэтгэл үзүүлдэг. Мөн GPT‑5.1‑Codex‑Max‑д нэвтрүүлсэн чадамж дээр тулгуурлан төрөлх Windows орчин дахь агентлаг кодчилолд хамаагүй илүү үр дүнтэй, найдвартай болсон.
Эдгээр сайжруулалтын ачаар Codex бүрэн контекстээ хадгалсан хэвээр урт хугацааны сешнүүдэд том репозитор дээр ажиллахдаа илүү чадвартай болсон. Төлөвлөгөө өөрчлөгдөх эсвэл оролдлого амжилтгүй болсон үед ч мөрөө алдалгүй, томоохон дахин бүтэцлэлт, кодын шилжилт, функц бүтээх зэрэг нарийн төвөгтэй ажлуудыг илүү найдвартай гүйцээж, үргэлжлүүлэн давтан сайжруулж чадна.
SWE-Bench Pro-д загварт кодын репозитор өгөгдөж, бодитой програм хангамжийн инженерчлэлийн даалгаврыг шийдэх нөхөөс үүсгэх ёстой. Terminal-Bench 2.0 нь AI агентуудыг бодит терминал орчинд шалгах жишиг үзүүлэлт юм. Даалгаварт код эмхэтгэх, загвар сургах, сервер тохируулах зэрэг орно.
Илүү хүчтэй харааны гүйцэтгэл нь GPT‑5.2‑Codex‑д кодчиллын сешний үеэр хуваалцсан дэлгэцийн зураг, техникийн диаграмм, график, UI гадаргууг илүү үнэн зөв тайлбарлах боломж олгодог.
Codex нь дизайны загваруудыг авч хурдан хугацаанд ажиллах прототип болгож хувиргаж чадна, мөн та Codex-той хослон эдгээр прототипийг продакшнд хүргэж болно.
Дизайны загвар

GPT‑5.2‑Codex‑оор үүсгэсэн прототип
Кибер аюулгүй байдлын үндсэн үнэлгээнүүдийн нэг дээрх гүйцэтгэлийг хугацааны явцад зураглахад GPT‑5‑Codex‑оос эхлэн чадамж огцом өсөж, GPT‑5.1‑Codex‑Max дээр дахин том үсрэлт хийж, одоо GPT‑5.2‑Codex дээр гурав дахь үсрэлт гарсныг бид харж байна. Удахгүй гарах AI загварууд энэ чиглэлийг үргэлжлүүлнэ гэж бид хүлээж байна. Үүнд бэлтгэж, манай Preparedness Framework(шинэ цонхонд нээгдэнэ)-ээр хэмжигдэхээр шинэ загвар бүр кибер аюулгүй байдлын ‘High’ түвшинд хүрч болзошгүй мэтээр бид төлөвлөж, үнэлж байна. GPT‑5.2‑Codex нь кибер чадамжийн ‘High’ түвшинд хараахан хүрээгүй ч энэ босгыг давах ирээдүйн загваруудад бид бэлтгэж байна. Кибер чадамж нэмэгдсэнтэй холбоотойгоор бид загвар болон бүтээгдэхүүнд нэмэлт хамгаалалтууд нэмж, тэдгээрийг системийн карт-д тайлбарласан.
Professional Capture-the-Flag (CTF) үнэлгээ нь Linux орчинд загвар бодит ертөнцийн ахисан түвшний, олон үе шаттай сорилтуудыг (мэргэжлийн түвшний кибер аюулгүй байдлын ур чадвар шаардсан) хэр олон удаа шийдэж чаддагийг хэмждэг.
Орчин үеийн нийгэм програм хангамж дээр ажилладаг бөгөөд түүний найдвартай байдал нь хүчтэй кибер аюулгүй байдлаас хамаардаг—банк, эрүүл мэнд, харилцаа холбоо, зайлшгүй үйлчилгээний чухал системүүдийг онлайн байлгах, мэдрэмтгий өгөгдлийг хамгаалах, мөн хүмүүс өдөр бүр түшиглэдэг програм хангамждаа итгэх боломжийг хангах. Эмзэг байдал хэн нэгэн мэдэхээс 훨 өмнө оршиж болох бөгөөд тэдгээрийг олох, баталгаажуулах, засах нь зөв хэрэгслээр хангагдсан инженерүүд болон хараат бус аюулгүй байдлын судлаачдын нийгэмлэгээс ихэвчлэн хамаардаг.
2025 оны 12-р сарын 11-нд React баг React Server Components-оор бүтээгдсэн аппуудад нөлөөлөх гурван аюулгүй байдлын эмзэг байдлыг нийтэлсэн. Энэ мэдэгдлийг онцгой болгосон зүйл нь зөвхөн эмзэг байдал өөрсдөө бус, харин тэдгээрийг хэрхэн илрүүлсэн явдал байв.
Stripe компанийн нэг хэсэг болох Privy-ийн ахлах аюулгүй байдлын инженер Andrew MacPherson нь өмнөх долоо хоногт мэдээлэгдсэн, React2Shell(шинэ цонхонд нээгдэнэ) (CVE-2025-55182(шинэ цонхонд нээгдэнэ)) нэрээр танигдсан өөр нэг чухал React эмзэг байдлыг дахин гаргаж, судлахын тулд Codex CLI болон бусад кодчиллын агентуудтай GPT‑5.1‑Codex‑Max‑ийг ашиглаж байв. Түүний зорилго нь загвар бодит ертөнцийн эмзэг байдлын судалгаанд хэр сайн тусалж чадахыг үнэлэх байсан.
Тэр эхэндээ хэд хэдэн тэг оролдлогын шинжилгээ хийж, нөхөөсийг шалгаж ямар эмзэг байдлыг зассаныг тодорхойлохыг загвараас хүссэн. Энэ нь үр дүн өгөөгүй тул тэр илүү их хэмжээний, давталттай өгөгдөл оруулах хандлагад шилжив. Эдгээр аргууд амжилтгүй болоход тэр Codex-ийг хамгаалалтын аюулгүй байдлын стандарт ажлын урсгалаар удирдсан—локал тестийн орчин тохируулах, боломжит довтолгооны гадаргууг сэтгэн бодох, мөн буруу бүтэцтэй оролтоор системийг шалгахын тулд fuzzing ашиглах зэрэг. Анхны React2Shell асуудлыг дахин гаргахыг оролдож байхдаа Codex илүү гүнзгий шалгалт шаардах гэнэтийн зан үйлийг илрүүлсэн. Нэг долоо хоногийн хугацаанд энэ процесс өмнө нь мэдэгдээгүй эмзэг байдлуудыг нээхэд хүргэсэн бөгөөд тэдгээрийг React багт хариуцлагатайгаар мэдээлсэн.
Энэ нь дэвшилтэт AI системүүд өргөн хэрэглэгддэг бодит ертөнцийн програм хангамж дахь хамгаалалтын аюулгүй байдлын ажлыг бодитоор хурдасгаж чаддгийг харуулж байна. Үүний зэрэгцээ хамгаалагчдад хурдан ажиллахад туслах чадамжийг муу этгээдүүд буруугаар ашиглаж болно.
Агентлаг системүүд кибер аюулгүй байдалтай холбоотой даалгавруудад улам чадварлаг болохын хэрээр эдгээр ахицыг хариуцлагатай нэвтрүүлэхийг бид үндсэн тэргүүлэх чиглэл болгож байна—чадамжийн өсөлт бүрийг илүү хүчтэй хамгаалалт, илүү хатуу хандалтын хяналт, аюулгүй байдлын нийгэмлэгтэй үргэлжилсэн хамтын ажиллагаатай хослуулж байна.
Аюулгүй байдлын багууд заналхийлэгч этгээдүүдийг дуурайлган үзэх, засварлах ажлыг дэмжихийн тулд malware шинжлэх, эсвэл чухал дэд бүтцийг стресс тестлэхийг оролдох үед хязгаарлалттай тулгарч болно. Бид шаардлага хангасан хэрэглэгчид болон байгууллагуудын хувьд энэ саадыг арилгаж, итгэмжлэгдсэн хамгаалагчдад хил хязгаарын AI кибер чадамжийг ашиглан кибер хамгаалалтыг хурдасгах боломж олгох итгэмжлэгдсэн хандалтын туршилтыг боловсруулж байна.
Эхний ээлжид энэхүү туршилтын хөтөлбөр нь зөвхөн урилгаар, эмзэг байдлыг хариуцлагатайгаар мэдээлж ирсэн туршлагатай шалгагдсан аюулгүй байдлын мэргэжилтнүүд болон мэргэжлийн кибер аюулгүй байдлын тодорхой хэрэглээтэй байгууллагуудад зориулагдана. Шаардлага хангасан оролцогчид хууль ёсны хоёрдмол хэрэглээний ажлыг боломжтой болгохын тулд хамгаалалтын хэрэглээний тохиолдолд зориулсан манай хамгийн чадварлаг загваруудад хандалт авна.
Хэрэв та аюулгүй байдлын мэргэжилтэн эсвэл эмзэг байдлын судалгаа, зөвшөөрөгдсөн red-teaming зэрэг ёс зүйтэй аюулгүй байдлын ажил хийдэг байгууллагын нэг хэсэг бол нэгдэх сонирхлоо илэрхийлж, хөтөлбөрөөс юу харахыг хүсэж байгаагаа энд(шинэ цонхонд нээгдэнэ) хуваалцахыг урьж байна.
GPT‑5.2‑Codex нь дэвшилтэт AI бодит ертөнцийн програм хангамжийн инженерчлэл болон кибер аюулгүй байдал зэрэг тусгай салбаруудыг хэрхэн дэмжиж болохын нэг алхам урагшилсан илэрхийлэл юм—хөгжүүлэгчид болон хамгаалагчдад нарийн төвөгтэй, урт хугацааны ажлыг шийдэхэд тусалж, хариуцлагатай аюулгүй байдлын судалгаанд ашиглах хэрэгслүүдийг бэхжүүлж байна.
GPT‑5.2‑Codex‑ийг аажмаар нэвтрүүлж, нэвтрүүлэлтийг хамгаалалттай хослуулж, аюулгүй байдлын нийгэмлэгтэй нягт хамтран ажилласнаар бид буруугаар ашиглах эрсдэлийг бууруулахын зэрэгцээ хамгаалалтын үр нөлөөг хамгийн их байлгахыг зорьж байна. Энэ хувилбараас суралцах зүйлс нь програм хангамж болон кибер хил хязгаарууд үргэлжлэн ахихын хэрээр хугацааны явцад хандалтыг хэрхэн өргөжүүлэхийг шууд тодорхойлох болно.


