Kutambulisha GPT‑5.2‑Codex
Muundo wa kisasa zaidi wa usimbaji wa kiwakala kwa uhandisi wa programu wa kitaalamu na usalama wa mtandao wa kujihami.
Leo tunatoa GPT‑5.2‑Codex, muundo wa kisasa zaidi wa usimbaji wa kiwakala kwa uhandisi changamano wa programu za ulimwengu halisi. GPT‑5.2‑Codex ni toleo la GPT‑5.2 lililoboreshwa zaidi kwa usimbaji wa mawakala katika Codex, likijumuisha maboresho katika kazi za muda mrefu kupitia ubanaji wa muktadha, utendaji bora katika mabadiliko makubwa ya msimbo kama vile marekebisho na uhamishaji, utendaji ulioboreshwa katika mazingira ya Windows, na uwezo wa usalama wa mtandao ulioimarishwa sana.
Kadri miundo yetu inavyoendelea kusonga mbele katika mpaka wa akili, tumeona kwamba maboresho haya pia yanatafsiri kuwa ongezeko la uwezo katika vikoa maalum kama usalama wa mtandao. Kwa mfano, wiki iliyopita tu, mtafiti wa usalama akitumia GPT‑5.1‑Codex‑Max kwa kutumia Codex CLI iligundua na kufichua kwa uwajibikaji udhaifu(fungua katika dirisha jipya) katika React ambao unaweza kusababisha kufichuliwa kwa msimbo wa chanzo.
GPT‑5.2‑Codex ina uwezo bora zaidi wa usalama wa mtandao kuliko muundo wowote ambao tumewahi kutoa hadi sasa. Maendeleo haya yanaweza kusaidia kuimarisha usalama wa mtandao kwa kiwango kikubwa, lakini pia yanaibua hatari mpya za matumizi mawili zinazohitaji utekelezaji wa makini. Ingawa GPT‑5.2‑Codex haifikii kiwango cha 'Juu' cha uwezo wa mtandao chini ya Mfumo wetu wa Utayari, tunabuni mbinu yetu ya utekelezaji kwa kuzingatia ukuaji wa uwezo wa siku zijazo.
Tunatoa GPT‑5.2‑Codex leo katika nyuso zote za Codex kwa watumiaji wa ChatGPT wanaolipia, na tunafanya kazi kuelekea kuwezesha upatikanaji salama wa GPT‑5.2‑Codex kwa watumiaji wa API katika wiki zijazo. Sambamba, tunafanya majaribio ya ufikiaji wa kuaminika wa mwaliko pekee kwa uwezo ujao na miundo yenye ruhusa zaidi kwa wataalamu na mashirika yaliyothibitishwa yanayolenga kazi za usalama wa mtandao wa kujihami. Tunaamini kwamba mbinu hii ya utekelezaji itasawazisha upatikanaji na usalama.
GPT‑5.2‑Codex inajenga juu ya nguvu za GPT‑5.2 katika kazi ya maarifa ya kitaalamu na GPT‑5.1‑Codex‑Max uwezo wa usimbaji wa wakala wa kisasa na uwezo wa kutumia terminali. GPT‑5.2‑Codex sasa ni bora zaidi katika uelewa wa muktadha mrefu, kuita zana kwa uaminifu, ukweli ulioboreshwa, na ufinyizaji wa asili, na kuifanya kuwa mshirika anayetegemewa zaidi kwa shughuli za usimbaji za muda mrefu, huku ikibaki na ufanisi wa tokeni katika hoja zake.
GPT‑5.2‑Codex inafikia utendaji wa kisasa kwenye SWE-Bench Pro na Terminal-Bench 2.0, viwango vya tathmini vilivyoundwa kupima utendaji wa mawakala katika shughuli mbalimbali kwenye mazingira halisi ya mitambo. Pia ni bora zaidi na ya kuaminika katika usimbaji wa kiwakala katika mazingira asilia ya Windows, ikijenga juu ya uwezo ulioletwa na GPT‑5.1‑Codex‑Max.
Kwa maboresho haya, Codex ina uwezo zaidi wa kufanya kazi katika hazina kubwa kwa vikao virefu huku muktadha ukiwa kamili. Inaweza kukamilisha kwa uaminifu zaidi shughuli ngumu kama marekebisho makubwa, uhamisho wa msimbo, na ujenzi wa vipengele — ikiendelea kurudia bila kupoteza mwelekeo, hata mipango inabadilika au majaribio yanaposhindwa.
Katika SWE-Bench Pro, muundo unapewa hazina ya msimbo na lazima uzalishe kiraka ili kutatua shughuli halisi ya uhandisi wa programu. Terminal-Bench 2.0 ni kipimo cha kulinganisha kwa kujaribu mawakala wa AI katika mazingira halisi ya mtambo. Shughuli ni pamoja na kukusanya msimbo, mafunzo miundo na kusanidi seva.
Utendaji bora wa maono unawasha GPT‑5.2‑Codex kutafsiri kwa usahihi zaidi picha za skrini, michoro ya kiufundi, chati, na sehemu za UI zinazoshirikiwa wakati wa vikao vya usimbaji.
Codex inaweza kuchukua michoro ya muundo na kuibadilisha haraka kuwa vielelezo vya kazi, na unaweza kushirikiana na Codex ili kuchukua vielelezo hivi hadi uzalishaji.
Mfano wa muundo

Mfano uliotengenezwa na GPT‑5.2‑Codex
Tunapochora utendaji kwenye moja ya tathmini zetu kuu za usalama wa mtandao kwa muda, tunaona ongezeko kubwa la uwezo kuanzia na GPT‑5‑Codex, ongezeko lingine kubwa na GPT‑5.1‑Codex‑Max na sasa ongezeko la tatu na GPT‑5.2‑Codex. Tunatarajia kwamba miundo ya AI ijayo itaendelea kwenye mwelekeo huu. Katika maandalizi, tunapanga na kutathmini kana kwamba kila muundo mpya unaweza kufikia viwango vya 'Juu' vya uwezo wa usalama wa mtandao, kama inavyopimwa na Mfumo wetu wa Utayari(fungua katika dirisha jipya). Ingawa GPT‑5.2‑Codex bado haijafikia kiwango cha 'Juu' cha uwezo wa mtandao, tunajiandaa kwa miundo ya baadaye itakayovuka kizingiti hicho. Kutokana na uwezo wa mtandao ulioongezeka, tumeongeza hatua za ziada za ulinzi katika muundo na katika bidhaa, ambazo zimeelezwa katika kadi ya mfumo.
Tathmini ya Professional Capture-the-Flag (CTF) inapima mara ngapi muundo unaweza kutatua changamoto za ulimwengu halisi, za hatua nyingi na za juu (zinazohitaji ujuzi wa kitaalamu wa usalama wa mtandao) katika mazingira ya Linux.
Jamii ya kisasa inaendeshwa na programu, na uaminifu wake unategemea usalama wa mtandao wenye nguvu—kuweka mifumo muhimu katika benki, huduma za afya, mawasiliano, na huduma muhimu mtandaoni, kulinda data nyeti, na kuhakikisha watu wanaweza kuamini programu wanazotegemea kila siku. Udhaifu unaweza kuwepo kwa muda mrefu kabla ya mtu yeyote kujua kuhusu wao, na kuwapata, kuthibitisha, na kurekebisha mara nyingi kunategemea jamii ya wahandisi na watafiti huru wa usalama walio na zana sahihi.
Mnamo tarehe 11 Desemba, 2025, timu ya React ilichapisha udhaifu wa usalama watatu unaohusu programu zilizojengwa na Vipengele vya Seva vya React. Kilichofanya ufichuzi huu kuwa wa kipekee si tu udhaifu wenyewe, bali pia jinsi ulivyogunduliwa.
Andrew MacPherson, mhandisi mkuu wa usalama katika Privy (kampuni ya Stripe), alikuwa akitumia GPT‑5.1‑Codex‑Max pamoja na Codex CLI na mawakala wengine wa usimbaji ili kuzalisha na kuchunguza udhaifu muhimu tofauti wa React uliofichuliwa wiki iliyopita, unaojulikana kama React2Shell(fungua katika dirisha jipya) (CVE-2025-55182(fungua katika dirisha jipya)). Lengo lake lilikuwa kutathmini jinsi gani muundo unavyoweza kusaidia katika utafiti wa udhaifu wa ulimwengu halisi.
Awali alijaribu uchambuzi kadhaa wa zero-shot, akihimiza muundo kuchunguza kiraka na kutambua udhaifu uliokuwa ukishughulikiwa. Wakati hiyo haikutoa matokeo, alibadilisha na kutumia mbinu ya kuhamasisha kwa sauti kubwa na ya hatua kwa hatua. Wakati mbinu hizo hazikufaulu, aliiongoza Codex kupitia michakato ya kawaida ya usalama wa kujihami—kuanzisha mazingira ya majaribio ya ndani, kufikiria kupitia maeneo yanayoweza kushambuliwa, na kutumia fuzzing kuchunguza mfumo kwa kutumia ingizo lililoharibika. Wakati wa kujaribu kuzalisha tena suala la awali la React2Shell, Codex ilionyesha tabia zisizotarajiwa ambazo zilihitaji uchunguzi wa kina zaidi. Katika kipindi cha wiki moja tu, mchakato huu ulisababisha kugunduliwa kwa udhaifu ambao haukujulikana hapo awali, ambao ulifichuliwa kwa uwajibikaji kwa timu ya React.
Hii inaonyesha jinsi mifumo ya AI iliyoendelea inaweza kuharakisha kwa kiasi kikubwa kazi ya usalama wa kujihami katika programu inayotumika sana, ya ulimwengu halisi. Wakati huo huo, uwezo unaosaidia watetezi kusonga haraka unaweza pia kutumiwa vibaya na wahusika waovu.
Kadiri mifumo ya kiwakala inavyozidi kuwa na uwezo katika shughuli zinazohusiana na usalama wa mtandao, tunafanya kuwa kipaumbele chetu cha msingi kuhakikisha maendeleo haya yanatumika kwa uwajibikaji—kuunganisha kila ongezeko la uwezo na ulinzi madhubuti zaidi, udhibiti wa ufikiaji ulioimarishwa, na ushirikiano unaoendelea na jamii ya usalama.
Timu za usalama zinaweza kukumbana na vizuizi wakati wa kujaribu kuiga wahusika wa tishio, kuchambua programu hasidi ili kutoa usaidizi wa marekebisho, au kupima kwa kina miundombinu muhimu. Tunatengeneza mradi wa majaribio wa ufikiaji unaoaminika ili kuondoa kikwazo hicho kwa watumiaji na mashirika yanayostahiki na kuwasha watetezi wanaoaminika kutumia uwezo wa kisasa wa AI wa mtandao ili kuharakisha ulinzi wa mtandao.
Hapo mwanzo, programu ya majaribio itakuwa ya mwaliko pekee kwa wataalamu wa usalama waliothibitishwa wenye rekodi ya kufichua udhaifu kwa uwajibikaji na mashirika yenye kesi wazi ya matumizi ya kitaalamu ya usalama wa mtandao. Washiriki wanaostahiki watapata ufikiaji wa miundo yetu yenye uwezo zaidi kwa matumizi ya kujihami ili washa kazi halali ya matumizi mawili.
Ikiwa wewe ni mtaalamu wa usalama au sehemu ya shirika linalofanya kazi ya usalama wa kimaadili kama vile utafiti wa udhaifu au red-teaming iliyoidhinishwa, tunakualika uonyeshe nia ya kujiunga na utoe majibu kuhusu kile unachotaka kuona kutoka kwa mpango hapa(fungua katika dirisha jipya).
GPT‑5.2‑Codex inawakilisha hatua mbele katika jinsi AI ya hali ya juu inaweza kutoa usaidizi katika uhandisi wa programu halisi na katika maeneo ya kikoa kama usalama wa mtandao—ikisaidia wasanidi programu na watetezi kushughulikia kazi ngumu, za muda mrefu, na kuimarisha zana zinazopatikana kwa utafiti wa usalama wenye uwajibikaji.
Kwa kuzindua GPT‑5.2‑Codex Kwa kusambaza hatua kwa hatua, kuoanisha usambazaji na hatua za ulinzi, na kushirikiana kwa karibu na jamii ya usalama, tunalenga kuongeza athari za ulinzi huku tukipunguza hatari ya matumizi mabaya. Tunachojifunza kutoka kwa toleo hili litaathiri moja kwa moja jinsi tunavyopanua ufikiaji kwa muda kadri programu na mipaka ya mtandao zinavyoendelea kusonga mbele.


