Disyembre 18, 2025

Ipinapakilala ang GPT‑5.2‑Codex

Ang pinaka-advanced na agentic coding na modelo para sa propesyonal na software engineering at depensibong cybersecurity.

$ npm i -g @openai/codex

Ngayong araw, ilalabas namin ang GPT‑5.2‑Codex, ang pinaka-advanced na agentic coding na modelo para sa kumplikado at totoong software engineering. Ang GPT‑5.2‑Codex ay isang bersyon ng GPT‑5.2⁠ na higit pang na-optimize para sa agentic coding sa Codex, kabilang ang mga pagpapabuti sa long-horizon work sa pamamagitan ng context compaction, mas malakas na pagganap sa malalaking pagbabago ng code tulad ng mga refactor at migration, pinahusay na pagganap sa mga Windows environment, at mas malakas na kakayahan sa cybersecurity.

Habang patuloy na sumusulong ang aming mga modelo sa larangan ng katalinuhan, naobserbahan namin na ang mga pagpapabuting ito ay isinasalin din sa mga pagtaas ng kakayahan sa mga espesyalisadong larangan tulad ng cybersecurity⁠. Halimbawa, noong nakaraang linggo lang, isang mananaliksik sa seguridad ang gumamit ng GPT‑5.1‑Codex‑Max gamit ang Codex CLI at may natagpuan ito at responsableng isiniwalat⁠(magbubukas sa bagong window) na kahinaan sa React na maaaring magdulot ng pagkakalantad ng source code.

May mas malakas na kakayahan sa cybersecurity ang GPT‑5.2‑Codex kaysa sa anumang modelo na aming inilabas sa ngayon. Ang mga pag-unlad na ito ay makakatulong sa pagpapalakas ng cybersecurity sa malawakang saklaw, ngunit nagdadala rin ito ng mga bagong panganib na may dalawahang gamit na nangangailangan ng maingat na pag-deploy. Habang ang GPT‑5.2‑Codex ay hindi umaabot sa 'Mataas' na antas ng kakayahan sa cyber sa ilalim ng aming Balangkas ng Kahandaan, idinisenyo namin ang aming paraan ng pag-deploy⁠ na may pag-iisip sa paglago ng kakayahan sa hinaharap.

Ilalabas namin ang GPT‑5.2‑Codex ngayon sa lahat ng interface ng Codex para sa mga bayad na user ng ChatGPT, at nagsusumikap kaming ligtas na paganahin ang access sa GPT‑5.2‑Codex para sa mga API user sa mga susunod na linggo. Kasabay nito, ipa-pilot namin ang imbitasyon-lamang na mapagkakatiwalaang pag-access sa mga paparating na kakayahan at mas maluwag na mga modelo para sa mga na-verify na propesyonal at organisasyong nakatuon sa depensibong gawain sa cybersecurity. Naniniwala kami na ang diskarteng ito sa pag-deploy ay magbabalanse sa accessibility at kaligtasan.

Pagtulak sa hangganan sa real-world software engineering

Ang GPT‑5.2‑Codex ay nakabatay sa mga kalakasan ng GPT‑5.2⁠ sa gawaing propesyonal na kaalaman at mga kakayahan ng GPT‑5.1‑Codex‑Max⁠ sa frontier agentic coding at paggamit ng terminal. Mas mahusay na ngayon ang GPT‑5.2‑Codex sa pag-unawa sa mahabang konteksto, maaasahang pagtawag ng tool, pinabuting factuality, at likas na compaction, kaya mas maaasahan na itong ka-partner para sa mga pangmatagalang gawain sa pag-code, habang nananatiling mahusay sa paggamit ng token sa pangangatwiran nito.

Nakakamit ng GPT‑5.2‑Codex ang pinakamataas na antas ng pagganap sa SWE-Bench Pro at Terminal-Bench 2.0, mga benchmark na idinisenyo para subukan ang agentic na pagganap sa iba't ibang gawain sa makatotohanang mga terminal na kapaligiran. Mas epektibo at maaasahan din ito sa agentic coding sa mga likas kapaligiran ng Windows, na nakabatay sa mga kakayahang ipinakilala sa GPT‑5.1‑Codex‑Max.

Sa mga pagpapabuting ito, mas may kakayahan na ang Codex na magtrabaho sa malalaking repositoryo sa mas mahabang mga session na may buo at kumpletong konteksto. Mas maaasahan itong makakumpleto ng mga kumplikadong gawain tulad ng malalaking pag-refactor, paglipat ng code, at pagbuo ng mga feature — patuloy na nag-i-iterate nang hindi nawawala sa landas, kahit na magbago ang mga plano o mabigo ang mga pagtatangka.

Sa SWE-Bench Pro⁠⁠⁠⁠, binibigyan ang modelo ng code repository at kailangan nitong bumuo ng patch para malutas ang makatotohanang gawain sa software engineering. Terminal-Bench 2.0 benchmark para sa pagsubok ng mga AI agent sa totoong terminal na kapaligiran. Kasama sa mga gawain ang pag-compile ng code, pagsasanay ng mga modelo, at pag-set up ng mga server.

Ang mas mahusay na vision sa pagganap ay nagbibigay-daan sa GPT‑5.2‑Codex na mas tumpak na maunawaan ang mga screenshot, technical diagram, chart, at UI surface na ibinabahagi sa mga coding session.

Kayang kunin ng Codex ang mga mock ng disenyo at mabilis na isalin ang mga ito sa mga gumaganang prototype, at maaari kang makipagpares sa Codex upang dalhin ang mga prototype na ito sa produksyon.

Mock ng disenyo

Design mock na ginamit para bumuo ng web prototype gamit ang Codex-5.2

Prototype na binuo ng GPT‑5.2‑Codex

Isinusulong ang hangganan ng cyber

Kapag china-chart ang pagganap sa isa sa aming mga pagsusuri sa cybersecurity sa paglipas ng panahon, nakikita namin ang matinding pagtalon sa kakayahan simula sa GPT‑5‑Codex, isa pang malaking pagtalon sa GPT‑5.1‑Codex‑Max at ngayon, pangatlong pagtalon sa GPT‑5.2‑Codex. Inaasahan namin na magpapatuloy sa landas na ito ang mga paparating na modelo ng AI. Bilang paghahanda, nagpaplano at sinusuri namin na parang ang bawat bagong modelo ay maaaring umabot sa 'Mataas' na antas ng kakayahan sa cybersecurity, gaya ng sinusukat ng aming Preparedness Framework⁠⁠(magbubukas sa bagong window). Habang hindi pa umaabot sa 'Mataas' na antas ng kakayahan sa cyber ang GPT‑5.2‑Codex, naghahanda na kami para sa mga hinaharap na modelo na tatawid sa threshold na iyon. Dahil sa pagtaas ng mga cyber na kakayahan, nagdagdag kami ng karagdagang mga proteksyon sa modelo at sa produkto, na nakabalangkas sa system card⁠.

Sinusukat ng pagsusuri ng Professional Capture-the-Flag (CTF) kung gaano kadalas malulutas ng modelo ang mga advanced, multi-step na hamon sa totoong mundo (na nangangailangan ng mga kasanayan sa cybersecurity sa antas ng propesyonal) sa kapaligirang Linux.

Mga kakayahan sa cyber sa totoong buhay

Umaasa ang modernong lipunan sa software, at nakadepende ang pagiging maaasahan nito sa matatag na cybersecurity—para mapanatiling online ang mga kritikal na sistema sa pagbabangko, pangangalagang pangkalusugan, komunikasyon, at mahahalagang serbisyo, maprotektahan ang sensitibong data, at matiyak na maaasahan ng mga tao ang software na ginagamit nila araw-araw. Maaaring umiral ang mga kahinaan bago pa man malaman ng sinuman ang tungkol sa mga ito, at ang paghahanap, pagpapatunay, at pag-aayos ng mga ito ay madalas na nakasalalay sa isang komunidad ng mga inhinyero at mga independiyenteng mananaliksik sa seguridad na may tamang kagamitan.

Noong Disyembre 11, 2025, nag-publish ang React team ang tatlong kahinaan sa seguridad na nakakaapekto sa mga app na ginawa gamit ang React Server Components. Ang naging kapansin-pansin sa paglalantad na ito ay hindi lang ang mismong mga kahinaan, kundi pati na rin ang paraan ng kanilang pagtuklas.

Si Andrew MacPherson, isang pangunahing security engineer sa Privy (kumpanya ng Stripe), ay gumagamit ng GPT‑5.1‑Codex‑Max gamit ang Codex CLI at iba pang mga coding agent para muling gawin at pag-aralan ang ibang kritikal na kahinaan ng React na isiniwalat noong nakaraang linggo, na kilala bilang React2Shell⁠(magbubukas sa bagong window) (CVE-2025-55182⁠(magbubukas sa bagong window)). Layunin niya na suriin kung gaano kahusay ang modelo sa pagtulong sa pananaliksik ng mga kahinaan sa totoong mundo.

Sa simula, sinubukan niya ang ilang zero-shot na pagsusuri, hinihikayat ang modelo na suriin ang patch at tukuyin ang kahinaang tinutugunan nito. Nang hindi iyon nagbunga ng mga resulta, lumipat siya sa mas mataas na volume at iterative na paraan ng pag-prompt. Nang hindi magtagumpay ang mga paraang iyon, ginabayan niya ang Codex sa mga karaniwang workflow ng depensibong seguridad—pagse-set up ng lokal na test environment, pag-iisip sa mga potensyal na attack surface, at paggamit ng fuzzing para suriin ang system gamit ang mga maling input. Habang sinusubukang i-reproduce ang orihinal na isyu ng React2Shell, nagpakita ang Codex ng mga hindi inaasahang paggawi na nangangailangan ng mas malalim na pagsisiyasat. Sa loob ng isang linggo, humantong ang prosesong ito sa pagtuklas ng mga dating hindi kilalang kahinaan, na responsableng isiniwalat sa React team.

Diagram ng daloy na pinamagatang “Pagtuklas ng Kahinaan gamit ang Codex: CVE-2025-55183” na nagpapakita ng daloy ng trabaho na nagsisimula sa isang Git repository at Codex na nag-sa-scan ng code para sa mga kahinaan. Ang isang zero-shot na pagtatangka ay nabigo, na sinundan ng isang prosesong ginagabayan ng eksperto na sinusuri ang codebase, kinikilala ang mga posibleng target, bumubuo ng isang harness, at nagsasagawa ng fuzz testing laban sa isang halimbawang app na may revalidation. Beberipikahin ang mga resulta upang gumawa ng patunay ng konsepto, na nagreresulta sa responsableng pagbubunyag at isang patch na ilalapat pabalik sa repository.

Ipinapakita nito kung paano lubos na mapabilis ng mga advanced na system ng AI ang gawaing pangdepensa sa seguridad sa malawakang ginagamit na software sa totoong mundo. Kasabay nito, ang mga kakayahan na tumutulong sa mga tagapagtanggol na mas mabilis na kumilos ay maaari ding abusuhin ng masasamang aktor.

Habang nagiging mas may kakayahan ang mga agentic na system sa mga gawaing may kaugnayan sa cybersecurity, ginagawa naming pangunahing priyoridad ang pagtiyak na ang mga pagsulong na ito ay nagagamit nang responsable—pinagsasama ang bawat pagtaas ng kakayahan kasabay ng mas matibay na mga pananggalang, mas mahigpit na mga kontrol sa pag-access, at patuloy na pakikipagtulungan sa komunidad ng seguridad.

Pinalalakas ang cyberdefense sa pamamagitan ng pinagkakatiwalaang pag-access

Maaaring makaranas ng mga limitasyon ang mga security team kapag sinusubukang gayahin ang mga threat actor, suriin ang malware para sa suporta sa remediation, o subukan ang tibay ng kritikal na imprastraktura. Nagde-develop kami ng pilot sa pinagkakatiwalaang pag-access para alisin ang hadlang na iyon para sa mga kwalipikadong user at organisasyon at i-enable ang mga pinagkakatiwalaang tagapagtanggol na gamitin ang mga nangungunang kakayahan ng AI sa cybersecurity para pabilisin ang cyberdefense.

Sa simula, ang pilot na programa ay para lang sa mga nasuring propesyonal sa seguridad na may rekord ng responsableng pagsisiwalat ng mga kahinaan at mga organisasyong may malinaw na kaso ng paggamit sa propesyonal na cybersecurity. Ang mga kwalipikadong kalahok ay magkakaroon ng access sa aming pinakamalalakas na modelo para sa mga kaso ng paggamit na pang-depensa upang i-enable ang lehitimong dual-use na trabaho.

Kung isa kang propesyonal sa seguridad o bahagi ng organisasyon na gumagawa ng etikal na gawain sa seguridad tulad ng pananaliksik sa kahinaan o awtorisadong red-teaming, inaanyayahan ka naming ipahayag ang interes na sumali at magbahagi ng feedback sa kung ano ang gusto mong makita mula sa programa dito⁠(magbubukas sa bagong window).

Konklusyon

Ang GPT‑5.2‑Codex ay hakbang pasulong sa kung paano maaaring suportahan ng advanced AI ang tunay na software engineering at mga specialized na domain gaya ng cybersecurity—tinutulungan ang mga developer at defender na harapin ang kumplikado at pangmatagalang trabaho, at pinapalakas ang mga tool para sa responsable at epektibong pananaliksik sa seguridad.

Sa pamamagitan ng unti-unting paglulunsad ng GPT‑5.2‑Codex, pagsasama ng mga pananggalang sa deployment, at pakikipagtulungan nang mabuti sa komunidad ng seguridad, layunin naming makamit ang pinakamataas na depensibong epekto habang pinapababa ang panganib ng maling paggamit. Ang aming matututuhan mula sa paglalabas na ito ay direktang gagabay sa kung paano namin palalawakin ang access sa paglipas ng panahon habang patuloy na umuunlad ang software at cyber na larangan.

May-akda

OpenAI

Magpatuloy sa pagbabasa

Tingnan lahat

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 na ngayon ang pinapaborang modelo sa Microsoft 365 Copilot

ProduktoHul 9, 2026

Partner na ngayon ang ChatGPT para sa pinakaambisyoso mong trabaho

ProduktoHul 9, 2026

GPT-5.6: Frontier intelligence na lumalawak kasabay ng iyong ambisyon

ProduktoHul 9, 2026