Liwati menyang isi utama
OpenAI

19 November 2025

ProdukRilis

Mbangun luwih akèh nganggo GPT‑5.1‑Codex‑Max

Lagi dimuat…

Pambuka

Kami ngenalké GPT‑5.1‑Codex‑Max, model coding agen tercanggih anyar kami, sing wis kasedhiya ing Codex dina iki. GPT‑5.1‑Codex‑Max dibangun saka pembaruan model nalar dhasar kami, sing dilatih nganggo tugas agen ing rekayasa piranti lunak, matématika, riset, lan liya-liyané. GPT‑5.1‑Codex‑Max luwih cepet, luwih pinter, lan luwih efisien token ing saben tahap siklus pangembangan—lan dadi langkah anyar menyang mitra coding sing andal.

GPT‑5.1‑Codex‑Max dibangun kanggo karya rinci sing mlaku suwé. Iki model pisanan kami sing dilatih native kanggo operasi ing pirang-pirang context window liwat proses sing disebut compaction, bisa kerja kanthi runtut ing jutaan token sajrone siji tugas. Iki mbukak refaktor skala proyek, sesi debugging jero, lan loop agen multi-jam.

GPT‑5.1‑Codex‑Max wis kasedhiya ing Codex dina iki kanggo digunakaké ing CLI, ekstensi IDE, cloud, lan review kode, lan akses API bakal teka enggal.

Kemampuan coding tercanggih

GPT‑5.1‑Codex‑Max dilatih nganggo tugas rekayasa piranti lunak donya nyata, kaya nggawe PR, review kode, coding frontend, lan tanya jawab lan ngluwihi model-model sadurungé kami ing akèh evaluasi coding tercanggih. Peningkatan model iki ing benchmark uga dibarengi perbaikan kanggo panggunaan donya nyata: GPT‑5.1‑Codex‑Max iku model pisanan sing kami latih kanggo operasi ing lingkungan Windows, lan latihane saiki uga nyakup tugas sing dirancang supaya dadi kolaborator sing luwih apik ing Codex CLI.

* Kabeh evaluasi dijalanké kanthi compaction aktif ing upaya nalar Extra High
* Terminal-Bench2.0 dijalanké nganggo Codex CLI ing
harness Laude Institute Harbor(mbukak ing jendhela anyar)

Kacepetan lan biaya

GPT‑5.1‑Codex‑Max nuduhaké peningkatan gedhé ing efisiensi token amarga nalar sing luwih efektif. Ing SWE-bench Verified, GPT‑5.1‑Codex‑Max kanthi upaya nalar ‘medium’ nggayuh kinerja luwih apik tinimbang GPT‑5.1‑Codex kanthi upaya nalar sing padha, nalika nggunakaké token mikir 30% luwih sithik. Kanggo tugas sing ora sensitif marang latensi, kami uga ngenalké upaya nalar Extra High (‘xhigh’) anyar, sing mikir luwih suwé kanggo jawaban sing luwih apik. Nanging, kami isih nyaranaké medium dadi pilihan saben dina kanggo akèh tugas.

Kami ngarep-arep peningkatan efisiensi token iki bakal dadi penghematan nyata kanggo para pengembang.

Contoné, GPT‑5.1‑Codex‑Max bisa ngasilaké desain frontend kualitas dhuwur kanthi fungsi lan éstetika sing padha, nanging kanthi biaya adoh luwih murah tinimbang GPT‑5.1‑Codex.

Prompt: Gawe siji aplikasi browser mandiri sing nampilaké sandbox RL CartPole interaktif nganggo grafis canvas, kontroler policy-gradient cilik, metrik, lan visualisator jaringan SVG.

Fitur

  • Kudu bisa tenan nglatih policy supaya model dadi luwih apik ing cart pole
  • Visualisator kanggo aktivasi/bobot nalika model lagi latihan utawa inferensi
  • Langkah ing épisode, ganjaran ing épisode iki
  • Wektu bertahan pungkasan lan wektu bertahan paling apik ing langkah

Simpen dadi index.html

Tugas sing mlaku suwé

Compaction ndadèkaké GPT‑5.1‑Codex‑Max bisa ngrampungaké tugas sing sadurungé bakal gagal amarga wates context window, kayata refaktor rumit lan loop agen sing mlaku suwé, kanthi ngresiki riwayaté nanging tetep njaga konteks paling penting kanggo rentang wektu dawa. Ing aplikasi Codex, GPT‑5.1‑Codex‑Max bakal otomatis ngompakaké sesiné nalika nyedhaki wates context window, menehi context window anyar. Proses iki diulang nganti tugasé rampung.

Kemampuan njaga karya sing runtut ing rentang wektu dawa iku kemampuan dhasar ing dalan menyang sistem AI sing luwih umum lan andal. GPT‑5.1‑Codex‑Max bisa kerja mandiri nganti pirang-pirang jam sekaligus. Ing evaluasi internal kami, kami ndelok GPT‑5.1‑Codex‑Max kerja ing tugas luwih saka 24 jam. Model iki bakal terus-terusan ngiterasi implementasiné, ndandani kegagalan tes, lan pungkasane ngirim asil sing sukses.

Ing conto iki, GPT‑5.1‑Codex‑Max kanthi mandiri ngrefaktor gudang kode open source Codex CLI.

Nalika dawa sesi nyedhaki context-window model, sesi bakal otomatis dikompakaké kanggo mbebasaké ruang supaya bisa nerusaké tugas tanpa kelangan kemajuan.

Videoné wis dipotong lan dicepetaké supaya luwih cetha.

Mbangun agen AI sing aman lan bisa dipercaya

GPT‑5.1‑Codex‑Max tampil luwih apik kanthi signifikan ing evaluasi sing mbutuhaké nalar terus-terusan lan jangka dawa. Amarga bisa kerja runtut ing pirang-pirang context window nganggo compaction, model iki ngasilaké asil luwih apik kanggo tantangan ing wilayah kaya coding jangka dawa lan keamanan siber. Kami nganalisis asil kinerja model iki ing evaluasi pihak pisanan lan katelu ing kertu sistem GPT‑5.1‑Codex‑Max.

GPT‑5.1‑Codex‑Max ora nggayuh kemampuan High ing Keamanan Siber miturut Kerangka Kesiapan kami, nanging iki model keamanan siber paling mumpuni sing wis kami luncuraké nganti saiki lan kemampuan keamanan siber agen berkembang kanthi cepet. Mulané, kami lagi njupuk langkah kanggo nyiapaké kemampuan High ing Keamanan Siber lan nguwataké safeguard kami ing domain siber uga kerja supaya para pembéla bisa oleh manfaat saka kemampuan sing luwih apik iki liwat program kaya Aardvark.

Nalika kami ngluncuraké GPT‑5‑Codex, kami nerapaké pemantauan khusus keamanan siber kanggo ndeteksi lan ngganggu aktivitas ala. Sanajan kami durung ndelok peningkatan penyalahgunaan skala gedhé sing wigati, kami lagi nyiapaké mitigasi tambahan kanggo kemampuan tingkat lanjut. Tim kami wis ngganggu operasi siber sing nyoba nyalahgunakaké model kami, lan aktivitas curiga diarahkan kanggo ditinjau liwat sistem pemantauan kabijakan kami.

Codex dirancang supaya mlaku ing sandbox aman kanthi bawaan: panulisan file diwatesi mung ing papan kerja, lan akses jaringan dipatèni kajaba pengembang nguripaké. Kami nyaranaké supaya Codex tetep ing mode akses winates iki, amarga nguripaké internet utawa panelusuran web bisa ngenalké risiko prompt-injection saka konten sing ora dipercaya.

Amarga Codex saya luwih mumpuni kanggo tugas sing mlaku suwé, saya penting kanggo para pengembang mriksa karya agen sadurungé nggawe owah-owahan utawa nyebaraké menyang produksi. Kanggo mbantu iki, Codex ngasilaké log terminal lan nyebutaké panggilan alat lan asil tes. Sanajan review kode saka Codex nyuda risiko nyebaraké bug sing digawe model utawa manungsa menyang produksi, Codex kudu dianggep minangka reviewer tambahan lan dudu pengganti review manungsa.

Kemampuan keamanan siber bisa digunakaké kanggo pertahanan uga serangan, mula kami nggunakaké pendekatan peluncuran iteratif: sinau saka panggunaan donya nyata, nganyari safeguard, lan njaga piranti pertahanan penting kaya pemindaian kerentanan otomatis lan bantuan remediasi.

Kasedhiyan

GPT‑5.1‑Codex‑Max wis kasedhiya ing Codex kanggo paket ChatGPT Plus, Pro, Business, Edu, lan Enterprise. Kanggo rincian cara wates panggunaan bisa dienggo ing paketmu, delengen dokumentasi(mbukak ing jendhela anyar) kami.

Kanggo pengembang sing nggunakaké Codex CLI liwat kunci API, kami ngrancang nggawé GPT‑5.1‑Codex‑Max kasedhiya ing API enggal.

Wiwit dina iki, GPT‑5.1‑Codex‑Max bakal ngganti GPT‑5.1‑Codex dadi model bawaan ing antarmuka Codex. Beda karo GPT‑5.1 sing minangka model tujuan umum, kami nyaranaké nggunakaké GPT‑5.1‑Codex‑Max lan kulawarga model Codex mung kanggo tugas coding agen ing Codex utawa lingkungan sing mirip Codex.

Panutup

GPT‑5.1‑Codex‑Max nuduhaké sepira adohé perkembangan model ing njaga tugas coding jangka dawa, ngelola alur kerja rumit, lan ngasilaké implementasi kualitas dhuwur kanthi token sing adoh luwih sithik. Kami wis ndelok model iki digabung karo peningkatan terus-terusan ing CLI, ekstensi IDE, integrasi cloud, lan piranti review kode kami ngasilaké produktivitas rekayasa sing melesat: sacara internal, 95% insinyur OpenAI nggunakaké Codex saben minggu, lan para insinyur iki ngirim kurang luwih 70% luwih akèh panyuwunan tarik sawisé ngadopsi Codex. Nalika kami terus nyurung batas tercanggih saka apa sing bisa ditindakaké agen, kami seneng ndelok apa sing bakal kokbangun nganggo agen-agen iki.

Lampiran: Evaluasi model

GPT‑5.1‑Codex (high)

GPT‑5.1‑Codex‑Max (xhigh)

SWE-bench Verified (n=500)

73.7%

77.9%

SWE-Lancer IC SWE

66.3%

79.9%

Terminal-Bench 2.0

52.8%

58.1%

Pangarang

OpenAI