GPT‑5.1‑Codex‑Max adalah model pengodean agen terdepan kami yang baru. Model ini dibangun berdasarkan pembaruan model penalaran dasar kami yang dilatih pada tugas-tugas agen di bidang rekayasa perangkat lunak, matematika, penelitian, kedokteran, penggunaan komputer, dan lainnya. Ini adalah model pertama kami yang dilatih secara asli untuk beroperasi di berbagai jendela konteks melalui proses yang disebut kompaksi, bekerja secara koheren pada jutaan token dalam satu tugas. Seperti pendahulunya, GPT‑5.1‑Codex‑Max dilatih pada tugas rekayasa perangkat lunak dunia nyata seperti pembuatan PR, peninjauan kode, pengkodean frontend, dan tanya jawab.
Kartu sistem ini menguraikan langkah-langkah keamanan komprehensif yang diterapkan untuk GPT‑5.1‑Codex‑Max. Kartu sistem ini memperinci mitigasi di tingkat model, seperti pelatihan keamanan khusus untuk tugas berbahaya dan injeksi prompt, serta mitigasi di tingkat produk seperti sandboxing agen dan akses jaringan yang dapat dikonfigurasi.
GPT‑5.1‑Codex‑Max dievaluasi di bawah Kerangka Kerja Kesiapan kami. Model ini sangat mampu dalam domain keamanan siber tetapi tidak mencapai tingkat kemampuan tinggi dalam keamanan siber. Kami mengharapkan tren saat ini dari peningkatan kemampuan yang cepat untuk lanjutkan, dan agar model melewati ambang batas tinggi dalam keamanan siber dalam waktu dekat. Seperti model-model terbaru lainnya, model ini diperlakukan sebagai Kemampuan Tinggi dalam bidang biologi, dan diterapkan dengan rangkaian langkah-langkah perlindungan yang kami gunakan untuk GPT‑5. Model ini tidak mencapai kemampuan tinggi dalam peningkatan diri AI.


