GPT‑5.1‑Codex‑Max 是我們全新前沿的代理編碼模型。該模型基於我們的基礎推理基座模型升級而來,並經過軟件工程、數學、研究、醫學、電腦操作等多元代理任務訓練。這是我們首個原生訓練的模型,能透過稱為壓縮的流程跨越多個情境視窗運作,並在單一任務中一致地處理數百萬個 Token。如同其前代模型一樣,GPT‑5.1‑Codex‑Max 是在現實世界的軟體工程任務中進行訓練的,例如 PR 建立、程式碼審查、前端編碼和問答。
此系統卡概述了為 GPT‑5.1‑Codex‑Max 實施的全面安全措施。當中詳細說明模型層級的緩解措施,例如就有害任務和提示詞拒絕進行專門安全訓練;以及產品層級的緩解措施,例如智能代理沙盒及可配置的網絡存取權限。
GPT‑5.1‑Codex‑Max 已透過我們的安全預備框架進行評估。該模型在網絡安全領域具備出色能力,但尚未達到「高級別能力」的評級標準。我們預期當前迅速增長的能力趨勢將會繼續,並且模型在不久的將來會跨越高網絡安全門檻。與其他近期推出的模型一樣,該模型在生物學領域被歸為「高級別能力」級別,並採用與 GPT‑5 相同的全套安全防護措施進行部署。在人工智能自我改進方面,尚未達到「高能力」級別。


