GPT‑5.1‑Codex‑Max is ons nieuwe grensverleggende agentic coderingsmodel. Het is gebaseerd op een update van ons fundamentele redeneermodel, getraind op agentic taken in softwareontwikkeling, wiskunde, onderzoek, geneeskunde, computergebruik en meer. Het is ons eerste model dat van nature is getraind om te werken met meerdere contexten via een proces dat 'compaction' wordt genoemd, waardoor het coherent over miljoenen tokens binnen één enkele taak kan werken. Net als zijn voorgangers is GPT‑5.1‑Codex‑Max getraind op echte software-engineeringtaken, zoals het maken van PR's, codebeoordeling, frontend-programmeren en Q&A.
Deze systeemkaart geeft een overzicht van de uitgebreide veiligheidsmaatregelen die zijn geïmplementeerd voor GPT‑5.1‑Codex‑Max. De kaart beschrijft zowel maatregelen op modelniveau, zoals gespecialiseerde veiligheidstraining voor schadelijke taken en prompt-injecties, als maatregelen op productniveau, zoals agent-sandboxing en configureerbare netwerktoegang.
GPT‑5.1‑Codex‑Max is geëvalueerd binnen ons Preparedness Framework. Het is zeer capabel in het cyberbeveiligingsdomein, maar bereikt niet het capaciteitsniveau 'Hoog' op het gebied van cyberveiligheid. We verwachten dat de huidige trends van snel groeiende capaciteit zullen doorgaan en dat modellen in de nabije toekomst de de drempel voor hoge cyberveiligheid zullen overschrijden. Net als andere recente modellen wordt het beschouwd als een hoge capaciteitscategorie op het gebied van biologie en wordt het ingezet met de bijbehorende suite van veiligheidsmaatregelen die we gebruiken voor GPT‑5. Het bereikt geen hoge capaciteit op het gebied van AI-zelfverbetering.


