19 november 2025

Systeemkaart GPT‑5.1‑Codex‑Max

Inleiding

GPT‑5.1‑Codex‑Max is ons nieuwe grensverleggende agentic coderingsmodel. Het is gebaseerd op een update van ons fundamentele redeneermodel, getraind op agentic taken in softwareontwikkeling, wiskunde, onderzoek, geneeskunde, computergebruik en meer. Het is ons eerste model dat van nature is getraind om te werken met meerdere contexten via een proces dat 'compaction' wordt genoemd, waardoor het coherent over miljoenen tokens binnen één enkele taak kan werken. Net als zijn voorgangers is GPT‑5.1‑Codex‑Max getraind op echte software-engineeringtaken, zoals het maken van PR's, codebeoordeling, frontend-programmeren en Q&A.

Deze systeemkaart geeft een overzicht van de uitgebreide veiligheidsmaatregelen die zijn geïmplementeerd voor GPT‑5.1‑Codex‑Max. De kaart beschrijft zowel maatregelen op modelniveau, zoals gespecialiseerde veiligheidstraining voor schadelijke taken en prompt-injecties, als maatregelen op productniveau, zoals agent-sandboxing en configureerbare netwerktoegang.

GPT‑5.1‑Codex‑Max is geëvalueerd binnen ons Preparedness Framework. Het is zeer capabel in het cyberbeveiligingsdomein, maar bereikt niet het capaciteitsniveau 'Hoog' op het gebied van cyberveiligheid. We verwachten dat de huidige trends van snel groeiende capaciteit zullen doorgaan en dat modellen in de nabije toekomst de de drempel voor hoge cyberveiligheid zullen overschrijden. Net als andere recente modellen wordt het beschouwd als een hoge capaciteitscategorie op het gebied van biologie en wordt het ingezet met de bijbehorende suite van veiligheidsmaatregelen die we gebruiken voor GPT‑5. Het bereikt geen hoge capaciteit op het gebied van AI-zelfverbetering.

Auteur

OpenAI

Andere interessante artikelen

Alles weergeven

Hoe twee instellingen onze score op de ARC-AGI-3-benchmark verdrievoudigden

Onderzoek29 jul 2026

Scientific computing agentic AI card image (1x1)

Wetenschappelijk rekenen in het tijdperk van agentic AI

Publicatie28 jul 2026

Veiligheid en afstemming bij modellen met lange tijdshorizon

Veiligheid20 jul 2026