18 december 2025

Introductie van GPT‑5.2‑Codex

Het meest geavanceerde agentic programmeermodel voor professionele softwareontwikkeling en defensieve cyberbeveiliging.

Vandaag lanceren we GPT‑5.2‑Codex, het meest geavanceerde agentic programmeermodel tot nu toe voor complexe, real-world softwareontwikkeling. GPT‑5.2‑Codex is een versie van GPT‑5.2⁠ die verder is geoptimaliseerd voor agentic programmeren in Codex. Het model is beter geschikt voor langdurig werk dankzij contextcompactie, presteert sterker bij grote codewijzigingen zoals refactors en migraties, werkt beter in Windows-omgevingen en beschikt over aanzienlijk verbeterde cybersecurity-mogelijkheden.

Naarmate onze modellen zich verder ontwikkelen aan de intelligentiegrens, zien we dat deze verbeteringen zich ook vertalen naar duidelijke sprongen in gespecialiseerde domeinen zoals cybersecurity⁠. Zo ontdekte een beveiligingsonderzoeker vorige week met GPT‑5.1‑Codex‑Max en Codex CLI een kwetsbaarheid in React die kan leiden tot blootstelling van broncode. Deze is vervolgens op verantwoorde wijze gemeld⁠(opent in een nieuw venster).

GPT‑5.2‑Codex heeft sterkere cybersecurity-capaciteiten dan elk model dat we tot nu toe hebben uitgebracht. Deze vooruitgang kan cyberbeveiliging op grote schaal versterken, maar brengt ook nieuwe risico’s met zich mee doordat dezelfde mogelijkheden zowel defensief als kwaadwillig gebruikt kunnen worden. Dat vraagt om een zorgvuldige uitrol. Hoewel GPT‑5.2‑Codex binnen ons Preparedness Framework niet het niveau 'High' van cybercapaciteit bereikt, ontwerpen we onze uitrolbenadering⁠ met toekomstige groei in capaciteiten in gedachten.

We brengen GPT‑5.2‑Codex vandaag uit in alle Codex-omgevingen voor betalende ChatGPT‑gebruikers, en we werken eraan om in de komende weken veilig toegang tot GPT‑5.2‑Codex voor API-gebruikers te bieden. Parallel daaraan voeren we een besloten 'trusted access'-pilot uit voor toekomstige functionaliteit en meer permissieve modellen voor gescreende professionals en organisaties die zich richten op defensief cybersecurity-werk. Wij denken dat deze aanpak van implementatie het evenwicht tussen toegankelijkheid en veiligheid zal bewaren.

Vooruitgang in softwareontwikkeling in de praktijk

GPT‑5.2‑Codex bouwt voort op de sterke punten van GPT‑5.2⁠ in professioneel kenniswerk en combineert die met de grensverleggende agentic programmeer- en terminalmogelijkheden van GPT‑5.1‑Codex‑Max⁠ . GPT‑5.2‑Codex begrijpt lange context beter, roept tools betrouwbaarder aan, beschikt over verbeterde feitenkennis en ondersteunt native compaction. Daardoor is het een betrouwbaardere partner voor langdurige programmeertaken, terwijl het token-efficiënt blijft redeneren.

GPT‑5.2‑Codex behaalt state-of-the-art prestaties op SWE-Bench Pro en Terminal-Bench 2.0, benchmarks die zijn ontworpen om agentic prestaties te testen op een breed scala aan taken in realistische terminalomgevingen. Het is ook aanzienlijk effectiever en betrouwbaarder in agentic programmeren in native Windows-omgevingen. Daarbij bouwt het voort op mogelijkheden die eerder zijn geïntroduceerd in GPT‑5.1‑Codex‑Max.

Met deze verbeteringen kan Codex beter werken in grote repositories tijdens langere sessies, waarbij de volledige context behouden blijft. Het kan complexere taken zoals grote refactors, code-migraties en het bouwen van functies betrouwbaarder voltooien, en blijft doorgaan met itereren zonder de draad kwijt te raken, zelfs wanneer plannen veranderen of pogingen mislukken.

In SWE-Bench Prokrijgt een model een coderepository en moet het een patch genereren om een realistische software-engineeringtaak op te lossen. Terminal-Bench 2.0 is een benchmark voor het testen van AI-agenten in echte terminalomgevingen. Taken omvatten het compileren van code, het trainen van modellen en het opzetten van servers.

Sterkere visuele prestaties zorgen ervoor dat GPT‑5.2‑Codex schermafbeeldingen, technische diagrammen, grafieken en UI-elementen tijdens programmeersessies nauwkeuriger kan interpreteren.

Codex kan ontwerpvoorstellen snel omzetten in functionele prototypes, en je kunt met Codex samenwerken om deze prototypes productieklaar te maken.

Ontwerpvoorbeeld

Ontwerp gebruikt om een webprototype te genereren met Codex-5.2.

Prototype gegenereerd door GPT‑5.2‑Codex

Het verleggen van de cybergrenzen

Als we de prestaties op een van onze kerncybersecurity-evaluaties in de tijd in kaart brengen, zien we duidelijke sprongen in capaciteit: eerst met GPT‑5‑Codex, daarna met GPT‑5.1‑Codex‑Max en nu opnieuw met GPT‑5.2‑Codex. We verwachten dat de komende AI-modellen deze koers zullen blijven aanhouden. Ter voorbereiding plannen en evalueren we alsof elk nieuw model het niveau 'High' van cyberbeveiligingscapaciteit zou kunnen bereiken, zoals gemeten door ons Preparedness Framework⁠(opent in een nieuw venster). Hoewel GPT‑5.2‑Codex nog niet het 'High' niveau van cybercapaciteit heeft bereikt, bereiden we ons voor op toekomstige modellen die die drempel wél overschrijden. Vanwege de toegenomen cybercapaciteiten hebben we extra beveiligingsmaatregelen toegevoegd aan het model en het product, die worden beschreven in de systeemkaart⁠.

De Professional Capture-the-Flag (CTF) -evaluatie meet hoe vaak het model geavanceerde, meerstaps real-world uitdagingen kan oplossen (die professionele cybersecurity-vaardigheden vereisen) in een Linux-omgeving.

Cybercapaciteiten in de praktijk

De moderne samenleving draait op software. De betrouwbaarheid daarvan hangt af van sterke cybersecurity: het online houden van kritieke systemen in de banksector, gezondheidszorg, communicatie en essentiële diensten, het beschermen van gevoelige gegevens en het waarborgen dat mensen kunnen vertrouwen op de software waarop zij dagelijks rekenen. Kwetsbaarheden kunnen al lang bestaan voordat iemand ervan weet, en het vinden, valideren en oplossen ervan hangt vaak af van een gemeenschap van ingenieurs en onafhankelijke beveiligingsonderzoekers die over de juiste hulpmiddelen beschikken.

Op 11 december 2025 publiceerde het React-team drie beveiligingslekken die apps gebouwd met React Server Components beïnvloedden. Wat deze onthulling opmerkelijk maakte, was niet alleen de kwetsbaarheden zelf, maar ook hoe ze werden ontdekt.

Andrew MacPherson, principal security engineer bij Privy (een dochterbedrijf van Stripe), maakte gebruik van GPT‑5.1‑Codex‑Max, Codex CLI en andere programmeeragents om een andere kritieke React-kwetsbaarheid te reproduceren en te bestuderen die de week ervoor werd onthuld, bekend als React2Shell⁠(opent in een nieuw venster) (CVE-2025-55182⁠(opent in een nieuw venster)). Zijn doel was om te evalueren hoe goed het model kon helpen bij praktijkgericht onderzoek naar kwetsbaarheden.

Aanvankelijk voerde hij meerdere zero-shot-analyses uit, waarbij hij het model liet kijken naar de patch en de kwetsbaarheid liet identificeren die daarmee werd verholpen. Toen dat geen resultaten opleverde, schakelde hij over naar een aanpak met meer, iteratieve prompts. Toen die benaderingen niet slaagden, leidde hij Codex door standaard defensieve beveiligingsworkflows: het opzetten van een lokale testomgeving, redeneren over mogelijke aanvalsvlakken en het gebruik van fuzzing om het systeem te testen met afwijkende invoer. Terwijl hij het oorspronkelijke React2Shell-probleem probeerde te reproduceren, ontdekte Codex onverwacht gedrag dat nader onderzoek rechtvaardigde. In de loop van een enkele week leidde dit proces tot de ontdekking van voorheen onbekende kwetsbaarheden, die op verantwoorde wijze aan het React-team werden gemeld.

Stroomdiagram met de titel "Vulnerability Discovery met Codex: CVE-2025-55183" dat een workflow toont die begint met een Git-repository en waarbij Codex code scant op kwetsbaarheden. Een zero-shot poging faalt, gevolgd door een door experts begeleid proces dat de codebase onderzoekt, mogelijke doelen identificeert, een testomgeving bouwt en fuzz-testing uitvoert op een voorbeeldapp met herbevestiging. Resultaten worden geverifieerd om een proof of concept te maken, wat leidt tot verantwoordelijke openbaarmaking en een patch die terug op de repository wordt toegepast.

Dit laat zien hoe geavanceerde AI-systemen het defensieve beveiligingswerk in veelgebruikte, real-world software aanzienlijk kunnen versnellen. Tegelijkertijd kunnen mogelijkheden die verdedigers helpen sneller te handelen, ook door kwaadwillenden worden misbruikt.

Naarmate agentic systemen capabeler worden in cybersecurity-gerelateerde taken, maken we er een kernprioriteit van om deze vooruitgang verantwoord uit te rollen. Elke toename in capaciteiten gaat gepaard met sterkere waarborgen, striktere toegangscontroles en voortdurende samenwerking met de beveiligings-community.

Vertrouwde toegang voor sterkere cyberverdediging

Beveiligingsteams kunnen tegen beperkingen aanlopen wanneer zij proberen kwaadwillenden na te bootsen, malware te analyseren ter ondersteuning van herstelmaatregelen of kritieke infrastructuur onder hoge belasting te testen. We ontwikkelen een trusted access-pilot om die drempels weg te nemen voor in aanmerking komende gebruikers en organisaties, en om vertrouwde beveiligingsteams in staat te stellen grensverleggende AI-mogelijkheden voor cybersecurity te gebruiken en zo cyberverdediging te versnellen.

In eerste instantie is het pilotprogramma alleen op uitnodiging beschikbaar voor gescreende beveiligingsprofessionals met een bewezen staat van dienst in verantwoorde kwetsbaarheidsmelding, en voor organisaties met een duidelijke professionele rol in cybersecurity. Gekwalificeerde deelnemers krijgen toegang tot onze meest geavanceerde modellen voor defensieve toepassingen, voor legitiem onderzoek met zowel beschermende als potentieel gevoelige aspecten.

Als je een beveiligingsprofessional bent of deel uitmaakt van een organisatie die ethisch beveiligingswerk doet, zoals kwetsbaarheidsonderzoek of geautoriseerde red-teaming, nodigen we je uit om hier⁠(opent in een nieuw venster) interesse te tonen in deelname en feedback te geven over wat je graag zou willen zien van het programma.

Conclusie

GPT‑5.2‑Codex markeert een volgende stap in hoe geavanceerde AI softwareontwikkeling in de praktijk en gespecialiseerde domeinen zoals cybersecurity kan ondersteunen. Het helpt ontwikkelaars en beveiligingsteams bij het aanpakken van complexe, langdurige taken en versterkt de beschikbare tools voor verantwoord beveiligingsonderzoek.

Door GPT‑5.2‑Codex geleidelijk uit te rollen, de implementatie te koppelen aan beveiligingsmaatregelen en nauw samen te werken met de beveiligingsgemeenschap, streven we ernaar de defensieve impact te maximaliseren en tegelijkertijd het risico op misbruik te verminderen. Wat we leren van deze release zal direct bepalen hoe we de toegang in de loop van de tijd uitbreiden, terwijl de software- en cybergrenzen blijven verschuiven.

Auteur

OpenAI

Andere interessante artikelen

Alles weergeven

A scorecard for the AI age

Over OpenAI17 jul 2026

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 is nu het voorkeursmodel in Microsoft 365 Copilot

Product9 jul 2026

GPT-5.6: grensverleggende intelligentie die meegroeit met je ambitie

Product9 jul 2026