Vi presenterar Codex
En molnbaserad agent för programvaruutveckling som kan arbeta med många uppgifter samtidigt och drivs av codex-1. Tillgänglig för ChatGPT Pro-, Team- och Enterprise-användare nu och snart för Plus-användare.

Uppdaterad den 3 juni 2025: Codex är nu tillgängligt för ChatGPT Plus-användare. Vi gör det också möjligt för användare att tillhandahålla Codex med internetanslutning under utförandet av uppgifter. Se ändringsloggen(öppnas i ett nytt fönster) och dokumentationen(öppnas i ett nytt fönster) för mer information.
Idag lanserar vi en forskningsförhandsgranskning av Codex, en molnbaserad agent för programvaruutveckling som kan arbeta på många uppgifter samtidigt. Codex kan utföra uppgifter åt dig, som t.ex. att skriva artiklar, besvara frågor om din kodbas, fixa buggar och föreslå pull-begäranden för granskning. Varje uppgift körs i sin egen molnsandlåda och är förladdad med ditt lager.
Codex drivs av codex-1, en version av OpenAI o3 som är optimerad för programvaruutveckling. Den har tränats med förstärkningsinlärning på verkliga kodningsuppgifter i flera olika miljöer för att generera kod som liknar mänsklig stil och PR-preferenser, den följer instruktioner exakt och kan iterativt köra tester tills den får godkända resultat. Vi börjar släppa Codex till ChatGPT Pro-, Enterprise- och Team-användare idag och snart kommer stöd för även Plus och Edu.
Idag kan du komma åt Codex genom sidopanelen i ChatGPT och ge den en ny kodningsuppgift genom att skriva en prompt och klicka på ”Kod”. Om du vill ställa en fråga till Codex om din kodbas klickar du på “Fråga”. Varje uppgift behandlas enskilt i en separat, isolerad miljö som förladdats med din kodbas. Codex kan läsa och redigera filer, samt köra kommandon, inklusive test-harnessar, linters och typkontroller. Slutförandet av uppgifter tar vanligtvis från 1 till 30 minuter, beroende på svårighetsgrad och du kan övervaka Codex framsteg i realtid.
När Codex har slutfört uppgiften genomför den ändringarna i sin miljö. Codex ger verifierbara bevis på sina åtgärder genom hänvisningar till terminalloggar och testutdata så att du kan spåra varje steg som utförts under uppgiftens slutförande. Du kan sedan granska resultaten, begära ytterligare redigeringar, öppna GitHub pull-begäranden eller direkt integrera ändringarna i din lokala miljö. I produkten kan du konfigurera Codex-miljön till att matcha din verkliga utvecklingsmiljö så mycket som möjligt.
Codex kan vägledas av AGENTS.md-filer som finns i ditt lager. De är textfiler, liknande README.md, där du kan informera Codex om hur man navigerar din kodbas, vilka kommandon som ska testköras och hur man bäst följer ditt projekts standardpraxis. Precis som mänskliga utvecklare presterar Codex-agenter bäst när de har fått konfigurerade utvecklingsmiljöer, tillförlitliga testuppsättningar och tydlig dokumentation.
På kodningsutvärderingar och interna riktmärken visar codex-1 starka resultat även utan AGENTS.md-filer eller anpassad scaffolding.
23 SWE-Bench Verified exempel som inte var körbara på vår interna infrastruktur exkluderades. Codex-1 testades på en sammanhangslängd med högst 192 000 token och medelmåttig “resonemangsansträngning”, vilket är den inställning som görs tillgänglig i produkten idag. Se här för mer information om o3‑utvärderingarna.
Vårt interna SWE uppgiftsriktmärke är en uppsättning utvalda interna SWE-uppgifter i realtid på OpenAI.
Vi släpper Codex som en forskningsförhandsgranskning, i linje med vår iterativa lanseringsstrategi. Vi har prioriterat säkerhet och transparens när vi utformade Codex så att användare kan verifiera dess utdata, en säkerhetsåtgärd som blir allt viktigare allt eftersom AI-modeller hanterar mer komplexa kodningsuppgifter oberoende och säkerhetsövervägandena utvecklas. Användare kan kontrollera Codex arbete genom hänvisningar, terminalloggar och testresultat. Vid osäkerheter eller misslyckade tester kommunicerar Codex-agenten dessa problem i detalj, vilket gör det möjligt för användare att fatta informerade beslut om hur de ska gå vidare. Det är fortfarande viktigt att användare granskar och validerar agentgenererad kod manuellt innan den integreras och körs.


Ett primärt mål när vi tränade codex-1 var att nära anpassa utdata efter mänskliga kodningspreferenser och standarder. I jämförelse med OpenAI o3 producerar codex-1 konsekvent renare buggfixar som är redo för omedelbar mänsklig granskning och integrering in i standardarbetsflöden.
Att skydda mot skadliga applikationer av AI-driven programvaruutveckling, såsom sabotageprogramsutveckling, blir allt mer kritiskt. På samma gång är det viktigt att skyddsåtgärder inte överdrivet hindrar legitima och gynnande applikationer som kan involvera tekniker som ibland används i utvecklingen av sabotageprogram, såsom utveckling av kärnor på lägre nivå.
För att balansera säkerheten och användbarheten har Codex tränats till att identifiera och exakt vägra uppfylla förfrågningar som syftar att utveckla skadlig programvara, medan den tydligt skiljer på och stödjer legitima uppgifter. Vi har också förbättrat våra policyramverk och införlivat rigorösa säkerhetsutvärderingar för att effektivt förstärka dessa gränser. Vi har publicerat ett tillägg till systemkortet för o3 som återspeglar dessa utvärderingar.
Codex-agenten agerar helt inom en säkert isolerad container i molnet. Under uppgifternas utföranden inaktiveras internet,vilket begränsar agentens interaktion endast till koden som specifikt tillhandahålls via GitHub-lagren och förinstallerade anslutningar som konfigurerats av användaren via installationsskript. Agenten kan inte komma åt externa webbplatser, API:er eller andra tjänster.
OpenAI:s tekniska team har börjat använda Codex som en del av deras vardagliga verktygssats. Den används oftast av OpenAI-tekniker för att avlasta repetitiva, väl avgränsade uppgifter, såsom omfaktorering, namnbyte och skrivprov, som annars skulle få en att tappa fokus. Det är lika användbart till scaffolding av nya funktioner, koppla komponenter, fixa buggar och skriva dokumentutkast. Team skapar nya vanor runt det. De prioriterar akuta problem, planerar uppgifter i början av dagen och avlastar bakgrundsarbetet för att göra framsteg. Genom att minska kontextbyten och framhäva glömda uppgifter hjälper Codex tekniker att leverera snabbare och hålla fokus på vad som är viktigast.
Före utgivningen samarbetade vi också med en mindre grupp externa testare för att bättre förstå hur Codex presterar på olika kodbaser, utvecklingsprocesser och team.
- Cisco(öppnas i ett nytt fönster) utforskar hur Codex kan hjälpa deras utvecklingsteam att snabbare förverkliga deras ambitiösa idéer. Som tidiga designpartner hjälper Cisco oss att forma Codex framtid genom att utvärdera den i användningsfall från verkligheten genom hela deras produktportfölj och ge OpenAI-teamet feedback.
- Temporal(öppnas i ett nytt fönster) använder Codex till att påskynda funktionsutveckling, buggfixar, skriva och genomföra tester samt omfaktorera större kodbaser. Det håller dem även fokuserade genom att köra komplexa uppgifter i bakgrunden så att teknikernas arbete flyter på och de kan påskynda iterationsprocessen.
- Superhuman(öppnas i ett nytt fönster) använder Codex till att påskynda mindre men repetitiva uppgifter som t.ex. att förbättra testtäckning och fixa integrationsfel. Det hjälper dem även att leverera snabbare genom att låta produktansvariga utföra mindre kodändringar utan att tillkalla en tekniker, förutom vid kodgranskning.
- Kodiak(öppnas i ett nytt fönster) använder Codex till att skriva verktyg till buggfixar, förbättra testtäckning och omfaktorisera kod för att påskynda utvecklingen av Kodiak Driver, deras autonoma körteknik. Codex har också blivit ett värdefullt referensverktyg som hjälper tekniker att förstå obekanta delar av stacken genom att granska relevanta sammanhang och tidigare ändringar.
Baserat på information från tidiga testare rekommenderar vi att tilldela väl avgränsade uppgifter till flera agenter samtidigt och experimentera med olika sorters uppgifter och prompter för att effektivt utforska modellens funktioner.
Förra månaden lanserade vi Codex CLI, en mindre kodningsagent med öppen källa som körs på din terminal. Den ger ditt lokala arbetsflöde samma kraft som modellerna o3 och o4-mini, vilket gör det lättare att ansluta till dem för att snabbare slutföra uppgifter.
Idag släpper vi även en mindre version av codex-1, en o4-mini-version som utformats specifikt för användning i Codex CLI. Den nya modellen stödjer snabbare arbetsflöden i CLI och har optimerats för vanliga frågor och redigering av kod med låg latens, medan den bibehåller sina styrkor i instruktionsföljning och stil. Den finns nu tillgänglig som standardmodell i Codex CLI och i API:et som codex-mini-senaste. Den underliggande ögonblicksbilden uppdateras regelbundet allt eftersom vi fortsätter att förbättra Codex-mini-modellen.
Vi gör det även mycket lättare att ansluta ditt utvecklarkonto till Codex CLI. Istället för att manuellt generera och konfigurera en API-token kan du nu logga in med ditt ChatGPT‑konto och välja API-organisationen du vill använda. Vi kommer automatiskt att generera och konfigurera API-nyckeln åt dig. Plus- och Pro-användare som loggar in på Codex CLI med ChatGPT kan också börja lösa in 5 $ och 50 $ i gratis API-krediter, respektive, senare idag för kommande 30 dagar.
Idag släpper vi Codex till ChatGPT Pro-, Enterprise- och Team-användare globalt och snart kommer även stöd för Plus och Edu. Användare får generös åtkomst utan extra kostnad under de närmaste veckorna så att du kan utforska vad Codex kan göra. Därefter släpper vi prisbegränsad åtkomst med flexibla prisalternativ som låter dig köpa ytterligare användning på begäran. Vi planerar att snart utvidga åtkomsten till Plus- och Edu-användare.
För utvecklare som skapar med codex-mini-senaste finns modellen tillgänglig på Responses API:et och kostar 1,50 $ per 1M indatatoken och 6 $ per 1M utdatatoken med 75 % rabatt på promptcachning.
Codex är ännu i ett tidigt utvecklingsstadie. Som en forskningsförhandsgranskning saknar den funktioner såsom bildindata till frontend-arbete och möjligheten att kurskorrigera agenten medan den arbetar. Dessutom tar det längre att delegera till en fjärragent än interaktiv redigering, vilket kan ta lite tid att vänja sig vid. Med tiden kommer interaktioner med Codex-agenter att mer och mer påminna om asynkront samarbete med medarbetare. Allt eftersom modellfunktionerna utvecklas förväntar vi oss att agenter kommer att kunna hantera mer komplexa uppgifter under längre perioder.
Vi föreställer oss en framtid där utvecklare driver arbetet de vill äga medan de delegerar resten till agenter för att bli snabbare och mer produktiva med AI. För att uppnå det skapar vi en uppsättning Codex-verktyg som stödjer både samarbete i realtid och asynkron delegering.
Att ansluta AI-verktyg såsom Codex CLI och andra har snabbt blivit en branschstandard som hjälper utvecklare att jobba snabbare med kodning. Men vi tror att det asynkrona arbetsflödet med flera agenter som introducerats av Codex i ChatGPT kommer att bli det faktiska sättet tekniker skapar högkvalitativ kod.
Till slut kommer dessa två interaktionssätt, realtidsanslutning och uppgiftsdelegering, att slås samman. Utvecklare kommer att samarbeta med AI-agenter genom deras IDE:er och vardagsverktyg för att ställa frågor, få förslag och avlasta längre uppgifter, allt i ett och samma arbetsflöde.
Framöver planerar vi att introducera mer interaktiva och flexibla agentarbetsflöden. Utvecklare kommer snart att kunna ge vägledning mitt i uppgiften, samarbeta på implementeringsstrategier och få proaktiva framstegsuppdateringar. Vi föreställer oss djupare integreringar genom verktygen du redan använder. Idag ansluter Codex till GitHub och snart kommer du att kunna tilldela uppgifter från Codex CLI, ChatGPT Desktop och även verktyg såsom din problemspårare och ditt CI-system.
Programvaruutveckling är en av de första branscherna som upplever större AI-drivna produktivitetsförbättringar, vilket medför nya möjligheter för enskilda personer och mindre team. Medan vi är optimistiska om förbättringarna samarbetar vi även med partner för att bättre förstå konsekvenserna av det bredare antagandet av agenter på utvecklares arbetsflöden, färdighetsutvecklingen för folk, färdighetsnivåer och geografiska områden.
Det här är bara början och vi ser fram emot att få se vad du kommer att skapa med Codex.
Systemmeddelande
Vi delar codex-1 systemmeddelande för att hjälpa utvecklare att förstå modellens standardbeteende och anpassa Codex till att effektivt arbeta i anpassade arbetsflöden. Codex-1 systemmeddelande uppmuntrar t.ex. Codex att köra alla tester som nämns i AGENTS.md-filen, men om du har ont om tid kan du be Codex att hoppa över dessa tester.