16 maj 2025

Vi presenterar Codex

En molnbaserad agent för programvaruutveckling som kan arbeta med många uppgifter samtidigt och drivs av codex-1. Tillgänglig för ChatGPT Pro-, Team- och Enterprise-användare nu och snart för Plus-användare.

Prova Codex

Infopanel som frågar ”Vad ska vi koda härnäst?” med en promptruta, repo-/grenväljare och en uppgiftslista på en bakgrund med pastellfärgat kodtema.

Laddar …

Uppdaterad den 3 juni 2025: Codex är nu tillgängligt för ChatGPT Plus-användare. Vi gör det också möjligt för användare att tillhandahålla Codex med internetanslutning under utförandet av uppgifter. Se ändringsloggen⁠(öppnas i ett nytt fönster) och dokumentationen⁠(öppnas i ett nytt fönster) för mer information.

Idag lanserar vi en forskningsförhandsgranskning av Codex, en molnbaserad agent för programvaruutveckling som kan arbeta på många uppgifter samtidigt. Codex kan utföra uppgifter åt dig, som t.ex. att skriva artiklar, besvara frågor om din kodbas, fixa buggar och föreslå pull-begäranden för granskning. Varje uppgift körs i sin egen molnsandlåda och är förladdad med ditt lager.

Codex drivs av codex-1, en version av OpenAI o3 som är optimerad för programvaruutveckling. Den har tränats med förstärkningsinlärning på verkliga kodningsuppgifter i flera olika miljöer för att generera kod som liknar mänsklig stil och PR-preferenser, den följer instruktioner exakt och kan iterativt köra tester tills den får godkända resultat. Vi börjar släppa Codex till ChatGPT Pro-, Enterprise- och Team-användare idag och snart kommer stöd för även Plus och Edu.

Hur Codex fungerar

Idag kan du komma åt Codex genom sidopanelen i ChatGPT och ge den en ny kodningsuppgift genom att skriva en prompt och klicka på ”Kod”. Om du vill ställa en fråga till Codex om din kodbas klickar du på “Fråga”. Varje uppgift behandlas enskilt i en separat, isolerad miljö som förladdats med din kodbas. Codex kan läsa och redigera filer, samt köra kommandon, inklusive test-harnessar, linters och typkontroller. Slutförandet av uppgifter tar vanligtvis från 1 till 30 minuter, beroende på svårighetsgrad och du kan övervaka Codex framsteg i realtid.

När Codex har slutfört uppgiften genomför den ändringarna i sin miljö. Codex ger verifierbara bevis på sina åtgärder genom hänvisningar till terminalloggar och testutdata så att du kan spåra varje steg som utförts under uppgiftens slutförande. Du kan sedan granska resultaten, begära ytterligare redigeringar, öppna GitHub pull-begäranden eller direkt integrera ändringarna i din lokala miljö. I produkten kan du konfigurera Codex-miljön till att matcha din verkliga utvecklingsmiljö så mycket som möjligt.

Codex kan vägledas av AGENTS.md-filer som finns i ditt lager. De är textfiler, liknande README.md, där du kan informera Codex om hur man navigerar din kodbas, vilka kommandon som ska testköras och hur man bäst följer ditt projekts standardpraxis. Precis som mänskliga utvecklare presterar Codex-agenter bäst när de har fått konfigurerade utvecklingsmiljöer, tillförlitliga testuppsättningar och tydlig dokumentation.

På kodningsutvärderingar och interna riktmärken visar codex-1 starka resultat även utan AGENTS.md-filer eller anpassad scaffolding.

23 SWE-Bench Verified exempel som inte var körbara på vår interna infrastruktur exkluderades. Codex-1 testades på en sammanhangslängd med högst 192 000 token och medelmåttig “resonemangsansträngning”, vilket är den inställning som görs tillgänglig i produkten idag. Se här⁠ för mer information om o3‑utvärderingarna.

Vårt interna SWE uppgiftsriktmärke är en uppsättning utvalda interna SWE-uppgifter i realtid på OpenAI.

Skapa säkra och tillförlitliga agenter

Vi släpper Codex som en forskningsförhandsgranskning, i linje med vår iterativa lanseringsstrategi. Vi har prioriterat säkerhet och transparens när vi utformade Codex så att användare kan verifiera dess utdata, en säkerhetsåtgärd som blir allt viktigare allt eftersom AI-modeller hanterar mer komplexa kodningsuppgifter oberoende och säkerhetsövervägandena utvecklas. Användare kan kontrollera Codex arbete genom hänvisningar, terminalloggar och testresultat. Vid osäkerheter eller misslyckade tester kommunicerar Codex-agenten dessa problem i detalj, vilket gör det möjligt för användare att fatta informerade beslut om hur de ska gå vidare. Det är fortfarande viktigt att användare granskar och validerar agentgenererad kod manuellt innan den integreras och körs.

Skärmdump av kodgranskning med en testfil som visar verifierade citerade filnamn, plus sammanfattning och godkända tester mot en blå bakgrund.

En skärmdump av kodgranskning med en svart terminal som visar ett godkänt test för citerade filnamn, sammanfattning och felmeddelande om en konflikt med specifika teckenförändringar som visas på en pastellblå bakgrund.

Anpassa till mänskliga preferenser

Ett primärt mål när vi tränade codex-1 var att nära anpassa utdata efter mänskliga kodningspreferenser och standarder. I jämförelse med OpenAI o3 producerar codex-1 konsekvent renare buggfixar som är redo för omedelbar mänsklig granskning och integrering in i standardarbetsflöden.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Förhindra missbruk

Att skydda mot skadliga applikationer av AI-driven programvaruutveckling, såsom sabotageprogramsutveckling, blir allt mer kritiskt. På samma gång är det viktigt att skyddsåtgärder inte överdrivet hindrar legitima och gynnande applikationer som kan involvera tekniker som ibland används i utvecklingen av sabotageprogram, såsom utveckling av kärnor på lägre nivå.

För att balansera säkerheten och användbarheten har Codex tränats till att identifiera och exakt vägra uppfylla förfrågningar som syftar att utveckla skadlig programvara, medan den tydligt skiljer på och stödjer legitima uppgifter. Vi har också förbättrat våra policyramverk och införlivat rigorösa säkerhetsutvärderingar för att effektivt förstärka dessa gränser. Vi har publicerat ett tillägg till systemkortet för o3⁠ som återspeglar dessa utvärderingar.

Säkert utförande

Codex-agenten agerar helt inom en säkert isolerad container i molnet. Under uppgifternas utföranden inaktiveras internet,vilket begränsar agentens interaktion endast till koden som specifikt tillhandahålls via GitHub-lagren och förinstallerade anslutningar som konfigurerats av användaren via installationsskript. Agenten kan inte komma åt externa webbplatser, API:er eller andra tjänster.

Tidiga användningsfall

OpenAI:s tekniska team har börjat använda Codex som en del av deras vardagliga verktygssats. Den används oftast av OpenAI-tekniker för att avlasta repetitiva, väl avgränsade uppgifter, såsom omfaktorering, namnbyte och skrivprov, som annars skulle få en att tappa fokus. Det är lika användbart till scaffolding av nya funktioner, koppla komponenter, fixa buggar och skriva dokumentutkast. Team skapar nya vanor runt det. De prioriterar akuta problem, planerar uppgifter i början av dagen och avlastar bakgrundsarbetet för att göra framsteg. Genom att minska kontextbyten och framhäva glömda uppgifter hjälper Codex tekniker att leverera snabbare och hålla fokus på vad som är viktigast.

Före utgivningen samarbetade vi också med en mindre grupp externa testare för att bättre förstå hur Codex presterar på olika kodbaser, utvecklingsprocesser och team.

Cisco⁠(öppnas i ett nytt fönster) utforskar hur Codex kan hjälpa deras utvecklingsteam att snabbare förverkliga deras ambitiösa idéer. Som tidiga designpartner hjälper Cisco oss att forma Codex framtid genom att utvärdera den i användningsfall från verkligheten genom hela deras produktportfölj och ge OpenAI-teamet feedback.
Temporal⁠(öppnas i ett nytt fönster) använder Codex till att påskynda funktionsutveckling, buggfixar, skriva och genomföra tester samt omfaktorera större kodbaser. Det håller dem även fokuserade genom att köra komplexa uppgifter i bakgrunden så att teknikernas arbete flyter på och de kan påskynda iterationsprocessen.
Superhuman⁠(öppnas i ett nytt fönster) använder Codex till att påskynda mindre men repetitiva uppgifter som t.ex. att förbättra testtäckning och fixa integrationsfel. Det hjälper dem även att leverera snabbare genom att låta produktansvariga utföra mindre kodändringar utan att tillkalla en tekniker, förutom vid kodgranskning.
Kodiak⁠(öppnas i ett nytt fönster) använder Codex till att skriva verktyg till buggfixar, förbättra testtäckning och omfaktorisera kod för att påskynda utvecklingen av Kodiak Driver, deras autonoma körteknik. Codex har också blivit ett värdefullt referensverktyg som hjälper tekniker att förstå obekanta delar av stacken genom att granska relevanta sammanhang och tidigare ändringar.

Baserat på information från tidiga testare rekommenderar vi att tilldela väl avgränsade uppgifter till flera agenter samtidigt och experimentera med olika sorters uppgifter och prompter för att effektivt utforska modellens funktioner.

Uppdateringar till Codex CLI

Förra månaden lanserade vi Codex CLI, en mindre kodningsagent med öppen källa som körs på din terminal. Den ger ditt lokala arbetsflöde samma kraft som modellerna o3 och o4-mini, vilket gör det lättare att ansluta till dem för att snabbare slutföra uppgifter.

Idag släpper vi även en mindre version av codex-1, en o4-mini-version som utformats specifikt för användning i Codex CLI. Den nya modellen stödjer snabbare arbetsflöden i CLI och har optimerats för vanliga frågor och redigering av kod med låg latens, medan den bibehåller sina styrkor i instruktionsföljning och stil. Den finns nu tillgänglig som standardmodell i Codex CLI och i API:et som codex-mini-senaste. Den underliggande ögonblicksbilden uppdateras regelbundet allt eftersom vi fortsätter att förbättra Codex-mini-modellen.

Vi gör det även mycket lättare att ansluta ditt utvecklarkonto till Codex CLI. Istället för att manuellt generera och konfigurera en API-token kan du nu logga in med ditt ChatGPT‑konto och välja API-organisationen du vill använda. Vi kommer automatiskt att generera och konfigurera API-nyckeln åt dig. Plus- och Pro-användare som loggar in på Codex CLI med ChatGPT kan också börja lösa in 5 $ och 50 $ i gratis API-krediter, respektive, senare idag för kommande 30 dagar.

Tillgänglighet, priser och begränsningar för Codex

Idag släpper vi Codex till ChatGPT Pro-, Enterprise- och Team-användare globalt och snart kommer även stöd för Plus och Edu. Användare får generös åtkomst utan extra kostnad under de närmaste veckorna så att du kan utforska vad Codex kan göra. Därefter släpper vi prisbegränsad åtkomst med flexibla prisalternativ som låter dig köpa ytterligare användning på begäran. Vi planerar att snart utvidga åtkomsten till Plus- och Edu-användare.

För utvecklare som skapar med codex-mini-senaste finns modellen tillgänglig på Responses API:et och kostar 1,50 $ per 1M indatatoken och 6 $ per 1M utdatatoken med 75 % rabatt på promptcachning.

Codex är ännu i ett tidigt utvecklingsstadie. Som en forskningsförhandsgranskning saknar den funktioner såsom bildindata till frontend-arbete och möjligheten att kurskorrigera agenten medan den arbetar. Dessutom tar det längre att delegera till en fjärragent än interaktiv redigering, vilket kan ta lite tid att vänja sig vid. Med tiden kommer interaktioner med Codex-agenter att mer och mer påminna om asynkront samarbete med medarbetare. Allt eftersom modellfunktionerna utvecklas förväntar vi oss att agenter kommer att kunna hantera mer komplexa uppgifter under längre perioder.

Vad händer härnäst?

Vi föreställer oss en framtid där utvecklare driver arbetet de vill äga medan de delegerar resten till agenter för att bli snabbare och mer produktiva med AI. För att uppnå det skapar vi en uppsättning Codex-verktyg som stödjer både samarbete i realtid och asynkron delegering.

Att ansluta AI-verktyg såsom Codex CLI och andra har snabbt blivit en branschstandard som hjälper utvecklare att jobba snabbare med kodning. Men vi tror att det asynkrona arbetsflödet med flera agenter som introducerats av Codex i ChatGPT kommer att bli det faktiska sättet tekniker skapar högkvalitativ kod.

Till slut kommer dessa två interaktionssätt, realtidsanslutning och uppgiftsdelegering, att slås samman. Utvecklare kommer att samarbeta med AI-agenter genom deras IDE:er och vardagsverktyg för att ställa frågor, få förslag och avlasta längre uppgifter, allt i ett och samma arbetsflöde.

Framöver planerar vi att introducera mer interaktiva och flexibla agentarbetsflöden. Utvecklare kommer snart att kunna ge vägledning mitt i uppgiften, samarbeta på implementeringsstrategier och få proaktiva framstegsuppdateringar. Vi föreställer oss djupare integreringar genom verktygen du redan använder. Idag ansluter Codex till GitHub och snart kommer du att kunna tilldela uppgifter från Codex CLI, ChatGPT Desktop och även verktyg såsom din problemspårare och ditt CI-system.

Programvaruutveckling är en av de första branscherna som upplever större AI-drivna produktivitetsförbättringar, vilket medför nya möjligheter för enskilda personer och mindre team. Medan vi är optimistiska om förbättringarna samarbetar vi även med partner för att bättre förstå konsekvenserna av det bredare antagandet av agenter på utvecklares arbetsflöden, färdighetsutvecklingen för folk, färdighetsnivåer och geografiska områden.

Det här är bara början och vi ser fram emot att få se vad du kommer att skapa med Codex.

Återuppspelning av livestream

Bilaga

Systemmeddelande

Vi delar codex-1 systemmeddelande för att hjälpa utvecklare att förstå modellens standardbeteende och anpassa Codex till att effektivt arbeta i anpassade arbetsflöden. Codex-1 systemmeddelande uppmuntrar t.ex. Codex att köra alla tester som nämns i AGENTS.md-filen, men om du har ont om tid kan du be Codex att hoppa över dessa tester.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Författare

OpenAI