16. mai 2025

Vi introduserer Codex

En skybasert programvareutviklingsagent som kan jobbe på mange oppgaver parallelt, drevet av codex-1. Tilgjengelig for ChatGPT Pro-, Team- og Enterprise-brukere i dag, og Plus-brukere snart.

Prøv Codex

Instrumentpanel som spør «What should we code next?» med en meldingsboks, velgere for repositorium/gren og en oppgaveliste på pastellfarget bakgrunn med kodetema.

Laster inn …

Oppdatering 3. juni 2025: Codex er nå tilgjengelig for ChatGPT Plus-brukere. Vi gir også brukerne muligheten til å gi Codex internettilgang under oppgaveutførelsen. Se endringslogg⁠(åpnes i et nytt vindu) og dokumenter⁠(åpnes i et nytt vindu) for mer informasjon.

I dag lanserer vi en utprøvingsversjon av Codex: en skybasert programvareutviklingsagent som kan jobbe på mange oppgaver parallelt. Codex kan utføre oppgaver for deg, som å skrive funksjoner, svare på spørsmål om kodebasen din, løse feil og foreslå pull-forespørsler for gjennomgang. Hver oppgave kjøres i sitt eget sandkassemiljø i nettskyen, forhåndsinnlastet med repositoriet ditt.

Codex er drevet av codex-1, en versjon av OpenAI o3 som er optimalisert for programvareutvikling. Den ble opplært med forsterkende læring på kodeoppgaver fra den virkelige verden i en rekke miljøer for å generere kode som er nær menneskelig stil og PR-preferanse, overholder instruksjoner presist og kan kjøre tester iterativt til den får et bestått resultat. Vi starter utrullingen av Codex til ChatGPT Pro-, Enterprise- og Team-brukere i dag, og støtte for Plus og Edu kommer snart.

Slik fungerer Codex

I dag kan du åpne Codex via sidefeltet i ChatGPT og tildele den nye kodeoppgaver ved å skrive en melding og klikke på «Skriv kode». Hvis du vil stille Codex et spørsmål om kodebasen din, klikker du på «Spør». Hver oppgave behandles uavhengig i et atskilt, isolert miljø som er forhåndinnlastet med kodebasen din. Codex kan lese og redigere filer samt kjøre kommandoer inkludert testrammeverk, lintere og typesjekkere. Fullførelse av oppgaver tar vanligvis mellom 1 og 30 minutter, avhengig av kompleksitet, og du kan overvåke fremdriften til Codex i sanntid.

Når Codex fullfører en oppgave, utfører den endringene i miljøet sitt. Codex gir verifiserbart bevis på handlingene via kildehenvisningene av terminallogger og testutdata, noe som gjør at du kan spore hvert trinn som utføres under fullførelse av oppgaver. Så kan du gjennomgå resultatene, be om videre revisjon, åpne en pull-forespørsel i GitHub eller integrere endringene direkte inn i det lokale miljøet ditt. I produktet kan du konfigurere Codex-miljøet for å matche det faktiske utviklingsmiljøet ditt så nært som mulig.

Codex kan veiledes av AGENTS.md-filer som plasseres i repositoriet ditt. Dette er tekstfiler, som minner om README.md, der du kan informere Codex om hvordan den navigerer i kodebasen, hvilke kommandoer som skal kjøres for testing, og hvordan den best kan overholde standardpraksisen for prosjektet. I likhet med menneskelige utviklere presterer Codex-agenter best når de får konfigurerte utviklingmiljøer, pålitelige testoppsett og tydelig dokumentasjon.

For evaluering av koding og interne referansemålinger viser codex-1 sterk ytelse selv uten AGENTS.md-filer eller tilpasset oppsett.

23 prøver verifisert med SWE-ref som ikke kunne kjøres på den interne infrastrukturen vår, ble ekskludert. codex-1 ble testet ved maksimal kontekstlengde på 192k tokener og middels «resonnementanstrengelse», som er innstillingen som er tilgjengelig i produktet i dag. Du finner detaljer om o3‑evalueringer her⁠.

Den interne referansemålingen vår for SWE-oppgaver er et utvalgt sett med interne SWE-oppgaver fra den virkelige verden hos OpenAI.

Bygge trygge og pålitelige agenter

Vi lanserer Codex som en utprøvingsversjon, i tråd med strategien vår for iterativ utrulling. Vi prioriterer sikkerhet og åpenhet under design av Codex, slik at brukere kan bekrefte utdataene fra den – en beskyttelsesmekanisme som blir stadig viktigere når AI-modeller håndterer mer komplekse kodeoppgaver uavhengig og sikkerhetsbekymringer utvikles. Brukere kan sjekke Codex-arbeidet via kildehenvisninger, terminallogger og testresultater. Når Codex-agenten er usikker eller støter på testfeil, kommuniserer den disse problemene uttrykkelig, noe som lar brukere ta informerte avgjørelser om hvordan de vil fortsette. Det er fremdeles viktig at brukere manuelt gjennomgår og bekrefter all agentgenerert kode før integrering og utførelse.

Skjermbilde av kodegjennomgang med et overlegg med testfil som bekrefter navngitte filnavn og består tester på en blå bakgrunn.

Skjermbilde av kodegjennomgang med et svart terminaloverlegg som viser én bestått test for navngitte filnavn, oppsummering og diff for endringen «Fix /diff error with special characters» synlig på en bakgrunn i blå pastellfarge.

Tilpasning etter menneskelige preferanser

Et primært mål under opplæring av codex-1 var å tilpasse utdata nær menneskelige preferanser og standarder for koding. Sammenlignet med OpenAI o3 produserer codex-1 konsekvent ryddigere endringer som er klare for umiddelbar menneskelig gjennomgang og integrering i vanlige arbeidsflyter.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Forhindre misbruk

Beskyttelse mot skadelig bruk av AI-basert programvareutvikling, for eksempel utvikling av skadelig programvare, er stadig viktigere. Samtidig er det viktig at beskyttende tiltak ikke urimelig hindrer legitim og fordelaktig bruk som kan involvere teknikker som noen ganger også brukes for utvikling av skadelig programvare, for eksempel utvikling på kjerne på lavt nivå.

For å balansere sikkerhet og nytte ble Codex lært opp til å identifisere og nøyaktig nekte forespørsler rettet mot utvikling av skadelig programvare, og samtidig tydelig skille ut og støtte legitime oppgaver. Vi har også forbedret rammeverkene for retningslinjer og innlemmet strenge sikkerhetsevalueringer for å forsterke disse grensene effektivt. Vi har publisert et vedlegg til o3‑systemkortet⁠ for å gjenspeile disse evalueringene.

Sikker utførelse

Codex-agenten opererer bare i en sikker, isolert container i nettskyen. Under utførelse av oppgaver blir internettilgang deaktivert, noe som begrenser agentens interaksjon til koden som uttrykkelig gis via GitHub-repositorier og forhåndsinstallerte avhengigheter konfigurert av brukeren via et konfigureringsskript. Agenten kan ikke bruke eksterne nettsteder, API-er eller andre tjenester.

Tidlige bruksområder

Tekniske team hos OpenAI har begynt å bruke Codex som en del av det daglige verktøysettet sitt. Den brukes oftest av OpenAI-ingeniører for å avlaste repeterende oppgaver med godt definert omfang, som refaktorering, endring av navn og skriving av tester, som vanligvis hadde brutt fokus. Det er like nyttig for å tilrettelegge for nye funksjoner, tilkoble nye komponenter, løse feil og opprette utkast for dokumentasjon. Team danner nye vaner rundt den: kategoriserer problemer på vakt, planlegger oppgaver ved starten av dagen og avlasting av bakgrunnsarbeid for å holde ting i gang. Ved å redusere kontekstbytte og avsløre glemte gjøremål hjelper Codex ingeniører med å levere raskere og holde seg fokusert på det som er viktigst.

I forkant av lanseringen har vi også jobbet med en liten gruppe eksterne testere for å få en bedre forståelse av hvordan Codex presterer med forskjellige kodebaser, utviklingsprosesser og team.

Cisco⁠(åpnes i et nytt vindu) utforsker hvordan Codex kan hjelpe ingeniørteamene deres med å gi liv til ambisiøse ideer raskere. Som partnere innen tidlig design, hjelper Cisco med å forme fremtiden til Codex ved å evaluere den for bruksområder i den virkelige verden fra produktporteføljen sin, og gi tilbakemelding til OpenAI-teamet.
Temporal⁠(åpnes i et nytt vindu) bruker Codex til å akselerere funksjonsutvikling, feilsøke problemer, skrive og utføre tester, og refaktorere store kodebaser. Den hjelper dem også med å holde seg fokusert ved å kjøre komplekse oppgaver i bakgrunnen – slik at ingeniører holdes i flyten mens iterering går raskere.
Superhuman⁠(åpnes i et nytt vindu) bruker Codex til å fremskynde små, men repeterende oppgaver, som forbedring av testdekning og løsning av integreringsfeil. Den hjelper dem også med å levere raskere ved å la produktledere bidra små kodeendringer uten å involvere en ingeniør, unntatt for kodegjennomgang.
Kodiak⁠(åpnes i et nytt vindu) bruker Codex til å bidra til å skrive feilsøkingsverktøy, forbedre testdekning og refaktorere kode, noe som akselerer utviklingen av Kodiak Driver, den autonome kjøreteknologien deres. Codex har også blitt et nyttig referanseverktøy som hjelper ingeniører med å forstå ukjente deler av stabelen ved å vise relevant kontekst og tidligere endringer.

Basert på lærdommen fra tidlige testere anbefaler vi tilordning av oppgaver med godt definert omfang til flere agenter samtidig og eksperimentering med forskjellige typer oppgaver og meldinger for å utforske funksjonaliteten effektivt.

Oppdateringer av Codex CLI

Forrige måned lanserte vi Codex CLI, en effektiv kodeagent med åpen kildekode som kjører i terminalen din. Den gir kraften til modeller som o3 og o4-mini i den lokale arbeidsflyten din, noe som gjør det enklere å koble til dem for å fullføre oppgaver raskere.

I dag lanserer vi også en mindre versjon av codex-1, en versjon av o4-mini designet spesifikt for bruk i Codex CLI. Denne nye modeller støtter raskere arbeidsflyter i CLI og er optimalisert for spørsmål og svar om kode og redigering med lav ventetid, mens samme styrke bevares for å følge instruksjoner og stil. Den er nå tilgjengelig som standardmodellen i Codex CLI og i API-et som codex-mini-latest. Underliggende snapshot blir regelmessig oppdatert mens vi fortsetter å forbedre Codex-mini-modellen.

Vi gjør det også mye enklere å koble utviklerkontoen din til Codex CLI. I stedet for å generere og konfigurere en API-token manuelt kan du nå logge på ChatGPT‑kontoen din og velge API-organisasjonen du vil bruke. Vi genererer og konfigurerer API-nøkkelen automatisk for deg. Plus- og Pro-brukere som logger på Codex CLI med ChatGPT, kan også begynne å løse inn henholdsvis USD 5 og USD 50 i gratis API-kreditt senere i dag for de neste 30 dagene.

Tilgjengelighet, priser og begrensninger for Codex

Fra og med i dag starter vi utrullingen av Codex til ChatGPT Pro-, Enterprise- og Team-brukere globalt, og støtte for Plus og Edu kommer snart. Brukere får rikelig tilgang uten ekstrakostnad i de kommende ukene, så du kan utforske hva Codex kan gjøre. Deretter ruller vi ut ratebegrenset tilgang, og alternativer med fleksibel pris som lar deg kjøpe mer bruk ved behov. Vi planlegger å utvide tilgang til Plus- og Edu-brukere snart.

For utviklere som bygger med codex-mini-latest, er modellen tilgjengelig på Responses API og prissatt til USD 1,50 per 1M inndatatokener og USD 6 per 1M utdatatokener, med 75 % rabatt for meldingsbufring.

Codex er fremdeles i tidlig utvikling. Som en utprøvingsversjon, mangler den fremdeles funksjoner som bildeinndata for grensesnittarbeid og evnen til å rette kurs for agenten mens den jobber. I tillegg tar delegering til en ekstern agent mer tid enn interaktiv redigering, noe det kan ta litt tid å bli vant til. Over tid kommer samhandling med Codex-agenter i økende grad til å minne om asynkront samarbeid med kolleger. Når modellfunksjoner blir bedre, forventer vi at agenter håndterer mer komplekse oppgaver over lengre perioder.

Hva skjer videre?

Vi ser for oss en fremtid der utviklere driver arbeidet de vil eie, og delegerer resten til agenter, noe som blir raskere og mer produktivt med AI. For å oppnå dette bygger vi en samling med Codex-verktøy som støtter både samarbeid i sanntid og asynkron delegering.

Sammenkobling med AI-verktøy som Codex CLI og andre, har raskt blitt en bransjenorm, og hjelper utviklere med å jobbe raskere når de koder. Men vi tror at den asynkrone arbeidsflyten med flere agenter som introduseres av Codex i ChatGPT, blir den faktiske måten ingeniører produserer kode av høy kvalitet.

Til syvende og sist ser vi at disse to samhandlingsmodusene – sammenkobling i sanntid og delegering av oppgave – samles. Utviklere samarbeider med AI-agenter på IDE-ene og hverdagsverktøyene sine for å stille spørsmål, få forslag og avlaste lengre oppgaver – alt i en forenet arbeidsflyt.

I fremtiden planlegger vi å introdusere mer interaktive og fleksible agentarbeidsflyter. Utviklere kan snart gi veiledning midt i oppgaver, samarbeide om implementeringsstrategier og få proaktive fremdriftsoppdateringer. Vi ser også for oss dypere integrering mellom verktøyene du allerede bruker: I dag kobler Codex til GitHub, og snart kan du tilordne oppgaver fra Codex CLI, ChatGPT Desktop eller til og med verktøy som problemsporingen din eller CI-systemet ditt.

Programvareutvikling er en av de første bransjene som opplever betydelig AI-basert produktivitetsforbedringer, noe som åpner nye muligheter for enkeltpersoner og små team. Selv om vi er optimistiske om disse forbedringene, samarbeider vi med partnere for å få en bedre forståelse av innvirkningen av omfattende agentbruk i utviklerarbeidsflyter, ferdighetsutvikling mellom folk, ferdighetsnivåer og geografier.

Dette er bare starten, og vi gleder oss til å se hva dere bygger med Codex.

Opptak av direktesending

Vedlegg

Systemmelding

Vi deler codex-1-systemmeldingen for å hjelpe utviklere med å forstå modellens standardatferd og tilpasse Codex for å fungere effektivt i egendefinerte arbeidsflyter. For eksempel anbefaler codex-1-systemmeldingen at Codex kjører alle tester som nevnes i AGENTS.md-filen, men hvis du har dårlig tid, kan du be Codex om å hoppe over disse testene.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Forfatter

OpenAI