Vi introduserer Codex
En skybasert programvareutviklingsagent som kan jobbe på mange oppgaver parallelt, drevet av codex-1. Tilgjengelig for ChatGPT Pro-, Team- og Enterprise-brukere i dag, og Plus-brukere snart.

Oppdatering 3. juni 2025: Codex er nå tilgjengelig for ChatGPT Plus-brukere. Vi gir også brukerne muligheten til å gi Codex internettilgang under oppgaveutførelsen. Se endringslogg(åpnes i et nytt vindu) og dokumenter(åpnes i et nytt vindu) for mer informasjon.
I dag lanserer vi en utprøvingsversjon av Codex: en skybasert programvareutviklingsagent som kan jobbe på mange oppgaver parallelt. Codex kan utføre oppgaver for deg, som å skrive funksjoner, svare på spørsmål om kodebasen din, løse feil og foreslå pull-forespørsler for gjennomgang. Hver oppgave kjøres i sitt eget sandkassemiljø i nettskyen, forhåndsinnlastet med repositoriet ditt.
Codex er drevet av codex-1, en versjon av OpenAI o3 som er optimalisert for programvareutvikling. Den ble opplært med forsterkende læring på kodeoppgaver fra den virkelige verden i en rekke miljøer for å generere kode som er nær menneskelig stil og PR-preferanse, overholder instruksjoner presist og kan kjøre tester iterativt til den får et bestått resultat. Vi starter utrullingen av Codex til ChatGPT Pro-, Enterprise- og Team-brukere i dag, og støtte for Plus og Edu kommer snart.
I dag kan du åpne Codex via sidefeltet i ChatGPT og tildele den nye kodeoppgaver ved å skrive en melding og klikke på «Skriv kode». Hvis du vil stille Codex et spørsmål om kodebasen din, klikker du på «Spør». Hver oppgave behandles uavhengig i et atskilt, isolert miljø som er forhåndinnlastet med kodebasen din. Codex kan lese og redigere filer samt kjøre kommandoer inkludert testrammeverk, lintere og typesjekkere. Fullførelse av oppgaver tar vanligvis mellom 1 og 30 minutter, avhengig av kompleksitet, og du kan overvåke fremdriften til Codex i sanntid.
Når Codex fullfører en oppgave, utfører den endringene i miljøet sitt. Codex gir verifiserbart bevis på handlingene via kildehenvisningene av terminallogger og testutdata, noe som gjør at du kan spore hvert trinn som utføres under fullførelse av oppgaver. Så kan du gjennomgå resultatene, be om videre revisjon, åpne en pull-forespørsel i GitHub eller integrere endringene direkte inn i det lokale miljøet ditt. I produktet kan du konfigurere Codex-miljøet for å matche det faktiske utviklingsmiljøet ditt så nært som mulig.
Codex kan veiledes av AGENTS.md-filer som plasseres i repositoriet ditt. Dette er tekstfiler, som minner om README.md, der du kan informere Codex om hvordan den navigerer i kodebasen, hvilke kommandoer som skal kjøres for testing, og hvordan den best kan overholde standardpraksisen for prosjektet. I likhet med menneskelige utviklere presterer Codex-agenter best når de får konfigurerte utviklingmiljøer, pålitelige testoppsett og tydelig dokumentasjon.
For evaluering av koding og interne referansemålinger viser codex-1 sterk ytelse selv uten AGENTS.md-filer eller tilpasset oppsett.
23 prøver verifisert med SWE-ref som ikke kunne kjøres på den interne infrastrukturen vår, ble ekskludert. codex-1 ble testet ved maksimal kontekstlengde på 192k tokener og middels «resonnementanstrengelse», som er innstillingen som er tilgjengelig i produktet i dag. Du finner detaljer om o3‑evalueringer her.
Den interne referansemålingen vår for SWE-oppgaver er et utvalgt sett med interne SWE-oppgaver fra den virkelige verden hos OpenAI.
Vi lanserer Codex som en utprøvingsversjon, i tråd med strategien vår for iterativ utrulling. Vi prioriterer sikkerhet og åpenhet under design av Codex, slik at brukere kan bekrefte utdataene fra den – en beskyttelsesmekanisme som blir stadig viktigere når AI-modeller håndterer mer komplekse kodeoppgaver uavhengig og sikkerhetsbekymringer utvikles. Brukere kan sjekke Codex-arbeidet via kildehenvisninger, terminallogger og testresultater. Når Codex-agenten er usikker eller støter på testfeil, kommuniserer den disse problemene uttrykkelig, noe som lar brukere ta informerte avgjørelser om hvordan de vil fortsette. Det er fremdeles viktig at brukere manuelt gjennomgår og bekrefter all agentgenerert kode før integrering og utførelse.


Et primært mål under opplæring av codex-1 var å tilpasse utdata nær menneskelige preferanser og standarder for koding. Sammenlignet med OpenAI o3 produserer codex-1 konsekvent ryddigere endringer som er klare for umiddelbar menneskelig gjennomgang og integrering i vanlige arbeidsflyter.
Beskyttelse mot skadelig bruk av AI-basert programvareutvikling, for eksempel utvikling av skadelig programvare, er stadig viktigere. Samtidig er det viktig at beskyttende tiltak ikke urimelig hindrer legitim og fordelaktig bruk som kan involvere teknikker som noen ganger også brukes for utvikling av skadelig programvare, for eksempel utvikling på kjerne på lavt nivå.
For å balansere sikkerhet og nytte ble Codex lært opp til å identifisere og nøyaktig nekte forespørsler rettet mot utvikling av skadelig programvare, og samtidig tydelig skille ut og støtte legitime oppgaver. Vi har også forbedret rammeverkene for retningslinjer og innlemmet strenge sikkerhetsevalueringer for å forsterke disse grensene effektivt. Vi har publisert et vedlegg til o3‑systemkortet for å gjenspeile disse evalueringene.
Codex-agenten opererer bare i en sikker, isolert container i nettskyen. Under utførelse av oppgaver blir internettilgang deaktivert, noe som begrenser agentens interaksjon til koden som uttrykkelig gis via GitHub-repositorier og forhåndsinstallerte avhengigheter konfigurert av brukeren via et konfigureringsskript. Agenten kan ikke bruke eksterne nettsteder, API-er eller andre tjenester.
Tekniske team hos OpenAI har begynt å bruke Codex som en del av det daglige verktøysettet sitt. Den brukes oftest av OpenAI-ingeniører for å avlaste repeterende oppgaver med godt definert omfang, som refaktorering, endring av navn og skriving av tester, som vanligvis hadde brutt fokus. Det er like nyttig for å tilrettelegge for nye funksjoner, tilkoble nye komponenter, løse feil og opprette utkast for dokumentasjon. Team danner nye vaner rundt den: kategoriserer problemer på vakt, planlegger oppgaver ved starten av dagen og avlasting av bakgrunnsarbeid for å holde ting i gang. Ved å redusere kontekstbytte og avsløre glemte gjøremål hjelper Codex ingeniører med å levere raskere og holde seg fokusert på det som er viktigst.
I forkant av lanseringen har vi også jobbet med en liten gruppe eksterne testere for å få en bedre forståelse av hvordan Codex presterer med forskjellige kodebaser, utviklingsprosesser og team.
- Cisco(åpnes i et nytt vindu) utforsker hvordan Codex kan hjelpe ingeniørteamene deres med å gi liv til ambisiøse ideer raskere. Som partnere innen tidlig design, hjelper Cisco med å forme fremtiden til Codex ved å evaluere den for bruksområder i den virkelige verden fra produktporteføljen sin, og gi tilbakemelding til OpenAI-teamet.
- Temporal(åpnes i et nytt vindu) bruker Codex til å akselerere funksjonsutvikling, feilsøke problemer, skrive og utføre tester, og refaktorere store kodebaser. Den hjelper dem også med å holde seg fokusert ved å kjøre komplekse oppgaver i bakgrunnen – slik at ingeniører holdes i flyten mens iterering går raskere.
- Superhuman(åpnes i et nytt vindu) bruker Codex til å fremskynde små, men repeterende oppgaver, som forbedring av testdekning og løsning av integreringsfeil. Den hjelper dem også med å levere raskere ved å la produktledere bidra små kodeendringer uten å involvere en ingeniør, unntatt for kodegjennomgang.
- Kodiak(åpnes i et nytt vindu) bruker Codex til å bidra til å skrive feilsøkingsverktøy, forbedre testdekning og refaktorere kode, noe som akselerer utviklingen av Kodiak Driver, den autonome kjøreteknologien deres. Codex har også blitt et nyttig referanseverktøy som hjelper ingeniører med å forstå ukjente deler av stabelen ved å vise relevant kontekst og tidligere endringer.
Basert på lærdommen fra tidlige testere anbefaler vi tilordning av oppgaver med godt definert omfang til flere agenter samtidig og eksperimentering med forskjellige typer oppgaver og meldinger for å utforske funksjonaliteten effektivt.
Forrige måned lanserte vi Codex CLI, en effektiv kodeagent med åpen kildekode som kjører i terminalen din. Den gir kraften til modeller som o3 og o4-mini i den lokale arbeidsflyten din, noe som gjør det enklere å koble til dem for å fullføre oppgaver raskere.
I dag lanserer vi også en mindre versjon av codex-1, en versjon av o4-mini designet spesifikt for bruk i Codex CLI. Denne nye modeller støtter raskere arbeidsflyter i CLI og er optimalisert for spørsmål og svar om kode og redigering med lav ventetid, mens samme styrke bevares for å følge instruksjoner og stil. Den er nå tilgjengelig som standardmodellen i Codex CLI og i API-et som codex-mini-latest. Underliggende snapshot blir regelmessig oppdatert mens vi fortsetter å forbedre Codex-mini-modellen.
Vi gjør det også mye enklere å koble utviklerkontoen din til Codex CLI. I stedet for å generere og konfigurere en API-token manuelt kan du nå logge på ChatGPT‑kontoen din og velge API-organisasjonen du vil bruke. Vi genererer og konfigurerer API-nøkkelen automatisk for deg. Plus- og Pro-brukere som logger på Codex CLI med ChatGPT, kan også begynne å løse inn henholdsvis USD 5 og USD 50 i gratis API-kreditt senere i dag for de neste 30 dagene.
Fra og med i dag starter vi utrullingen av Codex til ChatGPT Pro-, Enterprise- og Team-brukere globalt, og støtte for Plus og Edu kommer snart. Brukere får rikelig tilgang uten ekstrakostnad i de kommende ukene, så du kan utforske hva Codex kan gjøre. Deretter ruller vi ut ratebegrenset tilgang, og alternativer med fleksibel pris som lar deg kjøpe mer bruk ved behov. Vi planlegger å utvide tilgang til Plus- og Edu-brukere snart.
For utviklere som bygger med codex-mini-latest, er modellen tilgjengelig på Responses API og prissatt til USD 1,50 per 1M inndatatokener og USD 6 per 1M utdatatokener, med 75 % rabatt for meldingsbufring.
Codex er fremdeles i tidlig utvikling. Som en utprøvingsversjon, mangler den fremdeles funksjoner som bildeinndata for grensesnittarbeid og evnen til å rette kurs for agenten mens den jobber. I tillegg tar delegering til en ekstern agent mer tid enn interaktiv redigering, noe det kan ta litt tid å bli vant til. Over tid kommer samhandling med Codex-agenter i økende grad til å minne om asynkront samarbeid med kolleger. Når modellfunksjoner blir bedre, forventer vi at agenter håndterer mer komplekse oppgaver over lengre perioder.
Vi ser for oss en fremtid der utviklere driver arbeidet de vil eie, og delegerer resten til agenter, noe som blir raskere og mer produktivt med AI. For å oppnå dette bygger vi en samling med Codex-verktøy som støtter både samarbeid i sanntid og asynkron delegering.
Sammenkobling med AI-verktøy som Codex CLI og andre, har raskt blitt en bransjenorm, og hjelper utviklere med å jobbe raskere når de koder. Men vi tror at den asynkrone arbeidsflyten med flere agenter som introduseres av Codex i ChatGPT, blir den faktiske måten ingeniører produserer kode av høy kvalitet.
Til syvende og sist ser vi at disse to samhandlingsmodusene – sammenkobling i sanntid og delegering av oppgave – samles. Utviklere samarbeider med AI-agenter på IDE-ene og hverdagsverktøyene sine for å stille spørsmål, få forslag og avlaste lengre oppgaver – alt i en forenet arbeidsflyt.
I fremtiden planlegger vi å introdusere mer interaktive og fleksible agentarbeidsflyter. Utviklere kan snart gi veiledning midt i oppgaver, samarbeide om implementeringsstrategier og få proaktive fremdriftsoppdateringer. Vi ser også for oss dypere integrering mellom verktøyene du allerede bruker: I dag kobler Codex til GitHub, og snart kan du tilordne oppgaver fra Codex CLI, ChatGPT Desktop eller til og med verktøy som problemsporingen din eller CI-systemet ditt.
Programvareutvikling er en av de første bransjene som opplever betydelig AI-basert produktivitetsforbedringer, noe som åpner nye muligheter for enkeltpersoner og små team. Selv om vi er optimistiske om disse forbedringene, samarbeider vi med partnere for å få en bedre forståelse av innvirkningen av omfattende agentbruk i utviklerarbeidsflyter, ferdighetsutvikling mellom folk, ferdighetsnivåer og geografier.
Dette er bare starten, og vi gleder oss til å se hva dere bygger med Codex.
Systemmelding
Vi deler codex-1-systemmeldingen for å hjelpe utviklere med å forstå modellens standardatferd og tilpasse Codex for å fungere effektivt i egendefinerte arbeidsflyter. For eksempel anbefaler codex-1-systemmeldingen at Codex kjører alle tester som nevnes i AGENTS.md-filen, men hvis du har dårlig tid, kan du be Codex om å hoppe over disse testene.