16. toukokuuta 2025

Esittelyssä Codex

Pilvipohjainen ohjelmistoagentti, joka pystyy suorittamaan useita tehtäviä rinnakkain codex-1:n avulla. Saatavilla tänään ChatGPT Pro-, Team- ja Enterprise-käyttäjille, ja pian myös Plus-käyttäjille.

Kokeile Codexia

Hallintapaneeli kysyy “Mitä koodataan seuraavaksi?“ sisältäen kehotekentän, varasto-/haaraselaimen ja tehtävälistan pastellisävyisellä kooditeemaisella taustalla.

Ladataan...

Päivitys 3. kesäkuuta 2025: Codex on nyt saatavilla ChatGPT Plus -käyttäjille. Käyttäjät voivat nyt myös antaa Codexille internet-yhteyden tehtävien suorittamisen aikana. Katso lisätietoja muutoslokista⁠(avautuu uudessa ikkunassa) ja asiakirjoista⁠(avautuu uudessa ikkunassa).

Julkaisemme tänään Codexin esikatseluversion. Se on pilvipohjainen ohjelmistoagentti, joka pystyy suorittamaan useita tehtäviä rinnakkain codex-1:n avulla. Codex voi suorittaa tehtäviä puolestasi, kuten ominaisuuksien kirjoittamista, kysymyksiin vastaamista koodikannastasi, virheiden korjaamista ja ehdotusten tekemistä pull-pyyntöjen arviointiin. Tehtävät suoritetaan omissa pilvipohjaisissa hiekkalaatikkoympäristöissään, jotka on esiladattu varastollasi.

Codex toimii codex-1:llä, joka on ohjelmistosuunnitteluun optimoitu versio OpenAI o3:sta. Se koulutettiin vahvistusoppimisella todellisilla koodaustehtävillä eri ympäristöissä, jotta se voi tuottaa koodia, joka muistuttaa ihmisten tyyliä ja PR-mieltymyksiä, noudattaa tarkasti ohjeita ja pystyy iteratiivisesti suorittamaan testejä, kunnes se saa hyväksytyn tuloksen. Aloitamme Codexin käyttöönoton ChatGPT Pro-, Enterprise- ja Team-käyttäjille tänään, ja Plus- ja Edu-käyttäjien tuki on tulossa pian.

Miten Codex toimii

Nykyään voit käyttää Codexia ChatGPT:n sivupalkin kautta ja antaa sille uusia koodaustehtäviä kirjoittamalla kehotteen ja napsauttamalla Code. Jos haluat kysyä Codexilta koodipohjaasi koskevan kysymyksen, valitse Kysy. Jokainen tehtävä käsitellään itsenäisesti erillisessä, eristetyssä ympäristössä, johon on esiladattu koodipohjasi. Codex voi lukea ja muokata tiedostoja sekä ajaa komentoja, kuten testivalikoimia, lintereitä ja tyyppitarkistimia. Tehtävän suorittaminen kestää yleensä 1–30 minuuttia monimutkaisuudesta riippuen, ja voit seurata Codexin edistymistä reaaliajassa.

Kun Codex on saanut tehtävän valmiiksi, se siirtää muutokset ympäristöönsä. Codex tarjoaa todennettavia todisteita toiminnoistaan terminaalilokien ja testitulosten avulla, jolloin voit jäljittää jokaisen tehtävän suorittamisen aikana otetun askeleen. Tämän jälkeen voit tarkastella tuloksia, pyytää lisäkorjauksia, avata GitHubin pull-pyynnön tai integroida muutokset suoraan paikalliseen ympäristöön. Tuotteessa voit määrittää Codex-ympäristön vastaamaan mahdollisimman hyvin todellista kehitysympäristöäsi.

Codexia voidaan ohjata arkistoosi sijoitettujen AGENTS.md-tiedostojen avulla. Nämä ovat README.md:n kaltaisia tekstitiedostoja, joissa voit ohjeistaa Codexia navigoimaan koodipohjassasi, suorittamaan testikomennot ja noudattamaan projektisi vakiokäytäntöjä parhaalla mahdollisella tavalla. Kuten ihmiskehittäjät, myös Codex-agentit toimivat parhaiten, kun heille tarjotaan määritetyt kehitysympäristöt, luotettavat testausasetukset ja selkeä dokumentaatio.

Koodausarvioinneissa ja sisäisissä vertailuarvoissa codex-1 osoittaa vahvaa suorituskykyä jopa ilman AGENTS.md-tiedostoja tai mukautettuja tukirakenteita.

23 SWE-Benchin vahvistettua näytettä, joita ei voitu ajaa sisäisessä infrastruktuurissamme, jätettiin pois. Codex-1 testattiin enintään 192 000 tunnisteen kontekstipituudella ja keskitason päättelykyvyllä, joka on käytettävissä tuotteessa tänään. Lisätietoja o3‑arvioinneista on täällä⁠.

Sisäinen SWE-tehtävien vertailuarvomme on kuratoitu joukko OpenAI:n sisäisiä SWE-tehtäviä.

Turvallisten ja luotettavien agenttien rakentaminen

Julkaisemme Codexin esikatseluversiona iteratiivisen käyttöönottostrategiamme mukaisesti. Asetimme Codexin suunnittelussa etusijalle turvallisuuden ja avoimuuden, jotta käyttäjät voivat tarkistaa sen tuotokset – se on yhä tärkeämpi suojatoimi, kun tekoälymallit hoitavat monimutkaisempia koodaustehtäviä itsenäisesti ja turvallisuusarvioinnit kehittyvät. Käyttäjät voivat tarkistaa Codexin työn lainausten, päätelokien ja testitulosten avulla. Codex-agentti viestii avoimesti epävarmuuksista ja testivirheistä, mikä mahdollistaa käyttäjille harkittujen päätösten tekemisen jatkotoimien suhteen. Käyttäjien on edelleen välttämätöntä tarkistaa ja validoida manuaalisesti kaikki agentin luoma koodi ennen integrointia ja suorittamista.

Koodin tarkastuksen ruutukaappaus, jossa näkyy testitiedoston peittokuva ja joka varmistaa lainatut tiedostonimet, sekä yhteenveto ja hyväksytyt testit sinisellä taustalla.

Koodin tarkastelun kuvakaappaus, jossa on musta terminaali peittokuvana ja joka näyttää yhden hyväksytyn testin lainatuille tiedostonimille, yhteenveto ja muutosraportti “Fix /diff error with special characters“ -muutoksesta näkyvät sinisellä pastellitaustalla.

Ihmisten mieltymysten huomioon ottaminen

Ensisijainen tavoite codex-1:n kouluttamisessa oli sovittaa tuotokset tiiviisti yhteen ihmisten koodausmieltymysten ja -standardien kanssa. Verrattuna OpenAI o3‑malliin, codex-1 tuottaa johdonmukaisesti puhtaampia tietosegmenttejä jotka ovat heti valmiita ihmisen tarkistettaviksi ja integroitaviksi vakiotyönkulkuihin.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Väärinkäytön ehkäiseminen

On yhä tärkeämpää suojautua tekoälyavusteisen ohjelmistosuunnittelun väärinkäytöksiltä, kuten haittaohjelmien kehittämiseltä. Samalla on tärkeää, että suojatoimenpiteet eivät kohtuuttomasti estä laillisia ja hyödyllisiä sovelluksia, jotka voivat sisältää haittaohjelmien kehittämisessäkin käytettyjä tekniikoita, kuten matalan tason ytimen suunnittelua.

Turvallisuuden ja hyödyllisyyden tasapainottamiseksi Codex on koulutettu tunnistamaan ja tarkasti kieltäytymään haitallisen ohjelmiston kehittämiseen tähtäävistä pyynnöistä, samalla selkeästi erottaen ja tukien laillisia tehtäviä. Olemme myös parantaneet käytännön viitekehystämme ja ottaneet käyttöön perusteelliset turvallisuusarvioinnit näiden rajojen tehokkaaksi vahvistamiseksi. Olemme julkaisseet o3‑järjestelmäkorttiin lisäyksen⁠, joka heijastaa näitä arviointeja.

Turvallinen suorittaminen

Codex-agentti toimii täysin turvallisessa ja eristetyssä kontissa pilvipalvelussa. Tehtävän suorituksen aikana internet-yhteys on poistettu käytöstä, jolloin agentti voi olla vuorovaikutuksessa ainoastaan GitHub-varastojen kautta toimitetun koodin sekä käyttäjän määrityskomentosarjalla määrittämien valmiiksi asennettujen riippuvuuksien kanssa. Agentti ei voi käyttää ulkoisia verkkosivustoja, API-rajapintoja tai muita palveluja.

Varhaiset käyttötapaukset

OpenAI:n tekniset tiimit ovat alkaneet käyttää Codexia päivittäisessä työskentelyssään. OpenAI:n insinöörit käyttävät sitä useimmiten toistuvien, tarkkaan rajattujen tehtävien, kuten refaktoroinnin, uudelleennimeämisen ja testien kirjoittamisen, siirtämiseen, jotta keskittyminen ei häiriintyisi. Se on yhtä hyödyllinen uusien ominaisuuksien rakentamisessa, komponenttien kytkemisessä, virheiden korjaamisessa ja dokumentaation laatimisessa. Tiimit rakentavat uusia tapoja sen ympärille: päivystysongelmien luokittelu, tehtävien suunnittelu päivän alussa ja taustatyön siirtäminen eteenpäin pääsemiseksi. Vähentämällä kontekstin vaihtumista ja tuomalla esiin unohdetut tehtävät Codex auttaa insinöörejä tekemään työt nopeammin ja keskittymään tärkeimpiin asioihin.

Ennen julkaisua olemme myös työskennelleet pienen ulkopuolisten testaajien ryhmän kanssa ymmärtääksemme paremmin, miten Codex toimii erilaisissa koodipohjissa, kehitysprosesseissa ja tiimeissä.

Cisco⁠(avautuu uudessa ikkunassa) tutkii, miten Codex voi auttaa suunnittelutiimejä toteuttamaan kunnianhimoisia ideoita nopeammin. Cisco toimii Codexin varhaisena suunnittelukumppanina ja auttaa muovaamaan sen tulevaisuutta arvioimalla sen käytettävyyttä todellisissa käyttötapauksissa koko tuoteportfoliossaan sekä antamalla palautetta OpenAI:n tiimille.
Temporal⁠(avautuu uudessa ikkunassa) käyttää Codexia ominaisuuksien kehittämisen nopeuttamiseen, ongelmien virheenkorjaukseen, testien kirjoittamiseen ja suorittamiseen sekä suurten koodipohjien refaktoroimiseen. Se auttaa heitä myös keskittymään, sillä se suorittaa monimutkaisia tehtäviä taustalla, jolloin insinöörit pysyvät ajan tasalla ja iterointi nopeutuu.
Superhuman⁠(avautuu uudessa ikkunassa) käyttää Codexia nopeuttaakseen pieniä mutta toistuvia tehtäviä, kuten testien kattavuuden parantamista ja integrointivirheiden korjaamista. Se auttaa heitä myös toimittamaan tuotteita nopeammin, koska tuotepäälliköt voivat tehdä kevyitä koodimuutoksia ilman insinööriä, lukuun ottamatta koodin tarkistusta.
Kodiak⁠(avautuu uudessa ikkunassa) käyttää Codexia apuna virheenkorjaustyökalujen kirjoittamisessa, testien kattavuuden parantamisessa ja koodin muokkauksessa, mikä nopeuttaa heidän autonomisen ajoteknologiansa Kodiak Driverin kehitystä. Codexista on tullut myös arvokas viitetyökalu, joka auttaa insinöörejä ymmärtämään pinon tuntemattomia osia tuomalla esiin asiayhteyden ja aiemmat muutokset.

Varhaisilta testaajilta saatujen kokemusten perusteella suosittelemme, että useille agenteille annetaan hyvin rajattuja tehtäviä samanaikaisesti ja että kokeillaan erityyppisiä tehtäviä ja kehotuksia, jotta mallin kykyjä voidaan tutkia tehokkaasti.

Codex CLI:n päivitykset

Viime kuussa lanseerasimme Codex CLI:n, kevyen avoimen lähdekoodin koodausagentin, joka toimii päätelaitteessa. Se tuo o3- ja o4-mini-mallien tehon paikalliseen työnkulkuun, mikä helpottaa niiden yhdistämistä tehtävien nopeampaa suorittamista varten.

Tänään julkaisemme myös pienemmän version codex-1:stä, joka on erityisesti Codex CLI:n käyttöön suunniteltu versio o4-ministä. Uusi malli tukee nopeampia työnkulkuja CLI-ympäristössä ja on optimoitu vähäisen viiveen koodikysymyksiin ja muokkaukseen säilyttäen samalla vahvuutensa ohjeiden seuraamisessa ja tyylissä. Se on nyt saatavilla oletusmallina Codex CLI:ssä ja API:ssa nimellä codex-mini-latest. Taustalla olevaa tilannekuvaa päivitetään säännöllisesti, kun jatkamme Codex-mini-mallin parantamista.

Teemme myös paljon helpommaksi yhdistää kehittäjätilisi Codex CLI:hin. Sen sijaan, että luot ja määrität API-tunnisteen manuaalisesti, voit nyt kirjautua sisään ChatGPT‑tililläsi ja valita haluamasi API-organisaation. Luomme ja konfiguroimme API-avaimen automaattisesti puolestasi. Plus- ja Pro-käyttäjät, jotka kirjautuvat Codex CLI:hin ChatGPT:n avulla, voivat alkaa lunastaa 5 ja 50 dollarin arvosta ilmaisia API-krediittejä myöhemmin tänään seuraavien 30 päivän ajan.

Codexin saatavuus, hinnoittelu ja rajoitukset

Tästä päivästä alkaen otamme Codexin käyttöön ChatGPT Pro-, Enterprise- ja Team-käyttäjille globaalisti, ja tuki Plus- ja Edu-käyttäjille on tulossa pian. Käyttäjillä on runsaat käyttöoikeudet ilman lisäkustannuksia tulevina viikkoina, jotta he voivat tutkia, mitä Codex voi tehdä. Sen jälkeen otamme käyttöön rajoitetun käyttöoikeuden ja joustavat hinnoitteluvaihtoehdot, joiden avulla voi ostaa lisäkäyttöä tarpeen mukaan. Aiomme laajentaa käyttöoikeuden Plus- ja Edu-käyttäjille pian.

Codex-mini-latestia käyttäville kehittäjille malli on saatavilla Responses API:n kautta hintaan 1,50 $ miljoonaa syötetunnistetta ja 6 $ miljoonaa tuotostunnistetta kohti, sisältäen 75 % kehotteen välimuistialennuksen.

Codex on edelleen varhaisessa kehitysvaiheessa. Esikatseluversiona siitä puuttuu tällä hetkellä ominaisuuksia, kuten kuvien syötteet käyttöliittymätyöhön, ja kyky korjata agenttia sen työskentelyn aikana Lisäksi delegointi etäagentille kestää kauemmin kuin vuorovaikutteinen muokkaus, mikä voi vaatia totuttelua. Ajan myötä vuorovaikutus Codex-agenttien kanssa muistuttaa yhä enemmän asynkronista yhteistyötä kollegoiden kanssa. Mallin valmiuksien kehittyessä odotamme, että agentit hoitavat monimutkaisempia tehtäviä pitkiä aikoja.

Mitä seuraavaksi

Kuvittelemme tulevaisuuden, jossa kehittäjät ohjaavat itse haluamaansa työtä ja delegoivat loput agenteille – edeten nopeammin ja lisäten tuottavuutta tekoälyn avulla. Tätä varten rakennamme Codex-työkaluja, jotka tukevat sekä reaaliaikaista yhteistyötä että asynkronista delegointia.

Codex CLI:n ja muiden tekoälytyökalujen hyödyntäminen on nopeasti muodostunut alan standardiksi, mikä auttaa kehittäjiä etenemään nopeammin koodatessa. Uskomme kuitenkin, että Codexin ChatGPT:ssä käyttöön ottamasta asynkronisesta, moniagenttisesta työnkulusta tulee alan vakiintunut tapa tuottaa korkealaatuista koodia.

Näemme lopulta, että reaaliaikainen yhteistyö ja tehtävien delegointi sulautuvat yhteen tulevaisuudessa, muodostaen yhtenäisen toimintamallin. Kehittäjät työskentelevät tekoälyagenttien kanssa suoraan IDE:issä ja muissa arjen työkaluissa kysyen kysymyksiä, hyödyntäen ehdotuksia ja delegoiden laajempia tehtäviä yhtenäisessä työnkulussa.

Tulevaisuudessa aiomme ottaa käyttöön entistä vuorovaikutteisempia ja joustavampia agenttien työnkulkuja. Kehittäjät voivat pian antaa ohjeita kesken tehtävän, tehdä yhteistyötä toteutusstrategioiden parissa ja saada ennakoivia päivityksiä edistymisestä. Suunnittelemme myös syvempiä integraatioita jo käyttämiisi työkaluihin: tällä hetkellä Codex yhdistyy GitHubiin, ja pian voit määrittää tehtäviä Codex CLI:stä, ChatGPT Desktopista tai jopa virheenhallintajärjestelmän tai CI-järjestelmän kaltaisista työkaluista.

Ohjelmistotekniikka on yksi ensimmäisistä aloista, joilla on saavutettu merkittäviä tekoälyyn perustuvia tuottavuushyötyjä, mikä avaa uusia mahdollisuuksia yksilöille ja pienille tiimeille. Vaikka suhtaudumme optimistisesti näihin saavutuksiin, teemme myös yhteistyötä kumppaneiden kanssa ymmärtääksemme paremmin, mitä vaikutuksia agenttien laajamittaisella käyttöönotolla on kehittäjien työnkulkuihin sekä taitojen kehittämiseen eri ihmisten, taitotasojen ja maantieteellisten alueiden välillä.

Tämä on vasta alkua, ja olemme kiinnostuneita näkemään, mitä rakennat Codexin avulla.

Livestreamin toisto

Lisäys

Järjestelmän viesti

Jaamme codex-1-järjestelmän viestin, jotta kehittäjät ymmärtäisivät mallin oletuskäyttäytymistä ja voisivat räätälöidä Codexin toimimaan tehokkaasti mukautetuissa työnkuluissa. Esimerkiksi codex-1-järjestelmän viesti kehottaa Codexia suorittamaan kaikki AGENTS.md-tiedostossa mainitut testit, mutta jos sinulla on vähän aikaa, voit pyytää Codexia jättämään testit väliin.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Tekijä

OpenAI