16. mai 2025

Codexi tutvustus

Pilvepõhine tarkvaraarenduse agent, mis suudab paralleelselt töötada paljude ülesannetega, mida toidab codex-1. Saadaval täna ChatGPT Pro, Business ja Enterprise plaanide kasutajatele ning peagi Plusi kasutajatele.

Proovige Codexit

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Laadimine…

3. juuni 2025 värskendus: Codex on nüüd saadaval ChatGPT Plusi kasutajatele. Samuti võimaldame kasutajatel anda Codexile internetiühenduse ülesande täitmise ajal. Lisateabe saamiseks loe muudatuste logi⁠(avaneb uues aknas) ja dokumentatsiooni⁠(avaneb uues aknas).

Täna käivitame Codexi uurimistöö eelvaate: pilvepõhise tarkvaraarenduse agendi, mis suudab paralleelselt töötada paljude ülesannetega. Codex suudab sinu eest täita ülesandeid, nagu funktsioonide kirjutamine, küsimustele vastamine sinu koodibaasi kohta, vigade parandamine ja tõuketaotluste ettepanekute tegemine ülevaatamiseks; iga ülesanne töötab oma pilvepõhises liivakasti keskkonnas, mis on sinu varamuga eellaaditud.

Codexit toidab codex-1, mis on OpenAI o3 versioon, mis on optimeeritud tarkvaraarenduse jaoks. Seda koolitati, kasutades kinnistavat õppimist reaalmaailma kodeerimisülesannete lahendamiseks erinevates keskkondades, et koosta kood, mis peegeldab täpselt inimeste stiili ja PR-eelistusi, järgib täpselt juhiseid ning suudab korduvalt teste käivitada, kuni saavutatakse positiivne tulemus. Alustame täna Codexi juurutamist ChatGPT Pro, Enterprise ja Business kasutajatele, peagi lisandub tugi ka Plus ja Edu kasutajatele.

Kuidas Codex töötab

Täna pääseb Codexile ligi ChatGPT külgriba kaudu ja määrata sellele uusi kodeerimisülesandeid, tippides viiba ja klõpsates nupul „Kodeeri“. Kui tahad Codexilt oma koodibaasi kohta küsimust küsida, klõpsa valikul „Küsi“. Iga ülesanne töödeldakse iseseisvalt eraldi, isoleeritud keskkonnas, mis on eellaaditud sinu koodibaasiga. Codex suudab faile lugeda ja redigeerida ning käivitada käske, sealhulgas testrakendusi, lintereid ja tüübikontrollereid. Ülesande täitmine võtab tavaliselt aega 1–30 minutit, olenevalt keerukusest, ja sa saad Codexi edenemist reaalajas jälgida.

Kui Codexi on ülesande lõpetanud, kinnitab ta oma muudatused oma keskkonnas. Codex pakub kontrollitavaid tõendeid oma toimingute kohta terminali logide ja testiväljundite viidete kaudu, võimaldades sul jälgida iga sammu ülesande täitmisel. Seejärel saad tulemusi üle vaadata, taotleda täiendavaid parandusi, avada GitHubi tõmbetaotluse või integreerida muudatused otse oma kohalikku keskkonda. Tootes saad Codexi keskkonda konfigureerida nii, et see vastaks võimalikult täpselt su tegelikule arenduskeskkonnale.

Codexit saab suunata teie hoidlasse paigutatud AGENTS.md failide abil. Need on tekstifailid, mis sarnanevad README.md-le, kus saad Codexile teada anda, kuidas oma koodibaasis navigeerida, milliseid käske testimiseks käivitada ja kuidas oma projekti standardpraktikaid kõige paremini järgida. Nagu arendajad, toimivad Codexi agendid kõige paremini, kui neile on tagatud konfigureeritud arenduskeskkonnad, usaldusväärsed testimisseaded ja selge dokumentatsioon.

Kodeerimishindamiste ja sisemiste võrdlustestide puhul näitab codex-1 tugevat jõudlust isegi ilma AGENTS.md failide või kohandatud tugistruktuurideta.

23 SWE-Bench kinnitatud proovi, mida ei saanud meie sisemises infrastruktuuris käivitada, jäeti välja. Codex-1 testiti maksimaalse kontekstipikkusega 192k tokenit ja keskmise 'mõtlemispingutusega', mis on seadistus, mis on täna tootes saadaval. O3 hindamiste kohta vaata siit⁠.

Meie sisemine SWE-ülesannete võrdlusalus on OpenAI-s reaalsete sisemiste SWE-ülesannete hoolikalt valitud kogum.

Turvaliste ja usaldusväärsete agentide loomine

Avaldame Codexi teadusliku eelvaate, mis on kooskõlas meie iteratiivse juurutamise strateegiaga. Me seadsime Codexi disainimisel esikohale turvalisuse ja läbipaistvuse, et kasutajad saaksid selle väljundeid kinnitada – see kaitsemehhanism muutub üha olulisemaks, kuna tehisintellekti mudelid lahendavad keerukamaid kodeerimisülesandeid iseseisvalt ning turvakaalutlused arenevad. Kasutajad saavad Codexi tööd kontrollida viidete, terminalilogide ja testitulemuste kaudu. Kui on ebakindlus või testide ebaõnnestumisi, teavitab Codexi agent selgesõnaliselt nendest probleemidest, võimaldades kasutajatel teha teadlikke otsuseid, kuidas edasi minna. Endiselt on oluline, et kasutajad vaataksid enne integreerimist ja käivitamist kogu agendi koostatud koodi käsitsi üle ja valideeriksid.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Inimemeelistustega kooskõlastamine

Codex-1 koolituse peamine eesmärk oli viia väljundid tihedalt vastavusse inimeste kodeerimiseelistuste ja -standarditega. Võrreldes OpenAI o3‑ga toodab codex-1 järjepidevalt puhtamaid parandusi, mis on valmis koheseks inimülevaatuseks ja integreerimiseks standardsetesse töövoogudesse.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Väärkasutuse ennetamine

Tehisintellektijuhitud tarkvaraarenduse pahatahtlike rakenduste, näiteks pahavara arendamise, vastu kaitsmine on üha olulisem. Samas on oluline, et kaitsemeetmed ei takistaks liigselt seaduslikke ja kasulikke rakendusi, mis võivad hõlmata ka tehnikaid, mida mõnikord kasutatakse ka pahavara arendamiseks, näiteks madala taseme kerneli arendused.

Ohutuse ja kasulikkuse tasakaalustamiseks koolitati Codex tuvastama ja täpselt keelduma pahatahtliku tarkvara arendamisele suunatud taotlustest, eristades ja toetades samal ajal selgelt seaduslikke ülesandeid. Oleme samuti täiustanud oma poliitikaraamistikke ja lisanud ranged ohutushindamised, et neid piire tõhusalt tugevdada. Oleme avaldanud o3 süsteemikaardi lisa⁠, et neid hinnanguid kajastada.

Turvaline täitmine

Codexi agent töötab täielikult turvalises ja isoleeritud konteineris pilves. Ülesande täitmise ajal on internetiühendus keelatud, piirates agendi suhtlust ainult koodiga, mis on selgelt esitatud GitHubi hoidlate kaudu ja eelinstalleeritud sõltuvustega, mille kasutaja on seadistusskripti abil seadistanud. Agent ei pääse ligi välistele veebisaitidele, API-dele ega teistele teenustele.

Varased kasutusjuhtumid

OpenAI tehnilised meeskonnad on hakanud Codexit oma igapäevase tööriistakomplekti osana kasutama. OpenAI insenerid kasutavad seda kõige sagedamini korduvate, täpselt piiritletud ülesannete, nagu refaktoreerimine, nimetamist ümber ja testide kirjutamine, koormuse vähendamiseks, mis muidu katkestaksid keskendumise. See on sama kasulik uute funktsioonide väljatöötamiseks, komponentide ühendamiseks, vigade parandamiseks ja dokumentatsiooni koostamiseks. Meeskonnad kujundavad selle ümber uusi harjumusi: valvekorras tekkivate probleemide lahendamine, ülesannete planeerimine päeva alguses ja taustatöö delegeerimine edasiliikumiseks. Vähendades kontekstivahetust ja unustatud ülesannete esiletoomist, aitab Codex arendajatel kiiremini tarnida ja keskenduda sellele, mis on kõige olulisem.

Enne väljaandmist oleme teinud koostööd ka väikese rühmaga väliste testijatega, et paremini mõista, kuidas Codex toimib erinevates koodibaasides, arendusprotsessides ja meeskondades.

Cisco⁠(avaneb uues aknas) tutvub, kuidas Codex saaks aidata nende insenerimeeskondadel ambitsioonikaid ideid kiiremini ellu viia. Varajaste disainipartneritena aitab Cisco kujundada Codexi tulevikku, hinnates seda reaalsete kasutusjuhtumite jaoks kogu oma tooteportfelli ulatuses ja andes OpenAI meeskonnale tagasisidet.
Temporal⁠(avaneb uues aknas) kasutab Codexit funktsioonide arendamise kiirendamiseks, kõrvalda vead, testide kirjutamiseks ja käivitamiseks ning suurte koodibaaside refaktoreerimiseks. See aitab neil ka keskenduda, käivitades taustal keerukaid ülesandeid, hoides arendajaid järje peal ja kiirendades iteratsiooni.
Superhuman⁠(avaneb uues aknas) kasutab Codexit, et kiirendada väikeste, kuid korduvate ülesannete täitmist, nagu testikatvuse ja integratsioonivigade parandamine. See aitab neil ka kiiremini tarnida, võimaldades tootejuhtidel teha kergeid koodimuudatusi ilma arendaja kaasamiseta, välja arvatud koodide ülevaatamine.
Kodiak⁠(avaneb uues aknas) kasutab Codexit veatuvastustööriistade kirjutamiseks, testide katvuse parandamiseks ja koodi refaktoreerimiseks – kiirendades Kodiak Driveri, nende autonoomse sõidutehnoloogia, arendust. Codex on muutunud ka väärtuslikuks viitevahendiks, aidates inseneridel mõista virna tundmatuid osi, tuues esile asjakohase konteksti ja varasemad muudatused.

Varajaste testijate õppetundide põhjal soovitame määrata korraga mitmele agendile hästi määratletud ülesanded ning katsetada erinevat tüüpi ülesandeid ja viipasid, et mudeli võimekust tõhusalt tutvuda.

Codex CLI värskendused

Eelmisel kuul käivitasime Codex CLI, kerge avatud lähtekoodiga agendi, mis töötab sinu terminalis. See toob mudelite nagu o3 ja o4-mini võimsuse sinu kohalikku töövoogu, muutes nendega koostöö lihtsaks ja ülesannete täitmise kiiremaks.

Täna anname välja ka väiksema versiooni codex-1-st, o4-mini versiooni, mis on mõeldud spetsiaalselt Codex CLI jaoks. See uus mudel pakub CLI-s kiiremaid töövooge ja on optimeeritud madala latentsusega koodi küsimuste ja vastuste ning redigeerimise jaoks, säilitades samad tugevused juhiste järgimisel ja stiilis. See on nüüd saadaval vaikimisi mudelina Codex CLI-s ja API-s nimega codex-mini-latest. Aluseks olevat hetktõmmist uuendatakse regulaarselt, kui me jätkame Codex-mini mudeli täiustamist.

Samuti muudame su arendajakonto ühendamise Codex CLI-ga palju lihtsamaks. Selle asemel, et käsitsi API-tokenit genereerida ja seadistada, saad nüüd sisse logida oma ChatGPT kontoga ja valida API-organisatsiooni, mida soovid kasutada. Me koostame ja konfigureerime API-võtme sulle automaatselt. Plus ja Pro kasutajad, kes logivad sisse ChatGPT‑ga Codex CLI-sse, saavad alustada vastavalt 5 ja 50 dollari väärtuses tasuta API-krediitide lunastamist hiljem täna järgmise 30 päeva jooksul.

Codexi saadavus, hinnastamine ja piirangud

Alates tänasest hakkame Codexit ülemaailmselt kasutusele võtma ChatGPT Pro, Enterprise ja Business kasutajatele, varsti on saadaval ka tugi Plus ja Edu jaoks. Kasutajatel on lähinädalatel helde ligipääs ilma lisakuludeta, et nad saaksid tutvuda, mida Codex suudab teha. Seejärel rakendame piiratud ligipääsu ja paindlikke hinnastamise valikuid, mis võimaldavad teil osta lisakasutust nõudmisel. Meil on plaan peagi laiendada juurdepääsu Plus ja Edu kasutajatele.

Arendajatele, kes kasutavad arendamiseks codex-mini-latest'it, on mudel saadaval Responses API-s ning selle hind on $1,50 iga 1M sisestusmärgi kohta ja $6 iga 1M väljundmärgi kohta, koos 75% viibi vahemällu salvestamise soodustusega.

Codex on alles oma arenduse alguses. Uurimise eelvaate ajal puuduvad praegu sellised funktsioonid nagu pildisisendid frontendi tööks ja võimalus agenti töö käigus kursi korrigeerimiseks. Lisaks võtab kaugagentile delegeerimine kauem aega kui interaktiivne redigeerimine, millega harjumine võib aega võtta. Aja jooksul hakkab suhtlemine Codexi agentidega üha enam sarnanema asünkroonsele koostööle kolleegidega. Mudeli võimekuse arenedes ootame, et agendid hakkavad tegelema keerukamate ülesannetega pikema aja jooksul.

Mis järgmiseks

Kujutame ette tulevikku, kus arendajad juhivad tööd, mida nad soovivad omada, ja delegeerivad ülejäänu agentidele – liikudes kiiremini ja olles tehisintellekti abil produktiivsemad. Selle saavutamiseks loome Codexi tööriistade komplekti, mis pakub nii reaalajas koostöö tuge kui ka asünkroonset delegeerimist.

Koostöö tehisintellekti tööriistadega nagu Codex CLI ja teised on kiiresti muutunud tööstuse normiks, aidates arendajatel kiiremini koodi kirjutada. Kuid usume, et Codexi poolt ChatGPT‑s kasutusele võetud asünkroonne mitme agendiga töövoog saab de facto viisiks, kuidas arendajad toodavad kõrgekvaliteedilist koodi.

Lõppkokkuvõttes näeme, et need kaks suhtlusviisi – reaalajas koostöö ja ülesannete delegeerimine üksteisele lähenevad. Arendajad teevad koostööd tehisintellekti agentidega oma IDE-des ja igapäevastes tööriistades, et esitada küsimusi, saada ettepanekuid ja delegeerida pikemaid ülesandeid, kõik ühtses töövoos.

Tulevikku vaadates plaanime tutvustada rohkem interaktiivseid ja paindlikke agentide töövooge. Arendajad saavad peagi anda juhiseid ülesande keskel, teha koostööd rakendusstrateegiate kallal ja saada proaktiivseid edenemisteateid. Samuti näeme ette sügavamaid integratsioone juba kasutatavate tööriistade vahel: täna ühendab Codex GitHubiga ning peagi saad määrata ülesandeid Codex CLI-st, ChatGPT Desktopist või isegi sellistest tööriistadest nagu probleemide jälgija või CI süsteem.

Tarkvaratehnika on üks esimesi valdkondi, mis kogeb märkimisväärset tehisintellektil põhinevat tootlikkuse kasvu, avades uusi võimalusi nii üksikisikutele kui ka väikestele meeskondadele. Kuigi oleme nende edusammude suhtes optimistlikud, teeme koostööd partneritega, et paremini mõista laialdase agentide kasutuselevõtu mõju arendajate töövoogudele, oskuste arendamisele inimeste, oskustasemete ja geograafiliste piirkondade lõikes.

See on alles algus – ja meil on põnev näha, mida sa Codexiga ehitama hakkad.

Livestream kordus

Lisa

Süsteemi teade

Jagame codex-1 süsteemisõnumit, et aidata arendajatel mõista mudeli vaikimisi käitumist ja kohandada Codex tõhusaks tööks kohandatud töövoogudes. Näiteks julgustab Codex-1 süsteemiteade Codexit käivitama kõik AGENTS.md failis mainitud testid, kuid kui sul on vähe aega, võid paluda Codexil need testid vahele jätta.

Lihtne tekst

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Autor

OpenAI