16. maí 2025

Við kynnum Codex

Skýjabundinn hugbúnaðarverkfræðifulltrúi sem getur unnið að mörgum verkefnum í einu, knúinn af codex-1. Í boði fyrir ChatGPT Pro-, Business- og Enterprise-notendur í dag, og Plus-notendur fljótlega.

Prófaðu Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Hleður inn...

Uppfærsla 3. júní 2025: Codex er nú aðgengilegur fyrir ChatGPT Plus-notendur. Við erum einnig að gera notendum kleift að veita Codex aðgang að internetinu á meðan á verkefni stendur. Skoðaðu breytingaskrá⁠(opnast í nýjum glugga) og skjöl⁠(opnast í nýjum glugga) fyrir frekari upplýsingar.

Í dag erum við að hefja forskoðun á Codex: skýjabundnum hugbúnaðarfulltrúa sem getur unnið að mörgum verkefnum samtímis. Codex getur sinnt verkefnum fyrir þig eins og að skrifa eiginleika, svara spurningum um kóðagrunninn þinn, laga villur og leggja fram pull-beiðnir til yfirferðar; hvert verkefni keyrir í sínu eigin skýjasandkassaumhverfi, fyrirfram hlaðið með geymslunni þinni.

Codex er knúið af codex-1, útgáfu af OpenAI o3 sem er fínstillt fyrir hugbúnaðarverkfræði. Það var þjálfað með styrkingarnámi á raunverulegum kóðunarverkefnum í fjölbreyttum umhverfum til að búa til kóða sem líkir náið eftir mannlegum stíl og PR-óskum, fylgir nákvæmlega leiðbeiningum og getur endurtekið keyrt prófanir þar til það fær samþykkt niðurstöðu. Við erum að byrja að innleiða Codex fyrir ChatGPT Pro-, Enterprise- og Business-notendur í dag, með aðstoð fyrir Plus og Edu væntanlegri fljótlega.

Hvernig Codex virkar

Í dag geturðu nálgast Codex í gegnum hliðarstikuna í ChatGPT og úthlutað því nýjum forritunarverkefnum með því að slá inn kvaðningu og smella á „Kóði“. Ef þú vilt spyrja Codex spurningar um kóðagrunninn þinn, smelltu á „Spyrja“. Hvert verkefni er unnið sjálfstætt í aðskildu, einangruðu umhverfi sem er forhlaðið með kóðagrunninum þínum. Codex getur lesið og breytt skrám, auk þess að keyra skipanir eins og prófunarbeisli, linter og gerðaprófara. Lok verkefnis tekur venjulega á milli 1 og 30 mínútur, allt eftir flækjustigi, og þú getur fylgst með framvindu Codex í rauntíma.

Þegar Codex lýkur verkefni, skráir það breytingar sínar í umhverfi sitt. Codex veitir sannanlegar vísbendingar um aðgerðir sínar með tilvísunum í skráningar úr stöðvarskrám og prófunarfrálögum, sem gerir þér kleift að rekja hvert skref sem tekið er við verkefnalok. Þú getur þá skoðað niðurstöðurnar, óskað eftir frekari breytingum, opnað GitHub pull-beiðni eða samþætt breytingarnar beint í þínu staðbundna umhverfi. Í vörunni geturðu stillt Codex-umhverfið þannig að það passi eins vel við raunverulegt þróunarumhverfi þitt og mögulegt er.

Codex er hægt að leiðbeina með AGENTS.md skrám sem eru settar í geymsluna þína. Þetta eru textaskrár, svipaðar README.md, þar sem þú getur sagt Codex hvernig á að vafra um kóðagrunninn þinn, hvaða skipanir á að keyra til prófunar og hvernig best er að fylgja stöðluðum vinnubrögðum verkefnisins. Eins og mannlegir forritarar standa Codex-fulltrúar sig best þegar þeir hafa aðgang að stilltum þróunarumhverfum, áreiðanlegum prófunaruppsetningum og skýrri skjölun.

Í kóðunarmati og innri viðmiðum sýnir codex-1 sterka frammistöðu jafnvel án AGENTS.md skráa eða sérsniðinna vinnupalla.

23 SWE-Bench Verified sýni sem ekki var hægt að keyra á innri innviðum okkar voru útilokuð. codex-1 var prófaður með hámarks samhengislengd upp á 192 þúsund tákn og miðlungs „röksemdafærslu“, sem er það umhverfi sem verður í boði í vörunni í dag. Fyrir nánari upplýsingar um o3 mat, sjá hér⁠.

Viðmið okkar fyrir innri SWE-verkefni er vandlega valið safn af raunverulegum innri SWE-verkefnum hjá OpenAI.

Að byggja örugga og áreiðanlega fulltrúa

Við erum að gefa út Codex sem forskoðun, í samræmi við endurtekna dreifingarstefnu okkar. Við lögðum áherslu á öryggi og gagnsæi þegar við hönnuðum Codex svo notendur geti staðfest frálög þess – öryggisráðstöfun sem verður sífellt mikilvægari eftir því sem gervigreindarlíkön sinna flóknari forritunarverkefnum sjálfstætt og öryggissjónarmið þróast. Notendur geta skoðað vinnu Codex með tilvísunum, skráningum úr skel og prófunarniðurstöðum. Þegar óvissa eða prófunarmistök koma upp, miðlar Codex-fulltrúinn þessum málum skýrt, sem gerir notendum kleift að taka upplýstar ákvarðanir um hvernig á að halda áfram. Það er enn nauðsynlegt fyrir notendur að yfirfara og sannreyna handvirkt allan kóða sem fulltrúar búa til áður en hann er samþættur og keyrður.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Samræming við mannlegar óskir

Meginmarkmið við þjálfun codex-1 var að samræma frálag náið við óskir og staðla manna um forritun. Í samanburði við OpenAI o3 framleiðir codex-1 stöðugt hreinni bætur sem eru tilbúnar fyrir tafarlausa endurskoðun og samþættingu í stöðluð verkflæði.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Að koma í veg fyrir misnotkun

Vernd gegn skaðlegum snjallforritum sem eru þróuð með gervigreindarstýrðri hugbúnaðarverkfræði, eins og spilliforrit, er sífellt mikilvægara. Á sama tíma er mikilvægt að verndarráðstafanir hindri ekki óþarflega lögmæt og gagnleg snjallforrit sem geta falið í sér aðferðir sem stundum eru einnig notaðar til þróunar á spilliforritum, svo sem lágstigs kjarnaverkfræði.

Til að tryggja jafnvægi milli öryggis og notagildis var Codex þjálfað til að bera kennsl á og hafna nákvæmlega beiðnum sem miða að þróun skaðlegs hugbúnaðar, á meðan það greinir skýrt á milli og styður lögmæt verkefni. Við höfum einnig bætt stefnumótunarumgjarðir okkar og innleitt ítarlegt öryggismat til að styrkja þessi mörk á áhrifaríkan hátt. Við höfum gefið út viðauka við o3 kerfiskort⁠ til að endurspegla þessi möt.

Örugg framkvæmd

Codex-fulltrúi starfar alfarið innan öruggs, einangraðs íláts í skýinu. Á meðan á framkvæmd verkefna stendur er aðgangur að internetinu slökktur, sem takmarkar samskipti fulltrúa eingöngu við kóðann sem er sérstaklega veittur í gegnum GitHub-geymslur og fyrirfram uppsettur háður því sem notandinn stillir með uppsetningarlýsingu. Fulltrúinn getur ekki nálgast ytri vefsíður, API eða aðrar þjónustur.

Fyrstu notkunartilvik

Tækniteymi hjá OpenAI hafa byrjað að nota Codex sem hluta af daglegu verkfærasetti sínu. Það er oftast notað af verkfræðingum OpenAI til að létta á endurteknum, vel skilgreindum verkefnum, eins og endurskipulagningu, endurnefningu og skrifum á prófunum, sem annars myndu trufla einbeitingu. Það er jafn gagnlegt til að byggja upp nýja eiginleika, tengja íhluti, laga villur og skrifa skjöl. Teymin eru að byggja upp nýjar venjur í kringum þetta: þau flokka vandamál í bakvakt, skipuleggja verkefni í byrjun dags og losa sig við bakgrunnsvinnu til að halda áfram. Með því að draga úr samhengisskiptum og koma gleymdum verkefnum í ljós hjálpar Codex verkfræðingum að skila hraðar og einbeita sér að því sem skiptir mestu máli.

Í aðdraganda útgáfu höfum við einnig unnið með litlum hópi utanaðkomandi prófunaraðila til að skilja betur hvernig Codex virkar á fjölbreyttum kóðagrunnum, þróunarferlum og teymum.

Cisco⁠(opnast í nýjum glugga) er að kanna hvernig Codex getur hjálpað verkfræðiteymum sínum að láta metnaðarfullar hugmyndir rætast hraðar. Sem fyrstu hönnunarsamstarfsaðilar er Cisco að hjálpa til við að móta framtíð Codex með því að meta það fyrir raunveruleg notkunartilvik yfir vörueigu þeirra og veita teymi OpenAI ábendingar.
Temporal⁠(opnast í nýjum glugga) notar Codex til að flýta fyrir þróun eiginleika, gera villuleit, skrifa og framkvæma prófanir og endurskipuleggja stóra kóðagrunna. Það hjálpar þeim einnig að halda einbeitingu með því að keyra flókin verkefni í bakgrunni — sem heldur verkfræðingum í flæði á meðan þeir flýta fyrir endurtekningum.
Superhuman⁠(opnast í nýjum glugga) notar Codex til að flýta fyrir litlum en endurteknum verkefnum eins og að bæta prófunarþekju og laga samþættingarvillur. Það hjálpar þeim einnig að senda vörur hraðar með því að gera vörustjórum kleift að leggja sitt af mörkum við léttar kóðabreytingar án þess að kalla til verkfræðing, nema fyrir kóðaendurskoðun.
Kodiak⁠(opnast í nýjum glugga) notar Codex til að hjálpa við að skrifa villuleitarverkfæri, bæta prófunarþekju og endurskipuleggja kóða—sem hraðar þróun Kodiak Driver, sjálfkeyrandi aksturstækni þeirra. Codex hefur einnig orðið dýrmætt viðmiðunartæki sem hjálpar verkfræðingum að skilja ókunnuga hluta staflans með því að birta viðeigandi samhengi og fyrri breytingar.

Byggt á lærdómi frá fyrstu prófurum mælum við með að úthluta vel skilgreindum verkefnum til margra fulltrúa samtímis og prófa mismunandi tegundir verkefna og kvaðninga til að kanna getu líkansins á áhrifaríkan hátt.

Uppfærslur á Codex CLI

Í síðasta mánuði kynntum við Codex CLI, léttan opinn hugbúnaðarfulltrúa sem keyrir í skipanalínunni þinni. Það færir kraft líkana eins og o3 og o4-mini inn í vinnuflæðið þitt, sem gerir það auðvelt að para við þau til að klára verkefni hraðar.

Í dag erum við einnig að gefa út minni útgáfu af codex-1, sem er útgáfa af o4-mini sérstaklega hönnuð fyrir notkun í Codex CLI. Þetta nýja líkan veitir aðstoð við hraðari vinnuflæði í CLI og er fínstillt fyrir lágmarks biðtíma í kóða spurninga og svara og ritstjórn, á meðan það heldur sömu styrkleikum í leiðbeiningafylgni og stíl. Það er nú fáanlegt sem sjálfgefið líkan í Codex CLI og í API sem codex-mini-latest. Undirliggjandi skyndimynd verður reglulega uppfærð eftir því sem við höldum áfram að bæta Codex-mini líkanið.

Við erum líka að gera það miklu auðveldara að tengja forritarareikninginn þinn við Codex CLI. Í stað þess að búa til og stilla API-tákn handvirkt geturðu nú skráð þig inn með ChatGPT‑reikningnum þínum og valið API-samtökin sem þú vilt nota. Við munum sjálfkrafa búa til og stilla API-lykilinn fyrir þig. Plus- og Pro-notendur sem skrá sig inn í Codex CLI með ChatGPT geta einnig byrjað að innleysa $5 og $50 í ókeypis API-einingum, í sömu röð, síðar í dag næstu 30 daga.

Framboð Codex, verð og takmarkanir

Í dag erum við að innleiða Codex fyrir ChatGPT Pro-, Enterprise- og Business-notendur á alþjóðavísu, með aðstoð fyrir Plus og Edu væntanlegri fljótlega. Notendur munu hafa rausnarlegan aðgang án aukakostnaðar næstu vikurnar svo þið getið kannað hvað Codex getur gert. Eftir það munum við kynna takmarkaðan aðgang og sveigjanlega verðkosti sem leyfa ykkur að kaupa viðbótarnotkun eftir þörfum. Við ætlum að auka aðgengi fyrir Plus- og Edu-notendur fljótlega.

Fyrir forritara sem nota codex-mini-latest er líkanið fáanlegt á Responses API og kostar $1,50 fyrir hver 1 milljón inntaksmerki og $6 fyrir hver 1 milljón úttaksmerki, með 75% afslætti af skyndiminni fyrir kvaðningu.

Codex er enn á frumstigi þróunar þess. Sem forskoðun vantar það nú eiginleika eins og myndinntak fyrir framvinnsluvinnu og möguleika á að leiðrétta fulltrúann á meðan hann er að vinna. Að auki tekur það lengri tíma að fela fjartengdum fulltrúa verkefni en að breyta gagnvirkt, sem getur tekið smá tíma að venjast. Með tímanum munu samskipti við Codex-fulltrúa í auknum mæli líkjast ósamstilltu samstarfi við samstarfsmenn. Eftir því sem geta líkansins eykst, búumst við við að fulltrúar taki að sér flóknari verkefni yfir lengri tíma.

Hvað er á döfinni

Við ímyndum okkur framtíð þar sem forritarar stjórna þeirri vinnu sem þeir vilja eiga og fela restina til fulltrúa—hreyfa sig hraðar og vera afkastameiri með gervigreind. Til að ná því erum við að þróa safn Codex-verkfæra sem veita aðstoð við bæði samvinnu í rauntíma og ósamstillta verkefnaúthlutun.

Pörun við gervigreindarverkfæri eins og Codex CLI og önnur hefur fljótt orðið venja í greininni, sem hjálpar forriturum að vinna hraðar þegar þeir forrita. En við trúum að ósamstillt, fjölfulltrúaverkflæði sem Codex kynnti í ChatGPT muni verða aðalleiðin sem verkfræðingar framleiða hágæða kóða.

Að lokum sjáum við þessar tvær samskiptaaðferðir—pörun í rauntíma og úthlutun verkefna—renna saman. Forritarar munu vinna með gervigreindarfulltrúum í IDE sínum og daglegum verkfærum til að spyrja spurninga, fá tillögur og létta á lengri verkefnum, allt í samræmdu vinnuflæði.

Horft til framtíðar ætlum við að kynna meira gagnvirkt og sveigjanlegt vinnuflæði fyrir fulltrúa. Forritarar munu brátt geta veitt leiðsögn á miðju verkefni, unnið saman að framkvæmdastefnum og fengið virkar framvinduuppfærslur. Við sjáum einnig fyrir okkur dýpri samþættingar milli þeirra verkfæra sem þú notar nú þegar: í dag tengist Codex við GitHub, og brátt munt þú geta úthlutað verkefnum frá Codex CLI, ChatGPT Desktop eða jafnvel verkfærum eins og vandamálaeftirlitinu þínu eða CI-kerfinu.

Hugbúnaðarverkfræði er ein af fyrstu atvinnugreinunum til að upplifa verulega framleiðniaukningu knúna af gervigreind, sem opnar nýja möguleika fyrir einstaklinga og lítil teymi. Þó við séum bjartsýn á þessar framfarir, erum við einnig að vinna með samstarfsaðilum til að skilja betur hvaða áhrif víðtæk notkun fulltrúa hefur á vinnuflæði forritara, hæfileikaþróun hjá fólki, hæfnistig og landfræðileg svæði.

Þetta er bara byrjunin—og við hlökkum til að sjá hvað þú smíðar með Codex.

Endurspilun á streymi í beinni útsendingu

Viðauki

Kerfisskilaboð

Við erum að deila codex-1 kerfisskilaboðunum til að hjálpa forriturum að skilja sjálfgefna hegðun líkansins og aðlaga Codex til að virka á áhrifaríkan hátt í sérsniðnum verkferlum. Til dæmis hvetja kerfisskilaboð codex-1 Codex til að keyra öll próf sem nefnd eru í AGENTS.md skránni, en ef þú hefur lítinn tíma geturðu beðið Codex um að sleppa þessum prófum.

Ósniðinn texti

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Höfundur

OpenAI