16. maj 2025.

Predstavljamo Codex

Agent za softverski inženjering zasnovan na oblaku koji može raditi na mnogim zadacima paralelno, a pokreće ga codex-1. Dostupno korisnicima ChatGPT Pro, Business i Enterprise već danas, a uskoro i korisnicima Plus.

Isprobajte Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Učitavanje…

Ažuriranje 3. juna 2025: Codex je sada dostupan korisnicima ChatGPT Plus. Također omogućavamo korisnicima da Codexu omoguće pristup internetu tokom izvršavanja zadataka. Molimo vas da pogledate dnevnik promjena⁠(otvara se u novom prozoru) i dokumentaciju⁠(otvara se u novom prozoru) za više detalja.

Danas pokrećemo istraživački pregled Codexa: agenta za softverski inženjering u oblaku koji može raditi na mnogim zadacima istovremeno. Codex može obavljati zadatke za vas kao što su pisanje funkcionalnosti, odgovaranje na pitanja o vašoj bazi koda, ispravljanje grešaka i predlaganje pull requestova za pregled; svaki zadatak radi u svom cloud sandbox okruženju, unaprijed učitanom s vašim repozitorijem.

Codex pokreće codex-1, verzija OpenAI o3 optimizirana za softverski inženjering. Treniran je korištenjem pojačanog učenja na stvarnim zadacima kodiranja u raznim okruženjima kako bi generirao kod koji vjerno odražava ljudski stil i PR preferencije, precizno se pridržava uputa i može iterativno izvršavati testove dok ne dobije prolazan rezultat. Danas počinjemo uvoditi Codex za korisnike ChatGPT Pro, Enterprise i Business, a podrška za Plus i Edu uskoro dolazi.

Kako Codex radi

Danas možete pristupiti Codexu putem bočne trake u ChatGPT‑u i dodijeliti mu nove zadatke kodiranja unosom upita i klikom na “Code”. Ako želite postaviti Codexu pitanje o vašoj kodnoj bazi, kliknite "Pitaj". Svaki zadatak se obrađuje nezavisno u odvojenom, izoliranom okruženju u koje je prethodno učitana vaša kodna baza. Codex može čitati i uređivati datoteke, kao i pokretati naredbe, uključujući testne harnese, lintere i provjeravače tipova. Završetak zadatka obično traje između 1 i 30 minuta, ovisno o složenosti, a napredak Codexa možete pratiti u stvarnom vremenu.

Kada Codex završi zadatak, on primjenjuje svoje promjene u svom okruženju. Codex pruža provjerljive dokaze o svojim radnjama kroz citate logova terminala i testnih izlaza, omogućavajući Vam da pratite svaki korak preduzet tokom izvršavanja zadatka. Zatim možete pregledati rezultate, zatražiti dodatne revizije, otvoriti GitHub pull request ili direktno integrirati promjene u svoje lokalno okruženje. U proizvodu možete konfigurirati Codex okruženje tako da što više odgovara vašem stvarnom razvojnom okruženju.

Codex se može voditi pomoću AGENTS.md datoteka smještenih u vašem repozitoriju. Ovo su tekstualne datoteke, slične README.md, gdje možete obavijestiti Codex kako da se kreće kroz vašu kodnu bazu, koje naredbe da pokreće za testiranje i kako se najbolje pridržavati standardnih praksi vašeg projekta. Kao i ljudski programeri, Codex agenti postižu najbolje rezultate kada im se osigura konfigurisano razvojno okruženje, pouzdane postavke testiranja i jasna dokumentacija.

Na evaluacijama kodiranja i internim referentnim testovima, codex-1 pokazuje snažne performanse čak i bez AGENTS.md datoteka ili prilagođenog scaffoldinga.

23 SWE-Bench potvrđeni uzorci koji se nisu mogli pokrenuti na našoj internoj infrastrukturi su isključeni. Codex-1 je testiran na maksimalnoj dužini konteksta od 192k tokena i srednjem 'naporu za rezonovanje', što je postavka koja će danas biti dostupna u proizvodu. Za detalje o o3 evaluacijama, pogledajte ovdje⁠.

Naš interni SWE zadatak benchmark je odabrani skup stvarnih internih SWE zadataka u OpenAI-u.

Izgradnja sigurnih i pouzdanih agenata

Objavljujemo Codex kao istraživački pregled, u skladu sa našom iterativnom strategijom implementacije. Prioritet smo dali sigurnosti i transparentnosti prilikom dizajniranja Codexa kako bi korisnici mogli potvrditi njegov izlaz – zaštita koja postaje sve važnija kako AI modeli samostalno obavljaju složenije zadatke kodiranja, a sigurnosni aspekti evoluiraju. Korisnici mogu provjeriti rad Codexa putem citata, terminalskih logova i rezultata testova. Kada su nesigurni ili suočeni s neuspjesima na testu, Codex agent eksplicitno komunicira ove probleme, omogućavajući korisnicima da donesu informirane odluke o tome kako dalje postupiti. I dalje ostaje ključno da korisnici ručno pregledaju i potvrde sav kod koji generiraju agenti prije integracije i izvršavanja.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Usklađivanje sa ljudskim preferencijama

Primarni cilj tokom obuke codex-1 bio je uskladiti izlaze sa ljudskim preferencijama i standardima kodiranja. U poređenju s OpenAI o3, codex-1 dosljedno proizvodi čišće zakrpe spremne za trenutni ljudski pregled i integraciju u standardne tokove rada.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Sprečavanje zloupotrebe

Zaštita od zlonamjernih aplikacija softverskog inženjeringa vođenog umjetnom inteligencijom, kao što je razvoj zlonamjernog softvera, postaje sve kritičnija. Istovremeno, važno je da zaštitne mjere ne ometaju nepotrebno legitimne i korisne aplikacije koje mogu uključivati tehnike koje se ponekad koriste i za razvoj zlonamjernog softvera, kao što je inženjering niskog nivoa kernela.

Kako bi se uravnotežila sigurnost i korisnost, Codex je obučen da identifikuje i precizno odbije zahtjeve usmjerene na razvoj zlonamjernog softvera, dok jasno razlikuje i podržava legitimne zadatke. Također smo unaprijedili naše okvire politika i uključili rigorozne sigurnosne evaluacije kako bismo učinkovito ojačali te granice. Objavili smo dodatak za o3 System Card⁠ kako bismo odrazili ove evaluacije.

Sigurno izvršenje

Codex agent u potpunosti djeluje unutar sigurnog, izoliranog kontejnera u oblaku. Tokom izvršavanja zadatka, pristup internetu je onemogućen, ograničavajući interakciju agenta isključivo na kod koji je eksplicitno dostavljen putem GitHub repozitorija i unaprijed instaliranih zavisnosti koje korisnik konfiguriše putem skripte za postavljanje. Agent ne može pristupiti vanjskim web stranicama, API-jima ili drugim uslugama.

Rani slučajevi upotrebe

Tehnički timovi u OpenAI-u počeli su koristiti Codex kao dio svog svakodnevnog alata. Najčešće ga koriste OpenAI inženjeri za rasterećenje repetitivnih, dobro definisanih zadataka, kao što su refaktorisanje, promjena naziva i pisanje testova, koji bi inače narušili fokus. Podjednako je koristan za izradu novih funkcionalnosti, povezivanje komponenti, ispravljanje grešaka i sastavljanje dokumentacije. Timovi razvijaju nove navike u vezi s tim: razvrstavaju hitne probleme, planiraju zadatke na početku dana i prebacuju pozadinske poslove kako bi nastavili s radom. Smanjenjem prebacivanja konteksta i iznošenjem zaboravljenih zadataka, Codex pomaže inženjerima da brže isporučuju projekte i ostanu fokusirani na ono što je najvažnije.

Uoči objavljivanja, takođe smo sarađivali s malom grupom vanjskih testera kako bismo bolje razumjeli kako Codex funkcionira u različitim kodnim bazama, razvojnim procesima i timovima.

Cisco⁠(otvara se u novom prozoru) istražiti kako Codex može pomoći njihovim inženjerskim timovima da brže ostvare ambiciozne ideje. Kao rani dizajnerski partneri, Cisco pomaže u oblikovanju budućnosti Codexa procjenjujući ga za stvarne slučajeve upotrebe u cijelom svom portfoliju proizvoda i pružajući povratni odgovor Teamu OpenAI.
Temporal⁠(otvara se u novom prozoru) koristi Codex za ubrzavanje razvoja funkcija, otkloniti neispravnosti, pisanje i izvršavanje testova te refaktoriranje velikih kodnih baza. Također im pomaže da ostanu fokusirani izvršavanjem složenih zadataka u pozadini—održavajući inženjere u toku i ubrzavajući iteracije.
Superhuman⁠(otvara se u novom prozoru) koristi Codex za ubrzavanje malih, ali repetitivnih zadataka kao što su poboljšanje pokrivenosti testovima i ispravljanje grešaka u integraciji. Također im pomaže da brže isporuče omogućavajući menadžerima proizvoda da doprinesu laganim promjenama koda bez angažovanja inženjera, osim za pregled koda.
Kodiak⁠(otvara se u novom prozoru) koristi Codex za pomoć u pisanju alata za otklanjanje grešaka, poboljšanje pokrivenosti testiranjem i refaktoriranje koda—ubrzavajući razvoj Kodiak Drivera, njihove tehnologije autonomne vožnje. Codex je također postao vrijedan referentni alat, pomažući inženjerima da razumiju nepoznate dijelove stacka otkrivanjem relevantnog konteksta i prošlih promjena.

Na osnovu iskustava ranih testera, preporučujemo dodjeljivanje dobro definisanih zadataka višestrukim agentima istovremeno, te eksperimentisanje s različitim vrstama zadataka i upita kako bi se efikasno istražile mogućnosti modela.

Ažuriranja za Codex CLI

Prošlog mjeseca pokrenuli smo Codex CLI, lagani agent za kodiranje otvorenog koda koji radi na Vašem terminalu. Donosi snagu modela kao što su o3 i o4-mini u vaš lokalni tijek rada, olakšavajući njihovo uparivanje za brže izvršavanje zadataka.

Danas, takođe, objavljujemo manju verziju codex-1, verziju o4-mini dizajniranu posebno za korištenje u Codex CLI. Ovaj novi model podržava brže tokove rada u CLI-ju i optimizovan je za Q&A i uređivanje koda sa niskom latencijom, a istovremeno zadržava iste prednosti u praćenju instrukcija i stilu. Sada je dostupan kao predodređeni model u Codex CLI-ju i u API-ju kao codex-mini-latest. Osnovni snimak će se redovno ažurirati kako budemo nastavili poboljšavati Codex-mini model.

Također znatno olakšavamo povezivanje vašeg programerskog računa s Codex CLI-jem. Umjesto da ručno generirate i konfigurišete API token, sada se možete prijaviti sa svojim ChatGPT računom i odabrati API organizaciju koju želite koristiti. Automatski ćemo generirati i konfigurirati API ključ za Vas. Korisnici Plus i Pro koji se prijave na Codex CLI putem ChatGPT‑a također mogu početi iskorištavati 5 i 50 dolara besplatnih API kredita, respektivno, kasnije danas za sljedećih 30 dana.

Dostupnost Codexa, cijene i ograničenja

Počevši od danas, uvodimo Codex za korisnike ChatGPT Pro, Enterprise i Business širom svijeta, a podrška za Plus i Edu uskoro dolazi. Korisnici će imati velikodušan pristup bez dodatnih troškova u narednim sedmicama, tako da možete istražiti šta Codex može učiniti, nakon čega ćemo uvesti ograničen pristup i fleksibilne opcije cijena koje vam omogućavaju kupovinu dodatne upotrebe na zahtjev. Planiramo uskoro proširiti pristup Plus i Edu korisnicima.

Za programere koji rade s codex-mini-latest, model je dostupan na Responses API-ju i cijena je 1,50 USD po 1M ulaznih tokena i 6 USD po 1M izlaznih tokena, uz 75% popusta na keširanje upita.

Codex je još uvijek u ranoj fazi razvoja. Kao pregled istraživanja, trenutno nedostaju funkcije kao što su unos slika za frontend rad i mogućnost ispravljanja kursa agenta dok radi. Osim toga, delegiranje udaljenom agentu traje duže od interaktivnog uređivanja, na što se može neko vrijeme naviknuti. Vremenom će interakcija s Codex agentima sve više ličiti na asinhronu saradnju s kolegama. Kako se mogućnosti modela unapređuju, očekujemo da će agenti obavljati složenije zadatke tokom dužih vremenskih perioda.

Šta je sljedeće

Zamišljamo budućnost u kojoj programeri upravljaju poslom koji žele posjedovati, a ostatak delegiraju agentima—brže se krećući i postajući produktivniji uz pomoć UI-a. Da bismo to postigli, gradimo paket alata Codex koji podržava saradnju u realnom vremenu i asinhrono delegiranje.

Uparivanje s AI alatima kao što su Codex CLI i drugi brzo je postalo industrijski standard, pomažući programerima da brže napreduju u kodiranju. Ali vjerujemo da će asinhroni, višeagentski radni tok koji je Codex uveo u ChatGPT postati de facto način na koji inženjeri proizvode visokokvalitetan kod.

Na kraju, vidimo kako se ova dva načina interakcije—uparivanje u stvarnom vremenu i delegiranje zadataka—spajaju. Programeri će sarađivati s AI agentima u svojim IDE-ima i svakodnevnim alatima kako bi postavljali pitanja, dobijali prijedloge i prepuštali duže zadatke, sve u objedinjenom toku rada.

Gledajući unaprijed, planiramo uvesti interaktivnije i fleksibilnije radne procese agenata. Programeri će uskoro moći pružati smjernice tokom izvršavanja zadataka, sarađivati na strategijama implementacije i primati proaktivna ažuriranja o napretku. Također zamišljamo dublje integracije među alatima koje već koristite: danas se Codex povezuje s GitHubom, a uskoro ćete moći dodijeliti zadatke iz Codex CLI, ChatGPT Desktopa ili čak alata poput vašeg issue trackera ili CI sistema.

Softversko inženjerstvo je jedna od prvih industrija koja je doživjela značajan rast produktivnosti vođen umjetnom inteligencijom, otvarajući nove mogućnosti za pojedince i male timove. Iako smo optimistični u vezi s ovim napretkom, također surađujemo s partnerima kako bismo bolje razumjeli implikacije širokog usvajanja agenata na radne tokove programera, razvoj vještina među ljudima, razinama vještina i geografskim područjima.

Ovo je samo početak—i uzbuđeni smo vidjeti šta ćete izgraditi sa Codexom.

Repriza prijenosa uživo

Dodatak

Sistemska poruka

Dijelimo sistemsku poruku codex-1 kako bismo pomogli programerima da razumiju predodređeno ponašanje modela i prilagode Codex za efikasan rad u prilagođenim radnim procesima. Na primjer, sistemska poruka codex-1 potiče Codex da pokrene sve testove spomenute u datoteci AGENTS.md, ali ako nemate puno vremena, možete zamoliti Codex da preskoči te testove.

Običan tekst.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Autor

OpenAI