16 mai 2025

Îți prezentăm Codex

Un agent de inginerie software bazat pe cloud care poate lucra la mai multe sarcini în paralel, alimentat de Codex-1. Disponibil pentru utilizatorii ChatGPT Pro, Business și Enterprise astăzi și în curând și pentru utilizatorii Plus.

Încearcă Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Se încarcă…

Actualizare din 3 iunie 2025: Codex este acum disponibil pentru utilizatorii ChatGPT Plus. De asemenea, le permitem utilizatorilor să ofere Codex acces la internet în timpul executării sarcinilor. Consultă jurnalul de modificări⁠(se deschide într-o fereastră nouă) și documentația⁠(se deschide într-o fereastră nouă) pentru mai multe detalii.

Astăzi lansăm o previzualizare de cercetare pentru Codex: un agent de inginerie de software bazat pe cloud care poate lucra în paralel la mai multe sarcini. Codex poate realiza sarcini pentru tine, cum ar fi scrierea de funcții, răspunsul la întrebări despre baza de cod, remedierea bugurilor și propunerea de solicitări de extragere pentru a fi revizuite; fiecare sarcină este executată în propriul mediu cloud sandbox, având depozitul tău preîncărcat.

Codex este susținut de Codex-1, o versiune a OpenAI o3 optimizată pentru ingineria de software. A fost instruit folosind învățarea prin consolidare în sarcini de programare reale, într-o varietate de medii, pentru a genera cod care reflectă îndeaproape stilul uman și preferințele pentru solicitările de extragere, respectă cu precizie instrucțiunile și poate rula iterativ teste până când primește un rezultat pozitiv. Începem să lansăm Codex pentru utilizatorii ChatGPT Pro, Enterprise și Business astăzi, iar compatibilitatea cu Plus și Edu va fi disponibilă în curând.

Cum funcționează Codex

Astăzi poți accesa Codex prin bara laterală din ChatGPT și îi poți atribui noi sarcini de programare tastând o solicitare și făcând clic pe „Code”. Dacă vrei să-i pui o întrebare lui Codex despre baza de cod, fă clic pe „Ask”. Fiecare sarcină este procesată independent într-un mediu separat, izolat, având baza ta de cod preîncărcată. Codex poate citi și edita fișiere, precum și rula comenzi, inclusiv de tip test harness, linter și type checker. Finalizarea sarcinii durează de obicei între 1 și 30 de minute, în funcție de complexitate, iar progresul Codex poate fi monitorizat în timp real.

Odată ce Codex finalizează o sarcină, își înscrie modificările în mediul său. Codex oferă dovezi verificabile ale acțiunilor sale prin citarea jurnalelor terminalului și a datelor de ieșire ale testelor, permițându-ți să urmărești fiecare pas realizat în timpul finalizării sarcinii. Poți apoi să revizuiești rezultatele, să ceri revizuiri suplimentare, să deschizi o solicitare de extragere pe GitHub sau să integrezi direct modificările în mediul tău local. În produs, poți configura mediul Codex pentru a se potrivi cât mai bine cu mediul tău real de dezvoltare.

Codex poate fi ghidat de fișierele AGENTS.md plasate în depozitul tău. Acestea sunt fișiere text, asemănătoare cu README.md, prin care îl poți informa pe Codex cum să navigheze în baza de cod, ce comenzi să execute pentru testare și cum să respecte cel mai bine practicile standard ale proiectului tău. La fel ca dezvoltatorii umani, agenții Codex funcționează cel mai bine atunci când li se oferă medii de dezvoltare configurate, configurații de testare fiabile și documentație clară.

În evaluările de codare și testele de performanță interne, codex-1 prezintă performanțe puternice chiar și fără fișiere AGENTS.md sau schele personalizate.

23 de eșantioane verificate de SWE-Bench care nu au putut fi rulate pe infrastructura noastră internă au fost excluse. codex-1 a fost testat la o lungime maximă a contextului de 192k tokenuri și un „efort de raționament” mediu, adică setarea care va fi disponibilă astăzi în produs. Pentru detalii despre evaluările o3, le poți consulta aici⁠.

Testul nostru de performanță intern pentru SWE este un set selectat de sarcini SWE interne reale de la OpenAI.

Construirea unor agenți siguri și fiabili

Lansăm Codex ca o previzualizare de cercetare, în conformitate cu strategia noastră de implementare iterativă. Am acordat prioritate securității și transparenței în timpul proiectării Codex, pentru ca utilizatorii să-i poată verifica datele de ieșire – o măsură de siguranță care devine tot mai importantă pe măsură ce modelele de inteligență artificială gestionează în mod independent sarcini de programare tot mai complexe și considerentele privind siguranța evoluează. Utilizatorii pot verifica conținutul generat de Codex prin citate, jurnale de terminal și rezultate ale testelor. În caz de incertitudine sau de eșecuri ale testelor, agentul Codex comunică în mod explicit aceste probleme, permițându-le utilizatorilor să ia decizii informate asupra modului în care trebuie să procedeze. Este în continuare esențial ca utilizatorii să revizuiască și valideze manual tot codul generat de agenți înainte de integrare și execuție.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Alinierea la preferințele umane

Un obiectiv principal în timpul instruirii codex-1 a fost de a alinia rezultatele îndeaproape cu preferințele și standardele de programare umane. În comparație cu OpenAI o3, codex-1 produce în mod constant corecții mai clare, gata pentru revizuirea umană imediată și integrarea în fluxurile de lucru standard.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Prevenirea abuzurilor

Protejarea împotriva utilizării rău intenționate a ingineriei de software bazate pe inteligență artificială, cum ar fi dezvoltarea de malware, devine tot mai importantă. Cu toate acestea, este important ca măsurile de protecție să nu împiedice în mod nejustificat utilizarea legitimă și benefică a unor tehnici care pot fi folosite uneori și pentru dezvoltarea de malware, cum ar fi ingineria kernelului de nivel scăzut.

Pentru a echilibra siguranța și utilitatea, Codex a fost instruit să identifice și refuze cu precizie solicitările care vizau dezvoltarea de software rău intenționat, distingând și sprijinind totodată în mod clar sarcinile legitime. De asemenea, ne-am îmbunătățit cadrele de politici și am integrat evaluări riguroase ale siguranței pentru a consolida în mod eficient aceste limite. Am publicat o anexă la fișa de sistem a o3⁠ pentru a reflecta aceste evaluări.

Execuție securizată

Agentul Codex operează în întregime într-un container securizat și izolat din cloud. În timpul execuției sarcinii, accesul la internet este dezactivat, limitând interacțiunea agentului doar la codul furnizat explicit prin depozitele GitHub și dependențele preinstalate configurate de utilizator printr-un script de configurare. Agentul nu poate accesa site-uri web externe, API-uri sau alte servicii.

Primele cazuri de utilizare

Echipele tehnice de la OpenAI au început să folosească Codex ca parte a setului de instrumente de zi cu zi. Este cel mai adesea folosit de inginerii OpenAI pentru a delega sarcinile repetitive, bine definite, cum ar fi refactorizarea, redenumirea și scrierea testelor, care altfel ar întrerupe concentrarea. Este la fel de util pentru crearea de noi funcții, conectarea componentelor, remedierea bugurilor și schițarea documentației. Echipele își formează noi obiceiuri bazate pe acest model: triază problemele urgente, planifică sarcinile la începutul zilei și externalizează sarcinile secundare pentru a putea continua să avanseze. Prin reducerea comutării între contexte și readucerea în prim-plan a sarcinilor uitate, Codex ajută inginerii să livreze mai repede și să se concentreze pe ceea ce contează cel mai mult.

Înainte de lansare, am lucrat și cu un mic grup de testeri externi pentru a înțelege mai bine cum se comportă Codex în diverse baze de cod, procese de dezvoltare și echipe.

Cisco⁠(se deschide într-o fereastră nouă) explorează cum Codex îi poate ajuta echipele de ingineri să pună în pratică mai rapid ideile ambițioase. Ca partener de proiectare de început, Cisco contribuie la definirea viitorului Codex evaluându-l pentru cazuri de utilizare reale din portofoliul său de produse și oferindu-i feedback echipei de la OpenAI.
Temporal⁠(se deschide într-o fereastră nouă) folosește Codex pentru a accelera dezvoltarea de funcționalități, depana probleme, scrie și executa teste și refactoriza baze de cod mari. De asemenea, îi sprijină angajații să se concentreze, executând sarcini complexe în fundal — menținând inginerii în fluxul de lucru și accelerând iterarea.
Superhuman⁠(se deschide într-o fereastră nouă) folosește Codex pentru a accelera sarcini mici, dar repetitive, cum ar fi îmbunătățirea acoperirii testelor și remedierea erorilor de integrare. De asemenea, îi ajută angajații să livreze mai rapid, permițându-le managerilor de produs să contribuie cu modificări ușoare ale codului fără a apela la un inginer, cu excepția revizuirii codului.
Kodiak⁠(se deschide într-o fereastră nouă) folosește Codex pentru a-și scrie instrumentele de depanare, îmbunătăți acoperirea testelor și refactoriza codul, accelerând astfel dezvoltarea tehnologiei sale de conducere autonomă, Kodiak Driver. De asemenea, Codex a devenit un instrument de referință valoros, ajutând inginerii să înțeleagă părțile necunoscute ale stivei prin afișarea contextului relevant și a schimbărilor anterioare.

Pe baza celor învățate din experiența testerilor inițiali, îți recomandăm să atribui sarcini bine definite mai multor agenți simultan și să testezi diferite tipuri de sarcini și solicitări pentru a explora eficient capacitățile modelului.

Actualizări ale CLI Codex

Luna trecută, am lansat Codex CLI, un agent de programare de tip open-source ușor, care rulează în terminalul tău. Aduce puterea modelelor precum o3 și o4-mini în fluxul tău de lucru local, facilitând asocierea cu acestea pentru a finaliza sarcinile mai rapid.

Astăzi, lansăm și o versiune mai mică a codex-1, o versiune a o4-mini concepută special pentru a fi utilizată în Codex CLI. Acest nou model acceptă fluxuri de lucru mai rapide în CLI și este optimizat pentru întrebări și răspunsuri la cod cu latență redusă, precum și pentru editare, păstrând simultan aceleași avantaje referitoare la respectarea instrucțiunilor și stil. Este disponibil acum ca model implicit în Codex CLI și în API sub denumirea codex-mini-latest. Instantaneul subiacent va fi actualizat periodic pe măsură ce continuăm să îmbunătățim modelul CodeX-mini.

De asemenea, acum este mult mai ușor să-ți conectezi contul de dezvoltator la Codex CLI. În loc să generezi și configurezi manual un token API, acum te poți conecta cu contul ChatGPT și poți selecta organizația API pe care dorești s-o folosești. Vom genera și configura automat cheia API pentru tine. De asemenea, utilizatorii Plus și Pro care se conectează la Codex CLI cu ChatGPT pot începe să valorifice credite API gratuite în valoare de 5 USD și, respectiv, 50 USD, mai târziu în cursul zilei de astăzi, pentru următoarele 30 de zile.

Disponibilitatea, prețurile și limitările Codex

Începând de astăzi, lansăm Codex pentru utilizatorii ChatGPT Pro, Enterprise și Business la nivel global, iar compatibilitatea cu Plus și Edu va fi disponibilă în curând. Utilizatorii vor beneficia de acces generos fără costuri suplimentare în următoarele săptămâni, pentru a putea explora posibilitățile oferite de Codex. După această perioadă, vom introduce accesul limitat și opțiuni de tarifare flexibile, care îți vor permite să achiziționezi utilizare suplimentară la cerere. Intenționăm să extindem în curând accesul pentru utilizatorii Plus și Edu.

Pentru dezvoltatorii care utilizează codex-mini-latest, modelul este disponibil în API-ul Responses și are un preț de 1,50 USD per 1 milion de tokenuri de intrare și 6 USD per 1 milion de tokenuri de ieșire, cu o reducere de 75% pentru memorarea în cache a solicitărilor.

Codex este încă la începutul dezvoltării sale. Fiind o previzualizare de cercetare, în prezent îi lipsesc funcții precum introducerea de imagini pentru activitățile de front-end și capacitatea de a corecta direcția agentului în timp ce lucrează. În plus, delegarea către un agent la distanță durează mai mult decât editarea interactivă, lucru cu care poate dura ceva timp să te obișnuiești. Cu timpul, interacțiunea cu agenții Codex va deveni din ce în ce mai asemănătoare cu o colaborare asincronă cu colegii. Pe măsură ce capacitățile modelelor avansează, anticipăm că agenții vor gestiona sarcini mai complexe pe perioade extinse.

Ce urmează

Ne imaginăm un viitor în care dezvoltatorii se ocupă de sarcinile pe care doresc să le controleze și deleagă restul agenților — acționând mai rapid și fiind mai productivi cu inteligența artificială. Pentru a realiza acest lucru, construim o suită de instrumente Codex care acceptă atât colaborarea în timp real, cât și delegarea asincronă.

Asocierea cu instrumente de inteligență artificială precum Codex CLI și altele a devenit rapid o normă în acest sector, ajutând dezvoltatorii să programeze mai rapid. Însă credem că fluxul de lucru asincron, cu mai mulți agenți, introdus de Codex în ChatGPT, va deveni modalitatea de facto prin care inginerii produc cod de înaltă calitate.

În cele din urmă, considerăm că aceste două moduri de interacțiune — asocierea în timp real și delegarea sarcinilor — vor fuziona. Dezvoltatorii vor colabora cu agenții de inteligență artificială în cadrul IDE-urilor și al instrumentelor lor de zi cu zi pentru a pune întrebări, primi sugestii și delega sarcini mai lungi, toate într-un flux de lucru unificat.

Privind în perspectivă, intenționăm să introducem fluxuri de lucru pentru agenți mai interactive și mai flexibile. Dezvoltatorii vor putea în curând să ofere îndrumări în timpul sarcinii, să colaboreze la strategiile de implementare și să primească actualizări proactive privind progresul. De asemenea, ne imaginăm integrări mai profunde între instrumentele pe care le folosești deja: în prezent, Codex se conectează la GitHub, iar în curând vei putea atribui sarcini din Codex CLI, ChatGPT Desktop sau chiar din instrumente precum sistemul de urmărire a problemelor sau sistemul CI.

Ingineria de software este printre primele sectoare care au înregistrat creșteri semnificative ale productivității datorită inteligenței artificiale, deschizând noi posibilități pentru persoane individuale și echipe mici. Deși suntem optimiști în privința acestor câștiguri, colaborăm și cu unii parteneri ca să înțelegem mai bine ce înseamnă adoptarea pe scară largă a agenților pentru fluxurile de lucru ale dezvoltatorilor, dezvoltarea abilităților la nivel de angajat, nivel de abilități și zonă geografică.

Acesta este doar începutul și abia așteptăm să vedem ce vei crea cu Codex.

Reluare livestream

Anexă

Mesaj de sistem

Împărtășim mesajul de sistem codex-1 pentru a ajuta dezvoltatorii să înțeleagă comportamentul implicit al modelului și să adapteze modelul Codex pentru a funcționa eficient în fluxurile de lucru personalizate. De exemplu, mesajul sistemului codex-1 încurajează Codex să ruleze toate testele menționate în fișierul AGENTS.md, dar dacă n-ai timp, poți cere ca modelul Codex să omită aceste teste.

Text simplu

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Autor

OpenAI