16 ta’ Mejju 2025

Nintroduċu Codex

Aġent tal-inġinerija tas-software ibbażat fil-cloud li jista’ jaħdem fuq ħafna kompiti b’mod parallel, imħaddem minn codex-1. Disponibbli għal utenti ta’ ChatGPT Pro, Business, u Enterprise illum, u għal utenti Plus dalwaqt.

Ipprova Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Qed jillowdja…

Aġġornament fit-3 ta’ Ġunju, 2025: Codex issa huwa disponibbli għall-utenti ta’ ChatGPT Plus. Qed nattivaw ukoll il-possibbiltà li l-utenti jagħtu lil Codex aċċess għall-internet waqt l-eżekuzzjoni tal-kompitu. Jekk jogħġbok irreferi għall-changelog⁠(jinfetaħ f’tieqa ġdida) u d-docs⁠(jinfetaħ f’tieqa ġdida) għal aktar dettalji.

Illum qed inniedu preview ta’ riċerka ta’ Codex: aġent tal-inġinerija tas-software ibbażat fil-cloud li jista’ jaħdem fuq ħafna kompiti b’mod parallel. Codex jista’ jwettaq kompiti għalik bħall-kitba ta’ features, it-tweġib ta’ mistoqsijiet dwar il-codebase tiegħek, is-soluzzjoni ta’ bugs, u l-proposta ta’ talbiet ta' pull għar-reviżjoni; kull kompitu jaħdem fl-ambjent sandbox tiegħu stess fil-cloud, mgħobbi minn qabel bir-repożitorju tiegħek.

Codex huwa mħaddem minn codex-1, verżjoni ta’ OpenAI o3 ottimizzata għall-inġinerija tas-software. Ġie mħarreġ bl-apprendiment ta' tisħiħ fuq kompiti ta’ kodifikazzjoni fid-dinja reali f’varjetà ta’ ambjenti biex jiġġenera kodiċi li jirrifletti mill-qrib l-istil uman u l-preferenzi tal-PR, jaderixxi b’mod preċiż mal-istruzzjonijiet, u jista’ jmexxi testijiet b’mod iterattiv sakemm jirċievi riżultat pożittiv. Qed nibdew noħorġu Codex lill-utenti ta’ ChatGPT Pro, Enterprise, u Business illum, b’appoġġ għal Plus u Edu dalwaqt.

Kif jaħdem Codex

Illum tista’ taċċessa Codex permezz tas-sidebar f’ChatGPT u tassenjalu kompiti ġodda ta’ kodifikazzjoni billi tikteb prompt u tikklikkja “Ikkodifika”. Jekk trid tistaqsi mistoqsija lil Codex dwar il-codebase tiegħek, ikklikkja “Staqsi”. Kull kompitu jiġi pproċessat b’mod indipendenti f’ambjent separat u iżolat mgħobbi minn qabel bil-codebase tiegħek. Codex jista’ jaqra u jeditja fajls, kif ukoll imexxi kmandi inklużi test harnesses, linters, u type checkers. It-tlestija tal-kompiti tipikament tieħu bejn 1 u 30 minuta, skont il-kumplessità, u tista’ ssegwi l-progress ta’ Codex f’ħin reali.

Ladarba Codex itemm kompitu, jagħmel commit tal-bidliet tiegħu fl-ambjent tiegħu. Codex jipprovdi evidenza verifikabbli tal-azzjonijiet tiegħu permezz ta’ ċitazzjonijiet ta’ logs tat-terminal u outputs tat-testijiet, li jippermettulek issegwi kull pass li ttieħed waqt it-tlestija tal-kompitu. Tista’ mbagħad tirrevedi r-riżultati, titlob aktar reviżjonijiet, tiftaħ talba ta' pull fuq GitHub, jew tintegra l-bidliet direttament fl-ambjent lokali tiegħek. Fil-prodott, tista’ tikkonfigura l-ambjent ta’ Codex biex jaqbel mal-ambjent reali tal-iżvilupp tiegħek kemm jista’ jkun.

Codex jista’ jiġi ggwidat minn fajls AGENTS.md imqiegħda fir-repożitorju tiegħek. Dawn huma fajls ta’ test, simili għal README.md, fejn tista’ tinforma lil Codex kif jinnaviga l-codebase tiegħek, liema kmandi għandu jmexxi għat-testing, u kif l-aħjar iżomm mal-prattiki standard tal-proġett tiegħek. Bħall-iżviluppaturi umani, l-aġenti Codex jaħdmu l-aħjar meta jingħataw ambjenti dev ikkonfigurati, setups ta’ testing affidabbli, u dokumentazzjoni ċara.

Fl-evalwazzjonijiet tal-kodifikazzjoni u benchmarks interni, codex-1 juri prestazzjoni qawwija anke mingħajr fajls AGENTS.md jew scaffolding personalizzat.

23 kampjun SWE-Bench Verified li ma kinux jistgħu jitħaddmu fuq l-infrastruttura interna tagħna ġew esklużi. codex-1 ġie ttestjat b’tul massimu ta’ kuntest ta’ 192k tokens u “effort ta’ raġunament” medju, li huwa s-setting li se jkun disponibbli fil-prodott illum. Għad-dettalji dwar evalwazzjonijiet ta’ o3, ara hawn⁠.

Il-benchmark intern tagħna ta’ kompiti SWE huwa sett ikkurat ta’ kompiti SWE interni reali f’OpenAI.

Nibnu aġenti siguri u ta’ fiduċja

Qed noħorġu Codex bħala preview ta’ riċerka, f’konformità mal-istrateġija tagħna ta’ deploy iterattiv. Ipprijoritizzajna s-sigurtà u t-trasparenza meta ddisinjajna Codex sabiex l-utenti jkunu jistgħu jivverifikaw l-outputs tiegħu - salvagwardja li ssir dejjem aktar importanti hekk kif mudelli tal-AI jimmaniġġjaw kompiti ta’ kodifikazzjoni aktar kumplessi b’mod indipendenti u l-kunsiderazzjonijiet tas-sikurezza jevolvu. L-utenti jistgħu jiċċekkjaw ix-xogħol ta’ Codex permezz ta’ ċitazzjonijiet, logs tat-terminal u riżultati tat-testijiet. Meta jkun inċert jew jiffaċċja fallimenti fit-testijiet, l-aġent Codex jikkomunika dawn il-kwistjonijiet b’mod espliċitu, u b’hekk jippermetti lill-utenti jieħdu deċiżjonijiet infurmati dwar kif jipproċedu. Xorta jibqa’ essenzjali li l-utenti jirrevedu u jivvalidaw manwalment il-kodiċi kollu ġġenerat mill-aġent qabel l-integrazzjoni u l-eżekuzzjoni.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Allinjament mal-preferenzi umani

Għan ewlieni waqt it-taħriġ ta’ codex-1 kien li l-outputs jiġu allinjati mill-qrib mal-preferenzi u l-istandards umani tal-kodifikazzjoni. Meta mqabbel ma’ OpenAI o3, codex-1 b’mod konsistenti jipproduċi patches aktar nodfa u lesti għal reviżjoni umana immedjata u integrazzjoni fi flussi ta’ xogħol standard.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Prevenzjoni tal-abbuż

Il-protezzjoni kontra applikazzjonijiet malizzjużi tal-inġinerija tas-software immexxija mill-AI, bħall-iżvilupp ta’ malware, qed issir dejjem aktar kritika. Fl-istess ħin, huwa importanti li l-miżuri protettivi ma jxekklux bla bżonn applikazzjonijiet leġittimi u ta’ benefiċċju li jistgħu jinvolvu tekniki li xi kultant jintużaw ukoll fl-iżvilupp ta’ malware, bħall-inġinerija tal-kernel ta’ livell baxx.

Biex nibbilanċjaw is-sikurezza u l-utilità, Codex ġie mħarreġ biex jidentifika u jirrifjuta b’mod preċiż talbiet immirati lejn l-iżvilupp ta’ software malizzjuż, filwaqt li jiddistingwi b’mod ċar u jappoġġa kompiti leġittimi. Saħħaħna wkoll il-qafas tal-politiki tagħna u inkorporajna evalwazzjonijiet rigorużi tas-sikurezza biex insaħħu dawn il-konfini b’mod effettiv. Ippubblikajna addendum għall-kard tas-sistema o3⁠ biex nirriflettu dawn l-evalwazzjonijiet.

Eżekuzzjoni sigura

L-aġent Codex jopera kompletament ġewwa container sigur u iżolat fil-cloud. Waqt l-eżekuzzjoni tal-kompitu, l-aċċess għall-internet ikun diżattivat, u jillimita l-interazzjoni tal-aġent biss għall-kodiċi pprovdut b’mod espliċitu permezz ta’ repożitorji GitHub u dipendenzi installati minn qabel ikkonfigurati mill-utent permezz ta’ script ta’ setup. L-aġent ma jistax jaċċessa websites esterni, APIs, jew servizzi oħra.

Każijiet ta’ użu bikrin

Timijiet tekniċi f’OpenAI bdew jużaw Codex bħala parti mill-għodod ta’ kuljum tagħhom. Ħafna drabi jintuża minn inġiniera ta’ OpenAI biex iħottu kompiti ripetittivi b’ambitu ċar, bħar-rifattorizzazzjoni, tibdil ta’ ismijiet, u kitba ta’ testijiet, li inkella jkissru l-fokus. Huwa daqstant utli għall-ħolqien tal-istruttura ta’ features ġodda, il-konnessjoni ta’ komponenti, is-soluzzjoni ta’ bugs, u l-abbozzar ta’ dokumentazzjoni. It-timijiet qed jibnu drawwiet ġodda madwaru: triage ta’ kwistjonijiet on-call, ippjanar tal-kompiti fil-bidu tal-ġurnata, u t-tqegħid ta’ xogħol fl-isfond biex jibqgħu mexjin. Billi jnaqqas il-bdil tal-kuntest u jġib fil-wiċċ to-dos minsija, Codex jgħin lill-inġiniera jibagħtu aktar malajr u jibqgħu ffukati fuq dak li jgħodd l-aktar.

Lejn it-tnedija, konna qed naħdmu wkoll ma’ grupp żgħir ta’ testers esterni biex nifhmu aħjar kif Codex jaħdem fuq codebases diversi, proċessi ta’ żvilupp, u timijiet.

Cisco⁠(jinfetaħ f’tieqa ġdida) qed tesplora kif Codex jista’ jgħin lit-timijiet tal-inġinerija tagħha jwasslu ideat ambizzjużi għall-ħajja aktar malajr. Bħala sħab fid-disinn bikri, Cisco qed tgħin tifforma l-futur ta’ Codex billi tevalwah għal każijiet ta’ użu fid-dinja reali fil-portafoll tal-prodotti tagħha u tipprovdi feedback lit-tim ta’ OpenAI.
Temporal⁠(jinfetaħ f’tieqa ġdida) tuża Codex biex tħaffef l-iżvilupp tal-karatteristiċi, tiddibagga problemi, tikteb u teżegwixxi testijiet, u tirrifattorizza codebases kbar. Tgħinhom ukoll jibqgħu ffukati billi tmexxi kompiti kumplessi fl-isfond—u żżomm lill-inġiniera fil-flow filwaqt li tħaffef l-iterazzjoni.
Superhuman⁠(jinfetaħ f’tieqa ġdida) tuża Codex biex tħaffef kompiti żgħar iżda ripetittivi bħal it-titjib tal-kopertura tat-testijiet u s-soluzzjoni ta’ fallimenti ta’ integrazzjoni. Tgħinhom ukoll jibagħtu aktar malajr billi tippermetti lill-product managers jikkontribwixxu bidliet ħfief fil-kodiċi mingħajr ma jdaħħlu inġinier, ħlief għar-reviżjoni tal-kodiċi.
Kodiak⁠(jinfetaħ f’tieqa ġdida) qed tuża Codex biex tgħin fil-kitba ta’ għodod ta’ debugging, ittejjeb il-kopertura tat-testijiet, u tirrifattorizza l-kodiċi—u tħaffef l-iżvilupp tal-Kodiak Driver, it-teknoloġija tagħha tas-sewqan awtonomu. Codex sar ukoll għodda ta’ referenza ta’ valur, billi jgħin lill-inġiniera jifhmu partijiet mhux familjari tal-istack billi joħroġ kuntest rilevanti u bidliet tal-passat.

Abbażi tat-tagħlim mit-testers bikrin, nirrakkomandaw li tassenjaw kompiti b’ambitu ċar lil bosta aġenti simultanjament, u tesperimentaw b’tipi differenti ta’ kompiti u prompts biex tesploraw il-kapaċitajiet tal-mudell b’mod effettiv.

Aġġornamenti għal Codex CLI

Ix-xahar li għadda, nedejna Codex CLI, aġent ħafif tal-kodifikazzjoni open-source li jaħdem fit-terminal tiegħek. Iġib il-qawwa ta’ mudelli bħal o3 u o4-mini fil-fluss tax-xogħol lokali tiegħek, u jagħmilha faċli li taħdem magħhom f’pari biex tlesti kompiti aktar malajr.

Illum, qed noħorġu wkoll verżjoni iżgħar ta’ codex-1, verżjoni ta’ o4-mini mfassla speċifikament għall-użu f’Codex CLI. Dan il-mudell ġdid jappoġġa flussi ta’ xogħol aktar veloċi fil-CLI u huwa ottimizzat għal Q&A u editjar tal-kodiċi b’latenza baxxa, filwaqt li jżomm l-istess saħħiet fis-segwitu tal-istruzzjonijiet u l-istil. Huwa disponibbli issa bħala l-mudell awtomatiku f’Codex CLI u fl-API bħala codex-mini-latest. L-isnapshot sottostanti se jiġi aġġornat regolarment hekk kif inkomplu ntejbu l-mudell Codex-mini.

Qed nagħmluha wkoll ħafna aktar faċli biex tikkonnettja l-kont tal-iżviluppatur tiegħek ma’ Codex CLI. Minflok tiġġenera u tikkonfigura token tal-API manwalment, issa tista’ tidħol bil-kont ChatGPT tiegħek u tagħżel l-organizzazzjoni tal-API li trid tuża. Aħna niġġeneraw u nikkonfiguraw iċ-ċavetta tal-API għalik awtomatikament. Utenti Plus u Pro li jidħlu f’Codex CLI b’ChatGPT jistgħu wkoll jibdew jifdu $5 u $50 f’krediti tal-API b’xejn, rispettivament, aktar tard illum għat-30 jum li ġejjin.

Disponibbiltà, prezzijiet, u limitazzjonijiet ta’ Codex

Mill-lum, qed noħorġu Codex lil utenti ta’ ChatGPT Pro, Enterprise, u Business globalment, b’appoġġ għal Plus u Edu dalwaqt. L-utenti se jkollhom aċċess ġeneruż mingħajr spiża addizzjonali għall-ġimgħat li ġejjin sabiex tkun tista’ tesplora x’jista’ jagħmel Codex, u wara noħorġu aċċess b’limiti ta’ rata u għażliet ta’ prezzijiet flessibbli li jħalluk tixtri użu addizzjonali fuq talba. Qed nippjanaw li nespandu l-aċċess lill-utenti ta’ Plus u Edu dalwaqt.

Għall-iżviluppaturi li qed jibnu b’codex-mini-latest, il-mudell huwa disponibbli fuq ir-Responses API u għandu prezz ta’ $1.50 għal kull 1M input tokens u $6 għal kull 1M output tokens, b’roħs ta’ 75% għall-prompt caching.

Codex għadu kmieni fl-iżvilupp tiegħu. Bħala preview ta’ riċerka, bħalissa m’għandux karatteristiċi bħal inputs ta’ immaġni għax-xogħol frontend, u l-abbiltà li tikkoreġi l-kors tal-aġent waqt li jkun qed jaħdem. Barra minn hekk, id-delega lil aġent remot tieħu aktar żmien minn editjar interattiv, u dan jista’ jeħtieġ ftit żmien biex tidra. Maż-żmien, l-interazzjoni ma’ aġenti Codex se tixbah dejjem aktar kollaborazzjoni asinkrona ma’ kollegi. Hekk kif il-kapaċitajiet tal-mudell javvanzaw, nantiċipaw li l-aġenti jimmaniġġjaw kompiti aktar kumplessi fuq perjodi itwal.

X’hemm imiss

Nimmaġinaw futur fejn l-iżviluppaturi jmexxu x-xogħol li jridu jżommu huma u jiddelegaw il-bqija lill-aġenti—jimxu aktar malajr u jkunu aktar produttivi bl-AI. Biex niksbu dan, qed nibnu suite ta’ għodod Codex li tappoġġa kemm kollaborazzjoni f’ħin reali kif ukoll delega asinkrona.

Ix-xogħol f’pari ma’ għodod tal-AI bħal Codex CLI u oħrajn malajr sar norma fl-industrija, u jgħin lill-iżviluppaturi jimxu aktar malajr waqt li jikkodifikaw. Iżda nemmnu li l-fluss tax-xogħol asinkronu b’ħafna aġenti introdott minn Codex f’ChatGPT se jsir il-mod de facto kif l-inġiniera jipproduċu kodiċi ta’ kwalità għolja.

Fl-aħħar mill-aħħar, naraw dawn iż-żewġ modi ta’ interazzjoni—xogħol f’pari f’ħin reali u delega ta’ kompiti—jikkonverġu. L-iżviluppaturi se jikkollaboraw ma’ aġenti tal-AI fl-IDEs u l-għodod ta’ kuljum tagħhom biex jistaqsu mistoqsijiet, jiksbu suġġerimenti, u jiddelegaw kompiti itwal, kollox fi fluss tax-xogħol wieħed.

’Il quddiem, qed nippjanaw li nintroduċu flussi ta’ xogħol tal-aġenti aktar interattivi u flessibbli. Dalwaqt l-iżviluppaturi se jkunu jistgħu jipprovdu gwida f’nofs il-kompitu, jikkollaboraw fuq strateġiji ta’ implimentazzjoni, u jirċievu aġġornamenti proattivi dwar il-progress. Nivviżwalizzaw ukoll integrazzjonijiet aktar profondi mal-għodod li diġà tuża: illum Codex jgħaqqad ma’ GitHub, u dalwaqt tkun tista’ tassenja kompiti minn Codex CLI, ChatGPT Desktop, jew saħansitra minn għodod bħall-issue tracker jew sistema CI tiegħek.

L-inġinerija tas-software hija waħda mill-ewwel industriji li qed tesperjenza żidiet sinifikanti fil-produttività mmexxija mill-AI, u tiftaħ possibbiltajiet ġodda għall-individwi u timijiet żgħar. Filwaqt li aħna ottimisti dwar dawn il-qligħ, qed nikkollaboraw ukoll ma’ sħab biex nifhmu aħjar l-implikazzjonijiet tal-adozzjoni mifruxa tal-aġenti fuq il-flussi tax-xogħol tal-iżviluppaturi, l-iżvilupp tal-ħiliet bejn in-nies, il-livelli tal-ħiliet, u l-ġeografiji.

Dan huwa biss il-bidu—u aħna eċċitati naraw x’tibnu b’Codex.

Replay tal-livestream

Appendiċi

Messaġġ tas-sistema

Qed naqsmu l-messaġġ tas-sistema codex-1 biex ngħinu lill-iżviluppaturi jifhmu l-imġiba awtomatika tal-mudell u jadattaw Codex biex jaħdem b’mod effettiv f’flussi ta’ xogħol personalizzati. Pereżempju, il-messaġġ tas-sistema codex-1 iħeġġeġ lil Codex imexxi t-testijiet kollha msemmija fil-fajl AGENTS.md, iżda jekk għandek ftit ħin, tista’ titlob lil Codex jaqbeż dawn it-testijiet.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Awtur

OpenAI