16 maj 2025

Prezantimi i Codex

Një agjent inxhinierie softuerësh i bazuar në cloud që mund të punojë në shumë detyra paralelisht, i fuqizuar nga codex-1. Në dispozicion për përdoruesit e ChatGPT Pro, Business dhe Enterprise sot, dhe për përdoruesit e Plus së shpejti.

Provo Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Duke ngarkuar…

Përditësimi më 3 qershor 2025: Codex tani është në dispozicion për përdoruesit e ChatGPT Plus. Ne gjithashtu po i lejojmë përdoruesit t'i japin Codex qasje në internet gjatë ekzekutimit të detyrës. Referoju changelog⁠(hapet në një dritare të re) dhe docs⁠(hapet në një dritare të re) për më shumë detaje.

Sot po prezantojmë një tablo paraprake kërkimore të Codex: një agjent inxhinierie softuerike i bazuar në cloud që mund të punojë në shumë detyra paralelisht. Codex mund të kryejë detyra për ty si të shkruajë funksione, t'u përgjigjet pyetjeve rreth bazës së kodit, të rregullojë gabime dhe të propozojë kërkesa për rishikim; çdo detyrë funksionon në mjedisin e vet të izoluar në cloud, e parangarkuar me depon tënde.

Codex mbështetet nga codex-1, një version i OpenAI o3 i optimizuar për inxhinieri softuerike. U trajnua duke përdorur të mësuarit përforcues në detyra kodimi reale në një sërë mjedisesh për të gjeneruar kod që pasqyron nga afër stilin njerëzor dhe preferencat e PR, i përmbahet saktësisht udhëzimeve dhe mund të kryejë teste në mënyrë të përsëritur derisa të marrë një rezultat kalues. Po fillojmë të shpërndajmë Codex për përdoruesit e ChatGPT Pro, Enterprise dhe Business sot, me mbështetje për Plus dhe Edu që do të vijë së shpejti.

Si funksionon Codex

Sot mund të kesh qasje në Codex përmes shirit anësor në ChatGPT dhe t'i caktosh detyra të reja kodimi duke shtypur një kërkesë dhe duke klikuar “Code”. Nëse dëshiron t'i bësh Codex një pyetje në lidhje me bazën e kodit, kliko “Pyet”. Çdo detyrë përpunohet në mënyrë të pavarur në një mjedis të veçantë dhe të izoluar, të ngarkuar paraprakisht me bazën e kodit. Codex mund të lexojë dhe të modifikojë skedarët, si dhe të ekzekutojë komanda duke përfshirë sistemet e testimit, linter dhe kontrolluesit e tipit (type checker). Përfundimi i detyrës zakonisht zgjat nga 1 deri në 30 minuta, në varësi të kompleksitetit, dhe ti mund të monitorosh progresin e Codex në kohë reale.

Pasi Codex përfundon një detyrë, ai kryen ndryshimet e veta në mjedisin e tij. Codex ofron prova të verifikueshme të veprimeve të tij përmes citimeve të regjistrave të terminalit dhe përfundimeve të testeve, duke të lejuar të gjurmosh çdo hap të ndërmarrë gjatë përfundimit të detyrës. Pastaj mund të rishikosh rezultatet, të kërkosh rishikime të mëtejshme, të hapësh një kërkesë tërheqjeje në GitHub ose t'i integrosh ndryshimet drejtpërsëdrejti në mjedisin tënd lokal. Në produkt, mund të konfigurosh mjedisin Codex që të përputhet sa më shumë me mjedisin tënd real të zhvillimit.

Codex mund të udhëzohet nga skedarët AGENTS.md të vendosur brenda depove e tua. Këta janë skedarë teksti, të ngjashëm me README.md, ku mund t'i tregosh Codex-it se si të lundrojë në bazën e kodit, cilat komanda të përdorë për testim dhe si të ndjekë më mirë praktikat standarde të projektit tënd. Ashtu si zhvilluesit njerëzorë, agjentët e Codex performojnë më mirë kur u ofrohen mjedise të konfiguruara zhvillimi, konfigurime të besueshme testimi dhe dokumentacion i qartë.

Në vlerësimet e kodimit dhe standardet e brendshme, codex-1 tregon performancë të fortë edhe pa skedarët AGENTS.md ose skela të personalizuara.

23 mostra të verifikuara SWE-Bench që nuk mund të ekzekutoheshin në infrastrukturën tonë të brendshme u përjashtuan. codex-1 u testua me një gjatësi maksimale konteksti prej 192 mijë tokenësh dhe përpjekje arsyetimi të mesme, që është cilësimi që do të jetë i disponueshëm në produkt sot. Për detaje mbi vlerësimet e o3, shiko këtu⁠.

Vlerësimi ynë i brendshëm i detyrave SWE është një grup i kuruar i detyrave të brendshme të SWE në botën reale në OpenAI.

Ndërtimi i agjentëve të sigurt dhe të besueshëm

Po e publikojmë Codex si një pamje paraprake kërkimore, në përputhje me strategjinë tonë të implementimit iterativ. Ne i dhamë përparësi sigurisë dhe transparencës kur dizajnuam Codex në mënyrë që përdoruesit të mund të verifikojnë daljet e tij - një mbrojtje që bëhet gjithnjë e më e rëndësishme pasi modelet e AI trajtojnë detyra më komplekse kodimi në mënyrë të pavarur dhe çështjet e sigurisë evoluojnë. Përdoruesit mund të verifikojnë punën e Codex përmes citimeve, regjistrave të terminaleve dhe rezultateve të testeve. Kur është i pasigurt ose përballet me dështime të testimit, agjenti i Codex i komunikon qartë këto çështje, duke u mundësuar përdoruesve të marrin vendime të informuara se si të veprojnë. Mbetet ende thelbësore që përdoruesit të rishikojnë dhe të vërtetojnë manualisht të gjithë kodin e gjeneruar nga agjentët përpara integrimit dhe ekzekutimit.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Përshtatja me preferencat e njerëzve

Një qëllim kryesor gjatë trajnimit të codex-1 ishte të përshtateshin daljet ngushtësisht me preferencat dhe standardet e kodimit njerëzor. Krahasuar me OpenAI o3, codex-1 prodhon vazhdimisht "patches" më të pastra, të gatshme për rishikim të menjëhershëm nga njerëzit dhe integrim në rrjedhat standarde të punës.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Parandalimi i abuzimit

Mbrojtja nga aplikacionet keqdashëse të inxhinierisë së softuerëve të drejtuar nga IA, siç është zhvillimi i programeve dashakeqe (malware), është gjithnjë e më kritike. Në të njëjtën kohë, është e rëndësishme që masat mbrojtëse të mos pengojnë në mënyrë të panevojshme aplikacionet legjitime dhe të dobishme që mund të përfshijnë teknika që ndonjëherë përdoren edhe për zhvillimin e programeve dashakeqe, siç është inxhinieria e kernelit në nivel të ulët.

Për të balancuar sigurinë dhe përdorshmërinë, Codex u trajnua për të identifikuar dhe refuzuar saktësisht kërkesat që synojnë zhvillimin e softuerëve keqdashës, duke dalluar dhe mbështetur qartë detyrat legjitime. Ne gjithashtu kemi përmirësuar kuadrin e politikave tona dhe kemi përfshirë vlerësime rigoroze të sigurisë për t'i forcuar këta kufij në mënyrë efektive. Kemi publikuar një shtojcë në Kartën e Sistemit o3⁠ për të pasqyruar këto vlerësime.

Ekzekutim i sigurt

Agjenti Codex operon plotësisht brenda një konteineri të sigurt dhe të izoluar në re. Gjatë ekzekutimit të detyrës, qasja në internet është e çaktivizuar, duke kufizuar ndërveprimin e agjentit vetëm në kodin e dhënë në mënyrë eksplicite përmes depove GitHub dhe varësive të para-instaluara të konfiguruara nga përdoruesi përmes një skripti konfigurimi. Agjenti nuk mund të hyjë në faqet e internetit, API-të ose shërbimet e tjera të jashtme.

Rastet e përdorimit të hershëm

Ekipet teknike te OpenAI kanë filluar të përdorin Codex si pjesë të mjetit të tyre të përditshëm. Përdoret më shpesh nga inxhinierët e OpenAI për të lehtësuar detyra të përsëritura dhe të përcaktuara mirë, si rifaktorizimi, riemërtimi dhe shkrimi i testeve, të cilat përndryshe do të prishnin fokusin. Është po aq i dobishëm për krijimin e funksioneve të reja, lidhjen e komponentëve, rregullimin e defekteve dhe hartimin e dokumentacionit. Ekipet po krijojnë zakone të reja rreth tij: trajtimi i problemeve gjatë thirrjeve, planifikimi i detyrave në fillim të ditës dhe delegimi i punës në sfond për të vazhduar përpara. Duke zvogëluar ndërrimin e kontekstit dhe duke shfaqur detyrat e harruara, Codex ndihmon inxhinierët të punojnë më shpejt dhe të qëndrojnë të përqendruar në atë që ka më shumë rëndësi.

Para prezantimit, kemi punuar gjithashtu me një grup të vogël testuesish të jashtëm për të kuptuar më mirë se si performon Codex në baza të ndryshme kodimi, procese zhvillimi dhe ekipe.

Cisco⁠(hapet në një dritare të re) po eksploron se si Codex mund të ndihmojë ekipet e tyre inxhinierike që të sjellin më shpejt në jetë ide ambicioze. Si partnerë të hershëm të dizajnit, Cisco po ndihmon në formimin e së ardhmes së Codex duke e vlerësuar atë për rastet e përdorimit në botë reale në të gjithë portofolin e tyre të produkteve dhe duke ofruar përshtypje për Team e OpenAI.
Temporal⁠(hapet në një dritare të re) përdor Codex për të përshpejtuar zhvillimin e veçorive, për të spastruar, për të shkruar dhe ekzekutuar teste dhe për të rifaktuar baza të mëdha kodesh. Gjithashtu i ndihmon ata të qëndrojnë të përqendruar duke kryer detyra komplekse në sfond—duke i mbajtur inxhinierët në rrjedhën e punës ndërkohë që përshpejtohet përsëritja.
Superhuman⁠(hapet në një dritare të re) përdor Codex për të përshpejtuar detyra të vogla por të përsëritura, si përmirësimi i mbulimit të testeve dhe rregullimi i dështimeve të integrimit. Gjithashtu i ndihmon ata të dërgojnë më shpejt duke u mundësuar menaxherëve të produkteve të kontribuojnë në ndryshime të lehta në kod pa përfshirë një inxhinier, përveç për rishikimin e kodit.
Kodiak⁠(hapet në një dritare të re) po përdor Codex për të ndihmuar në shkrimin e mjeteve të korrigjimit, përmirësimin e mbulimit të testit dhe rifaktorizimin e kodit—duke përshpejtuar zhvillimin e Kodiak Driver, teknologjisë së tyre të drejtimit autonom. Codex është bërë gjithashtu një mjet i vlefshëm referimi, duke ndihmuar inxhinierët të kuptojnë pjesët e panjohura të paketës duke shfaqur kontekstin përkatës dhe ndryshimet e kaluara.

Bazuar në mësimet nga testuesit e hershëm, ne rekomandojmë caktimin e detyrave të mirëpërcaktuara për agjentë të shumtë njëkohësisht dhe eksperimentimin me lloje të ndryshme detyrash dhe kërkesash për të eksploruar aftësitë e modelit në mënyrë efektive.

Përditësime në Codex CLI

Muajin e kaluar prezantuam Codex CLI, një agjent të lehtë dhe me burim të hapur për kodim që funksionon në terminalin tënd. Ajo sjell fuqinë e modeleve si o3 dhe o4-mini në proceset e tua lokale të punës, duke e bërë të lehtë çiftimin me ta për të përfunduar detyrat më shpejt.

Sot po publikojmë gjithashtu një version më të vogël të codex-1, një version të o4-mini të projektuar posaçërisht për përdorim në Codex CLI. Ky model i ri ofron mbështetje për proceset më të shpejta të punës në CLI dhe është optimizuar për pyetje-përgjigje dhe redaktim të kodit me vonesë të ulët, duke ruajtur të njëjtat pika të forta në ndjekjen e udhëzimeve dhe në stil. Tani është i disponueshëm si modeli i parazgjedhur në Codex CLI dhe në API si codex-mini-latest. Pamja e çastit do të përditësohet rregullisht ndërsa vazhdojmë të përmirësojmë modelin e Codex-mini.

Ne po e bëjmë gjithashtu shumë më të lehtë lidhjen e llogarisë tënde të zhvilluesit me Codex CLI. Në vend që të përftosh dhe të konfigurosh manualisht një token API, tani mund të hysh me llogarinë tënde të ChatGPT dhe të zgjedhësh organizatën API që dëshiron të përdorësh. Ne do të gjenerojmë dhe do ta konfigurojmë automatikisht çelësin API për ty. Përdoruesit Plus dhe Pro që hyjnë në Codex CLI me ChatGPT mund të fillojnë gjithashtu të shlyejnë kredite API falas prej 5 dhe 50 dollarësh, përkatësisht, më vonë sot për 30 ditët para.

Disponueshmëria, çmimi dhe kufizimet e Codex

Duke filluar nga sot, po e shpërndajmë Codex për përdoruesit e ChatGPT Pro, Enterprise dhe Business në mbarë botën, me mbështetje për Plus dhe Edu që do të vijë së shpejti. Përdoruesit do të kenë qasje të gjerë pa kosto shtesë për javët e ardhshme, kështu që mund të eksplorosh se çfarë mund të bëjë Codex, pas së cilës do të ofrojmë akses të kufizuar me tarifë dhe opsione fleksibël çmimesh që të lejojnë të blesh përdorim shtesë sipas kërkesës. Ne planifikojmë të zgjerojmë qasjen për përdoruesit e Plus dhe Edu së shpejti.

Për zhvilluesit që ndërtojnë me codex-mini-latest, modeli është i disponueshëm në Responses API dhe kushton 1.50 dollarë për 1 milion kode të hyrjes dhe 6 dollarë për 1 milion kode të daljes, me një zbritje prej 75% për ruajtjen në cache të kërkesës.

Codex është ende në fazat e hershme të zhvillimit të tij. Si një pamje paraprake kërkimore, aktualisht i mungojnë veçori si hyrje imazhe për punën e frontend dhe aftësia për të korrigjuar kursin e agjentit ndërsa punon. Për më tepër, delegimi te një agjent në distancë kërkon më shumë kohë sesa redaktimi interaktiv, gjë që mund të kërkojë pak kohë për t'u mësuar. Me kalimin e kohës, ndërveprimi me agjentët e Codex do të ngjajë gjithnjë e më shumë me bashkëpunimin asinkron me kolegët. Ndërsa aftësitë e modeleve përparojnë, ne presim që agjentët të merren me detyra më komplekse për periudha më të gjata.

Çfarë vjen më pas

Ne imagjinojmë një të ardhme ku zhvilluesit drejtojnë punën që duan të zotërojnë dhe delegojnë pjesën tjetër te agjentët—duke lëvizur më shpejt dhe duke qenë më produktivë me IA. Për ta arritur këtë, po ndërtojmë një grup mjetesh Codex që mbështesin si bashkëpunimin në kohë reale ashtu edhe delegimin asinkron.

Përdorimi i mjeteve IA si Codex CLI dhe të tjerë është bërë shpejt një normë në industri, duke i ndihmuar zhvilluesit të punojnë më shpejt ndërsa kodojnë. Por ne besojmë se rrjedha e punës asinkrone dhe me shumë agjentë e prezantuar nga Codex në ChatGPT do të bëhet mënyra de facto se si inxhinierët prodhojnë kod me cilësi të lartë.

Në fund të fundit, ne shohim këto dy mënyra të ndërveprimit—çiftimi në kohë reale dhe delegimi i detyrave—duke u bashkuar. Zhvilluesit do të bashkëpunojnë me agjentët e IA në të gjitha IDE-të dhe mjetet e tyre të përditshme për të bërë pyetje, për të marrë sugjerime dhe për të deleguar detyra më të gjata, të gjitha në një rrjedhë pune të unifikuar.

Duke parë përpara, planifikojmë të prezantojmë rrjedha pune më interaktive dhe fleksibël për agjentët. Zhvilluesit së shpejti do të mund të ofrojnë udhëzime gjatë detyrës, të bashkëpunojnë për strategjitë e zbatimit dhe të marrin përditësime proaktive mbi progresin. Ne gjithashtu parashikojmë integrime më të thella nëpër mjetet që ti tashmë përdor: sot Codex lidhet me GitHub dhe së shpejti do të jesh në gjendje të caktosh detyra nga Codex CLI, ChatGPT Desktop apo edhe mjete të tilla si gjurmuesi yt i problemeve ose sistemi CI.

Inxhinieria e softuerit është një nga industritë e para që përjeton rritje të rëndësishme të produktivitetit të drejtuara nga IA, duke hapur mundësi të reja për individët dhe ekipet e vogla. Ndërsa jemi optimistë për këto përfitime, po bashkëpunojmë gjithashtu me partnerët për të kuptuar më mirë implikimet e adoptimit të gjerë të agjentëve në rrjedhat e punës së zhvilluesve, zhvillimin e aftësive midis njerëzve, nivelet e aftësive dhe vendndodhjet gjeografike.

Ky është vetëm fillimi—dhe jemi të emocionuar të shohim se çfarë do të ndërtosh me Codex.

Ritransmetim i drejtpërdrejtë

Shtojca

Mesazh sistemi

Ne po ndajmë mesazhin e sistemit codex-1 për të ndihmuar zhvilluesit të kuptojnë sjelljen e parazgjedhur të modelit dhe ta përshtatin Codex që të funksionojë në mënyrë efektive në proceset e personalizuara të punës. Për shembull, mesazhi i sistemit codex-1 in e nxit Codex të kryejë të gjitha testet e përmendura në skedarin AGENTS.md, por nëse ke pak kohë, mund t'i kërkosh Codex t'i kapërcejë këto teste.

Tekst i thjeshtë

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Autor

OpenAI