16. mája 2025

Predstavujeme Codex

Cloudový agent na vývoj softvéru, ktorý dokáže pracovať na mnohých úlohách súbežne a je postavený na agentovi codex-1. Už k dispozícii pre používateľov ChatGPT Pro, Business a Enterprise, čoskoro aj pre používateľov Plus.

Vyskúšajte Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Načítava sa…

Aktualizácia z 3. júna 2025: Codex je teraz k dispozícii pre používateľov ChatGPT Plus. Taktiež umožňujeme používateľom povoliť Codexu prístup na internet počas vykonávania úloh. Viac informácií nájdete v zozname zmien⁠(otvorí sa v novom okne) a dokumentácii⁠(otvorí sa v novom okne).

Dnes spúšťame výskumnú ukážku Codexu: cloudového agenta na vývoj softvéru, ktorý dokáže pracovať na mnohých úlohách súbežne. Codex môže pre vás vykonávať rôzne úlohy, ako sú písanie funkcií, odpovedanie na otázky týkajúce sa kódu, opravovanie chýb a navrhovanie kontroly žiadostí o prijatie zmien, pričom každá úloha beží vo vlastnom cloudovom sandboxe, v ktorom je vopred načítaný váš repozitár.

Codex je postavený na agentovi codex-1, verzii modelu OpenAI o3, ktorý je optimalizovaný pre vývoj softvéru. Bol vytrénovaný pomocou učenia posilňovaním na reálnych úlohách programovania v rôznych prostrediach, aby generoval kód, ktorý presne odráža ľudský štýl a preferencie PR, striktne dodržiava pokyny a dokáže iteratívne vykonávať testy, kým nedosiahne úspešný výsledok. Dnes začíname zavádzať Codex pre používateľov ChatGPT Pro, Enterprise a Business, pričom podpora pre Plus a Edu bude k dispozícii čoskoro.

Ako funguje Codex

Dnes máte prístup ku Codexu cez bočný panel v ChatGPT a môžete mu prideliť nové úlohy kódovania tak, že napíšete príkaz a kliknete na „Kód“. Ak chcete položiť Codexu otázku ohľadom vašej kódovej základne, kliknite na „Opýtať sa“. Každá úloha sa spracováva nezávisle v samostatnom, izolovanom prostredí, ktoré je predinštalované s vašou kódovou základňou. Codex dokáže čítať a upravovať súbory, ako aj spúšťať príkazy vrátane testovacích rámcov, linterov a kontrolórov typov. Dokončenie úlohy zvyčajne trvá medzi 1 a 30 minútami v závislosti od zložitosti a postup Codexu môžete sledovať v reálnom čase.

Po dokončení úlohy Codex zapíše svoje zmeny do svojho prostredia. Codex poskytuje overiteľné záznamy o svojich akciách prostredníctvom citácií z protokolov terminálov a výstupov testov, čo vám umožňuje sledovať každý krok vykonaný počas plnenia úlohy. Potom môžete skontrolovať výsledky, požiadať o ďalšie úpravy, otvoriť žiadosť o prijatie zmien na GitHube alebo priamo integrovať zmeny do svojho lokálneho prostredia. V produkte môžete nakonfigurovať prostredie Codex tak, aby čo najviac zodpovedalo vášmu skutočnému vývojovému prostrediu.

Codex môže byť riadený súbormi AGENTS.md vo vašom repozitári. Sú to textové súbory, podobné README.md, pomocou ktorých môžete Codexu povedať, ako sa má orientovať vo vašej kódovej základni, ktoré príkazy má spustiť na testovanie a ako najlepšie dodržiavať štandardné postupy vášho projektu. Podobne ako ľudia, ktorí vyvíjajú softvér, aj agenti Codex dosahujú najlepšie výsledky, ak majú k dispozícii nakonfigurované vývojárske prostredia, spoľahlivé testovacie nastavenia a jasnú dokumentáciu.

Pri hodnotení kódovania a interných benchmarkoch vykazuje codex-1 vysoký výkon aj bez súborov AGENTS.md alebo vlastných štruktúr.

23 vzoriek SWE-Bench Verified, ktoré sa nedali spustiť v internej infraštruktúre, bolo vylúčených. Agent codex-1 bol testovaný pri maximálnej dĺžke kontextu 192 000 tokenov a strednej „náročnosti myslenia“, čo je nastavenie, ktoré bude dnes k dispozícii v produkte. Podrobnosti o hodnoteniach modelu o3 nájdete na tejto stránke⁠.

Náš interný benchmark úloh SWE je vybraný súbor reálnych interných úloh SWE v OpenAI.

Budovanie bezpečných a dôveryhodných agentov

V súlade s našou stratégiou postupného nasadenia vydávame Codex ako predbežnú verziu na výskumné účely. Pri navrhovaní Codexu sme kládli dôraz na bezpečnosť a transparentnosť, aby používatelia mohli overovať jeho výstupy – ide o bezpečnostné opatrenie, ktoré nadobúda čoraz väčší význam, keďže modely umelej inteligencie samostatne spracúvajú zložitejšie úlohy kódovania a bezpečnostné hľadiská sa neustále vyvíjajú. Používatelia môžu skontrolovať prácu Codexu prostredníctvom citácií, protokolov terminálu a výsledkov testov. V prípade neistoty alebo neúspešných testov agent Codex výslovne oznamuje tieto problémy, čím umožňuje používateľom prijať informované rozhodnutia o ďalšom postupe. Pre používateľov je naďalej nevyhnutné, aby pred integráciou a spustením manuálne skontrolovali a overili všetok kód generovaný agentom.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Zosúladenie s ľudskými preferenciami

Hlavným cieľom pri trénovaní agenta codex-1 bolo úzko zosúladiť výstupy s preferenciami a normami ľudského kódovania. V porovnaní s modelom OpenAI o3, agent codex-1 konzistentne produkuje čistejšie opravy, ktoré sú pripravené na okamžitú kontrolu človekom a integráciu do štandardných pracovných postupov.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Prevencia zneužívania

Ochrana pred zneužitím vývoja softvéru pomocou umelej inteligencie, ako je vývoj škodlivého softvéru, je čoraz dôležitejšia. Zároveň je však potrebné dbať na to, aby ochranné opatrenia zbytočne neobmedzovali legitímne a prospešné aplikácie, ktoré môžu zahŕňať techniky, ktoré sa niekedy používajú aj na vývoj škodlivého softvéru, ako je napríklad low‑level kernel engineering.

Aby sa dosiahla rovnováha medzi bezpečnosťou a užitočnosťou, Codex bol vytrénovaný tak, aby identifikoval a odmietol len požiadavky zamerané na vývoj škodlivého softvéru, pričom jasne rozlišoval a podporoval legitímne úlohy. Zlepšili sme tiež naše rámce zásad a zaviedli prísne bezpečnostné hodnotenia, aby sme tieto hranice účinne posilnili. Na základe týchto hodnotení sme uverejnili dodatok k systémovej karte modelu o3⁠.

Bezpečné vykonávanie

Agent Codex pracuje výlučne v bezpečnom, izolovanom kontajneri v cloude. Počas vykonávania úlohy je prístup na internet zakázaný, čím je interakcia agenta obmedzená výlučne na kód explicitne poskytnutý prostredníctvom repozitárov GitHub a predinštalovaných závislostí nakonfigurovaných používateľom prostredníctvom inštalačného skriptu. Agent nemá prístup k externým webom, rozhraniam API ani iným službám.

Prvé prípady použitia

Technické tímy v OpenAI začali používať Codex ako súčasť svojich každodenných nástrojov. Najčastejšie ho používajú inžinieri OpenAI na odbremenenie sa od opakovaných, presne vymedzených úloh, ako sú refaktoring, premenovávanie a písanie testov, ktoré by inak narušili ich sústredenie. Je rovnako užitočný pri vytváraní nových funkcií, prepojení komponentov, oprave chýb a príprave dokumentácie. Tímy si v súvislosti s tým vytvárajú nové návyky: triedenie hlásených problémov, plánovanie úloh na začiatku dňa a odbúravanie vedľajšej práce, aby mohli napredovať Znížením prepínania medzi kontextmi a odhalením zabudnutých úloh pomáha Codex inžinierom pracovať rýchlejšie a sústrediť sa na to, čo je najdôležitejšie.

Pred vydaním sme tiež spolupracovali s malou skupinou externých testerov, aby sme lepšie pochopili, ako Codex funguje v rôznych kódových základniach, vývojových procesoch a tímoch.

Cisco⁠(otvorí sa v novom okne) skúma, ako môže Codex pomôcť ich technickým tímom rýchlejšie realizovať ambiciózne nápady. Ako jeden z prvých partnerov v oblasti návrhu, spoločnosť Cisco pomáha formovať budúcnosť Codexu tým, že ho hodnotí na základe reálnych prípadov použitia v rámci svojho portfólia produktov a poskytuje spätnú väzbu tímu OpenAI.
Temporal⁠(otvorí sa v novom okne) využíva Codex na urýchlenie vývoja funkcií, odstraňovanie chýb, písanie a vykonávanie testov a refaktorizáciu veľkých kódových základní. Pomáha im tiež udržiavať pozornosť tým, že zložité úlohy vykonáva na pozadí, čím udržuje inžinierov v pracovnom tempe a zároveň urýchľuje iteráciu.
Superhuman⁠(otvorí sa v novom okne) používa Codex na urýchlenie malých, ale opakujúcich sa úloh, ako je zlepšenie pokrytia testov a oprava chýb pri integrácii. Pomáha im tiež rýchlejšie dodávať produkty, pretože produktovým manažérom umožňuje vykonávať jednoduché zmeny kódu bez toho, aby museli zapájať inžinierov, s výnimkou kontroly kódu.
Kodiak⁠(otvorí sa v novom okne) využíva Codex na pomoc pri písaní ladiacich nástrojov, zlepšovaní pokrytia testov a refaktorizácii kódu, čím urýchľuje vývoj Kodiak Driver, svojej technológie autonómneho riadenia. Codex sa stal aj cenným referenčným nástrojom, ktorý pomáha inžinierom porozumieť neznámym častiam stacku tým, že zobrazuje relevantný kontext a minulé zmeny.

Na základe poznatkov získaných od prvých testerov odporúčame prideľovať jasne vymedzené úlohy viacerým agentom súčasne a experimentovať s rôznymi typmi úloh a príkazov, aby ste efektívne preskúmali možnosti modelu.

Aktualizácie Codex CLI

Minulý mesiac sme uviedli odľahčeného programovacieho agenta Codex CLI, ktorý beží vo vašom termináli. Prináša výkon modelov ako o3 a o4-mini do vášho lokálneho pracovného postupu, čím uľahčuje ich spárovanie a umožňuje rýchlejšie dokončenie úloh.

Dnes tiež vydávame menšiu verziu agenta codex-1, verziu o4-mini navrhnutú špeciálne pre použitie v Codex CLI. Tento nový model podporuje rýchlejšie pracovné postupy v prostredí CLI a je optimalizovaný pre otázky a odpovede týkajúce sa kódu s nízkou latenciou a úpravy, pričom si zachováva rovnaké silné stránky, pokiaľ ide o dodržiavanie pokynov a štýl. Teraz je k dispozícii ako predvolený model v Codex CLI a v API ako codex-mini-latest. Podkladová snímka bude pravidelne aktualizovaná, keďže pokračujeme v zdokonaľovaní modelu Codex-mini.

Tiež výrazne zjednodušujeme pripojenie vášho vývojárskeho účetu ku Codex CLI. Namiesto ručného generovania a konfigurácie tokenu API sa teraz môžete prihlásiť pomocou svojho účtu ChatGPT a vybrať organizáciu API, ktorú chcete používať. Automaticky pre vás vygenerujeme a nakonfigurujeme kľúč API. Používatelia taríf Plus a Pro, ktorí sa do Codex CLI prihlásia s účtom ChatGPT, môžu tiež začať využívať bezplatné kredity API v hodnote 5 USD, resp. 50 USD, a to ešte dnes a počas nasledujúcich 30 dní.

Dostupnosť, ceny a obmedzenia Codexu

Oddnes zavádzame Codex pre používateľov ChatGPT Pro, Enterprise a Business po celom svete, pričom podpora pre Plus a Edu bude k dispozícii čoskoro. Používatelia budú mať v nasledujúcich týždňoch bezplatný prístup bez ďalších nákladov, aby mohli vyskúšať, čo všetko Codex dokáže. Potom zavedieme prístup s obmedzenou kapacitou a flexibilné cenové možnosti, ktoré vám umožnia zakúpiť si ďalšie využitie podľa potreby. Plánujeme čoskoro rozšíriť prístup pre používateľov taríf Plus a Edu.

Vývojárom, ktorí používajú codex-mini-latest, je model k dispozícii v rozhraní Responses API za cenu 1,50 USD za 1 milión vstupných tokenov a 6 USD za 1 milión výstupných tokenov, so 75 % zľavou na ukladanie príkazov do vyrovnávacej pamäte.

Codex je stále v ranej fáze svojho vývoja. Ako vývojová ukážka momentálne neobsahuje funkcie ako obrazové vstupy pre frontendové úlohy a možnosť korigovať agenta počas jeho práce. Okrem toho delegovanie na vzdialeného agenta trvá dlhšie ako interaktívne editovanie, na čo si možno budete musieť chvíľu zvykať. Postupom času bude interakcia s agentmi Codexu čoraz viac pripomínať asynchrónnu spoluprácu s kolegami. S rozvojom schopností modelu predpokladáme, že agenti budú v dlhšom časovom horizonte riešiť zložitejšie úlohy.

Čo bude ďalej

Predstavujeme si budúcnosť, v ktorej vývojári riadia prácu a ostatné úlohy delegujú na agentov – vďaka umelej inteligencii pracujú rýchlejšie a sú produktívnejší. Na dosiahnutie tohto cieľa vytvárame súbor nástrojov Codex, ktoré podporujú spoluprácu v reálnom čase aj asynchrónne delegovanie.

Spojenie s AI nástrojmi, ako sú Codex CLI a ďalšie, sa rýchlo stalo normou v odvetví a pomáha vývojárom napredovať rýchlejšie pri programovaní. My však veríme, že asynchrónny multiagentný pracovný postup, ktorý Codex zavádza v ChatGPT, sa stane de facto spôsobom, akým vývojári vytvárajú vysoko kvalitný kód.

V konečnom dôsledku vidíme, že tieto dva spôsoby interakcie – spájanie v reálnom čase a delegovanie úloh – sa zbližujú. Vývojári budú spolupracovať s AI agentmi vo svojich vývojových prostrediach a každodenných nástrojoch, aby kládli otázky, získavali návrhy a delegovali časovo náročnejšie úlohy, a to všetko v rámci jednotného pracovného postupu.

Do budúcnosti plánujeme zaviesť viac interaktívnych a flexibilných pracovných postupov agentov. Vývojári budú čoskoro môcť poskytovať usmernenia počas vykonávania úloh, spolupracovať na implementačných stratégiách a dostávať proaktívne aktuálne informácie o priebehu. Takisto plánujeme hlbšiu integráciu s nástrojmi, ktoré už používate: dnes je Codex prepojený s GitHubom a čoskoro budete môcť prideľovať úlohy z Codex CLI, ChatGPT pre počítače alebo dokonca z nástrojov, ako sú váš systém na sledovanie problémov alebo CI systém.

Vývoj softvéru je jedným z prvých odvetví, ktoré zažíva významný nárast produktivity vďaka umelej inteligencii, čím sa otvárajú nové možnosti pre jednotlivcov a malé tímy. Hoci sme optimistickí, pokiaľ ide o tieto úspechy, v spolupráci s partnermi sa snažíme lepšie pochopiť dôsledky širokého zavádzania agentov na pracovné postupy vývojárov, rozvoj zručností ľudí, úrovne zručností a geografické oblasti.

Toto je len začiatok – a tešíme sa na to, čo s Codexom vytvoríte.

Záznam z priameho prenosu

Príloha

Systémová správa

Zdieľame systémovú správu codex-1, aby sme vývojárom pomohli pochopiť predvolené správanie modelu a prispôsobiť Codex tak, aby efektívne fungoval v prispôsobených pracovných postupoch. Napríklad systémová správa codex-1 nabáda Codex, aby spustil všetky testy uvedené v súbore AGENTS.md, ale ak máte málo času, môžete Codex požiadať, aby tieto testy preskočil.

Obyčajný text

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Autor

OpenAI