2025 ж. 16 мамыр

Codex-пен таныстыру

codex-1 негізіндегі, параллель көп тапсырмада жұмыс істей алатын бұлттық бағдарламалық инженерия агенті. Бүгін ChatGPT Pro, Business және Enterprise пайдаланушыларына, ал жақында Plus пайдаланушыларына қолжетімді.

Codex-ті қолданып көріңіз

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Жүктелуде…

2025 жылғы 3 маусымдағы жаңарту: Codex енді ChatGPT Plus пайдаланушыларына да қолжетімді. Сондай-ақ тапсырманы орындау кезінде пайдаланушылардың Codex-ке интернетке қолжеткізу беруін қосып жатырмыз. Қосымша мәлімет үшін өзгерістер журналын⁠(жаңа терезеде ашылады) және құжаттаманы⁠(жаңа терезеде ашылады) қараңыз.

Бүгін біз Codex-тің зерттеу алдын ала қарауын іске қосып отырмыз: бұл параллель көптеген тапсырмада жұмыс істей алатын бұлттық бағдарламалық инженерия агенті. Codex сіз үшін функциялар жазу, код базаңыз туралы сұрақтарға жауап беру, қателерді түзету және шолу үшін өзгеріс сұраныстарын ұсыну сияқты тапсырмаларды орындай алады; әр тапсырма репозиторийіңіз алдын ала жүктелген өз бұлттық sandbox ортасында орындалады.

Codex-тің негізінде бағдарламалық инженерияға оңтайландырылған OpenAI o3 нұсқасы — codex-1 жатыр. Ол адам стилі мен PR талғамына жақын код жасау, нұсқауларды дәл орындау және сәтті нәтиже алғанша тесттерді итеративті іске қоса алу үшін әртүрлі ортадағы нақты кодтау тапсырмаларында күшейтпелі оқыту арқылы үйретілді. Бүгіннен бастап біз Codex-ті ChatGPT Pro, Enterprise және Business пайдаланушыларына ұсына бастаймыз, ал Plus пен Edu қолдауы жақында келеді.

Codex қалай жұмыс істейді

Бүгіннен бастап Codex-ке ChatGPT ішіндегі бүйірлік панель арқылы кіріп, көмексөз теріп, «Code» түймесін басу арқылы оған жаңа кодтау тапсырмаларын бере аласыз. Егер Codex-ке код базаңыз туралы сұрақ қойғыңыз келсе, «Ask» түймесін басыңыз. Әр тапсырма код базаңыз алдын ала жүктелген бөлек, оқшауланған ортада дербес өңделеді. Codex файлдарды оқып, өңдей алады, сондай-ақ тест harness-тері, линтерлер және тип тексергіштерді қоса алғанда командаларды іске қоса алады. Тапсырманың аяқталуы әдетте күрделілігіне қарай 1 мен 30 минут арасында созылады, және Codex барысын нақты уақытта бақылай аласыз.

Codex тапсырманы аяқтағаннан кейін, ол өзгерістерін өз ортасында commit етеді. Codex өз әрекеттерінің тексерілетін дәлелдерін терминал журналдары мен тест шығыстарына сілтемелер арқылы береді, бұл тапсырманы орындау кезіндегі әр қадамды қадағалауға мүмкіндік береді. Содан кейін нәтижелерді қарап, қосымша түзетулер сұрай аласыз, GitHub өзгеріс сұранысын аша аласыз немесе өзгерістерді тікелей жергілікті ортаңызға біріктіре аласыз. Өнімде Codex ортасын нақты әзірлеу ортаңызға барынша жақын етіп теңшей аласыз.

Codex-ті репозиторийіңіздің ішінде орналасқан AGENTS.md файлдары арқылы бағыттауға болады. Бұлар README.md тәрізді мәтіндік файлдар, онда Codex-ке код базаңызды қалай шарлау керегін, тестілеу үшін қай командаларды іске қосу керегін және жобаңыздың стандартты тәжірибелерін қалай жақсы ұстану керегін көрсете аласыз. Адам әзірлеушілер сияқты, Codex агенттері де бапталған dev орталары, сенімді тестілеу баптаулары және анық құжаттама берілгенде ең жақсы жұмыс істейді.

Кодтау бағалаулары мен ішкі бенчмарктерде codex-1 AGENTS.md файлдарынсыз немесе теңшелген scaffolding-сіз де мықты нәтиже көрсетеді.

Ішкі инфрақұрылымымызда іске қосылмайтын 23 SWE-Bench Verified үлгісі алынып тасталды. codex-1 ең көп дегенде 192k токен контекст ұзындығында және орташа «reasoning effort» параметрімен сыналды, бұл бүгін өнімде қолжетімді болатын баптау. o3 бағалаулары туралы толық ақпаратты осы жерден⁠ қараңыз.

Біздің ішкі SWE тапсырма бенчмаркі — OpenAI ішіндегі нақты әлемдік SWE тапсырмаларының іріктелген жиынтығы.

Қауіпсіз және сенімді агенттерді құру

Біз Codex-ті итерациялық енгізу стратегиямызға сай зерттеу алдын ала қарауы ретінде шығарып жатырмыз. Codex-ті жобалау кезінде қауіпсіздік пен ашықтыққа басымдық бердік, сондықтан пайдаланушылар оның нәтижелерін тексере алады — бұл AI модельдері барған сайын күрделі кодтау тапсырмаларын дербес орындай бастаған сайын және қауіпсіздік мәселелері дамыған сайын маңызы арта түсетін қорғаныс шарасы. Пайдаланушылар Codex жұмысын сілтемелер, терминал журналдары және тест нәтижелері арқылы тексере алады. Белгісіздік туындағанда немесе тесттер сәтсіз аяқталғанда, Codex агенті бұл мәселелерді ашық хабарлайды, осылайша пайдаланушылар әрі қарай қалай жүру керегін саналы түрде шеше алады. Соған қарамастан, біріктіру мен орындаудың алдында агент жасаған барлық кодты қолмен қарап, тексеру әлі де өте маңызды.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Адам талғамына сәйкестендіру

codex-1-ді үйрету кезіндегі негізгі мақсаттардың бірі шығыстарды адам кодтау талғамдары мен стандарттарына барынша жақын келтіру болды. OpenAI o3‑пен салыстырғанда, codex-1 стандартты жұмыс ағындарына бірден адам шолуы мен біріктіруге дайын неғұрлым таза патчтарды тұрақты түрде шығарады.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Теріс пайдаланудың алдын алу

Зиянды БҚ әзірлеу сияқты AI басқаратын бағдарламалық инженерияның қаскүнемдік қолданылуларынан қорғану барған сайын маңызды болуда. Сонымен бірге қорғаныс шаралары кейде зиянды БҚ жасауда да қолданылатын, мысалы төмен деңгейлі ядро инженериясы сияқты, заңды әрі пайдалы қолдануларға орынсыз кедергі келтірмеуі маңызды.

Қауіпсіздік пен пайдалықты тең ұстау үшін Codex зиянды бағдарламаны әзірлеуге бағытталған сұрауларды анықтап, дәл бас тартуға үйретілді, сонымен қатар заңды тапсырмаларды айқын ажыратып, қолдайды. Біз саясат шеңберлерімізді де күшейтіп, бұл шекараларды тиімді нығайту үшін қатаң қауіпсіздік бағалауларын енгіздік. Осы бағалауларды көрсету үшін o3 жүйе картасына қосымшаны⁠ жарияладық.

Қауіпсіз орындау

Codex агенті бұлттағы қауіпсіз, оқшауланған контейнер ішінде толықтай жұмыс істейді. Тапсырманы орындау кезінде интернетке қолжеткізу өшіріледі, сондықтан агенттің өзара әрекеті тек GitHub репозиторийлері арқылы анық берілген кодпен және пайдаланушы баптау скрипті арқылы теңшеген алдын ала орнатылған тәуелділіктермен шектеледі. Агент сыртқы веб-сайттарға, API-лерге немесе басқа қызметтерге кіре алмайды.

Ерте қолдану жағдайлары

OpenAI-дегі техникалық командалар Codex-ті күнделікті құралдар жиынтығының бір бөлігі ретінде қолдана бастады. OpenAI инженерлері оны көбіне назарды бөлетін қайталанатын, ауқымы нақты тапсырмаларды, мысалы рефакторинг, қайта атау және тест жазуды, өзінен алып тастау үшін пайдаланады. Ол жаңа функцияларға қаңқа жасауға, компоненттерді жалғауға, қателерді түзетуге және құжаттама нобайын дайындауға да бірдей пайдалы. Командалар оның айналасында жаңа дағдылар қалыптастырып жатыр: кезекші мәселелерді іріктеу, күн басында тапсырмаларды жоспарлау және ілгерілеуді сақтау үшін фондық жұмысты жүктеп беру. Контекст ауыстыруды азайтып, ұмыт қалған to-do-ларды шығару арқылы Codex инженерлерге тезірек жеткізуге және ең маңыздысына назар аударуға көмектеседі.

Шығарылым алдында біз Codex-тің әртүрлі код базаларында, әзірлеу процестерінде және командаларда қалай жұмыс істейтінін жақсырақ түсіну үшін сыртқы тестілеушілердің шағын тобымен де жұмыс істедік.

Cisco⁠(жаңа терезеде ашылады) Codex олардың инженерлік командаларына өршіл идеяларды жылдамырақ іске асыруға қалай көмектесе алатынын зерттеп жатыр. Ерте дизайн серіктесі ретінде Cisco өз өнімдер портфеліндегі нақты қолдану жағдайларында бағалау жүргізіп, OpenAI командасына кері байланыс беру арқылы Codex-тің болашағын қалыптастыруға көмектесуде.
Temporal⁠(жаңа терезеде ашылады) Codex-ті функция әзірлеуді жеделдетуге, ақауларды жөндеуге, тесттер жазып орындауға және үлкен код базаларын рефакторингтеуге пайдаланады. Ол сондай-ақ күрделі тапсырмаларды фонда орындап, инженерлердің жұмыс ырғағын сақтай отырып, итерацияны жылдамдатып, назарды жоғалтпауға көмектеседі.
Superhuman⁠(жаңа терезеде ашылады) Codex-ті тест қамтуын жақсарту және интеграция қателерін түзету сияқты шағын, бірақ қайталанатын тапсырмаларды жеделдету үшін қолданады. Сондай-ақ бұл оларға код шолуын қоспағанда, инженерді тартпай-ақ өнім менеджерлеріне жеңіл код өзгерістерін енгізуге мүмкіндік беру арқылы жылдамырақ жеткізуге көмектеседі.
Kodiak⁠(жаңа терезеде ашылады) Codex-ті жөндеу құралдарын жазуға, тест қамтуын жақсартуға және кодты рефакторингтеуге көмектесу үшін пайдаланып, олардың автономды жүргізу технологиясы — Kodiak Driver-ді әзірлеуді жеделдетіп жатыр. Codex сонымен қатар инженерлерге стектің бейтаныс бөліктерін түсінуге көмектесетін, өзекті контекст пен бұрынғы өзгерістерді көрсететін құнды анықтамалық құралға айналды.

Ерте тестілеушілерден алынған сабақтарға сүйене отырып, біз бірнеше агентке бір уақытта шекарасы анықталған тапсырмалар беруді және модель мүмкіндіктерін тиімді зерттеу үшін әртүрлі тапсырма түрлері мен көмексөздерді сынап көруді ұсынамыз.

Codex CLI жаңартулары

Өткен айда біз терминалыңызда жұмыс істейтін, ашық бастапқы коды бар жеңіл кодтау агенті Codex CLI-ді іске қостық. Ол o3 және o4-mini сияқты модельдердің қуатын жергілікті жұмыс ағыныңызға әкеліп, тапсырмаларды жылдамырақ аяқтау үшін олармен жұптасуды жеңілдетеді.

Бүгін біз codex-1-дің кішірек нұсқасын да шығарып жатырмыз, бұл Codex CLI-де қолдануға арнайы жасалған o4-mini нұсқасы. Бұл жаңа модель CLI-дегі жұмыс ағындарын жылдамдатады және кідірісі төмен код бойынша сұрақ-жауап пен өңдеуге оңтайландырылған, сонымен бірге нұсқауларды орындау мен стильдегі сол артықшылықтарын сақтайды. Ол қазір Codex CLI-дегі әдепкі модель ретінде және API-де codex-mini-latest атауымен қолжетімді. Codex-mini моделін жақсартуды жалғастырған сайын, оның негізіндегі снапшот тұрақты түрде жаңартылып отырады.

Сондай-ақ әзірлеуші аккаунтыңызды Codex CLI-ге қосуды әлдеқайда оңайлатып жатырмыз. Енді API токенін қолмен жасап, баптаудың орнына ChatGPT аккаунтыңызбен кіріп, қолданғыңыз келетін API ұйымын таңдай аласыз. Біз API кілтін автоматты түрде жасап, баптап береміз. Бұған қоса, ChatGPT арқылы Codex CLI-ге кірген Plus және Pro пайдаланушылары сәйкесінше $5 және $50 көлеміндегі тегін API кредиттерін келесі 30 күнге бүгіннен бастап ала алады.

Codex қолжетімділігі, бағасы және шектеулері

Бүгіннен бастап біз Codex-ті әлем бойынша ChatGPT Pro, Enterprise және Business пайдаланушыларына ұсына бастаймыз, ал Plus пен Edu қолдауы жақында келеді. Алдағы апталарда пайдаланушылар Codex не істей алатынын зерттей алуы үшін жомарт қолжеткізу қосымша ақысыз болады, содан кейін біз rate-limited қолжеткізуді және қажет кезде қосымша пайдалануды сатып алуға мүмкіндік беретін икемді баға нұсқаларын енгіземіз. Жақын арада қолжеткізуді Plus және Edu пайдаланушыларына да кеңейтуді жоспарлап отырмыз.

codex-mini-latest негізінде жасап жатқан әзірлеушілер үшін модель Responses API-де қолжетімді және бағасы 1M кіріс токеніне $1.50 және 1M шығыс токеніне $6, көмексөз кэштеуге 75% жеңілдікпен.

Codex әлі де дамуының ерте кезеңінде. Зерттеу алдын ала қарауы ретінде, қазір онда frontend жұмысына арналған кескін енгізу және жұмыс кезінде агенттің бағытын түзету мүмкіндігі сияқты функциялар жоқ. Бұған қоса, қашықтағы агентке тапсыру интерактивті өңдеуге қарағанда ұзағырақ уақыт алады, бұған үйрену керек болуы мүмкін. Уақыт өте келе Codex агенттерімен өзара әрекеттесу әріптестермен асинхронды ынтымақтастыққа көбірек ұқсай түседі. Модель мүмкіндіктері дамыған сайын, агенттер ұзақ уақыт аралығында күрделірек тапсырмаларды орындайды деп күтеміз.

Келесі не

Біз болашақты әзірлеушілер өздері иелік еткісі келетін жұмысты жүргізіп, қалғанын агенттерге тапсыратын, AI көмегімен жылдамырақ әрі өнімдірек болатын орта ретінде елестетеміз. Соған жету үшін біз нақты уақыттағы бірлескен жұмысты да, асинхронды тапсыруды да қолдайтын Codex құралдарының жиынтығын жасап жатырмыз.

Codex CLI және басқа да AI құралдарымен жұптасып жұмыс істеу тез арада салалық нормаға айналып, әзірлеушілерге код жазу барысында жылдамырақ ілгерілеуге көмектесіп отыр. Бірақ біздің ойымызша, ChatGPT ішіндегі Codex енгізген асинхронды, көп агентті жұмыс ағыны инженерлердің жоғары сапалы код жасауының де-факто тәсіліне айналады.

Түптеп келгенде, біз өзара әрекеттесудің осы екі режимі — нақты уақыттағы жұптасу мен тапсырма тапсыру — тоғысады деп санаймыз. Әзірлеушілер AI агенттерімен IDE-лері мен күнделікті құралдары арқылы сұрақ қою, ұсыныстар алу және ұзақтау тапсырмаларды жүктеп беру үшін біртұтас жұмыс ағынында ынтымақтасады.

Алға қарай біз анағұрлым интерактивті және икемді агенттік жұмыс ағындарын енгізуді жоспарлап отырмыз. Жақын арада әзірлеушілер тапсырма ортасында нұсқаулық бере алады, іске асыру стратегияларында бірлесе жұмыс істей алады және прогресс туралы проактивті жаңартулар ала алады. Сондай-ақ қазірдің өзінде қолданатын құралдармен тереңірек интеграцияларды елестетеміз: бүгінде Codex GitHub-пен қосылады, ал жақында Codex CLI, ChatGPT Desktop немесе тіпті мәселе трекері не CI жүйесі сияқты құралдардан тапсырма бере аласыз.

Бағдарламалық инженерия — AI негізіндегі өнімділік өсімін айтарлықтай сезінген алғашқы салалардың бірі, бұл жеке адамдар мен шағын командалар үшін жаңа мүмкіндіктер ашады. Біз бұл артықшылықтарға оптимистік көзқарастамыз, бірақ сонымен қатар агенттердің кең таралуының әзірлеуші жұмыс ағындарына, адамдар арасындағы дағды дамуына, біліктілік деңгейлері мен географияларға әсерін жақсырақ түсіну үшін серіктестермен де жұмыс істеп жатырмыз.

Бұл тек бастамасы ғана — және Codex-пен не құратыныңызды көруге асықпыз.

Тікелей эфир жазбасы

Қосымша

Жүйелік хабарлама

Әзірлеушілерге модельдің әдепкі мінез-құлқын түсінуге және Codex-ті теңшелген жұмыс ағындарында тиімді істеуге бейімдеуге көмектесу үшін codex-1 жүйелік хабарламасын бөлісіп отырмыз. Мысалы, codex-1 жүйелік хабарламасы Codex-ті AGENTS.md файлында аталған барлық тесттерді іске қосуға ынталандырады, бірақ уақытыңыз аз болса, Codex-тен бұл тесттерді өткізіп жіберуді сұрай аласыз.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Автор

OpenAI