16 մայիսի, 2025 թ.

Ներկայացնում ենք Codex-ը

Ամպային ծրագրային ապահովման ինժեներական ագենտ, որը կարող է զուգահեռաբար աշխատել բազմաթիվ առաջադրանքների վրա՝ Codex-1-ի միջոցով։ Այսօր հասանելի է ChatGPT Pro, Business և Enterprise օգտատերերին, իսկ շուտով՝ Plus օգտատերերին։

Փորձեք Codex-ը

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Բեռնվում է…

Թարմացում՝ 2025 թվականի հունիսի 3-ին. Codex-ը այժմ հասանելի է ChatGPT Plus օգտատերերի համար: Մենք նաև հնարավորություն ենք տալիս օգտատերերին Codex-ին տրամադրել ինտերնետ հասանելիություն առաջադրանքի կատարման ընթացքում: Խնդրում ենք ծանոթանալ փոփոխությունների ցանկին⁠(բացվում է նոր պատուհանում)ևփաստաթղթերին՝⁠(բացվում է նոր պատուհանում) ավելի մանրամասն տեղեկությունների համար:

Այսօր մենք գործարկում ենք Codex-ի հետազոտական նախադիտումը, ամպային ծրագրային ապահովման ինժեներական ագենտ, որը կարող է զուգահեռաբար աշխատել բազմաթիվ առաջադրանքների վրա։ Codex-ը կարող է կատարել առաջադրանքներ Ձեզ համար, ինչպիսիք են ֆունկցիաների գրումը, Ձեր կոդային բազայի վերաբերյալ հարցերին պատասխանելը, սխալների շտկումը և վերանայման հարցումների առաջարկումը, յուրաքանչյուր առաջադրանք աշխատում է իր սեփական ամպային ավազարկղի միջավայրում, նախապես բեռնված Ձեր պահոցով։

Codex-ը աշխատում է codex-1-ի հիման վրա, որը OpenAI o3‑ի տարբերակն է, օպտիմալացված ծրագրային ապահովման ճարտարագիտության համար։ Այն ուսուցանվել է ամրապնդումով ուսուցմամբ՝ իրական աշխարհի կոդավորման առաջադրանքների վրա տարբեր միջավայրերում, որպեսզի գեներացնի կոդ, որը սերտորեն արտացոլում է մարդկային ոճը և PR նախասիրությունները, ճշգրտորեն հետևում է հրահանգներին և կարող է կրկնել թեստերը, մինչև ստանա անցողիկ արդյունք։ Մենք այսօր սկսում ենք Codex-ը թողարկել ChatGPT Pro, Enterprise և Business օգտատերերի համար, իսկ Plus և Edu-ի աջակցումը շուտով կլինի։

Ինչպես է աշխատում Codex-ը

Այսօր դուք կարող եք մուտք գործել Codex ChatGPT‑ի կողագոտու միջոցով և դրան նոր կոդավորման առաջադրանքներ հանձնարարել՝ մուտքագրելով հարցում և սեղմելով «Կոդ»։ Եթե ցանկանում եք Codex-ին հարց տալ ձեր կոդային բազայի վերաբերյալ, սեղմեք «Հարցնել»։ Յուրաքանչյուր առաջադրանք մշակվում է անկախ՝ առանձին, մեկուսացված միջավայրում, նախապես բեռնված ձեր կոդային բազայով։ Codex-ը կարող է կարդալ և խմբագրել ֆայլեր, ինչպես նաև կատարել հրամաններ, այդ թվում՝ թեստային հարմարանքներ, լինթերներ և տիպի ստուգիչներ: Առաջադրանքի ավարտը սովորաբար տևում է 1-ից 30 րոպե՝ կախված բարդությունից, և դուք կարող եք հետևել Codex-ի առաջընթացին իրական ժամանակում։

Երբ Codex-ն ավարտում է առաջադրանքը, այն կատարում է իր փոփոխությունները իր միջավայրում։ Codex-ը տրամադրում է իր գործողությունների ստուգելի ապացույցներ տերմինալային մատյանների և թեստային արտածումների մեջբերումների միջոցով, ինչը թույլ է տալիս Ձեզ հետևել առաջադրանքի կատարման ընթացքում կատարված յուրաքանչյուր քայլին։ Այնուհետև Դուք կարող եք վերանայել արդյունքները, պահանջել հետագա վերանայումներ, բացել GitHub pull request կամ ուղղակիորեն ինտեգրել փոփոխությունները Ձեր տեղական միջավայրում։ Արտադրանքում Դուք կարող եք կարգավորել Codex միջավայրը՝ հնարավորինս մոտեցնելով այն Ձեր իրական մշակման միջավայրին։

Codex-ը կարող է ուղղորդվել ձեր պահոցում տեղադրված AGENTS.md ֆայլերով: Դրանք տեքստային ֆայլեր են՝ README.md-ին նման, որտեղ դուք կարող եք Codex-ին տեղեկացնել, թե ինչպես կողմնորոշվել ձեր կոդային բազայում, որ հրամաններն իրականացնել փորձարկման համար և ինչպես լավագույնս հետևել ձեր նախագծի ստանդարտ գործելակերպին։ Ինչպես մարդիք ծրագրավորողները, Codex ագենտները նույնպես լավագույնս են աշխատում, երբ ապահովված են կարգավորված մշակման միջավայրերով, հուսալի թեստավորման կարգավորումներով և հստակ փաստաթղթավորմամբ։

Կոդավորման գնահատումների և ներքին չափորոշիչների ժամանակ codex-1-ը ցույց է տալիս բարձր արդյունավետություն նույնիսկ առանց AGENTS.md ֆայլերի կամ հատուկ սքաֆֆոլդինգի։

23 հաստատված SWE-Bench նմուշներ, որոնք չէին աշխատում մեր ներքին ենթակառուցվածքում, բացառվեցին։ Codex-1-ը փորձարկվել է առավելագույնը 192 հազար token-ի համատեքստի երկարությամբ և միջին «մտածողության ջանք» գործադրելով, որը հենց այն կարգավորումն է, որը հասանելի կլինի արտադրանքի մեջ այսօր։ o3 գնահատումների մանրամասների համար տե՛ս այստեղ⁠։

Մեր ներքին SWE առաջադրանքների չափանիշը OpenAI-ի իրական աշխարհի ներքին SWE առաջադրանքների ընտրված հավաքածու է։

Անվտանգ և վստահելի ագենտների կառուցում

Մենք թողարկում ենք Codex-ը որպես հետազոտական նախադիտում՝ համաձայն մեր փուլային տեղակայման ռազմավարության։ Codex-ը նախագծելիս մենք առաջնահերթություն տվեցինք անվտանգությանը և թափանցիկությանը, որպեսզի օգտատերերը կարողանան հաստատել դրա արտածումները՝ մի երաշխիք, որն ավելի ու ավելի կարևոր է դառնում, քանի որ ԱԲ մոդելները ինքնուրույն են կատարում ավելի բարդ կոդավորման առաջադրանքներ, և անվտանգության նկատառումները զարգանում են։ Օգտատերերը կարող են ստուգել Codex-ի աշխատանքը մեջբերումների, տերմինալների մատյանների և թեստերի արդյունքների միջոցով։ Երբ անորոշության մեջ եք կամ բախվում եք թեստային ձախողումների, Codex-ի ագենտը հստակորեն հաղորդում է այդ խնդիրների մասին՝ թույլ տալով օգտատերերին տեղեկացված որոշումներ կայացնել հետագա քայլերի վերաբերյալ։ Օգտատերերի համար դեռևս կարևոր է ձեռքով վերանայել և վավերացնել ագենտի կողմից գեներացված բոլոր կոդերը՝ ինտեգրացիայից և կատարման առաջ։

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Համապատասխանություն մարդկանց նախասիրություններին

Codex-1-ի ուսուցման հիմնական նպատակն էր արտածումները սերտորեն համապատասխանեցնել մարդկու կողմից կոդավորման նախասիրություններին և ստանդարտներին։ Համեմատած OpenAI o3‑ի հետ՝ codex-1-ը մշտապես արտադրում է ավելի մաքուր կարկատաններ, որոնք պատրաստ են անմիջապես մարդկային վերանայման և ստանդարտ աշխատանքային հոսքերի մեջ ինտեգրման համար։

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Չարաշահումների կանխարգելում

ԱԲ վրա հիմնված ծրագրային ապահովման ճարտարագիտության վնասակար հավելվածների, ինչպիսիք են վնասակար ծրագրերի մշակումը, պաշտպանվելը գնալով ավելի կարևոր է։ Միեւնույն ժամանակ, կարեւոր է, որ պաշտպանական միջոցները անհարկի չխոչընդոտեն օրինական եւ օգտակար հավելվածներին, որոնք կարող են ներառել այնպիսի մեթոդներ, որոնք երբեմն օգտագործվում են նաեւ վնասակար ծրագրերի մշակման համար, օրինակ՝ ցածր մակարդակի միջուկային ճարտարագիտություն։

Անվտանգությունն ու օգտակարությունը հավասարակշռելու համար Codex-ը վարժեցվել է վնասակար ծրագրաշարի մշակմանն ուղղված հարցումները նույնականացնելու և ճշգրիտ մերժելու համար՝ միաժամանակ հստակ տարբերակելով և աջակցելով օրինական առաջադրանքներին։ Մենք նաև բարելավել ենք մեր քաղաքականության շրջանակները և ներառել խիստ անվտանգության գնահատումներ՝ այս սահմանները արդյունավետորեն ամրապնդելու համար։ Մենք հրապարակել ենք o3 համակարգային քարտի հավելված⁠ ՝ այս գնահատականները արտացոլելու համար։

Ապահով իրականացում

Codex-ի ագենտն ամբողջությամբ գործում է ամպի մեջ գտնվող անվտանգ, մեկուսացված կոնտեյների ներսում։ Առաջադրանքի կատարման ընթացքում համացանցի հասանելիությունը անջատվում է՝ սահմանափակելով ագենտի փոխազդեցությունը միայն GitHub-ի պահոցների միջոցով հստակորեն տրամադրված կոդով և նախապես տեղադրված կախվածություններով, որոնք կարգավորվում են օգտատիրոջ կողմից setup սցենարի միջոցով։ Ագենտը չի կարող մուտք գործել արտաքին կայքեր, API-ներ կամ այլ ծառայություններ։

Վաղ կիրառման դեպքեր

OpenAI-ի տեխնիկական թիմերը սկսել են օգտագործել Codex-ը որպես իրենց ամենօրյա գործիքակազմի մաս։ Այն ամենից հաճախ օգտագործվում է OpenAI-ի ինժեներների կողմից՝ կրկնվող, լավ սահմանված առաջադրանքներից ազատվելու համար, ինչպիսիք են վերակառուցումը, վերանվանումը և թեստեր գրելը, որոնք այլապես կխաթարեին կենտրոնացումը։ Այն նույնքան օգտակար է նոր հնարավորություններ նախագծելու, բաղադրիչներ միացնելու, սխալներ շտկելու և փաստաթղթեր կազմելու համար։ Թիմերը նոր սովորություններ են ձևավորում դրա շուրջ՝ հերթապահության խնդիրները տեսակավորելով, օրվա սկզբում պլանավորելով առաջադրանքները և ֆոնային աշխատանքը թեթևացնելով՝ շարունակելու համար։ Նվազեցնելով համատեքստի փոփոխությունը և մոռացված անելիքները բացահայտելով՝ Codex-ը օգնում է ինժեներներին ավելի արագ առաքել և կենտրոնացած մնալ ամենակարևորի վրա։

Թողարկմանը նախորդող ժամանակահատվածում մենք նաև աշխատել ենք արտաքին փորձարկողների փոքր խմբի հետ՝ ավելի լավ հասկանալու համար, թե ինչպես է Codex-ը գործում տարբեր կոդային բազաներում, մշակման գործընթացներում և թիմերում։

Cisco-ն⁠(բացվում է նոր պատուհանում) ուսումնասիրում է, թե ինչպես կարող է Codex-ը օգնել իրենց ինժեներական թիմերին ավելի արագ կյանքի կոչել հավակնոտ գաղափարները։ Որպես վաղ նախագծման գործընկերներ՝ Cisco-ն օգնում է ձևավորել Codex-ի ապագան՝ գնահատելով այն իրական աշխարհի օգտագործման դեպքերի համար իրենց արտադրանքի պորտֆելում և տրամադրելով կարծիք OpenAI թիմին։
Temporal-ը⁠(բացվում է նոր պատուհանում) օգտագործում է Codex-ը՝ ֆունկցիաների մշակումը արագացնելու, վրիպազերծելու, թեստեր գրելու և իրականացնելու, ինչպես նաև մեծ կոդային բազաները վերափոխելու համար։ Այն նաև օգնում է նրանց կենտրոնացած մնալ՝ ֆոնում բարդ առաջադրանքներ կատարելով՝ ինժեներներին հոսքի մեջ պահելով և միաժամանակ արագացնելով կրկնությունը։
Superhuman-ն⁠(բացվում է նոր պատուհանում) օգտագործում է Codex՝ փոքր, բայց կրկնվող առաջադրանքները արագացնելու համար, ինչպիսիք են թեստային ծածկույթի բարելավումը և ինտեգրման ձախողումների շտկումը։ Այն նաև օգնում է դրանց ավելի արագ առաքել՝ թույլ տալով արտադրանքի մենեջերներին կատարել կոդի թեթև փոփոխություններ՝ առանց ինժեներ ներգրավելու, բացառությամբ կոդի վերանայման։
Kodiak-ն⁠(բացվում է նոր պատուհանում) օգտագործում է Codex-ը՝ վրիպազերծման գործիքներ գրելու, թեստավորման ծածկույթը բարելավելու և կոդը վերափոխելու համար՝ արագացնելով Kodiak Driver-ի՝ իրենց ինքնավար վարորդական տեխնոլոգիայի մշակումը։ Codex-ը նաև դարձել է արժեքավոր տեղեկատու գործիք, որը օգնում է ինժեներներին հասկանալ կույտի անծանոթ մասերը՝ ներկայացնելով համապատասխան համատեքստը և անցյալի փոփոխությունները։

Հիմնվելով վաղ փորձարկողների փորձի վրա՝ մենք խորհուրդ ենք տալիս միաժամանակ մի քանի ագենտներին հանձնարարել հստակ սահմանված առաջադրանքներ և փորձարկել տարբեր տեսակի առաջադրանքներ և հարցումներ՝ մոդելի հնարավորությունները արդյունավետ ուսումնասիրելու համար։

Codex CLI-ի թարմացումները

Անցյալ ամիս մենք թողարկեցինք Codex CLI-ը՝ թեթև, բաց կոդով կոդավորման ագենտ, որն աշխատում է Ձեր տերմինալում։ Այն o3 և o4-mini մոդելների հզորությունը բերում է ձեր տեղական աշխատանքային հոսք՝ հեշտացնելով դրանց հետ համատեղելն ու առաջադրանքները ավելի արագ կատարելը։

Այսօր մենք նաև թողարկում ենք codex-1-ի ավելի փոքր տարբերակը՝ o4-mini-ի տարբերակը, որը հատուկ մշակված է Codex CLI-ում օգտագործման համար։ Այս նոր մոդելը աջակցում է CLI-ում ավելի արագ աշխատանքային հոսքերին և օպտիմիզացված է ցածր հապաղմամբ կոդի հարցուպատասխանի և խմբագրման համար՝ միաժամանակ պահպանելով հրահանգների հետևման և ոճի նույն ուժեղ կողմերը: Այն այժմ հասանելի է որպես կանխադրված մոդել Codex CLI-ում և API-ում՝ որպես codex-mini-latest։ Հիմքում ընկած կադրը կանոնավորաբար կթարմացվի, քանի որ մենք շարունակում ենք բարելավել Codex-mini մոդելը։

Մենք նաև շատ ավելի հեշտացնում ենք ձեր ծրագրավորողի հաշիվը Codex CLI-ին կապելը: Փոխարենը ձեռքով գեներացնել և կարգավորել API թոքենը, այժմ կարող եք մուտք գործել ձեր ChatGPT հաշիվ և ընտրել այն API կազմակերպությունը, որը ցանկանում եք օգտագործել։ Մենք ավտոմատ կերպով կգեներացնենք և կկարգավորենք API բանալին Ձեզ համար։ Plus և Pro օգտատերերը, ովքեր մուտք են գործում Codex CLI ChatGPT‑ով, կարող են նաև սկսել մարել $5 և $50 անվճար API կրեդիտներ, համապատասխանաբար, ավելի ուշ այսօր՝ հաջորդ 30 օրվա ընթացքում:

Codex-ի հասանելիությունը, գները և սահմանափակումները

Այսօրվանից մենք Codex-ը թողարկում ենք ChatGPT Pro, Enterprise և Business օգտատերերի համար ամբողջ աշխարհում, իսկ Plus և Edu-ի աջակցումը շուտով հասանելի կլինի։ Օգտատերերը առաջիկա շաբաթների ընթացքում առատաձեռն մուտք կունենան առանց լրացուցիչ ծախսերի, որպեսզի դուք կարողանաք ուսումնասիրել Codex-ի հնարավորությունները, որից հետո մենք կներկայացնենք սահմանափակ մուտք և ճկուն գներ տարբերակներ, որոնք թույլ կտան Ձեզ գնել լրացուցիչ օգտագործում ըստ պահանջի: Մենք նախատեսում ենք շուտով ընդլայնել հասանելիությունը Plus և Edu օգտատերերի համար։

Ծրագրավորողների համար, որոնք աշխատում են codex-mini-latest-ով, մոդելը հասանելի է Պատասխաններ API-ում և արժե 1,50 դոլար յուրաքանչյուր 1 մլն մուտքային թոքենի համար և 6 դոլար յուրաքանչյուր 1 մլն արտածման թոքենի համար՝ 75% հարցման քեշավորման զեղչով։

Codex-ը դեռ իր զարգացման վաղ փուլում է։ Որպես հետազոտական նախադիտում, այն ներկայումս չունի այնպիսի գործառույթներ, ինչպիսիք են պատկերի մուտքագրումը առջևի աշխատանքի համար և ագենտի աշխատանքը ուղղորդելու հնարավորությունը, երբ այն աշխատում է։ Բացի այդ, հեռավոր ագենտին պատվիրակելը ավելի երկար է տևում, քան ինտերակտիվ խմբագրումը, ինչը կարող է որոշ ժամանակ պահանջել, որպեսզի ընտելանաք։ Ժամանակի ընթացքում Codex ագենտների հետ շփումը ավելի ու ավելի կնմանվի գործընկերների հետ ասինխրոն համագործակցությանը։ Մոդելի հնարավորությունների զարգացմանը զուգընթաց, մենք ակնկալում ենք, որ ագենտները կկատարեն ավելի բարդ առաջադրանքներ երկար ժամանակահատվածում։

Ի՞նչ է հաջորդը

Մենք պատկերացնում ենք մի ապագա, որտեղ ծրագրավորողները կղեկավարեն իրենց ուզած աշխատանքը, իսկ մնացածը կհանձնարարեն ագենտներին՝ ԱԲ միջոցով ավելի արագ շարժվելով և ավելի արդյունավետ լինելով։ Դրան հասնելու համար մենք ստեղծում ենք Codex գործիքների մի ամբողջ փաթեթ, որն աջակցում է ինչպես իրական ժամանակի համագործակցությանը, այնպես էլ ասինխրոն լիազորությունների փոխանցմանը։

ԱԲ գործիքների՝ Codex CLI-ի և այլոց հետ զուգակցումը արագորեն դարձել է արդյունաբերության նորմ՝ օգնելով ծրագրավորողներին ավելի արագ կոդավորել։ Բայց մենք հավատում ենք, որ ChatGPT‑ում Codex-ի կողմից ներդրված ասինխրոն, բազմագենտային աշխատանքային հոսքը կդառնա ինժեներների կողմից բարձրորակ կոդ ստեղծելու փաստացի եղանակը։

Ի վերջո, մենք տեսնում ենք, որ փոխազդեցության այս երկու ռեժիմները՝ իրական ժամանակի զուգավորումը և առաջադրանքների պատվիրակումը, համախմբվում են։ Ծրագրավորողները կհամագործակցեն ԱԲ ագենտների հետ իրենց IDE-ներում և ամենօրյա գործիքներում՝ հարցեր տալու, առաջարկներ ստանալու և ավելի երկար առաջադրանքներ փոխանցելու համար՝ միավորված աշխատանքային հոսքում։

Առաջ նայելով, մենք պլանավորում ենք ներդնել ավելի ինտերակտիվ և ճկուն ագենտների աշխատանքային հոսքեր։ Ծրագրավորողները շուտով կկարողանան առաջադրանքի ընթացքում տրամադրել ուղեցույց, համագործակցել իրականացման ռազմավարությունների մշակման վրա և ստանալ ակտիվ առաջընթացի թարմացումներ։ Մենք նաև պատկերացնում ենք ավելի խորը ինտեգրումներ այն գործիքների հետ, որոնք դուք արդեն օգտագործում եք. այսօր Codex-ը կապվում է GitHub-ի հետ, և շուտով դուք կկարողանաք առաջադրանքներ հանձնարարել Codex CLI-ից, ChatGPT Desktop-ից կամ նույնիսկ այնպիսի գործիքներից, ինչպիսիք են ձեր խնդիրների հետապնդողը կամ CI համակարգը։

Ծրագրային ապահովման ճարտարագիտությունը առաջին ոլորտներից մեկն է, որը զգալի արտադրողականության աճ է գրանցել արհեստական բանականության միջոցով՝ բացելով նոր հնարավորություններ անհատների և փոքր թիմերի համար։ Թեև մենք լավատեսորեն ենք նայում այս ձեռքբերումներին, մենք նաև համագործակցում ենք գործընկերների հետ՝ ավելի լավ հասկանալու ագենտների լայնածավալ ընդունման հետևանքները ծրագրավորողների աշխատանքային հոսքերի, հմտությունների զարգացման, հմտությունների մակարդակների և աշխարհագրական տարածքների վրա։

Սա միայն սկիզբն է, և մենք անհամբեր սպասում ենք տեսնելու, թե ինչ կստեղծեք Codex-ի միջոցով։

Ուղիղ եթերի կրկնություն

Հավելված

Համակարգի հաղորդագրություն

Մենք կիսվում ենք codex-1 համակարգի հաղորդագրությամբ՝ օգնելու ծրագրավորողներին հասկանալ մոդելի կանխադրված վարքագիծը և հարմարեցնել Codex-ը անհատական աշխատանքային հոսքերում արդյունավետ աշխատելու համար։ Օրինակ, codex-1 համակարգային հաղորդագրությունը խրախուսում է Codex-ին անցկացնել AGENTS.md ֆայլում նշված բոլոր թեստերը, բայց եթե ժամանակը սուղ է, կարող եք խնդրել Codex-ին բաց թողնել այդ փորձարկողները։

Պարզ տեքստ

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Հեղինակ

OpenAI