16 მაისი, 2025

გაიცანით Codex

ღრუბელზე დაფუძნებული პროგრამული ინჟინერიის აგენტი, რომელსაც მრავალი დავალების პარალელურად შესრულება შეუძლია და რომელსაც codex-1 ამუშავებს. დღეს ხელმისაწვდომია ChatGPT Pro, Business და Enterprise მომხმარებლებისთვის, მალე კი Plus მომხმარებლებისთვისაც.

სცადეთ Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

იტვირთება…

განახლება 2025 წლის 3 ივნისს: Codex ახლა უკვე ChatGPT Plus მომხმარებლებისთვისაც ხელმისაწვდომია. ასევე მომხმარებლებს ვაძლევთ შესაძლებლობას, დავალების შესრულებისას Codex-ს ინტერნეტთან წვდომა მიაწოდონ. დამატებითი დეტალებისთვის იხილეთ ცვლილებების ჟურნალი⁠(იხსნება ახალ ფანჯარაში) და დოკუმენტაცია⁠(იხსნება ახალ ფანჯარაში).

დღეს ვუშვებთ Codex-ის კვლევით წინასწარ ვერსიას: ღრუბელზე დაფუძნებულ პროგრამული ინჟინერიის აგენტს, რომელსაც მრავალი დავალების პარალელურად შესრულება შეუძლია. Codex-ს შეუძლია თქვენთვის ისეთი დავალებების შესრულება, როგორიცაა ფუნქციების წერა, თქვენს კოდურ ბაზაზე კითხვებზე პასუხი, შეცდომების გამოსწორება და მიმოხილვისთვის შერწყმის მოთხოვნების შეთავაზება; თითოეული დავალება თავის საკუთარ ღრუბლოვან sandbox გარემოში სრულდება, სადაც თქვენი რეპოზიტორიუმი წინასწარაა ჩატვირთული.

Codex-ს ამუშავებს codex-1, OpenAI o3‑ის ვერსია, რომელიც პროგრამული ინჟინერიისთვისაა ოპტიმიზებული. ის რეალური სამყაროს კოდირების დავალებებზე სხვადასხვა გარემოში განამამტკიცებელი სწავლებით გაწვრთნეს, რათა შექმნას კოდი, რომელიც ახლოსაა ადამიანის სტილთან და PR პრეფერენციებთან, ზუსტად მიჰყვება ინსტრუქციებს და შეუძლია იტერაციულად გაუშვას ტესტები, სანამ წარმატებულ შედეგს არ მიიღებს. დღესვე ვიწყებთ Codex-ის ეტაპობრივ მიწოდებას ChatGPT Pro, Enterprise და Business მომხმარებლებისთვის, ხოლო Plus-ისა და Edu-ს მხარდაჭერა მალე დაემატება.

როგორ მუშაობს Codex

დღეს Codex-ზე წვდომა შეგიძლიათ ChatGPT‑ის გვერდითი პანელიდან და ახალი კოდირების დავალებები მიანიჭოთ მოთხოვნის აკრეფით და „კოდი“-ზე დაჭერით. თუ გსურთ Codex-ს კითხვა დაუსვათ თქვენი კოდური ბაზის შესახებ, დააჭირეთ „კითხვა“-ს. თითოეული დავალება დამოუკიდებლად მუშავდება ცალკე, იზოლირებულ გარემოში, სადაც თქვენი კოდური ბაზა წინასწარაა ჩატვირთული. Codex-ს შეუძლია ფაილების წაკითხვა და რედაქტირება, ასევე ბრძანებების გაშვება, მათ შორის test harness-ების, linter-ებისა და type checker-ების. დავალების დასრულებას, როგორც წესი, 1-დან 30 წუთამდე სჭირდება, სირთულიდან გამომდინარე, და Codex-ის პროგრესის მონიტორინგი რეალურ დროში შეგიძლიათ.

მას შემდეგ, რაც Codex დავალებას დაასრულებს, ის თავის გარემოში ცვლილებებს commit-ს გაუკეთებს. Codex თავისი მოქმედებების გადამოწმებად მტკიცებულებებს გვაწვდის ტერმინალის ლოგებისა და ტესტის შედეგების ციტირებით, რაც საშუალებას გაძლევთ დავალების შესრულებისას გადადგმულ ყოველ ნაბიჯს თვალი მიადევნოთ. შემდეგ შეგიძლიათ შედეგები გადაამოწმოთ, მოითხოვოთ დამატებითი ცვლილებები, გახსნათ GitHub შერწყმის მოთხოვნა ან პირდაპირ მოახდინოთ ცვლილებების ინტეგრაცია თქვენს ლოკალურ გარემოში. პროდუქტში შეგიძლიათ Codex-ის გარემო ისე დააკონფიგურიროთ, რომ რაც შეიძლება მეტად ემთხვეოდეს თქვენს რეალურ დეველოპერულ გარემოს.

Codex-ს შეიძლება უხელმძღვანელონ თქვენს რეპოზიტორიუმში განთავსებულმა AGENTS.md ფაილებმა. ეს ტექსტური ფაილებია, README.md-ის მსგავსი, სადაც შეგიძლიათ აცნობოთ Codex-ს, როგორ მოინახულოს თქვენი კოდური ბაზა, რომელი ბრძანებები გაუშვას ტესტირებისთვის და როგორ დაიცვას საუკეთესოდ თქვენი პროექტის სტანდარტული პრაქტიკები. ადამიან დეველოპერების მსგავსად, Codex აგენტები საუკეთესოდ მუშაობენ მაშინ, როცა მათ მიეწოდებათ კონფიგურირებული dev გარემოები, საიმედო ტესტირების გამართვები და მკაფიო დოკუმენტაცია.

კოდირების შეფასებებსა და შიდა ბენჩმარკებზე codex-1 ძლიერ შედეგებს აჩვენებს AGENTS.md ფაილების ან მორგებული scaffolding-ის გარეშეც.

23 SWE-Bench Verified ნიმუში, რომლებიც ჩვენს შიდა ინფრასტრუქტურაზე გაშვებადი არ იყო, გამორიცხულია. codex-1 გამოიცადა მაქსიმალური 192k token კონტექსტის სიგრძით და საშუალო „მსჯელობის ძალისხმევით“, რაც ის პარამეტრია, რომელიც დღეს პროდუქტში იქნება ხელმისაწვდომი. o3‑ის შეფასებების დეტალებისთვის იხილეთ აქ⁠.

ჩვენი შიდა SWE დავალებების ბენჩმარკი წარმოადგენს OpenAI-ის რეალური შიდა SWE დავალებების კურირებულ ნაკრებს.

უსაფრთხო და სანდო აგენტების შექმნა

ჩვენ Codex-ს ვუშვებთ როგორც კვლევით წინასწარ ვერსიას, ჩვენი ეტაპობრივი დანერგვის სტრატეგიის შესაბამისად. Codex-ის დაპროექტებისას პრიორიტეტად დავაყენეთ უსაფრთხოება და გამჭვირვალობა, რათა მომხმარებლებს შეეძლოთ მისი შედეგების გადამოწმება — დაცვის მექანიზმი, რომელიც სულ უფრო მნიშვნელოვანი ხდება, რადგან AI მოდელები უფრო რთულ კოდირების დავალებებს დამოუკიდებლად ასრულებენ და უსაფრთხოების საკითხები ვითარდება. მომხმარებლებს შეუძლიათ Codex-ის ნამუშევარი შეამოწმონ ციტირებების, ტერმინალის ლოგებისა და ტესტის შედეგების მეშვეობით. როცა Codex აგენტი დარწმუნებული არ არის ან ტესტის ჩავარდნებს აწყდება, ის ამ პრობლემებს აშკარად ატყობინებს, რაც მომხმარებლებს ინფორმირებული გადაწყვეტილების მიღების საშუალებას აძლევს, როგორ გააგრძელონ. მაინც აუცილებელია, რომ მომხმარებლებმა ინტეგრაციასა და გაშვებამდე ხელით გადაამოწმონ და დაადასტურონ აგენტის მიერ გენერირებული მთელი კოდი.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

ადამიანის პრეფერენციებთან გასწორება

codex-1-ის გაწვრთნისას ერთ-ერთი მთავარი მიზანი იყო შედეგების მაქსიმალურად დაახლოება ადამიანის კოდირების პრეფერენციებსა და სტანდარტებთან. OpenAI o3‑თან შედარებით, codex-1 სტაბილურად აწარმოებს უფრო სუფთა პატჩებს, რომლებიც მზადაა ადამიანური მიმოხილვისა და სტანდარტულ სამუშაო პროცესებში ინტეგრაციისთვის.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

ბოროტად გამოყენების პრევენცია

ხელოვნური ინტელექტით მართული პროგრამული ინჟინერიის მავნე გამოყენებებისგან, მაგალითად მავნე პროგრამების შექმნისგან, დაცვა სულ უფრო კრიტიკული ხდება. ამავე დროს, მნიშვნელოვანია, რომ დამცავმა ზომებმა ზედმეტად არ შეაფერხოს ლეგიტიმური და სასარგებლო გამოყენებები, რომლებიც შეიძლება მოიცავდეს ისეთ ტექნიკებსაც, რომლებიც ზოგჯერ მავნე პროგრამების განვითარებაშიც გამოიყენება, როგორიცაა დაბალი დონის kernel ინჟინერია.

უსაფრთხოებისა და სარგებლიანობის დასაბალანსებლად, Codex გაწვრთნილი იყო, რომ ამოიცნოს და ზუსტად უარყოს მოთხოვნები, რომლებიც მავნე პროგრამული უზრუნველყოფის განვითარებას ისახავს მიზნად, და ამავე დროს მკაფიოდ გაარჩიოს და მხარი დაუჭიროს ლეგიტიმურ დავალებებს. ჩვენ ასევე გავაძლიერეთ ჩვენი პოლიტიკის ჩარჩოები და ჩავრთეთ მკაცრი უსაფრთხოების შეფასებები, რათა ეს საზღვრები ეფექტიანად გავამყაროთ. ამ შეფასებების ასასახად გამოვაქვეყნეთ o3 სისტემური ბარათის დამატება⁠.

უსაფრთხო შესრულება

Codex აგენტი მთლიანად ფუნქციონირებს ღრუბელში მდებარე უსაფრთხო, იზოლირებულ კონტეინერში. დავალების შესრულების დროს ინტერნეტთან წვდომა გამორთულია, რაც აგენტის ურთიერთქმედებას ზღუდავს მხოლოდ იმ კოდით, რომელიც ცხადადაა მიწოდებული GitHub რეპოზიტორიუმებით და იმ წინასწარ დაყენებული დამოკიდებულებებით, რომლებიც მომხმარებელმა setup script-ის მეშვეობით დააკონფიგურა. აგენტს არ შეუძლია წვდომა გარე ვებსაიტებზე, API-ებზე ან სხვა სერვისებზე.

ადრეული გამოყენების შემთხვევები

OpenAI-ის ტექნიკურმა გუნდებმა დაიწყეს Codex-ის გამოყენება, როგორც მათი ყოველდღიური ინსტრუმენტარიუმის ნაწილის. OpenAI-ის ინჟინრები მას ყველაზე ხშირად იყენებენ განმეორებადი, მკაფიოდ განსაზღვრული დავალებების გადასაბარებლად, როგორიცაა რეფაქტორინგი, სახელების შეცვლა და ტესტების წერა, რომლებიც სხვა შემთხვევაში ფოკუსს დაარღვევდა. ის თანაბრად სასარგებლოა ახალი ფუნქციების ჩონჩხის შესაქმნელად, კომპონენტების დასაკავშირებლად, შეცდომების გამოსასწორებლად და დოკუმენტაციის მონახაზის დასაწერად. გუნდები მის გარშემო ახალ ჩვევებს აყალიბებენ: მორიგეობისას ინციდენტების triage, დღის დასაწყისში დავალებების დაგეგმვა და ფონური სამუშაოს გადაბარება, რათა მოძრაობა არ შეჩერდეს. კონტექსტის ხშირი გადართვის შემცირებით და დავიწყებული to-do-ების გამოჩენით, Codex ეხმარება ინჟინრებს უფრო სწრაფად გამოუშვან და ყურადღება ყველაზე მნიშვნელოვანზე შეინარჩუნონ.

რელიზამდე ჩვენ ასევე ვმუშაობდით გარე ტესტერების მცირე ჯგუფთან, რათა უკეთ გაგვეგო, როგორ მუშაობს Codex მრავალფეროვან კოდურ ბაზებზე, დეველოპერულ პროცესებსა და გუნდებში.

Cisco⁠(იხსნება ახალ ფანჯარაში) იკვლევს, როგორ შეუძლია Codex-ს დაეხმაროს მათ საინჟინრო გუნდებს ამბიციური იდეების უფრო სწრაფად განხორციელებაში. როგორც ადრეული დიზაინის პარტნიორი, Cisco ეხმარება Codex-ის მომავლის ფორმირებას, აფასებს მას რეალური გამოყენების შემთხვევებისთვის მათი პროდუქტის პორტფელში და OpenAI-ის გუნდს უკუკავშირს აწვდის.
Temporal⁠(იხსნება ახალ ფანჯარაში) იყენებს Codex-ს ფუნქციების განვითარების დასაჩქარებლად, პრობლემების დასაბაგად, ტესტების დასაწერად და გასაშვებად, ასევე დიდი კოდური ბაზების რეფაქტორინგისთვის. ის ასევე ეხმარება მათ ფოკუსის შენარჩუნებაში რთული დავალებების ფონურად გაშვებით — რაც ინჟინრებს ნაკადში ტოვებს და იტერაციას აჩქარებს.
Superhuman⁠(იხსნება ახალ ფანჯარაში) იყენებს Codex-ს მცირე, მაგრამ განმეორებადი დავალებების დასაჩქარებლად, როგორიცაა ტესტების დაფარვის გაუმჯობესება და ინტეგრაციის ჩავარდნების გამოსწორება. ის ასევე ეხმარება მათ უფრო სწრაფად გამოშვებაში, რადგან პროდუქტის მენეჯერებს საშუალებას აძლევს შეიტანონ მსუბუქი კოდის ცვლილებები ინჟინრის ჩართვის გარეშე, გარდა კოდის მიმოხილვისა.
Kodiak⁠(იხსნება ახალ ფანჯარაში) იყენებს Codex-ს დასაბაგი ხელსაწყოების დაწერაში, ტესტების დაფარვის გაუმჯობესებასა და კოდის რეფაქტორინგში დასახმარებლად — რაც აჩქარებს მათი ავტონომიური მართვის ტექნოლოგიის, Kodiak Driver-ის, განვითარებას. Codex ასევე იქცა ღირებულ საცნობარო ინსტრუმენტად, რომელიც ინჟინრებს ეხმარება სტეკის უცნობი ნაწილების გაგებაში შესაბამისი კონტექსტისა და წინა ცვლილებების გამოტანით.

ადრეული ტესტერებისგან მიღებულ გამოცდილებაზე დაყრდნობით, გირჩევთ, რამდენიმე აგენტს ერთდროულად მიანიჭოთ მკაფიოდ განსაზღვრული დავალებები და სხვადასხვა ტიპის დავალებებსა და მოთხოვნებზე ექსპერიმენტი ჩაატაროთ, რათა მოდელის შესაძლებლობები ეფექტიანად გამოიკვლიოთ.

განახლებები Codex CLI-ში

გასულ თვეში გამოვუშვით Codex CLI, მსუბუქი ღია კოდის კოდირების აგენტი, რომელიც თქვენს ტერმინალში მუშაობს. მას თქვენს ლოკალურ სამუშაო პროცესში შემოაქვს ისეთი მოდელების ძალა, როგორიცაა o3 და o4-mini, და ამარტივებს მათთან წყვილში მუშაობას, რათა დავალებები უფრო სწრაფად დაასრულოთ.

დღეს ასევე ვუშვებთ codex-1-ის უფრო მცირე ვერსიას, o4-mini-ის ვერსიას, რომელიც სპეციალურად Codex CLI-ში გამოსაყენებლადაა შექმნილი. ეს ახალი მოდელი CLI-ში უფრო სწრაფ სამუშაო პროცესებს უჭერს მხარს და ოპტიმიზებულია დაბალი დაყოვნების კოდის კითხვა-პასუხისა და რედაქტირებისთვის, ამასთან ინარჩუნებს იმავე სიძლიერეს ინსტრუქციების მიყოლასა და სტილში. ის უკვე ხელმისაწვდომია როგორც ნაგულისხმევი მოდელი Codex CLI-ში და API-ში როგორც codex-mini-latest. საბაზისო snapshot რეგულარულად განახლდება, რადგან Codex-mini მოდელის გაუმჯობესებას ვაგრძელებთ.

ასევე ბევრად ვამარტივებთ თქვენი დეველოპერული ანგარიშის Codex CLI-სთან დაკავშირებას. API token-ის ხელით გენერირებისა და კონფიგურაციის ნაცვლად, ახლა შეგიძლიათ შეხვიდეთ თქვენი ChatGPT ანგარიშით და აირჩიოთ API ორგანიზაცია, რომლის გამოყენებაც გსურთ. API გასაღებს ავტომატურად დავაგენერირებთ და დავაკონფიგურირებთ. გარდა ამისა, Plus და Pro მომხმარებლებს, რომლებიც ChatGPT‑ით შედიან Codex CLI-ში, დღეის მოგვიანებით უკვე შეეძლებათ, შესაბამისად, $5 და $50 უფასო API კრედიტების მიღება მომდევნო 30 დღის განმავლობაში.

Codex-ის ხელმისაწვდომობა, ფასები და შეზღუდვები

დღეიდან Codex-ს ეტაპობრივად ვაწვდით ChatGPT Pro, Enterprise და Business მომხმარებლებს გლობალურად, ხოლო Plus-ისა და Edu-ს მხარდაჭერა მალე დაემატება. მომდევნო კვირების განმავლობაში მომხმარებლებს ექნებათ უხვი წვდომა დამატებითი საფასურის გარეშე, რათა შეძლოთ Codex-ის შესაძლებლობების შესწავლა, რის შემდეგაც დავნერგავთ სიჩქარის ლიმიტებით შეზღუდულ წვდომასა და მოქნილ საფასო ვარიანტებს, რომლებიც მოგცემთ საჭიროებისამებრ დამატებითი გამოყენების შეძენის საშუალებას. ასევე ვგეგმავთ წვდომის გაფართოებას Plus და Edu მომხმარებლებზე უახლოეს მომავალში.

დეველოპერებისთვის, რომლებიც codex-mini-latest-ით ქმნიან, მოდელი ხელმისაწვდომია Responses API-ზე და ფასდება $1.50-ად 1M input token-ზე და $6-ად 1M output token-ზე, 75%-იანი prompt caching ფასდაკლებით.

Codex ჯერ კიდევ განვითარების ადრეულ ეტაპზეა. როგორც კვლევით წინასწარ ვერსიას, მას ამჟამად აკლია ისეთი ფუნქციები, როგორიცაა frontend სამუშაოსთვის სურათის შეყვანები და აგენტის კურსის შესწორების შესაძლებლობა მუშაობის პროცესში. დამატებით, დისტანციურ აგენტზე დელეგირებას ინტერაქტიულ რედაქტირებაზე მეტი დრო სჭირდება, რასაც შეიძლება შეჩვევა დასჭირდეს. დროთა განმავლობაში Codex აგენტებთან ურთიერთობა სულ უფრო დაემსგავსება კოლეგებთან ასინქრონულ თანამშრომლობას. მოდელების შესაძლებლობების წინსვლასთან ერთად, ველით, რომ აგენტები უფრო რთულ დავალებებს უფრო ხანგრძლივ პერიოდში აიღებენ საკუთარ თავზე.

რა იქნება შემდეგ

ჩვენ წარმოგვიდგენია მომავალი, სადაც დეველოპერები თავად წარმართავენ იმ სამუშაოს, რომლის ფლობაც სურთ, დანარჩენს კი აგენტებს აბარებენ — AI-ს დახმარებით უფრო სწრაფად მოძრაობენ და უფრო პროდუქტიულები არიან. ამის მისაღწევად ვქმნით Codex-ის ინსტრუმენტების ნაკრებს, რომელიც მხარს უჭერს როგორც რეალურ დროში თანამშრომლობას, ისე ასინქრონულ დელეგირებას.

AI ინსტრუმენტებთან, როგორიცაა Codex CLI და სხვები, დაწყვილება სწრაფად იქცა ინდუსტრიის ნორმად და ეხმარება დეველოპერებს კოდის წერისას უფრო სწრაფად იმოძრაონ. მაგრამ გვჯერა, რომ ChatGPT‑ში Codex-ის მიერ დანერგილი ასინქრონული, მრავალაგენტიანი სამუშაო პროცესი გახდება დე ფაქტო გზა, რომლითაც ინჟინრები მაღალი ხარისხის კოდს შექმნიან.

საბოლოოდ, ჩვენ ამ ურთიერთქმედების ორ რეჟიმს — რეალურ დროში დაწყვილებასა და დავალებების დელეგირებას — დაახლოებულს ვხედავთ. დეველოპერები ითანამშრომლებენ AI აგენტებთან თავიანთ IDE-ებში და ყოველდღიურ ინსტრუმენტებში, რათა დასვან კითხვები, მიიღონ შეთავაზებები და გადაიბარონ გრძელი დავალებები, ყველაფერი ერთიან სამუშაო პროცესში.

მომავლისკენ ვიყურებით და ვგეგმავთ უფრო ინტერაქტიული და მოქნილი აგენტური სამუშაო პროცესების დანერგვას. დეველოპერებს მალე შეეძლებათ დავალების მიმდინარეობისას მისცენ მითითებები, ითანამშრომლონ იმპლემენტაციის სტრატეგიებზე და მიიღონ პროაქტიული პროგრესის განახლებები. ასევე წარმოგვიდგენია უფრო ღრმა ინტეგრაციები იმ ინსტრუმენტებში, რომლებსაც უკვე იყენებთ: დღეს Codex GitHub-ს უკავშირდება, ხოლო მალე დავალებების მინიჭებას Codex CLI-დან, ChatGPT Desktop-იდან ან თუნდაც ისეთი ინსტრუმენტებიდანაც შეძლებთ, როგორიცაა თქვენი issue tracker ან CI სისტემა.

პროგრამული ინჟინერია ერთ-ერთი პირველი ინდუსტრიაა, რომელიც AI-ით მართული პროდუქტიულობის მნიშვნელოვან ზრდას განიცდის, რაც ახალ შესაძლებლობებს ხსნის ინდივიდებისა და მცირე გუნდებისთვის. მიუხედავად იმისა, რომ ამ სარგებლის მიმართ ოპტიმისტურად ვართ განწყობილი, პარტნიორებთანაც ვთანამშრომლობთ, რათა უკეთ გავიგოთ აგენტების ფართო დანერგვის გავლენა დეველოპერების სამუშაო პროცესებზე, უნარების განვითარებაზე სხვადასხვა ადამიანში, კვალიფიკაციის დონესა და გეოგრაფიულ რეგიონებში.

ეს მხოლოდ დასაწყისია — და მოუთმენლად ველით, რას შექმნით Codex-ით.

ლაივსტრიმის გამეორება

დანართი

სისტემური შეტყობინება

ჩვენ ვაზიარებთ codex-1-ის სისტემურ შეტყობინებას, რათა დავეხმაროთ დეველოპერებს გაიგონ მოდელის ნაგულისხმევი ქცევა და მოარგონ Codex ისე, რომ ეფექტურად იმუშაოს მორგებულ სამუშაო პროცესებში. მაგალითად, codex-1-ის სისტემური შეტყობინება Codex-ს უბიძგებს გაუშვას ყველა ტესტი, რომელიც AGENTS.md ფაილშია ნახსენები, მაგრამ თუ დრო არ გყოფნით, შეგიძლიათ Codex-ს სთხოვოთ ამ ტესტების გამოტოვება.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

ავტორი

OpenAI