16 Μαΐου 2025

Παρουσίαση του Codex

Ένας πράκτορας μηχανικής λογισμικού που βασίζεται στο cloud και μπορεί να εργάζεται σε πολλές εργασίες παράλληλα, με την υποστήριξη του codex-1. Διαθέσιμο σήμερα στους χρήστες ChatGPT Pro, Business και Enterprise, και σύντομα στους χρήστες Plus.

Δοκιμάστε το Codex

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

Φόρτωση…

Ενημέρωση στις 3 Ιουνίου 2025: Το Codex είναι πλέον διαθέσιμο στους χρήστες του ChatGPT Plus. Επίσης, δίνουμε στους χρήστες τη δυνατότητα να παρέχουν στο Codex πρόσβαση στο διαδίκτυο κατά την εκτέλεση εργασιών. Ανατρέξτε στο changelog⁠(ανοίγει σε νέο παράθυρο) και στα docs⁠(ανοίγει σε νέο παράθυρο) για περισσότερες λεπτομέρειες.

Σήμερα εγκαινιάζουμε την προεπισκόπηση έρευνας του Codex: ενός πράκτορα μηχανικής λογισμικού που βασίζεται στο cloud και μπορεί να εκτελεί πολλές εργασίες ταυτόχρονα. Το Codex μπορεί να εκτελεί εργασίες για λογαριασμό σας, όπως η συγγραφή λειτουργιών, η απάντηση σε ερωτήσεις για το codebase σας, η διόρθωση σφαλμάτων και η πρόταση για pull requests για έλεγχο. Σε κάθε εργασία προφορτώνεται το σύνολο του αποθετηρίου σας και εκτελείται στο δικό της απομονωμένο περιβάλλον στο cloud.

Το Codex υποστηρίζεται από το codex-1, μια έκδοση του OpenAI o3 που είναι βελτιστοποιημένη για την ανάπτυξη λογισμικού. Εκπαιδεύτηκε με ενισχυτική μάθηση σε πραγματικές εργασίες σύνταξης κώδικα σε διάφορα περιβάλλοντα για να δημιουργεί κώδικα που προσεγγίζει το ανθρώπινο στυλ και τις προτιμήσεις PR, ακολουθεί πιστά τις οδηγίες και μπορεί να εκτελεί επαναληπτικά δοκιμές μέχρι να επιτύχει ένα θετικό αποτέλεσμα. Ξεκινάμε σήμερα την κυκλοφορία του Codex στους χρήστες ChatGPT Pro, Enterprise και Business, ενώ θα ακολουθήσει σύντομα υποστήριξη για τα Plus και Edu.

Πώς λειτουργεί το Codex

Σήμερα, μπορείτε να αποκτήσετε πρόσβαση στο Codex μέσω της πλαϊνής γραμμής στο ChatGPT και να του αναθέσετε νέες εργασίες σύνταξης κώδικα, πληκτρολογώντας μια προτροπή και κάνοντας κλικ στην επιλογή «Κώδικας». Αν θέλετε να κάνετε μια ερώτηση στο Codex σχετικά με τον κώδικά σας, κάντε κλικ στην επιλογή «Ερώτηση». Κάθε εργασία υποβάλλεται σε επεξεργασία ανεξάρτητα σε ένα ξεχωριστό, απομονωμένο περιβάλλον, στο οποίο έχει προφορτωθεί ο κώδικάς σας. Το Codex μπορεί να διαβάζει και να επεξεργάζεται αρχεία, καθώς και να εκτελεί εντολές όπως τα test harnesses, οι linters και οι type checkers. Η ολοκλήρωση της εργασίας διαρκεί συνήθως από 1 έως 30 λεπτά, ανάλογα με την πολυπλοκότητα, και μπορείτε να παρακολουθείτε την πρόοδο του Codex σε πραγματικό χρόνο.

Μόλις το Codex ολοκληρώσει μια εργασία, καταχωρεί τις αλλαγές του στο περιβάλλον του. Το Codex παρέχει επαληθεύσιμα αποδεικτικά των ενεργειών του μέσω παραπομπών σε αρχεία καταγραφής τερματικού και αποτελέσματα δοκιμών, επιτρέποντάς σας να ανιχνεύετε κάθε βήμα που πραγματοποιήθηκε κατά την ολοκλήρωση της εργασίας. Στη συνέχεια, μπορείτε να ελέγξετε τα αποτελέσματα, να ζητήσετε περαιτέρω αναθεωρήσεις, να ανοίξετε ένα αίτημα pull στο GitHub ή να ενσωματώσετε απευθείας τις αλλαγές στο τοπικό σας περιβάλλον. Στο προϊόν μπορείτε να διαμορφώσετε το περιβάλλον του Codex έτσι ώστε να ταιριάζει όσο το δυνατόν περισσότερο με το πραγματικό περιβάλλον ανάπτυξής σας.

Το Codex μπορεί να καθοδηγείται από αρχεία AGENTS.md που τοποθετούνται στο αποθετήριό σας. Αυτά είναι αρχεία κειμένου, παρόμοια με το README.md, όπου μπορείς να ενημερώσεις τον Codex πώς να πλοηγηθεί στη βάση κώδικά σας, ποιες εντολές να εκτελέσει για δοκιμή και πώς να τηρεί καλύτερα τις τυπικές πρακτικές του έργου σας. Όπως και οι ανθρώπινοι προγραμματιστές, οι πράκτορες του Codex αποδίδουν καλύτερα όταν τους παρέχονται διαμορφωμένα περιβάλλοντα ανάπτυξης, αξιόπιστες ρυθμίσεις δοκιμών και σαφής τεκμηρίωση.

Στις αξιολογήσεις κώδικα και στους εσωτερικούς δείκτες αξιολόγησης, το codex-1 παρουσιάζει ισχυρή απόδοση ακόμη και χωρίς αρχεία AGENTS.md ή προσαρμοσμένη υποστηρικτική δομή (scaffolding).

Αποκλείστηκαν 23 επαληθευμένα δείγματα SWE-Bench που δεν μπορούσαν να εκτελεστούν στην εσωτερική μας υποδομή. Το codex-1 δοκιμάστηκε σε μέγιστο μήκος θεματικού πλαισίου 192k tokens και μεσαία «προσπάθεια συλλογισμού», η οποία είναι η ρύθμιση που θα είναι διαθέσιμη στο προϊόν σήμερα. Για λεπτομέρειες σχετικά με τις αξιολογήσεις o3, δείτε εδώ⁠.

Το εσωτερικό μας σημείο αναφοράς για τις εργασίες SWE είναι ένα επιμελημένο σύνολο πραγματικών εσωτερικών εργασιών SWE στην OpenAI.

Κατασκευή ασφαλών και αξιόπιστων πρακτόρων

Κυκλοφορούμε το Codex ως προεπισκόπηση έρευνας, σύμφωνα με τη στρατηγική υλοποίησής μας με διορθωτικές κινήσεις. Δώσαμε προτεραιότητα στην ασφάλεια και τη διαφάνεια κατά τον σχεδιασμό του Codex, ώστε οι χρήστες να μπορούν να επαληθεύουν τα αποτελέσματά του. Αυτή είναι μια δικλείδα ασφαλείας που γίνεται ολοένα και πιο σημαντική καθώς τα μοντέλα τεχνητής νοημοσύνης χειρίζονται ανεξάρτητα πιο σύνθετες εργασίες σύνταξης κώδικα και οι παράμετροι ασφαλείας εξελίσσονται. Οι χρήστες μπορούν να ελέγξουν τη δουλειά του Codex μέσω παραπομπών, αρχείων καταγραφής τερματικού και αποτελεσμάτων δοκιμών. Όταν υπάρχει αβεβαιότητα ή αντιμετωπίζονται αποτυχίες στις δοκιμές, ο πράκτορας Codex κοινοποιεί ρητά αυτά τα ζητήματα, επιτρέποντας στους χρήστες να λαμβάνουν τεκμηριωμένες αποφάσεις σχετικά με το πώς να προχωρήσουν. Εξακολουθεί να είναι απαραίτητο για τους χρήστες να ελέγχουν και να επικυρώνουν χειροκίνητα όλο τον κώδικα που δημιουργείται από τους πράκτορες πριν από την ενσωμάτωση και την εκτέλεση.

Code-review screenshot with a test-file overlay verifying quoted filenames, plus summary and passing tests on a blue backdrop.

Code-review screenshot with a black terminal overlay showing one passing test for quoted filenames; summary and diff of the ‘Fix /diff error with special characters’ change visible on a blue-pastel background.

Ευθυγράμμιση με τις ανθρώπινες προτιμήσεις

Ένας από τους κύριους στόχους στην εκπαίδευση του codex-1 ήταν να ευθυγραμμιστούν οι έξοδοί του όσο το δυνατόν περισσότερο με τις ανθρώπινες προτιμήσεις και τα καθιερωμένα πρότυπα σύνταξης κώδικα. Σε σύγκριση με το OpenAI o3, το codex-1 παράγει σταθερά καθαρότερα patches έτοιμα για άμεση ανθρώπινη αναθεώρηση και ενσωμάτωση σε τυπικές ροές εργασίας.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Αποτροπή κατάχρησης

Η προστασία από κακόβουλες εφαρμογές της τεχνητής νοημοσύνης στη μηχανική λογισμικού, όπως η ανάπτυξη κακόβουλου λογισμικού (malware), γίνεται ολοένα και πιο κρίσιμη. Ταυτόχρονα, είναι σημαντικό τα μέτρα προστασίας να μην εμποδίζουν αδικαιολόγητα τις νόμιμες και ωφέλιμες εφαρμογές που ενδεχομένως να περιλαμβάνουν τεχνικές που μερικές φορές χρησιμοποιούνται στην ανάπτυξη κακόβουλου λογισμικού, όπως η χαμηλού επιπέδου μηχανική πυρήνα

Για να εξισορροπήσει την ασφάλεια και τη χρησιμότητα, το Codex εκπαιδεύτηκε να εντοπίζει και να απορρίπτει με ακρίβεια αιτήματα που στοχεύουν στην ανάπτυξη κακόβουλου λογισμικού, ενώ διακρίνει και υποστηρίζει σαφώς τις νόμιμες εργασίες. Έχουμε επίσης ενισχύσει τα πλαίσια πολιτικής μας και ενσωματώσει αυστηρές αξιολογήσεις ασφάλειας για να ενισχύσουμε αποτελεσματικά αυτά τα όρια. Έχουμε δημοσιεύσει ένα προσάρτημα στην Κάρτα Συστήματος o3⁠ για να αντικατοπτρίσουμε αυτές τις αξιολογήσεις.

Ασφαλής εκτέλεση

Ο Codex πράκτορας λειτουργεί εξ ολοκλήρου μέσα σε ένα ασφαλές, απομονωμένο κοντέινερ στο cloud. Κατά την εκτέλεση εργασιών, η πρόσβαση στο Διαδίκτυο απενεργοποιείται, περιορίζοντας την αλληλεπίδραση του πράκτορα αποκλειστικά στον κώδικα που παρέχεται ρητά μέσω των αποθετηρίων GitHub και των προεγκατεστημένων εξαρτήσεων που έχουν διαμορφωθεί από τον χρήστη μέσω ενός script εγκατάστασης. Ο πράκτορας δεν μπορεί να έχει πρόσβαση σε εξωτερικούς ιστότοπους, API ή άλλες υπηρεσίες.

Πρώιμες περιπτώσεις χρήσης

Οι τεχνικές ομάδες στην OpenAI έχουν αρχίσει να χρησιμοποιούν το Codex ως μέρος της καθημερινής εργαλειοθήκης τους. Χρησιμοποιείται συχνότερα από τους μηχανικούς του OpenAI για να απαλλάσσονται από επαναλαμβανόμενες, καλά καθορισμένες εργασίες, όπως η αναδιάρθρωση, η μετονομασία και η συγγραφή δοκιμών, που διαφορετικά θα διέκοπταν την συγκέντρωση. Είναι εξίσου χρήσιμο για την ανάπτυξη νέων λειτουργιών, τη σύνδεση εξαρτημάτων, τη διόρθωση σφαλμάτων και τη σύνταξη τεκμηρίωσης. Οι ομάδες αναπτύσσουν νέες συνήθειες γύρω από αυτό: διαλογή ζητημάτων εφημερίας, προγραμματισμός εργασιών στην αρχή της ημέρας και απαλλαγή από τι εργασίες στο παρασκήνιο για να συνεχίσουν να προχωρούν. Μειώνοντας την εναλλαγή περιβάλλοντος και φέρνοντας στην επιφάνεια τις ξεχασμένες εργασίες, το Codex βοηθά τους μηχανικούς να παραδίδουν ταχύτερα και να παραμένουν συγκεντρωμένοι σε ό,τι έχει μεγαλύτερη σημασία.

Καθώς πλησιάζει η ημέρα της κυκλοφορίας, εργαζόμαστε επίσης με μια μικρή ομάδα εξωτερικών δοκιμαστών για να κατανοήσουμε καλύτερα πώς αποδίδει το Codex στις διάφορες βάσεις δεδομένων, διαδικασίες ανάπτυξης και ομάδες.

Η Cisco⁠(ανοίγει σε νέο παράθυρο) ερευνά πώς το Codex μπορεί να βοηθήσει τις ομάδες μηχανικών της να υλοποιήσουν φιλόδοξες ιδέες πιο γρήγορα. Ως συνεργάτης στο πρώιμο στάδιο του σχεδιασμού, η Cisco βοηθάει να διαμορφώσουμε το μέλλον του Codex, αξιολογώντας το σε πραγματικές περιπτώσεις χρήσης σε όλη τη γκάμα των προϊόντων της και παρέχοντας σχόλια στην ομάδα της OpenAI.
Η Temporal⁠(ανοίγει σε νέο παράθυρο) χρησιμοποιεί το Codex για την ταχύτερη ανάπτυξη χαρακτηριστικών, την επίλυση σφαλμάτων, τη σύνταξη και εκτέλεση δοκιμών και την αναδιάρθρωση εκτεταμένων βάσεων κώδικα. Βοηθά επίσης την ομάδα να παραμένει συγκεντρωμένη εκτελώντας σύνθετες εργασίες στο παρασκήνιο — κρατώντας τους μηχανικούς σε κατάσταση ροής ενώ επιταχύνει του κύκλους επανάληψης.
Η Superhuman⁠(ανοίγει σε νέο παράθυρο) χρησιμοποιεί το Codex για να επιταχύνει μικρές αλλά επαναλαμβανόμενες εργασίες, όπως η βελτίωση της κάλυψης των δοκιμών και η διόρθωση αστοχιών ενσωμάτωσης. Επωφελούνται επίσης από τη βοήθεια για να αποστέλλουν ταχύτερα τα προϊόντα τους καθώς οι διαχειριστές προϊόντων έχουν τη δυνατότητα να συνεισφέρουν απλές αλλαγές στον κώδικα χωρίς να χρειάζονται τη βοήθεια προγραμμαστιστή παρά μόνο για τον έλεγχο του κώδικα.
Η Kodiak⁠(ανοίγει σε νέο παράθυρο) χρησιμοποιεί το Codex για να βοηθήσει στη σύνταξη εργαλείων εντοπισμού σφαλμάτων, στη βελτίωση της κάλυψης δοκιμών και στην ανακατασκευή κώδικα—επιταχύνοντας την ανάπτυξη του Kodiak Driver, της τεχνολογίας αυτόνομης οδήγησης. Το Codex έχει επίσης γίνει ένα πολύτιμο εργαλείο αναφοράς, βοηθώντας τους μηχανικούς να κατανοήσουν άγνωστα μέρη της στοίβας, προβάλλοντας το σχετικό περιβάλλον και παλαιότερες αλλαγές.

Από την εμπειρία των πρώτων δοκιμαστών, συστήνουμε να αναθέτετε καλά καθορισμένες εργασίες σε πολλούς πράκτορες ταυτόχρονα και να δοκιμάζετε ποικίλους τύπους εργασιών και προτροπών, για να αξιοποιείτε πλήρως τις δυνατότητες του μοντέλου.

Ενημερώσεις στο Codex CLI

Τον περασμένο μήνα, κυκλοφορήσαμε το Codex CLI, έναν ελαφρύ πράκτορα ανοιχτού κώδικα για τη σύνταξη κώδικα, ο οποίος εκτελείται στο τερματικό σας. Φέρνει τη δύναμη των μοντέλων όπως το o3 και το o4-mini στη δική σας τοπική ροή εργασίας, καθιστώντας εύκολη τη συνεργασία μαζί τους για την ταχύτερη ολοκλήρωση των εργασιών.

Σήμερα, κυκλοφορούμε επίσης μια μικρότερη έκδοση του codex-1, μια έκδοση του o4-mini που έχει σχεδιαστεί ειδικά για χρήση στο Codex CLI. Το νέο μοντέλο επιτρέπει πιο γρήγορες ροές εργασίας στο CLI και έχει βελτιστοποιηθεί για ερωτήσεις–απαντήσεις και επεξεργασία κώδικα με χαμηλή λανθάνουσα καθυστέρηση, διατηρώντας παράλληλα τις ίδιες δυνατότητες στην εκτέλεση οδηγιών και στο ύφος. Είναι πλέον διαθέσιμο ως το μοντέλο προεπιλογής στο Codex CLI και στο API ως codex-mini-latest. Το υποκείμενο στιγμιότυπο θα ενημερώνεται τακτικά καθώς συνεχίζουμε να βελτιώνουμε το μοντέλο Codex-mini.

Κάνουμε επίσης πολύ πιο εύκολη τη σύνδεση του λογαριασμού προγραμματιστή σας με το Codex CLI. Αντί να δημιουργείτε και να ρυθμίζετε χειροκίνητα ένα διακριτικό σύνδεσης API, μπορείτε πλέον να συνδέεστε με τον λογαριασμό σας ChatGPT και να επιλέγετε τον οργανισμό API που θέλετε να χρησιμοποιήσετε. Θα δημιουργήσουμε και θα διαμορφώσουμε αυτόματα το κλειδί API για εσάς. Οι χρήστες Plus και Pro που συνδέονται στο Codex CLI με το ChatGPT μπορούν επίσης να ξεκινήσουν να εξαργυρώνουν δωρεάν μονάδες API αξίας 5$ και 50$, αντίστοιχα, αργότερα σήμερα και για τις επόμενες 30 ημέρες.

Διαθεσιμότητα, τιμολόγηση και περιορισμοί του Codex

Από σήμερα, διαθέτουμε το Codex στους χρήστες του ChatGPT Pro, Enterprise και Business παγκοσμίως, ενώ σύντομα θα προστεθεί υποστήριξη για τα Plus και Edu. Οι χρήστες θα έχουν γενναιόδωρη πρόσβαση χωρίς επιπλέον κόστος για τις επόμενες εβδομάδες, ώστε να μπορούν να εξερευνήσουν τι μπορεί να κάνει το Codex, μετά από το οποίο θα διαθέσουμε πρόσβαση περιορισμένης τιμής και ευέλικτες επιλογές τιμολόγησης που θα επιτρέπουν την αγορά πρόσθετης χρήσης κατ' απαίτηση. Σκοπεύουμε να επεκτείνουμε σύντομα την πρόσβαση στους χρήστες Plus και Edu.

Για προγραμματιστές που χρησιμοποιούν το codex-mini-latest, το μοντέλο είναι διαθέσιμο στο Responses API και κοστίζει 1,50 $ ανά 1 εκατομμύριο διακριτικά εισαγωγής και 6 $ ανά 1 εκατομμύριο διακριτικά αποτελέσματος, με έκπτωση 75% στην προσωρινή αποθήκευση προτροπών.

Το Codex είναι ακόμα σε πρώιμο στάδιο ανάπτυξης. Ως προεπισκόπηση έρευνας, προς το παρόν δεν διαθέτει λειτουργίες όπως η εισαγωγή εικόνων για εργασία στο frontend και η δυνατότητα διόρθωσης του πράκτορα κατά τη διάρκεια της εργασίας του. Επιπλέον, η ανάθεση σε έναν απομακρυσμένο πράκτορα διαρκεί περισσότερο από τη διαδραστική επεξεργασία, το οποίο θα χρειαστεί λίγος χρόνος για να το συνηθίσετε. Με την πάροδο του χρόνου, η αλληλεπίδραση με τους πράκτορες του Codex θα αρχίσει να μοιάζει όλο και περισσότερο με ασύγχρονη συνεργασία με συναδέλφους. Καθώς οι δυνατότητες των μοντέλων εξελίσσονται, αναμένουμε ότι οι πράκτορες θα αναλαμβάνουν πιο σύνθετες εργασίες για μεγαλύτερα χρονικά διαστήματα.

Επόμενα βήματα

Φανταζόμαστε ένα μέλλον όπου οι προγραμματιστές καθοδηγούν τις εργασίες που θέλουν να είναι δική τους και αναθέτουν τις υπόλοιπες στους πράκτορες—μειώνοντας τον χρόνο εργασιών και αυξάνοντας την παραγωγικότητά τους με την ΤΝ. Για να το πετύχουμε αυτό, κατασκευάσαμε μια σουίτα εργαλείων Codex που υποστηρίζουν τόσο τη συνεργασία σε πραγματικό χρόνο όσο και την ασύγχρονη ανάθεση εργασιών.

Η σύνδεση με εργαλεία ΤΝ όπως το Codex CLI και άλλα, αναδείχθηκε γρήγορα σε κανόνα του κλάδου, διευκολύνοντας τους προγραμματιστές για να συντάσσουν κώδικα σε λιγότερο χρόνο. Πιστεύουμε πως η ασύγχρονη ροή εργασίας με πολλούς πράκτορες, την οποία εισήγαγε το Codex στο ChatGPT, θα εξελιχθεί στον de facto τρόπο παραγωγής κώδικα υψηλής ποιότητας από τους προγραμματιστές.

Σε τελική φάση προβλέπουμε ότι αυτοί οι δύο τύποι αλληλεπίδρασης—συνεργασία σε πραγματικό χρόνο και ανάθεση εργασιών—πρόκειται να συγκλίνουν. Οι προγραμματιστές θα συνεργάζονται με πράκτορες τεχνητής νοημοσύνης στα IDE και τα καθημερινά εργαλεία τους για να κάνουν ερωτήσεις, να λαμβάνουν προτάσεις και να αναθέτουν τις μεγαλύτερες εργασίες, όλα σε μια ενοποιημένη ροή εργασίας.

Στο μέλλον σκοπεύουμε να εισαγάγουμε πιο διαδραστικές και ευέλικτες ροές εργασίας πρακτόρων. Οι προγραμματιστές σύντομα θα μπορούν να παρέχουν καθοδήγηση κατά τη διάρκεια της εργασίας, να συνεργάζονται σε στρατηγικές υλοποίησης και να λαμβάνουν προληπτικές ενημερώσεις προόδου. Οραματιζόμαστε επίσης βαθύτερες ενσωματώσεις στα εργαλεία που ήδη χρησιμοποιείτε: τώρα το Codex συνδέεται με το GitHub και σύντομα θα μπορείτε να αναθέσετε εργασίες από το Codex CLI, το ChatGPT Desktop ή ακόμη και σε εργαλεία όπως το πρόγραμμα παρακολούθησης προβλημάτων ή το σύστημα CI που χρησιμοποιείτε.

Ο τομέας της μηχανικής λογισμικού είναι από τους πρώτους που καταγράφουν σημαντικές αυξήσεις στην παραγωγικότητα μέσω της τεχνητής νοημοσύνης, δημιουργώντας νέες προοπτικές για μεμονωμένους χρήστες και μικρές ομάδες. Αν και είμαστε αισιόδοξοι για αυτές τις αυξήσεις, συνεργαζόμαστε επίσης με συνεργάτες για να κατανοήσουμε καλύτερα τις επιπτώσεις της ευρείας υιοθέτησης πρακτόρων στις ροές εργασίας των προγραμματιστών, στην ανάπτυξη δεξιοτήτων μεταξύ ανθρώπων, στα επίπεδα δεξιοτήτων και στις γεωγραφικές περιοχές.

Αυτή είναι μόνο η αρχή! Ανυπομονούμε να δούμε όλα όσα θα δημιουργήσετε με το Codex.

Επανάληψη ζωντανής μετάδοσης

Παράρτημα

Μήνυμα συστήματος

Κοινοποιούμε το μήνυμα συστήματος codex-1 για να βοηθήσουμε τους προγραμματιστές να κατανοήσουν την προεπιλεγμένη συμπεριφορά του μοντέλου και να προσαρμόσουν το Codex ώστε να λειτουργεί αποτελεσματικά σε προσαρμοσμένες ροές εργασίας. Για παράδειγμα, το μήνυμα συστήματος codex-1 ενθαρρύνει το Codex να εκτελέσει όλες τις δοκιμές που αναφέρονται στο αρχείο AGENTS.md, αλλά αν δεν έχετε χρόνο, μπορείτε να ζητήσετε από τον Codex να παραλείψει αυτές τις δοκιμές.

Απλό κείμενο

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Συντάκτης

OpenAI