Παρουσίαση του Codex
Ένας πράκτορας μηχανικής λογισμικού που βασίζεται στο cloud και μπορεί να εργάζεται σε πολλές εργασίες παράλληλα, με την υποστήριξη του codex-1. Διαθέσιμο σήμερα στους χρήστες ChatGPT Pro, Business και Enterprise, και σύντομα στους χρήστες Plus.

Ενημέρωση στις 3 Ιουνίου 2025: Το Codex είναι πλέον διαθέσιμο στους χρήστες του ChatGPT Plus. Επίσης, δίνουμε στους χρήστες τη δυνατότητα να παρέχουν στο Codex πρόσβαση στο διαδίκτυο κατά την εκτέλεση εργασιών. Ανατρέξτε στο changelog(ανοίγει σε νέο παράθυρο) και στα docs(ανοίγει σε νέο παράθυρο) για περισσότερες λεπτομέρειες.
Σήμερα εγκαινιάζουμε την προεπισκόπηση έρευνας του Codex: ενός πράκτορα μηχανικής λογισμικού που βασίζεται στο cloud και μπορεί να εκτελεί πολλές εργασίες ταυτόχρονα. Το Codex μπορεί να εκτελεί εργασίες για λογαριασμό σας, όπως η συγγραφή λειτουργιών, η απάντηση σε ερωτήσεις για το codebase σας, η διόρθωση σφαλμάτων και η πρόταση για pull requests για έλεγχο. Σε κάθε εργασία προφορτώνεται το σύνολο του αποθετηρίου σας και εκτελείται στο δικό της απομονωμένο περιβάλλον στο cloud.
Το Codex υποστηρίζεται από το codex-1, μια έκδοση του OpenAI o3 που είναι βελτιστοποιημένη για την ανάπτυξη λογισμικού. Εκπαιδεύτηκε με ενισχυτική μάθηση σε πραγματικές εργασίες σύνταξης κώδικα σε διάφορα περιβάλλοντα για να δημιουργεί κώδικα που προσεγγίζει το ανθρώπινο στυλ και τις προτιμήσεις PR, ακολουθεί πιστά τις οδηγίες και μπορεί να εκτελεί επαναληπτικά δοκιμές μέχρι να επιτύχει ένα θετικό αποτέλεσμα. Ξεκινάμε σήμερα την κυκλοφορία του Codex στους χρήστες ChatGPT Pro, Enterprise και Business, ενώ θα ακολουθήσει σύντομα υποστήριξη για τα Plus και Edu.
Σήμερα, μπορείτε να αποκτήσετε πρόσβαση στο Codex μέσω της πλαϊνής γραμμής στο ChatGPT και να του αναθέσετε νέες εργασίες σύνταξης κώδικα, πληκτρολογώντας μια προτροπή και κάνοντας κλικ στην επιλογή «Κώδικας». Αν θέλετε να κάνετε μια ερώτηση στο Codex σχετικά με τον κώδικά σας, κάντε κλικ στην επιλογή «Ερώτηση». Κάθε εργασία υποβάλλεται σε επεξεργασία ανεξάρτητα σε ένα ξεχωριστό, απομονωμένο περιβάλλον, στο οποίο έχει προφορτωθεί ο κώδικάς σας. Το Codex μπορεί να διαβάζει και να επεξεργάζεται αρχεία, καθώς και να εκτελεί εντολές όπως τα test harnesses, οι linters και οι type checkers. Η ολοκλήρωση της εργασίας διαρκεί συνήθως από 1 έως 30 λεπτά, ανάλογα με την πολυπλοκότητα, και μπορείτε να παρακολουθείτε την πρόοδο του Codex σε πραγματικό χρόνο.
Μόλις το Codex ολοκληρώσει μια εργασία, καταχωρεί τις αλλαγές του στο περιβάλλον του. Το Codex παρέχει επαληθεύσιμα αποδεικτικά των ενεργειών του μέσω παραπομπών σε αρχεία καταγραφής τερματικού και αποτελέσματα δοκιμών, επιτρέποντάς σας να ανιχνεύετε κάθε βήμα που πραγματοποιήθηκε κατά την ολοκλήρωση της εργασίας. Στη συνέχεια, μπορείτε να ελέγξετε τα αποτελέσματα, να ζητήσετε περαιτέρω αναθεωρήσεις, να ανοίξετε ένα αίτημα pull στο GitHub ή να ενσωματώσετε απευθείας τις αλλαγές στο τοπικό σας περιβάλλον. Στο προϊόν μπορείτε να διαμορφώσετε το περιβάλλον του Codex έτσι ώστε να ταιριάζει όσο το δυνατόν περισσότερο με το πραγματικό περιβάλλον ανάπτυξής σας.
Το Codex μπορεί να καθοδηγείται από αρχεία AGENTS.md που τοποθετούνται στο αποθετήριό σας. Αυτά είναι αρχεία κειμένου, παρόμοια με το README.md, όπου μπορείς να ενημερώσεις τον Codex πώς να πλοηγηθεί στη βάση κώδικά σας, ποιες εντολές να εκτελέσει για δοκιμή και πώς να τηρεί καλύτερα τις τυπικές πρακτικές του έργου σας. Όπως και οι ανθρώπινοι προγραμματιστές, οι πράκτορες του Codex αποδίδουν καλύτερα όταν τους παρέχονται διαμορφωμένα περιβάλλοντα ανάπτυξης, αξιόπιστες ρυθμίσεις δοκιμών και σαφής τεκμηρίωση.
Στις αξιολογήσεις κώδικα και στους εσωτερικούς δείκτες αξιολόγησης, το codex-1 παρουσιάζει ισχυρή απόδοση ακόμη και χωρίς αρχεία AGENTS.md ή προσαρμοσμένη υποστηρικτική δομή (scaffolding).
Αποκλείστηκαν 23 επαληθευμένα δείγματα SWE-Bench που δεν μπορούσαν να εκτελεστούν στην εσωτερική μας υποδομή. Το codex-1 δοκιμάστηκε σε μέγιστο μήκος θεματικού πλαισίου 192k tokens και μεσαία «προσπάθεια συλλογισμού», η οποία είναι η ρύθμιση που θα είναι διαθέσιμη στο προϊόν σήμερα. Για λεπτομέρειες σχετικά με τις αξιολογήσεις o3, δείτε εδώ.
Το εσωτερικό μας σημείο αναφοράς για τις εργασίες SWE είναι ένα επιμελημένο σύνολο πραγματικών εσωτερικών εργασιών SWE στην OpenAI.
Κυκλοφορούμε το Codex ως προεπισκόπηση έρευνας, σύμφωνα με τη στρατηγική υλοποίησής μας με διορθωτικές κινήσεις. Δώσαμε προτεραιότητα στην ασφάλεια και τη διαφάνεια κατά τον σχεδιασμό του Codex, ώστε οι χρήστες να μπορούν να επαληθεύουν τα αποτελέσματά του. Αυτή είναι μια δικλείδα ασφαλείας που γίνεται ολοένα και πιο σημαντική καθώς τα μοντέλα τεχνητής νοημοσύνης χειρίζονται ανεξάρτητα πιο σύνθετες εργασίες σύνταξης κώδικα και οι παράμετροι ασφαλείας εξελίσσονται. Οι χρήστες μπορούν να ελέγξουν τη δουλειά του Codex μέσω παραπομπών, αρχείων καταγραφής τερματικού και αποτελεσμάτων δοκιμών. Όταν υπάρχει αβεβαιότητα ή αντιμετωπίζονται αποτυχίες στις δοκιμές, ο πράκτορας Codex κοινοποιεί ρητά αυτά τα ζητήματα, επιτρέποντας στους χρήστες να λαμβάνουν τεκμηριωμένες αποφάσεις σχετικά με το πώς να προχωρήσουν. Εξακολουθεί να είναι απαραίτητο για τους χρήστες να ελέγχουν και να επικυρώνουν χειροκίνητα όλο τον κώδικα που δημιουργείται από τους πράκτορες πριν από την ενσωμάτωση και την εκτέλεση.


Ένας από τους κύριους στόχους στην εκπαίδευση του codex-1 ήταν να ευθυγραμμιστούν οι έξοδοί του όσο το δυνατόν περισσότερο με τις ανθρώπινες προτιμήσεις και τα καθιερωμένα πρότυπα σύνταξης κώδικα. Σε σύγκριση με το OpenAI o3, το codex-1 παράγει σταθερά καθαρότερα patches έτοιμα για άμεση ανθρώπινη αναθεώρηση και ενσωμάτωση σε τυπικές ροές εργασίας.
Η προστασία από κακόβουλες εφαρμογές της τεχνητής νοημοσύνης στη μηχανική λογισμικού, όπως η ανάπτυξη κακόβουλου λογισμικού (malware), γίνεται ολοένα και πιο κρίσιμη. Ταυτόχρονα, είναι σημαντικό τα μέτρα προστασίας να μην εμποδίζουν αδικαιολόγητα τις νόμιμες και ωφέλιμες εφαρμογές που ενδεχομένως να περιλαμβάνουν τεχνικές που μερικές φορές χρησιμοποιούνται στην ανάπτυξη κακόβουλου λογισμικού, όπως η χαμηλού επιπέδου μηχανική πυρήνα
Για να εξισορροπήσει την ασφάλεια και τη χρησιμότητα, το Codex εκπαιδεύτηκε να εντοπίζει και να απορρίπτει με ακρίβεια αιτήματα που στοχεύουν στην ανάπτυξη κακόβουλου λογισμικού, ενώ διακρίνει και υποστηρίζει σαφώς τις νόμιμες εργασίες. Έχουμε επίσης ενισχύσει τα πλαίσια πολιτικής μας και ενσωματώσει αυστηρές αξιολογήσεις ασφάλειας για να ενισχύσουμε αποτελεσματικά αυτά τα όρια. Έχουμε δημοσιεύσει ένα προσάρτημα στην Κάρτα Συστήματος o3 για να αντικατοπτρίσουμε αυτές τις αξιολογήσεις.
Ο Codex πράκτορας λειτουργεί εξ ολοκλήρου μέσα σε ένα ασφαλές, απομονωμένο κοντέινερ στο cloud. Κατά την εκτέλεση εργασιών, η πρόσβαση στο Διαδίκτυο απενεργοποιείται, περιορίζοντας την αλληλεπίδραση του πράκτορα αποκλειστικά στον κώδικα που παρέχεται ρητά μέσω των αποθετηρίων GitHub και των προεγκατεστημένων εξαρτήσεων που έχουν διαμορφωθεί από τον χρήστη μέσω ενός script εγκατάστασης. Ο πράκτορας δεν μπορεί να έχει πρόσβαση σε εξωτερικούς ιστότοπους, API ή άλλες υπηρεσίες.
Οι τεχνικές ομάδες στην OpenAI έχουν αρχίσει να χρησιμοποιούν το Codex ως μέρος της καθημερινής εργαλειοθήκης τους. Χρησιμοποιείται συχνότερα από τους μηχανικούς του OpenAI για να απαλλάσσονται από επαναλαμβανόμενες, καλά καθορισμένες εργασίες, όπως η αναδιάρθρωση, η μετονομασία και η συγγραφή δοκιμών, που διαφορετικά θα διέκοπταν την συγκέντρωση. Είναι εξίσου χρήσιμο για την ανάπτυξη νέων λειτουργιών, τη σύνδεση εξαρτημάτων, τη διόρθωση σφαλμάτων και τη σύνταξη τεκμηρίωσης. Οι ομάδες αναπτύσσουν νέες συνήθειες γύρω από αυτό: διαλογή ζητημάτων εφημερίας, προγραμματισμός εργασιών στην αρχή της ημέρας και απαλλαγή από τι εργασίες στο παρασκήνιο για να συνεχίσουν να προχωρούν. Μειώνοντας την εναλλαγή περιβάλλοντος και φέρνοντας στην επιφάνεια τις ξεχασμένες εργασίες, το Codex βοηθά τους μηχανικούς να παραδίδουν ταχύτερα και να παραμένουν συγκεντρωμένοι σε ό,τι έχει μεγαλύτερη σημασία.
Καθώς πλησιάζει η ημέρα της κυκλοφορίας, εργαζόμαστε επίσης με μια μικρή ομάδα εξωτερικών δοκιμαστών για να κατανοήσουμε καλύτερα πώς αποδίδει το Codex στις διάφορες βάσεις δεδομένων, διαδικασίες ανάπτυξης και ομάδες.
- Η Cisco(ανοίγει σε νέο παράθυρο) ερευνά πώς το Codex μπορεί να βοηθήσει τις ομάδες μηχανικών της να υλοποιήσουν φιλόδοξες ιδέες πιο γρήγορα. Ως συνεργάτης στο πρώιμο στάδιο του σχεδιασμού, η Cisco βοηθάει να διαμορφώσουμε το μέλλον του Codex, αξιολογώντας το σε πραγματικές περιπτώσεις χρήσης σε όλη τη γκάμα των προϊόντων της και παρέχοντας σχόλια στην ομάδα της OpenAI.
- Η Temporal(ανοίγει σε νέο παράθυρο) χρησιμοποιεί το Codex για την ταχύτερη ανάπτυξη χαρακτηριστικών, την επίλυση σφαλμάτων, τη σύνταξη και εκτέλεση δοκιμών και την αναδιάρθρωση εκτεταμένων βάσεων κώδικα. Βοηθά επίσης την ομάδα να παραμένει συγκεντρωμένη εκτελώντας σύνθετες εργασίες στο παρασκήνιο — κρατώντας τους μηχανικούς σε κατάσταση ροής ενώ επιταχύνει του κύκλους επανάληψης.
- Η Superhuman(ανοίγει σε νέο παράθυρο) χρησιμοποιεί το Codex για να επιταχύνει μικρές αλλά επαναλαμβανόμενες εργασίες, όπως η βελτίωση της κάλυψης των δοκιμών και η διόρθωση αστοχιών ενσωμάτωσης. Επωφελούνται επίσης από τη βοήθεια για να αποστέλλουν ταχύτερα τα προϊόντα τους καθώς οι διαχειριστές προϊόντων έχουν τη δυνατότητα να συνεισφέρουν απλές αλλαγές στον κώδικα χωρίς να χρειάζονται τη βοήθεια προγραμμαστιστή παρά μόνο για τον έλεγχο του κώδικα.
- Η Kodiak(ανοίγει σε νέο παράθυρο) χρησιμοποιεί το Codex για να βοηθήσει στη σύνταξη εργαλείων εντοπισμού σφαλμάτων, στη βελτίωση της κάλυψης δοκιμών και στην ανακατασκευή κώδικα—επιταχύνοντας την ανάπτυξη του Kodiak Driver, της τεχνολογίας αυτόνομης οδήγησης. Το Codex έχει επίσης γίνει ένα πολύτιμο εργαλείο αναφοράς, βοηθώντας τους μηχανικούς να κατανοήσουν άγνωστα μέρη της στοίβας, προβάλλοντας το σχετικό περιβάλλον και παλαιότερες αλλαγές.
Από την εμπειρία των πρώτων δοκιμαστών, συστήνουμε να αναθέτετε καλά καθορισμένες εργασίες σε πολλούς πράκτορες ταυτόχρονα και να δοκιμάζετε ποικίλους τύπους εργασιών και προτροπών, για να αξιοποιείτε πλήρως τις δυνατότητες του μοντέλου.
Τον περασμένο μήνα, κυκλοφορήσαμε το Codex CLI, έναν ελαφρύ πράκτορα ανοιχτού κώδικα για τη σύνταξη κώδικα, ο οποίος εκτελείται στο τερματικό σας. Φέρνει τη δύναμη των μοντέλων όπως το o3 και το o4-mini στη δική σας τοπική ροή εργασίας, καθιστώντας εύκολη τη συνεργασία μαζί τους για την ταχύτερη ολοκλήρωση των εργασιών.
Σήμερα, κυκλοφορούμε επίσης μια μικρότερη έκδοση του codex-1, μια έκδοση του o4-mini που έχει σχεδιαστεί ειδικά για χρήση στο Codex CLI. Το νέο μοντέλο επιτρέπει πιο γρήγορες ροές εργασίας στο CLI και έχει βελτιστοποιηθεί για ερωτήσεις–απαντήσεις και επεξεργασία κώδικα με χαμηλή λανθάνουσα καθυστέρηση, διατηρώντας παράλληλα τις ίδιες δυνατότητες στην εκτέλεση οδηγιών και στο ύφος. Είναι πλέον διαθέσιμο ως το μοντέλο προεπιλογής στο Codex CLI και στο API ως codex-mini-latest. Το υποκείμενο στιγμιότυπο θα ενημερώνεται τακτικά καθώς συνεχίζουμε να βελτιώνουμε το μοντέλο Codex-mini.
Κάνουμε επίσης πολύ πιο εύκολη τη σύνδεση του λογαριασμού προγραμματιστή σας με το Codex CLI. Αντί να δημιουργείτε και να ρυθμίζετε χειροκίνητα ένα διακριτικό σύνδεσης API, μπορείτε πλέον να συνδέεστε με τον λογαριασμό σας ChatGPT και να επιλέγετε τον οργανισμό API που θέλετε να χρησιμοποιήσετε. Θα δημιουργήσουμε και θα διαμορφώσουμε αυτόματα το κλειδί API για εσάς. Οι χρήστες Plus και Pro που συνδέονται στο Codex CLI με το ChatGPT μπορούν επίσης να ξεκινήσουν να εξαργυρώνουν δωρεάν μονάδες API αξίας 5$ και 50$, αντίστοιχα, αργότερα σήμερα και για τις επόμενες 30 ημέρες.
Από σήμερα, διαθέτουμε το Codex στους χρήστες του ChatGPT Pro, Enterprise και Business παγκοσμίως, ενώ σύντομα θα προστεθεί υποστήριξη για τα Plus και Edu. Οι χρήστες θα έχουν γενναιόδωρη πρόσβαση χωρίς επιπλέον κόστος για τις επόμενες εβδομάδες, ώστε να μπορούν να εξερευνήσουν τι μπορεί να κάνει το Codex, μετά από το οποίο θα διαθέσουμε πρόσβαση περιορισμένης τιμής και ευέλικτες επιλογές τιμολόγησης που θα επιτρέπουν την αγορά πρόσθετης χρήσης κατ' απαίτηση. Σκοπεύουμε να επεκτείνουμε σύντομα την πρόσβαση στους χρήστες Plus και Edu.
Για προγραμματιστές που χρησιμοποιούν το codex-mini-latest, το μοντέλο είναι διαθέσιμο στο Responses API και κοστίζει 1,50 $ ανά 1 εκατομμύριο διακριτικά εισαγωγής και 6 $ ανά 1 εκατομμύριο διακριτικά αποτελέσματος, με έκπτωση 75% στην προσωρινή αποθήκευση προτροπών.
Το Codex είναι ακόμα σε πρώιμο στάδιο ανάπτυξης. Ως προεπισκόπηση έρευνας, προς το παρόν δεν διαθέτει λειτουργίες όπως η εισαγωγή εικόνων για εργασία στο frontend και η δυνατότητα διόρθωσης του πράκτορα κατά τη διάρκεια της εργασίας του. Επιπλέον, η ανάθεση σε έναν απομακρυσμένο πράκτορα διαρκεί περισσότερο από τη διαδραστική επεξεργασία, το οποίο θα χρειαστεί λίγος χρόνος για να το συνηθίσετε. Με την πάροδο του χρόνου, η αλληλεπίδραση με τους πράκτορες του Codex θα αρχίσει να μοιάζει όλο και περισσότερο με ασύγχρονη συνεργασία με συναδέλφους. Καθώς οι δυνατότητες των μοντέλων εξελίσσονται, αναμένουμε ότι οι πράκτορες θα αναλαμβάνουν πιο σύνθετες εργασίες για μεγαλύτερα χρονικά διαστήματα.
Φανταζόμαστε ένα μέλλον όπου οι προγραμματιστές καθοδηγούν τις εργασίες που θέλουν να είναι δική τους και αναθέτουν τις υπόλοιπες στους πράκτορες—μειώνοντας τον χρόνο εργασιών και αυξάνοντας την παραγωγικότητά τους με την ΤΝ. Για να το πετύχουμε αυτό, κατασκευάσαμε μια σουίτα εργαλείων Codex που υποστηρίζουν τόσο τη συνεργασία σε πραγματικό χρόνο όσο και την ασύγχρονη ανάθεση εργασιών.
Η σύνδεση με εργαλεία ΤΝ όπως το Codex CLI και άλλα, αναδείχθηκε γρήγορα σε κανόνα του κλάδου, διευκολύνοντας τους προγραμματιστές για να συντάσσουν κώδικα σε λιγότερο χρόνο. Πιστεύουμε πως η ασύγχρονη ροή εργασίας με πολλούς πράκτορες, την οποία εισήγαγε το Codex στο ChatGPT, θα εξελιχθεί στον de facto τρόπο παραγωγής κώδικα υψηλής ποιότητας από τους προγραμματιστές.
Σε τελική φάση προβλέπουμε ότι αυτοί οι δύο τύποι αλληλεπίδρασης—συνεργασία σε πραγματικό χρόνο και ανάθεση εργασιών—πρόκειται να συγκλίνουν. Οι προγραμματιστές θα συνεργάζονται με πράκτορες τεχνητής νοημοσύνης στα IDE και τα καθημερινά εργαλεία τους για να κάνουν ερωτήσεις, να λαμβάνουν προτάσεις και να αναθέτουν τις μεγαλύτερες εργασίες, όλα σε μια ενοποιημένη ροή εργασίας.
Στο μέλλον σκοπεύουμε να εισαγάγουμε πιο διαδραστικές και ευέλικτες ροές εργασίας πρακτόρων. Οι προγραμματιστές σύντομα θα μπορούν να παρέχουν καθοδήγηση κατά τη διάρκεια της εργασίας, να συνεργάζονται σε στρατηγικές υλοποίησης και να λαμβάνουν προληπτικές ενημερώσεις προόδου. Οραματιζόμαστε επίσης βαθύτερες ενσωματώσεις στα εργαλεία που ήδη χρησιμοποιείτε: τώρα το Codex συνδέεται με το GitHub και σύντομα θα μπορείτε να αναθέσετε εργασίες από το Codex CLI, το ChatGPT Desktop ή ακόμη και σε εργαλεία όπως το πρόγραμμα παρακολούθησης προβλημάτων ή το σύστημα CI που χρησιμοποιείτε.
Ο τομέας της μηχανικής λογισμικού είναι από τους πρώτους που καταγράφουν σημαντικές αυξήσεις στην παραγωγικότητα μέσω της τεχνητής νοημοσύνης, δημιουργώντας νέες προοπτικές για μεμονωμένους χρήστες και μικρές ομάδες. Αν και είμαστε αισιόδοξοι για αυτές τις αυξήσεις, συνεργαζόμαστε επίσης με συνεργάτες για να κατανοήσουμε καλύτερα τις επιπτώσεις της ευρείας υιοθέτησης πρακτόρων στις ροές εργασίας των προγραμματιστών, στην ανάπτυξη δεξιοτήτων μεταξύ ανθρώπων, στα επίπεδα δεξιοτήτων και στις γεωγραφικές περιοχές.
Αυτή είναι μόνο η αρχή! Ανυπομονούμε να δούμε όλα όσα θα δημιουργήσετε με το Codex.
Μήνυμα συστήματος
Κοινοποιούμε το μήνυμα συστήματος codex-1 για να βοηθήσουμε τους προγραμματιστές να κατανοήσουν την προεπιλεγμένη συμπεριφορά του μοντέλου και να προσαρμόσουν το Codex ώστε να λειτουργεί αποτελεσματικά σε προσαρμοσμένες ροές εργασίας. Για παράδειγμα, το μήνυμα συστήματος codex-1 ενθαρρύνει το Codex να εκτελέσει όλες τις δοκιμές που αναφέρονται στο αρχείο AGENTS.md, αλλά αν δεν έχετε χρόνο, μπορείτε να ζητήσετε από τον Codex να παραλείψει αυτές τις δοκιμές.