Παρουσιάζουμε ένα νέο μοντέλο που ξεκλειδώνει ακόμη περισσότερες δυνατότητες του Codex: το GPT‑5.3‑Codex, το πιο ικανό μοντέλο προγραμματισμού με πράκτορα μέχρι σήμερα. Το μοντέλο εξελίσσει τόσο τις κορυφαίες επιδόσεις προγραμματισμού του GPT‑5.2‑Codex όσο και τις δυνατότητες συλλογιστικής και επαγγελματικής γνώσης του GPT‑5.2, συνδυασμένες σε ένα ενιαίο μοντέλο, το οποίο είναι κατά 25% ταχύτερο. Έτσι, μπορεί να αναλαμβάνει εργασίες μεγάλης διάρκειας που περιλαμβάνουν έρευνα, χρήση εργαλείων και σύνθετη εκτέλεση. Όπως με έναν συνάδελφο, μπορείτε να το κατευθύνετε και να αλληλεπιδράτε με το GPT‑5.3‑Codex όσο εργάζεται, χωρίς να χάνεται το θεματικό πλαίσιο.
Το GPT‑5.3‑Codex είναι το πρώτο μας μοντέλο που συνέβαλε καθοριστικά στη δημιουργία του ίδιου του εαυτού του. Η ομάδα του Codex χρησιμοποίησε πρώιμες εκδόσεις για να εντοπίσει σφάλματα στη δική του εκπαίδευση, να διαχειριστεί τη δική του ανάπτυξη και να διαγνώσει αποτελέσματα δοκιμών και αξιολογήσεων — η ομάδα μας εντυπωσιάστηκε από το πόσο πολύ το Codex επιτάχυνε τη δική του εξέλιξη.
Με το GPT‑5.3‑Codex, το Codex εξελίσσεται από πράκτορα που γράφει και ελέγχει κώδικα σε πράκτορα που μπορεί να κάνει σχεδόν οτιδήποτε μπορούν να κάνουν οι προγραμματιστές και οι επαγγελματίες σε έναν υπολογιστή.
Το GPT‑5.3‑Codex θέτει νέο υψηλό πήχη για τον κλάδο στα SWE-Bench Pro και Terminal-Bench και δείχνει ισχυρή απόδοση στα OSWorld και GDPval, τέσσερις δείκτες αξιολόγησης που χρησιμοποιούμε για να μετράμε δυνατότητες προγραμματισμού, συμπεριφοράς πρακτόρων και πραγματικού κόσμου.
Το GPT‑5.3‑Codex καθορίζει ένα νέο κορυφαίο πρότυπο στο SWE-Bench Pro, μια αυστηρή αξιολόγηση μηχανικής λογισμικού στον πραγματικό κόσμο. Ενώ το SWE‑bench Verified δοκιμάζει μόνο Python, το SWE‑Bench Pro καλύπτει τέσσερις γλώσσες και είναι πιο ανθεκτικό στη μόλυνση των δεδομένων, πιο απαιτητικό, ποικιλόμορφο και σχετικό με τον κλάδο. Επίσης ξεπερνά κατά πολύ την προηγούμενη κορυφαία επίδοση στο Terminal-Bench 2.0, που μετρά τις δεξιότητες τερματικού που χρειάζεται ένας πράκτορας προγραμματισμού όπως το Codex. Αξιοσημείωτο είναι ότι το GPT‑5.3‑Codex το πετυχαίνει αυτό με λιγότερα token από κάθε προηγούμενο μοντέλο, επιτρέποντας στους χρήστες να δημιουργούν περισσότερα.
Ο συνδυασμός των πρωτοποριακών δυνατοτήτων προγραμματισμού, των βελτιώσεων στην αισθητική και της συμπίεσης οδηγεί σε ένα μοντέλο που μπορεί να παράγει εντυπωσιακό έργο, δημιουργώντας από το μηδέν ιδιαίτερα λειτουργικά και σύνθετα παιχνίδια και εφαρμογές μέσα σε λίγες ημέρες. Για να δοκιμάσουμε τις δυνατότητες του μοντέλου στην ανάπτυξη web και στις μακράς διάρκειας εργασίες με πράκτορα, ζητήσαμε από το GPT‑5.3‑Codex να μας φτιάξει δύο παιχνίδια: τη δεύτερη έκδοση του παιχνιδιού racing από το λανσάρισμα της εφαρμογής Codex και ένα παιχνίδι κατάδυσης. Χρησιμοποιώντας τη δεξιότητα ανάπτυξης web παιχνιδιών και προεπιλεγμένες, γενικές διορθωτικές προτροπές όπως «διόρθωσε το bug» ή «βελτίωσε το παιχνίδι», το GPT‑5.3‑Codex διόρθωσε αυτόνομα την ανάπτυξη των παιχνιδιών σε εκατομμύρια token. Δείτε τα τρέιλερ και παίξτε τα παιχνίδια για να καταλάβετε τι μπορεί να κάνει το Codex.
Ένα παιχνίδι racing, με διαφορετικούς οδηγούς, οκτώ πίστες και αντικείμενα για χρήση με το πλήκτρο διαστήματος. Παίξτε το εδώ(ανοίγει σε νέο παράθυρο)!
Ένα παιχνίδι κατάδυσης όπου εξερευνάτε διάφορους υφάλους, τους συλλέγετε για να ολοκληρώσετε το ιχθυολογικό σας κώδικα, ενώ παράλληλα διαχειρίζεστε το οξυγόνο, την πίεση και τους κινδύνους. Παίξτε το εδώ(ανοίγει σε νέο παράθυρο)!
Το GPT‑5.3‑Codex κατανοεί επίσης καλύτερα την πρόθεσή σας όταν του ζητάτε να δημιουργήσει καθημερινά website, σε σύγκριση με το GPT‑5.2‑Codex. Απλές ή λιγότερο συγκεκριμένες προτροπές οδηγούν πλέον από προεπιλογή σε site με περισσότερη λειτουργικότητα και λογικές ρυθμίσεις, προσφέροντάς σας έναν πιο ισχυρό αρχικό καμβά για να ζωντανέψετε τις ιδέες σας.
Για παράδειγμα, ζητήσαμε από το GPT‑5.3‑Codex και το GPT‑5.2‑Codex να δημιουργήσουν δύο σελίδες προορισμού. Το GPT‑5.3‑Codex εμφάνισε αυτόματα το ετήσιο πρόγραμμα ως μειωμένη μηνιαία τιμή, κάνοντας την έκπτωση ξεκάθαρη και σκόπιμη, αντί να πολλαπλασιάζει απλώς το ετήσιο σύνολο. Δημιούργησε επίσης ένα αυτόματα εναλλασσόμενο carousel μαρτυριών με τρία διαφορετικά αποσπάσματα χρηστών αντί για ένα, με αποτέλεσμα μια σελίδα που δείχνει πιο ολοκληρωμένη και έτοιμη για παραγωγή από προεπιλογή.
Προτροπή: Φτιάξε μια σελίδα προορισμού για το Quiet KPI, μια εβδομαδιαία αναφορά μετρήσεων που να είναι φιλική προς τους ιδρυτές. Η αισθητική να είναι SaaS, με γυαλιστερές κάρτες, διαβάθμιση από λιλά σε μπλε, και διακριτικά θολωμένα σημεία. Ενότητες, hero με συλλογή email, πλέγμα καρτών δείγματος αναφοράς, σειρά ενσωματώσεων, καρουζέλ μαρτυριών, εναλλαγή μηνιαίας/ετήσιας χρέωσης, συχνές ερωτήσεις, υποσέλιδο.
- Γραμματοσειρά Satoshi ή παρόμοια γεωμετρική sans.
- Κουμπιά με απαλές γωνίες, ακτίνα 14px, έντονη εστίαση.
- Πρόσθεσε μια καλαίσθητη αποκάλυψη βασισμένη σε κύλιση.
Οι μηχανικοί λογισμικού, οι designer, οι product manager και οι data scientist κάνουν πολύ περισσότερα από το να παράγουν κώδικα. Το GPT‑5.3‑Codex έχει σχεδιαστεί για να υποστηρίζει όλο το εύρος της εργασίας στον κύκλο ζωής του λογισμικού — εντοπισμό σφαλμάτων, ανάπτυξη, παρακολούθηση, σύνταξη PRD, επιμέλεια κειμένων, έρευνα χρηστών, δοκιμές, μετρήσεις και πολλά ακόμη. Οι δυνατότητες πράκτορα που διαθέτει ξεπερνούν το λογισμικό, βοηθώντας σας να δημιουργήσετε ό,τι θέλετε — είτε πρόκειται για παρουσιάσεις είτε για ανάλυση δεδομένων σε φύλλα εργασίας.
Με προσαρμοσμένες δεξιότητες παρόμοιες με εκείνες που χρησιμοποιήθηκαν για τα προηγούμενα αποτελέσματα του GDPval, το GPT‑5.3‑Codex δείχνει επίσης ισχυρή απόδοση σε επαγγελματική εργασία γνώσης, όπως μετριέται από το GDPval, ισοφαρίζοντας το GPT‑5.2. Το GDPval είναι μια αξιολόγηση που κυκλοφόρησε η OpenAI το 2025 και μετρά την απόδοση ενός μοντέλου σε καλά προσδιορισμένες εργασίες γνώσης σε 44 επαγγέλματα. Αυτές οι εργασίες περιλαμβάνουν, μεταξύ άλλων, τη δημιουργία παρουσιάσεων, υπολογιστικών φύλλων και άλλων παραδοτέων εργασίας.
Ακολουθούν μερικά παραδείγματα της εργασίας που παρήγαγε ο πράκτορας.
Προτροπή + θεματικό πλαίσιο εργασίας
GPT-5.3-Codex output

Το OSWorld είναι ένα σημείο αναφοράς για τη χρήση υπολογιστή με πράκτορες, όπου ο πράκτορας πρέπει να ολοκληρώσει εργασίες παραγωγικότητας σε ένα οπτικό περιβάλλον επιτραπέζιου υπολογιστή. Το GPT‑5.3‑Codex επιδεικνύει πολύ ισχυρότερες δυνατότητες χρήσης υπολογιστή από τα προηγούμενα μοντέλα GPT.
Στο OSWorld-Verified, τα μοντέλα χρησιμοποιούν εικόνες για να ολοκληρώνουν διάφορες εργασίες υπολογιστή. Οι άνθρωποι επιτυγχάνουν βαθμολογία ~72%.
Συνολικά, αυτά τα αποτελέσματα στον προγραμματισμό, στο περιβάλλον που βλέπει ο χρήστης, στη χρήση υπολογιστή και σε εργασίες του πραγματικού κόσμου δείχνουν ότι το GPT‑5.3‑Codex δεν είναι απλώς καλύτερο σε μεμονωμένες εργασίες, αλλά σηματοδοτεί ένα ποιοτικό άλμα προς έναν ενιαίο, γενικής χρήσης πράκτορα που μπορεί να συλλογίζεται, να δημιουργεί και να εκτελεί σε όλο το φάσμα της πραγματικής τεχνικής εργασίας.
Καθώς οι δυνατότητες των μοντέλων γίνονται πιο ισχυρές, το χάσμα μετατοπίζεται από το τι μπορούν να κάνουν οι πράκτορες στο πόσο εύκολα οι άνθρωποι μπορούν να αλληλεπιδρούν μαζί τους, να τους κατευθύνουν και να τους επιβλέπουν όταν εργάζονται πολλοί παράλληλα. Η εφαρμογή Codex κάνει τη διαχείριση και τον συντονισμό των πρακτόρων πολύ πιο εύκολη και, με το GPT‑5.3‑Codex, γίνεται ακόμη πιο διαδραστική. Με το νέο μοντέλο, το Codex παρέχει συχνές ενημερώσεις, ώστε να είστε ενήμεροι για τις βασικές αποφάσεις και την πρόοδο όσο εργάζεται. Αντί να περιμένετε το τελικό αποτέλεσμα, μπορείτε να αλληλεπιδράτε σε πραγματικό χρόνο — να κάνετε ερωτήσεις, να συζητάτε προσεγγίσεις και να κατευθύνετε τη λύση. Το GPT‑5.3‑Codex εξηγεί τι κάνει, ανταποκρίνεται στις παρατηρήσεις σας και σας κρατά ενήμερους από την αρχή μέχρι το τέλος.
Ενεργοποιήστε την καθοδήγηση ενώ το μοντέλο λειτουργεί, από την εφαρμογή στις Ρυθμίσεις > Γενικά > Συμπεριφορά παρακολούθησης.
Οι πρόσφατες, ραγδαίες βελτιώσεις του Codex βασίζονται στους καρπούς ερευνητικών έργων που εκτείνονται σε μήνες ή και χρόνια σε όλη την OpenAI. Αυτά τα ερευνητικά έργα επιταχύνονται πλέον από το Codex, με πολλούς ερευνητές και μηχανικούς στην OpenAI να αναφέρουν ότι η δουλειά τους σήμερα είναι θεμελιωδώς διαφορετική από ό,τι ήταν μόλις πριν από δύο μήνες. Ακόμη και οι πρώιμες εκδόσεις του GPT‑5.3‑Codex έδειξαν εξαιρετικές δυνατότητες, επιτρέποντας στην ομάδα μας να δουλέψει με αυτές για να βελτιώσει την εκπαίδευση και να υποστηρίξει την ανάπτυξη των μεταγενέστερων εκδόσεων.
Το Codex είναι χρήσιμο σε ένα πολύ ευρύ φάσμα εργασιών, γεγονός που δυσκολεύει την πλήρη απαρίθμηση όλων των τρόπων με τους οποίους βοηθά τις ομάδες μας. Ενδεικτικά, η ερευνητική ομάδα χρησιμοποίησε το Codex για την παρακολούθηση και τον εντοπισμό σφαλμάτων της εκπαίδευσης για αυτήν την έκδοση. Η συμβολή του ξεπέρασε την απλή αντιμετώπιση προβλημάτων υποδομής: βοήθησε στην ανίχνευση μοτίβων καθ’ όλη τη διάρκεια της εκπαίδευσης, παρείχε σε βάθος ανάλυση της ποιότητας αλληλεπίδρασης, πρότεινε διορθώσεις και δημιούργησε πλούσιες εφαρμογές που επέτρεψαν στους ανθρώπινους ερευνητές να κατανοήσουν με ακρίβεια πώς διέφερε η συμπεριφορά του μοντέλου σε σύγκριση με προηγούμενα μοντέλα.
Η ομάδα μηχανικών χρησιμοποίησε το Codex για να βελτιστοποιήσει και να προσαρμόσει την υποδομή βάσης για το GPT‑5.3‑Codex. Όταν άρχισαν να εμφανίζονται περίεργες οριακές περιπτώσεις που επηρέαζαν τους χρήστες, τα μέλη της ομάδας χρησιμοποίησαν το Codex για να εντοπίσουν σφάλματα απόδοσης περιεχομένου στο θεματικό πλαίσιο και να εντοπίσουν τη βασική αιτία των χαμηλών ποσοστών επιτυχίας cache. Το GPT‑5.3‑Codex συνεχίζει να υποστηρίζει την ομάδα καθ’ όλη τη διάρκεια του λανσαρίσματος, κλιμακώνοντας δυναμικά συστάδες GPU για να ανταποκρίνεται σε αιχμές κίνησης και διατηρώντας σταθερή τη καθυστέρηση.
Κατά τη διάρκεια των δοκιμών alpha, ένας ερευνητής ήθελε να κατανοήσει πόση επιπλέον εργασία ολοκλήρωνε το GPT‑5.3‑Codex ανά γύρο και ποια ήταν η αντίστοιχη διαφορά στην παραγωγικότητα. Το GPT‑5.3‑Codex πρότεινε αρκετούς απλούς regex ταξινομητές για να εκτιμήσει τη συχνότητα διευκρινίσεων, θετικών και αρνητικών αποκρίσεων χρηστών και την πρόοδο της εργασίας, και στη συνέχεια τους εκτέλεσε κλιμακωτά σε όλα τα αρχεία συνεδριών, παράγοντας μια αναφορά με τα συμπεράσματά του. Όσοι δημιουργούσαν με το Codex δήλωσαν μεγαλύτερη ικανοποίηση, καθώς ο πράκτορας κατανοούσε καλύτερα την πρόθεσή τους και σημείωνε μεγαλύτερη πρόοδο ανά γύρο, με λιγότερες διευκρινιστικές ερωτήσεις.
Επειδή το GPT‑5.3‑Codex διαφέρει σημαντικά από τους προκατόχους του, τα δεδομένα από τη δοκιμή alpha εμφάνισαν πολλά ασυνήθιστα και αντιδιαισθητικά αποτελέσματα. Ένας επιστήμονας δεδομένων της ομάδας συνεργάστηκε με το GPT‑5.3‑Codex για να δημιουργήσει νέες ροές δεδομένων και να οπτικοποιήσει τα αποτελέσματα με πολύ πλουσιότερο τρόπο από ό,τι επέτρεπαν τα τυπικά εργαλεία πινακα εργαλείων. Τα αποτελέσματα αναλύθηκαν από κοινού με το Codex, το οποίο συνόψισε με σαφήνεια βασικά συμπεράσματα από χιλιάδες σημεία δεδομένων σε λιγότερο από τρία λεπτά.
Μεμονωμένα, όλες αυτές οι εργασίες αποτελούν ενδιαφέροντα παραδείγματα του πώς το Codex μπορεί να βοηθήσει ερευνητές και δημιουργούς προϊόντων. Συνολικά, διαπιστώσαμε ότι αυτές οι νέες δυνατότητες οδήγησαν σε ισχυρή επιτάχυνση των ερευνητικών, μηχανικών και προϊοντικών ομάδων μας.
Τους τελευταίους μήνες έχουμε παρατηρήσει ουσιαστικές βελτιώσεις στην απόδοση των μοντέλων σε εργασίες κυβερνοασφάλειας, προς όφελος τόσο των προγραμματιστών όσο και των επαγγελματιών ασφάλειας. Παράλληλα, προετοιμάζουμε ενισχυμένους μηχανισμούς κυβερνοασφάλειας για να υποστηρίξουμε την αμυντική χρήση και την ανθεκτικότητα του ευρύτερου οικοσυστήματος.
Το GPT‑5.3‑Codex είναι το πρώτο μοντέλο που κατατάσσουμε ως Υψηλής ικανότητας για εργασίες σχετικές με την κυβερνοασφάλεια στο πλαίσιο του Πλαισίου Ετοιμότητάς μας, και το πρώτο που εκπαιδεύσαμε άμεσα να εντοπίζει ευπάθειες λογισμικού. Παρότι δεν διαθέτουμε οριστικές αποδείξεις ότι μπορεί να αυτοματοποιήσει ολοκληρωμένα κυβερνοεπιθέσεις, υιοθετούμε μια προληπτική προσέγγιση και αναπτύσσουμε το πιο ολοκληρωμένο έως σήμερα σύνολο μέτρων κυβερνοασφάλειας. Τα μέτρα μας περιλαμβάνουν εκπαίδευση ασφάλειας, αυτοματοποιημένη παρακολούθηση, αξιόπιστη πρόσβαση σε προηγμένες δυνατότητες και αγωγούς επιβολής που ενσωματώνουν πληροφορίες απειλών.
Επειδή η κυβερνοασφάλεια είναι εκ φύσεως διπλής χρήσης, ακολουθούμε μια τεκμηριωμένη, επαναληπτική προσέγγιση που επιταχύνει τη δυνατότητα των αμυνόμενων να εντοπίζουν και να διορθώνουν ευπάθειες, ενώ ταυτόχρονα επιβραδύνει την κακόβουλη χρήση. Στο πλαίσιο αυτό, λανσάρουμε το πιλοτικό πρόγραμμα Αξιόπιστη Πρόσβαση για τον Κυβερνοχώρο για την επιτάχυνση της έρευνας στην κυβερνοάμυνα.
Επενδύουμε επίσης σε μηχανισμούς προστασίας του οικοσυστήματος, όπως η επέκταση του ιδιωτικού beta του Aardvark, του πράκτορα έρευνας ασφάλειας, ως την πρώτη προσφορά στη σουίτα προϊόντων και εργαλείων Codex Security, καθώς και συνεργασίες με συντηρητές έργων ανοιχτού κώδικα για την παροχή δωρεάν σάρωσης codebase σε ευρέως χρησιμοποιούμενα έργα όπως το Next.js — όπου ερευνητής ασφάλειας χρησιμοποίησε το Codex για να εντοπίσει ευπάθειες που αποκαλύφθηκαν(ανοίγει σε νέο παράθυρο) την προηγούμενη εβδομάδα.
Βασιζόμενοι στο πρόγραμμα Cybersecurity Grant Program ύψους 1 εκατ. δολαρίων που ξεκινήσαμε το 2023, δεσμευόμαστε επιπλέον για 10 εκατ. δολάρια σε μονάδες API ώστε να επιταχύνουμε την κυβερνοάμυνα με τα πιο ικανά μας μοντέλα, ιδίως για λογισμικό ανοιχτού κώδικα και συστήματα κρίσιμων υποδομών. Οργανισμοί που συμμετέχουν σε έρευνα ασφάλειας με καλή πίστη μπορούν να υποβάλουν αίτηση για μονάδες API και υποστήριξη μέσω του προγράμματος Cybersecurity Grant Program.
Το GPT‑5.3‑Codex είναι διαθέσιμο με τα επί πληρωμή προγράμματα ChatGPT, παντού όπου μπορείτε να χρησιμοποιήσετε το Codex: στην εφαρμογή, στο CLI, στην επέκταση IDE και στο web. Καταβάλλουμε προσπάθειες για να ενεργοποιήσουμε σύντομα και με ασφάλεια την πρόσβαση στο API.
Με αυτή την ενημέρωση, εκτελούμε πλέον το GPT‑5.3‑Codex κατά 25% ταχύτερα για τους χρήστες του Codex, χάρη σε βελτιώσεις στην υποδομή και στο inference stack μας, με αποτέλεσμα πιο γρήγορες αλληλεπιδράσεις και ταχύτερα αποτελέσματα.
Το GPT‑5.3‑Codex συνσχεδιάστηκε, εκπαιδεύτηκε και εξυπηρετείται σε συστήματα NVIDIA GB200 NVL72. Ευχαριστούμε την NVIDIA για τη συνεργασία.
Με το GPT‑5.3‑Codex, το Codex ξεπερνά τη σύνταξη κώδικα και χρησιμοποιεί τον κώδικα ως εργαλείο για να χειρίζεται έναν υπολογιστή και να ολοκληρώνει εργασίες. Διευρύνοντας τα όρια του τι μπορεί να κάνει ένας πράκτορας προγραμματισμού, ξεκλειδώνουμε ταυτόχρονα μια ευρύτερη κατηγορία εργασίας γνώσης — από τη δημιουργία και την ανάπτυξη λογισμικού έως την έρευνα, την ανάλυση και την εκτέλεση σύνθετων εργασιών. Ξεκίνησε ως στόχος για να γίνει ο καλύτερος πράκτορας προγραμματισμού και έχει εξελιχθεί στο θεμέλιο για έναν πιο γενικό συνεργάτη στον υπολογιστή, διευρύνοντας τόσο το ποιος μπορεί να δημιουργεί όσο και το τι είναι δυνατό με το Codex.
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (Δημόσια μορφή) | 56,8% | 56,4% | 55,6% |
Terminal-Bench 2.0 | 77,3% | 64,0% | 62,2% |
OSWorld-Verified | 64,7% | 38,2% | 37,9% |
GDPval (νίκες ή ισοπαλίες) | 70,9% | - | 70,9% (υψηλό) |
Cybersecurity Capture The Flag Challenges | 77,6% | 67,4% | 67,7% |
SWE-lancer IC Diamond | 81,4% | 76,0% | 74,6% |


