Σήμερα, κυκλοφορούμε μια προεπισκόπηση έρευνας του GPT‑5.3‑Codex‑Spark, μια μικρότερη έκδοση του GPT‑5.3‑Codex, και το πρώτο μας μοντέλο που έχει σχεδιαστεί για προγραμματισμό σε πραγματικό χρόνο. Το Codex-Spark σηματοδοτεί το πρώτο ορόσημο στη συνεργασία μας με τη Cerebras, την οποία ανακοινώσαμε τον Ιανουάριο. Το Codex-Spark είναι βελτιστοποιημένο για ώστε να αποδίδει σχεδόν άμεσα όταν εκτελείται σε υλικό με εξαιρετικά χαμηλή καθυστέρηση, με πάνω από 1.000 token ανά δευτερόλεπτο, ενώ παραμένει εξαιρετικά ικανό σε πραγματικές εργασίες προγραμματισμού.
Παρουσιάζουμε το Codex-Spark στη Cerebras ως προεπισκόπηση έρευνας στους χρήστες του ChatGPT Pro, ώστε οι προγραμματιστές να μπορούν να ξεκινήσουν να πειραματίζονται από νωρίς, ενώ συνεργαζόμαστε με τη Cerebras για να αυξήσουμε τη χωρητικότητα των κέντρων δεδομένων, να ενισχύσουμε την ολοκληρωμένη εμπειρία χρήστη και να αναπτύξουμε τα μεγαλύτερα κορυφαία μοντέλα μας.
Τα πιο πρόσφατα κορυφαία μοντέλα μας έχουν επιδείξει ιδιαίτερα πλεονεκτήματα ως προς την ικανότητά τους να εκτελούν εργασίες μεγάλης διάρκειας, λειτουργώντας αυτόνομα για ώρες, ημέρες ή εβδομάδες, χωρίς παρέμβαση. Το Codex-Spark είναι το πρώτο μοντέλο μας που έχει σχεδιαστεί ειδικά για εργασία με το Codex σε πραγματικό χρόνο — για να κάνετε στοχευμένη επεξεργασία, να αλλάζετε τη λογική ή να βελτιώνετε περιβάλλοντα χρήστη και να βλέπετε άμεσα τα αποτελέσματα. Με το Codex-Spark, το Codex υποστηρίζει πλέον τόσο μακροχρόνιες, φιλόδοξες εργασίες όσο και την άμεση ολοκλήρωση εργασιών. Ελπίζουμε να αποκομίσουμε σημαντικά διδάγματα από τον τρόπο με τον οποίο το χρησιμοποιούν οι προγραμματιστές και να προσαρμοστούμε στα σχόλιά τους καθώς συνεχίζουμε να επεκτείνουμε την πρόσβαση.
Κατά την κυκλοφορία, το Codex-Spark διαθέτει παράθυρο θεματικού πλαισίου 128.000 και είναι μόνο για κείμενο. Κατά τη διάρκεια της προεπισκόπησης έρευνας, το Codex-Spark θα έχει τα δικά του όρια ρυθμού και η χρήση δεν θα προσμετράται στα τυπικά όρια ρυθμού. Ωστόσο, όταν η ζήτηση είναι υψηλή, ενδέχεται να παρατηρήσετε περιορισμένη πρόσβαση ή προσωρινή αναμονή, καθώς εξισορροπούμε την αξιοπιστία μεταξύ των χρηστών.
Το Codex-Spark είναι βελτιστοποιημένο για διαδραστική εργασία όπου η καθυστέρηση έχει την ίδια σημασία με τη νοημοσύνη. Μπορείτε να συνεργαστείτε με το μοντέλο σε πραγματικό χρόνο, να το διακόπτετε ή να το ανακατευθύνετε καθώς εργάζεται, και να κάνετε γρήγορα διορθώσεις με σχεδόν άμεση απόκριση. Επειδή είναι σχεδιασμένο με γνώμονα την ταχύτητα, το Codex-Spark διατηρεί την προεπιλεγμένη του λειτουργική προσέγγιση ελαφριά: κάνει ελάχιστες, στοχευμένες επεξεργασίες και δεν εκτελεί αυτόματα δοκιμές, εκτός αν το ζητήσετε.
Το Codex-Spark είναι ένα ιδιαίτερα ικανό μικρό μοντέλο που έχει βελτιστοποιηθεί με γνώμονα τη γρήγορη επεξεργασία. Στους δείκτες αξιολόγησης SWE-Bench Pro και Terminal-Bench 2.0, που αξιολογούν την ικανότητα μηχανικής λογισμικού με πράκτορα, το GPT‑5.3‑Codex‑Spark επιδεικνύει ισχυρή απόδοση ενώ ολοκληρώνει τις εργασίες σε ένα κλάσμα του χρόνου σε σύγκριση με το GPT‑5.3‑Codex.
Η διάρκεια εκτιμάται ως το άθροισμα του (1) χρόνου δημιουργίας αποτελέσματος (token αποτελέσματος ÷ ταχύτητα δειγματοληψίας), (2) χρόνου προσυμπλήρωσης (token προσυμπλήρωσης ÷ ταχύτητα προσυμπλήρωσης), (3) συνολικού χρόνου εκτέλεσης του εργαλείου και (4) συνολικού δικτυακού φόρτου.
Καθώς εκπαιδεύαμε το Codex-Spark, έγινε σαφές ότι η ταχύτητα του μοντέλου ήταν μόνο ένα μέρος της εξίσωσης για τη συνεργασία σε πραγματικό χρόνο — έπρεπε επίσης να μειώσουμε την καθυστέρηση σε ολόκληρη τη διαδικασία αιτήματος-απόκρισης. Έτσι, προχωρήσαμε σε βελτιώσεις στην καθυστέρηση από άκρο σε άκρο στο σύστημά μας, οι οποίες θα ωφελήσουν όλα τα μοντέλα. Στο παρασκήνιο, απλοποιήσαμε τον τρόπο με τον οποίο οι απαντήσεις ρέουν από τον πελάτη προς τον διακομιστή και πίσω, ξαναγράψαμε βασικά τμήματα της στοίβας εξαγωγής συμπερασμάτων μας και αναδιαμορφώσαμε τον τρόπο με τον οποίο αρχικοποιούνται οι συνεδρίες, ώστε το πρώτο ορατό token να εμφανίζεται νωρίτερα και το Codex να συνεχίζει να ανταποκρίνεται καθώς κάνετε διορθώσεις. Μέσω της εισαγωγής μόνιμης σύνδεσης WebSocket και στοχευμένων βελτιστοποιήσεων εντός του API Responses, μειώσαμε το φορτίο ανά κύκλο πελάτη/διακομιστή κατά 80%, το φορτίο ανά token κατά 30% και τον χρόνο έως το πρώτο token κατά 50%. Η διαδρομή WebSocket είναι ενεργοποιημένη για το Codex-Spark από προεπιλογή και σύντομα θα αποτελέσει την προεπιλογή για όλα τα μοντέλα.
Το Codex-Spark εκτελείται στο Wafer Scale Engine 3(ανοίγει σε νέο παράθυρο)της Cerebras, έναν επιταχυντή ΤΝ ειδικά σχεδιασμένο για υψηλής ταχύτητας παρέμβαση, προσφέροντας στο Codex ένα επίπεδο εξυπηρέτησης με προτεραιότητα στη χαμηλή καθυστέρηση. Συνεργαστήκαμε με τη Cerebras με σκοπό να προσθέσουμε αυτήν τη διαδρομή χαμηλής καθυστέρησης στην ίδια στοίβα εξυπηρέτησης παραγωγής με το υπόλοιπο του στόλου μας, ώστε να λειτουργεί απρόσκοπτα σε όλο το Codex και να μας προετοιμάσει για την υποστήριξη μελλοντικών μοντέλων.
«Αυτό που μας ενθουσιάζει περισσότερο σχετικά με το GPT-5.3-Codex-Spark είναι η συνεργασία με την OpenAI και την κοινότητα προγραμματιστών, προκειμένου να ανακαλύψουμε τι καθιστά δυνατή η γρήγορη επεξεργασία — νέα μοτίβα αλληλεπίδρασης, νέα σενάρια χρήσης και μια θεμελιωδώς διαφορετική εμπειρία μοντέλου. Αυτή η προεπισκόπηση είναι μόνο η αρχή.»
Οι GPU παραμένουν θεμελιώδεις σε όλες τις διαδικασίες εκπαίδευσης και συμπερασματολογίας μας και προσφέρουν τα πιο οικονομικά token για ευρεία χρήση. Η Cerebras συμπληρώνει αυτήν τη βάση, διαπρέποντας σε ροές εργασίας που απαιτούν εξαιρετικά χαμηλή καθυστέρηση, σφίγγοντας τον βρόχο από την αρχή μέχρι το τέλος, ώστε το Codex να χαρίζει πιο άμεση αίσθηση, καθώς κάνετε διορθώσεις. Οι GPU και Cerebras μπορούν να συνδυαστούν για μεμονωμένους φόρτους εργασίας ώστε να επιτευχθεί η καλύτερη απόδοση.
Το Codex-Spark κυκλοφορεί σήμερα ως προεπισκόπηση έρευνας για τους χρήστες του ChatGPT Pro στις πιο πρόσφατες εκδόσεις της εφαρμογής Codex, του CLI και της επέκτασης VS Code. Επειδή εκτελείται σε εξειδικευμένο υλικό χαμηλής καθυστέρησης, η χρήση διέπεται από ένα ξεχωριστό όριο ρυθμού που μπορεί να προσαρμόζεται ανάλογα με τη ζήτηση κατά τη διάρκεια της προεπισκόπησης της έρευνας. Επιπλέον, διαθέτουμε το Codex-Spark στο API για ένα μικρό σύνολο συνεργατών σχεδιασμού, ώστε να κατανοήσουμε πώς οι προγραμματιστές προτίθενται να ενσωματώσουν το Codex-Spark στα προϊόντα τους. Θα επεκτείνουμε την πρόσβαση τις επόμενες εβδομάδες καθώς συνεχίζουμε να ρυθμίζουμε την ενσωμάτωσή μας υπό πραγματικούς φόρτους εργασίας.
Το Codex-Spark προορίζεται, προς το παρόν, μόνο για κείμενο, με παράθυρο θεματικού πλαισίου 128.000, και είναι το πρώτο σε μια οικογένεια εξαιρετικά γρήγορων μοντέλων. Καθώς αποκομίζουμε περισσότερα διδάγματα από την κοινότητα των προγραμματιστών σχετικά με το πού τα γρήγορα μοντέλα υπερέχουν στον προγραμματισμό, θα προσθέσουμε ακόμη περισσότερες δυνατότητες, συμπεριλαμβανομένων μεγαλύτερων μοντέλων, μεγαλύτερων ορίων θεματικού πλαισίου και πολυτροπικής εισαγωγής.
Το Codex-Spark περιλαμβάνει την ίδια εκπαίδευση ασφάλειας όπως τα κύρια μοντέλα μας, συμπεριλαμβανομένης της εκπαίδευσης που σχετίζεται με την κυβερνοασφάλεια. Αξιολογήσαμε το Codex-Spark στο πλαίσιο της τυπικής διαδικασίας διάθεσής μας, η οποία περιλαμβάνει βασικές αξιολογήσεις για την κυβερνοασφάλεια και άλλες δυνατότητες, και διαπιστώσαμε ότι δεν έχει εύλογη πιθανότητα να φτάσει το όριο του Πλαισίου Ετοιμότητάς μας για υψηλή ικανότητα στην κυβερνοασφάλεια ή τη βιολογία.
Το Codex-Spark είναι το πρώτο βήμα προς ένα Codex με δύο συμπληρωματικές λειτουργίες: συλλογιστική και εκτέλεση με μεγαλύτερο χρονικό ορίζοντα, και συνεργασία σε πραγματικό χρόνο για γρήγορες διορθώσεις. Με την πάροδο του χρόνου, οι λειτουργίες θα συγχωνευτούν. Το Codex μπορεί να σας κρατά σε έναν στενό διαδραστικό βρόχο, ενώ αναθέτει εργασίες μεγαλύτερης διάρκειας σε δευτερεύοντες πράκτορες στο παρασκήνιο ή να διαμοιράζει εργασίες σε πολλά μοντέλα παράλληλα, όταν για εσάς έχει σημασία το εύρος και η ταχύτητα, ώστε να μη χρειάζεται να επιλέξετε μία μόνο λειτουργία εξαρχής.
Καθώς τα μοντέλα γίνονται όλο και πιο ικανά, η ταχύτητα αλληλεπίδρασης εξελίσσεται σε σαφές σημείο συμφόρησης. Η εξαιρετικά γρήγορη εξαγωγή συμπερασμάτων περιορίζει αυτόν τον κύκλο, καθιστώντας το Codex πιο φυσικό στη χρήση και διευρύνοντας τα όρια του δυνατού για οποιονδήποτε μετατρέπει μια ιδέα σε λειτουργικό λογισμικό.


