18 Δεκεμβρίου 2025

Ανακαλύψτε το GPT‑5.2‑Codex

Το πιο προηγμένο μοντέλο προγραμματισμού με πράκτορα για επαγγελματίες μηχανικούς λογισμικού και αμυντική κυβερνοασφάλεια.

$ npm i -g @openai/codex

Σήμερα διαθέτουμε το GPT‑5.2‑Codex, το πιο προηγμένο μοντέλο προγραμματισμού με πράκτορα μέχρι σήμερα για σύνθετη μηχανική λογισμικού στον πραγματικό κόσμο. Το GPT‑5.2‑Codex είναι μια έκδοση του GPT‑5.2⁠ που έχει βελτιστοποιηθεί περαιτέρω για προγραμματισμό με πράκτορα στο Codex, περιλαμβάνοντας βελτιώσεις σε εργασίες μεγάλης διάρκειας μέσω συμπύκνωσης περιβάλλοντος, ισχυρότερη απόδοση σε μεγάλες αλλαγές κώδικα όπως αναδιαρθρώσεις και μεταφορές, βελτιωμένη απόδοση σε περιβάλλοντα Windows και σημαντικά ισχυρότερες δυνατότητες κυβερνοασφάλειας.

Καθώς τα μοντέλα μας συνεχίζουν να εξελίσσονται στο μέτωπο της νοημοσύνης, έχουμε παρατηρήσει ότι αυτές οι βελτιώσεις σημειώνουν επίσης μεγάλη πρόοδο ως προς τις δυνατότητές τους σε εξειδικευμένους τομείς όπως είναι η κυβερνοασφάλεια⁠. Για παράδειγμα, μόλις την προηγούμενη εβδομάδα, ένας ερευνητής ασφαλείας, χρησιμοποιώντας το GPT‑5.1‑Codex‑Max με το Codex CLI εντόπισε και αποκάλυψε⁠(ανοίγει σε νέο παράθυρο) υπεύθυνα μια ευπάθεια στο React που θα μπορούσε να οδηγήσει σε έκθεση του πηγαίου κώδικα.

Το GPT‑5.2‑Codex διαθέτει ισχυρότερες δυνατότητες κυβερνοασφάλειας από οποιοδήποτε μοντέλο έχουμε κυκλοφορήσει μέχρι σήμερα. Αυτές οι εξελίξεις μπορούν να ενισχύσουν την κυβερνοασφάλεια σε μεγάλη κλίμακα, αλλά παράλληλα δημιουργούν νέους κινδύνους διττής χρήσης που απαιτούν προσεκτική ανάπτυξη και διάθεση. Παρότι το GPT‑5.2‑Codex δεν φτάνει σε υψηλό επίπεδο («High») κυβερνοδυνατοτήτων στο πλαίσιο του Πλαισίου Ετοιμότητάς μας, σχεδιάζουμε την προσέγγιση διάθεσής⁠ του έχοντας υπόψη τη μελλοντική αύξηση των δυνατοτήτων του.

Διαθέτουμε το GPT‑5.2‑Codex σήμερα σε όλες τις επιφάνειες του Codex για τους χρήστες επί πληρωμή του ChatGPT, και καταβάλλουμε προσπάθειες για την ασφαλή ενεργοποίηση της πρόσβασης στο GPT‑5.2‑Codex για τους χρήστες του API τις επόμενες εβδομάδες. Παράλληλα, δοκιμάζουμε πιλοτικά την πρόσβαση μόνο με πρόσκληση για αξιόπιστη χρήση των επερχόμενων δυνατοτήτων και πιο επιτρεπτικών μοντέλων για ελεγμένους επαγγελματίες και οργανισμούς που επικεντρώνονται στην αμυντική κυβερνοασφάλεια. Πιστεύουμε ότι αυτή η προσέγγιση για την ανάπτυξη θα εξισορροπήσει την προσβασιμότητα με την ασφάλεια.

Διευρύνοντας τα όρια της μηχανικής λογισμικού στον πραγματικό κόσμο

Το GPT‑5.2‑Codex βασίζεται στα δυνατά σημεία του GPT‑5.2⁠ στην επαγγελματική εργασία γνώσης και στις πρωτοποριακές δυνατότητες προγραμματισμού με πράκτορα και χρήσης τερματικού του GPT‑5.1‑Codex‑Max⁠ . Το GPT‑5.2‑Codex είναι πλέον καλύτερο στην κατανόηση μακροσκελούς θεματικού πλαισίου, την αξιόπιστη κλήση εργαλείων, τη βελτιωμένη ακρίβεια πραγματολογικών πληροφοριών και την εγγενή συμπύκνωση, γεγονός που το καθιστά πιο αξιόπιστο συνεργάτη για μακράς διάρκειας εργασίες προγραμματισμού, παραμένοντας ταυτόχρονα αποδοτικό σε token στη συλλογιστική του.

Το GPT‑5.2‑Codex επιτυγχάνει κορυφαία απόδοση στους δείκτες αξιολόγησης SWE-Bench Pro και Terminal-Bench 2.0, οι οποίοι έχουν σχεδιαστεί για να τεστάρουν την απόδοση με πράκτορα σε ένα ευρύ φάσμα εργασιών σε ρεαλιστικά περιβάλλοντα τερματικού. Είναι επίσης πολύ πιο αποτελεσματικό και αξιόπιστο στον προγραμματισμό με πράκτορα σε εγγενή περιβάλλοντα Windows, βασιζόμενο σε δυνατότητες που εισήχθησαν στο GPT‑5.1‑Codex‑Max.

Με αυτές τις βελτιώσεις, το Codex είναι πιο ικανό να εργάζεται σε μεγάλα αποθετήρια κώδικα για εκτεταμένες συνεδρίες, διατηρώντας πλήρες θεματικό πλαίσιο. Μπορεί να ολοκληρώνει με μεγαλύτερη αξιοπιστία σύνθετες εργασίες, όπως εκτεταμένες αναδομήσεις, μεταφορές κώδικα και ανάπτυξη νέων λειτουργιών, συνεχίζοντας να διορθώνει και να βελτιώνει χωρίς να χάνει τον ειρμό, ακόμη και όταν τα πλάνα αλλάζουν ή οι προσπάθειες αποτυγχάνουν.

Στο SWE-Bench Pro⁠⁠⁠⁠, σε ένα μοντέλο δίνεται ένα αποθετήριο κώδικα και πρέπει να δημιουργήσει μια επιδιόρθωση ώστε να επιλύσει μια ρεαλιστική εργασία μηχανικής λογισμικού. Το Terminal-Bench 2.0 είναι ένας δείκτης αξιολόγησης για τη δοκιμή πρακτόρων ΤΝ σε πραγματικά περιβάλλοντα τερματικού. Οι εργασίες περιλαμβάνουν τη σύνταξη κώδικα, την εκπαίδευση μοντέλων και τη ρύθμιση διακομιστών.

Η ισχυρότερη απόδοση στα οπτικά στοιχεία επιτρέπει στο GPT‑5.2‑Codex να ερμηνεύει με μεγαλύτερη ακρίβεια στιγμιότυπα οθόνης, τεχνικά διαγράμματα, γραφήματα και επιφάνειες περιβάλλοντος χρήστη που κοινοποιούνται κατά τη διάρκεια συνεδριών προγραμματισμού.

Το Codex μπορεί να μετατρέπει γρήγορα σχεδιαστικές μακέτες σε λειτουργικά πρωτότυπα και μπορείτε να συνεργαστείτε με το Codex για να μεταφέρετε αυτά τα πρωτότυπα στην παραγωγή.

Μακέτα σχεδίασης

Πρωτότυπο που δημιουργήθηκε από το GPT‑5.2‑Codex

Προώθηση των ορίων στον κυβερνοχώρο

Καταγράφοντας την απόδοση σε μία από τις αξιολογήσεις κυβερνοασφάλειάς μας διαχρονικά, παρατηρούμε απότομη άνοδο δυνατοτήτων ξεκινώντας με το GPT‑5‑Codex, ένα ακόμη μεγάλο άλμα με το GPT‑5.1‑Codex‑Max και μια τρίτη άνοδο με το GPT‑5.2‑Codex. Αναμένουμε ότι τα επερχόμενα μοντέλα ΤΝ θα συνεχίσουν σε αυτήν την πορεία. Στο πλαίσιο της προετοιμασίας, σχεδιάζουμε και αξιολογούμε με την υπόθεση ότι κάθε νέο μοντέλο θα μπορεί να φτάσει σε υψηλά επίπεδα κυβερνοδυνατοτήτων («High»), όπως μετρώνται από το Πλαίσιο Ετοιμότητάς⁠⁠(ανοίγει σε νέο παράθυρο) μας. Παρότι το GPT‑5.2‑Codex δεν έχει ακόμη φτάσει το υψηλό επίπεδο κυβερνοδυνατοτήτων («High»), προετοιμαζόμαστε για μελλοντικά μοντέλα που θα ξεπεράσουν αυτό το όριο. Λόγω των αυξημένων κυβερνοδυνατοτήτων, έχουμε προσθέσει επιπλέον δικλίδες ασφαλείας στο μοντέλο και στο προϊόν, οι οποίες περιγράφονται στην κάρτα συστήματος⁠.

Η αξιολόγηση Professional Capture-the-Flag (CTF) μετρά πόσο συχνά το μοντέλο μπορεί να επιλύσει προχωρημένες προκλήσεις με πολλά βήματα στον πραγματικό κόσμο (που απαιτούν δεξιότητες κυβερνοασφάλειας επαγγελματικού επιπέδου) σε περιβάλλον Linux.

Πραγματικές κυβερνοδυνατότητες

Η σύγχρονη κοινωνία λειτουργεί βάσει λογισμικών και η αξιοπιστία τους εξαρτάται από την ισχυρή κυβερνοασφάλεια, δηλαδή τη διατήρηση κρίσιμων συστημάτων σε τραπεζικές υπηρεσίες, υγεία, επικοινωνίες και βασικές υπηρεσίες σε λειτουργία, την προστασία ευαίσθητων δεδομένων και τη διασφάλιση ότι οι άνθρωποι μπορούν να εμπιστεύονται το λογισμικό στο οποίο βασίζονται καθημερινά. Ευπάθειες μπορεί να υπάρχουν πολύ πριν γίνουν αντιληπτές και ο εντοπισμός, η επικύρωση και η αποκατάστασή τους συχνά εξαρτώνται από μια κοινότητα μηχανικών και ανεξάρτητων ερευνητών ασφάλειας που διαθέτουν τα κατάλληλα εργαλεία.

Στις 11 Δεκεμβρίου 2025, η ομάδα της React δημοσίευση τρεις ευπάθειες ασφάλειας που επηρέαζαν εφαρμογές βασισμένες στα React Server Components. Αυτό που έκανε την αποκάλυψη αξιοσημείωτη δεν ήταν μόνο οι ίδιες οι ευπάθειες, αλλά και ο τρόπος με τον οποίο εντοπίστηκαν.

Ο Άντριου ΜακΦέρσον, βασικό μηχανικός ασφάλειας στην Privy (εταιρεία της Stripe), χρησιμοποιούσε το GPT‑5.1‑Codex‑Max με το Codex CLI και άλλους πράκτορες προγραμματισμού, για να αναπαραγάγει και να μελετήσει μια διαφορετική κρίσιμη ευπάθεια της React που είχε αποκαλυφθεί την προηγούμενη εβδομάδα, γνωστή ως React2Shell⁠(ανοίγει σε νέο παράθυρο) (CVE-2025-55182⁠(ανοίγει σε νέο παράθυρο)). Στόχος του ήταν να αξιολογήσει πόσο αποτελεσματικά το μοντέλο μπορούσε να συνδράμει στην έρευνα ευπαθειών στον πραγματικό κόσμο.

Αρχικά επιχείρησε αρκετές αναλύσεις zero-shot, ζητώντας από το μοντέλο να εξετάσει την επιδιόρθωση και να εντοπίσει το κενό ασφαλείας που αυτό αντιμετώπιζε. Όταν αυτή η προσέγγιση δεν απέδωσε αποτελέσματα, πέρασε σε μια μέθοδο διορθωτικών προτροπών υψηλού όγκου. Όταν και αυτές οι προσεγγίσεις δεν είχαν επιτυχία, καθοδήγησε το Codex μέσα από τυπικές ροές εργασίας αμυντικής ασφάλειας, με ρύθμιση τοπικού περιβάλλοντος δοκιμών, συλλογιστική γύρω από πιθανά σημεία επίθεσης και χρήση fuzzing για τη δοκιμή του συστήματος με κακοδιαμορφωμένες εισαγωγές. Κατά την προσπάθεια αναπαραγωγής του αρχικού ζητήματος React2Shell, το Codex ανέδειξε απροσδόκητες συμπεριφορές που απαιτούσαν βαθύτερη διερεύνηση. Μέσα σε διάστημα μίας εβδομάδας, αυτή η διαδικασία οδήγησε στην ανακάλυψη προηγουμένως άγνωστων ευπαθειών, οι οποίες γνωστοποιήθηκαν υπεύθυνα στην ομάδα της React.

Διάγραμμα ροής με τίτλο «Ανακάλυψη Ευπαθειών με το Codex: CVE-2025-55183» που δείχνει μια ροή εργασίας που ξεκινά με ένα αποθετήριο Git και το Codex να σαρώνει τον κώδικα για ευπάθειες. Μια προσπάθεια zero-shot αποτυγχάνει, ακολουθούμενη από μια διαδικασία καθοδηγούμενη από ειδικούς που εξετάζει τη βάση κώδικα, εντοπίζει πιθανούς στόχους, κατασκευάζει ένα πλαίσιο και εκτελεί δοκιμή με μέθοδο fuzz σε μια εφαρμογή παραδείγματος με επαναξιολόγηση. Τα αποτελέσματα επαληθεύονται για να δημιουργηθεί μια απόδειξη της ιδέας, οδηγώντας σε υπεύθυνη αποκάλυψη και μια επιδιόρθωση που εφαρμόζεται πίσω στο αποθετήριο.

Αυτό καταδεικνύει πώς προηγμένα συστήματα ΤΝ μπορούν να επιταχύνουν ουσιαστικά το αμυντικό έργο ασφάλειας σε ευρέως χρησιμοποιούμενο, πραγματικό λογισμικό. Ταυτόχρονα, οι ίδιες δυνατότητες που βοηθούν τους αμυνόμενους να κινούνται ταχύτερα μπορούν επίσης να χρησιμοποιηθούν από άτομα με κακές προθέσεις.

Καθώς τα συστήματα με πράκτορες γίνονται όλο και πιο ικανά σε εργασίες σχετικές με την κυβερνοασφάλεια, θέτουμε ως βασική προτεραιότητα τη υπεύθυνη διάθεση αυτών των εξελίξεων, συνδυάζοντας κάθε αύξηση δυνατοτήτων με ισχυρότερες δικλίδες ασφαλείας, αυστηρότερους ελέγχους πρόσβασης και συνεχή συνεργασία με την κοινότητα ασφάλειας.

Ενδυνάμωση της κυβερνοάμυνας μέσω αξιόπιστης πρόσβασης

Οι ομάδες ασφαλείας συχνά αντιμετωπίζουν περιορισμούς όταν προσπαθούν να προσομοιώσουν απειλητικούς παράγοντες, να αναλύσουν κακόβουλο λογισμικό για την υποστήριξη της αποκατάστασης ή να δοκιμάσουν την αντοχή κρίσιμων υποδομών. Αναπτύσσουμε ένα πιλοτικό πρόγραμμα αξιόπιστης πρόσβασης για να άρουμε αυτήν την τριβή για επιλέξιμους χρήστες και οργανισμούς και να δώσουμε τη δυνατότητα σε έμπιστους αμυνόμενους να αξιοποιούν κυβερνοδυνατότητες ΤΝ αιχμής, επιταχύνοντας την κυβερνοάμυνα.

Αρχικά, το πιλοτικό πρόγραμμα θα είναι διαθέσιμο μόνο κατόπιν πρόσκλησης σε ελεγμένους επαγγελματίες ασφάλειας με ιστορικό υπεύθυνης γνωστοποίησης ευπαθειών και σε οργανισμούς με σαφή, επαγγελματικά σενάρια χρήσης στον τομέα της κυβερνοασφάλειας. Οι επιλέξιμοι συμμετέχοντες θα αποκτούν πρόσβαση στα πιο ισχυρά μοντέλα μας για αμυντικές περιπτώσεις χρήσης, ώστε να υποστηρίζεται νόμιμη εργασία διττής χρήσης.

Αν είστε επαγγελματίας ασφαλείας ή μέλος οργανισμού που δραστηριοποιείται σε ηθικό έργο ασφάλειας, όπως έρευνα ευπαθειών ή εξουσιοδοτημένος επαγγελματίας αντιπαραθετικού ελέγχου ασφαλείας (red-teaming), σας προσκαλούμε να εκδηλώσετε ενδιαφέρον για συμμετοχή και να μας αφήσετε τα σχόλιά σας για το τι θα θέλατε να δείτε από το πρόγραμμα εδώ⁠(ανοίγει σε νέο παράθυρο).

Συμπέρασμα

Το GPT‑5.2‑Codex αποτελεί ένα βήμα προόδου στον τρόπο με τον οποίο η προηγμένη ΤΝ μπορεί να υποστηρίξει τη μηχανική λογισμικού και εξειδικευμένους τομείς όπως την κυβερνοασφάλεια στον πραγματικό κόσμο, βοηθώντας προγραμματιστές και αμυνόμενους να αντιμετωπίζουν σύνθετες εργασίες μεγάλης χρονικής εμβέλειας και ενισχύοντας τα εργαλεία που είναι διαθέσιμα για την υπεύθυνη έρευνα ασφαλείας.

Με τη σταδιακή διάθεση του GPT‑5.2‑Codex, τη σύζευξη της ανάπτυξης με μηχανισμούς ασφαλείας και τη στενή συνεργασία με την κοινότητα ασφάλειας, στοχεύουμε στη μεγιστοποίηση του αμυντικού αντίκτυπου, μειώνοντας παράλληλα τον κίνδυνο κακής χρήσης. Όσα μάθουμε από αυτήν τη διάθεση θα καθοδηγήσουν άμεσα το πώς θα επεκτείνουμε την πρόσβαση με την πάροδο του χρόνου, καθώς το λογισμικό και τα όρια της κυβερνοασφάλειας συνεχίζουν να εξελίσσονται.

Συντάκτης

OpenAI

Συνεχίστε να διαβάζετε

Εμφάνιση όλων

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

Το GPT-5.6 είναι πλέον το προτιμώμενο μοντέλο στο Microsoft 365 Copilot

Προϊόν9 Ιουλ 2026

Το ChatGPT είναι πλέον συνεργάτης για τις πιο φιλόδοξες εργασίες σας

Προϊόν9 Ιουλ 2026

GPT-5.6: Κορυφαία νοημοσύνη που εξελίσσεται με τη φιλοδοξία σας

Προϊόν9 Ιουλ 2026