Η εξέλιξη του Agents SDK
Το ενημερωμένο Agents SDK βοηθά τους προγραμματιστές να δημιουργούν πράκτορες που μπορούν να εξετάζουν αρχεία, να εκτελούν εντολές, να επεξεργάζονται κώδικα και να εκτελούν εργασίες μακράς διάρκειας μέσα σε ελεγχόμενα απομονωμένα περιβάλλοντα.
Παρουσιάζουμε νέες δυνατότητες στο Agents SDK που προσφέρουν στους προγραμματιστές τυποποιημένη υποδομή, η οποία τους διευκολύνει να ξεκινήσουν και έχει σχεδιαστεί σωστά για τα μοντέλα της OpenAI: ένα εγγενές στο μοντέλο πλαίσιο λειτουργίας που επιτρέπει στους πράκτορες να εργάζονται σε αρχεία και εργαλεία σε έναν υπολογιστή, καθώς και εγγενή εκτέλεση σε περιβάλλοντα απομόνωσης, για την ασφαλή εκτέλεση αυτής της εργασίας.
Για παράδειγμα, οι προγραμματιστές μπορούν να παρέχουν σε έναν πράκτορα έναν ελεγχόμενο χώρο εργασίας, σαφείς οδηγίες και τα εργαλεία που χρειάζεται για να εξετάζει στοιχεία:
Οι προγραμματιστές χρειάζονται περισσότερα από τα καλύτερα μοντέλα για να δημιουργούν χρήσιμους πράκτορες — χρειάζονται συστήματα που υποστηρίζουν τον τρόπο με τον οποίο οι πράκτορες επιθεωρούν αρχεία, εκτελούν εντολές, γράφουν κώδικα και συνεχίζουν να λειτουργούν σε πολλά βήματα.
Τα συστήματα που υπάρχουν σήμερα συνοδεύονται από συμβιβασμούς καθώς οι ομάδες μεταβαίνουν από τα πρωτότυπα στην παραγωγή. Τα πλαίσια είναι ανεξάρτητα από τα μοντέλα και ευέλικτα, αλλά δεν αξιοποιούν πλήρως τις δυνατότητες των κορυφαίων μοντέλων. Τα SDK παρόχων μοντέλων μπορούν να βρίσκονται πιο κοντά στο μοντέλο, αλλά συχνά δεν προσφέρουν επαρκή ορατότητα στο περιβάλλον εκτέλεσης, ενώ τα διαχειριζόμενα API πρακτόρων μπορούν να απλοποιήσουν την ανάπτυξη, αλλά περιορίζουν το πού εκτελούνται οι πράκτορες και τον τρόπο με τον οποίο αποκτούν πρόσβαση σε ευαίσθητα δεδομένα.
Δείτε τι λένε ορισμένοι από τους πελάτες που δοκίμασαν μαζί μας το νέο SDK:
«Το GPT-5.4 θέτει ένα νέο σημείο αναφοράς για νομική εργασία με πολλά έγγραφα. Στην αξιολόγηση BigLaw Bench, σημείωσε 91%. Σε σύγκριση με άλλα μοντέλα, το GPT-5.4 είναι αυτήν τη στιγμή καλύτερο στη δόμηση σύνθετης ανάλυσης συναλλαγών, στη διατήρηση της ακρίβειας σε εκτενείς συμβάσεις και στην παροχή του υψηλού επιπέδου λεπτομέρειας που απαιτούν οι επαγγελματίες από τον χώρο της νομικής.»
Με τη σημερινή κυκλοφορία, το πλαίσιο αξιοποίησης του Agents SDK γίνεται πιο ικανό για πράκτορες που εργάζονται με έγγραφα, αρχεία και συστήματα. Πλέον προσθέτει διαμορφώσιμη μνήμη, συντονισμό με επίγνωση του απομονωμένου περιβάλλοντος, εργαλεία συστήματος αρχείων παρόμοια με του Codex και τυποποιημένες ενσωματώσεις με primitive που γίνονται κοινά στα κορυφαία συστήματα πρακτόρων.
Αυτά τα δομικά στοιχεία περιλαμβάνουν χρήση εργαλείων μέσω MCP(ανοίγει σε νέο παράθυρο), σταδιακή αποκάλυψη μέσω δεξιοτήτων(ανοίγει σε νέο παράθυρο), προσαρμοσμένες οδηγίες μέσω AGENTS.md(ανοίγει σε νέο παράθυρο), εκτέλεση κώδικα με το εργαλείο shell(ανοίγει σε νέο παράθυρο), επεξεργασία αρχείων με το εργαλείο apply patch(ανοίγει σε νέο παράθυρο) και άλλα. Ο μηχανισμός θα συνεχίσει να ενσωματώνει νέα μοτίβα με πράκτορα και νέα δομικά στοιχεία με την πάροδο του χρόνου, ώστε οι προγραμματιστές να αφιερώνουν λιγότερο χρόνο σε ενημερώσεις της βασικής υποδομής και περισσότερο χρόνο στη λογική ειδική για τον τομέα τους, η οποία καθιστά τους πράκτορές τους χρήσιμους.
Το πλαίσιο βοηθά επίσης τους προγραμματιστές να αξιοποιήσουν ακόμη περισσότερο τις δυνατότητες ενός κορυφαίου μοντέλου, ευθυγραμμίζοντας την εκτέλεση με τον τρόπο με τον οποίο αυτά τα μοντέλα αποδίδουν καλύτερα. Αυτό κρατά τους πράκτορες πιο κοντά στο φυσικό μοτίβο λειτουργίας του μοντέλου, βελτιώνοντας την αξιοπιστία και την απόδοση σε σύνθετες εργασίες — ιδιαίτερα όταν η εργασία είναι μακράς διάρκειας ή συντονίζεται σε ένα ποικιλόμορφο σύνολο εργαλείων και συστημάτων.
Επιπλέον, αναγνωρίζουμε ότι κάθε προϊόν είναι μοναδικό και σπάνια εντάσσεται απόλυτα σε ένα προκαθορισμένο καλούπι. Σχεδιάσαμε το Agents SDK με γνώμονα αυτήν την ποικιλομορφία. Οι προγραμματιστές αποκτούν έναν μηχανισμό έτοιμο προς χρήση αλλά ευέλικτο —διευκολύνοντας την προσαρμογή του στη δική τους στοίβα τεχνολογιών— συμπεριλαμβανομένων της χρήσης εργαλείων, της μνήμης και του περιβάλλοντος δοκιμών.
Το ενημερωμένο Agents SDK υποστηρίζει εγγενώς την εκτέλεση σε απομονωμένο περιβάλλον, ώστε οι πράκτορες να μπορούν να εκτελούνται σε ελεγχόμενα υπολογιστικά περιβάλλοντα με τα αρχεία, τα εργαλεία και τις εξαρτήσεις που χρειάζονται για μια εργασία.
Πολλοί χρήσιμοι πράκτορες χρειάζονται έναν χώρο εργασίας όπου μπορούν να διαβάζουν και να γράφουν αρχεία, να εγκαθιστούν εξαρτήσεις, να εκτελούν κώδικα, και να χρησιμοποιούν εργαλεία με ασφάλεια. Η εγγενής υποστήριξη απομονωμένου περιβάλλοντος παρέχει στους προγραμματιστές αυτό το επίπεδο εκτέλεσης εξαρχής, αντί να τους αναγκάζει να το συνθέτουν μόνοι τους.
Οι προγραμματιστές μπορούν είτε να φέρουν το δικό τους απομονωμένο περιβάλλον είτε να χρησιμοποιήσουν την ενσωματωμένη υποστήριξη για τα Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop και Vercel.
Για να καταστήσει αυτά τα περιβάλλοντα φορητά μεταξύ παρόχων, το SDK εισάγει επίσης μια αφαίρεση Manifest για την περιγραφή του χώρου εργασίας του πράκτορα. Οι προγραμματιστές μπορούν να προσαρτούν τοπικά αρχεία, να ορίζουν καταλόγους αποτελεσμάτων και να εισάγουν δεδομένα από παρόχους αποθήκευσης, συμπεριλαμβανομένων των AWS S3, Google Cloud Storage, Azure Blob Storage και Cloudflare R2.
Έτσι, οι προγραμματιστές έχουν στη διάθεσή τους έναν συνεπή τρόπο να διαμορφώνουν το περιβάλλον του πράκτορα από το τοπικό πρωτότυπο έως την ανάπτυξη στην παραγωγή. Επίσης, το μοντέλο έχει στη διάθεσή του έναν προβλέψιμο χώρο εργασίας: πού να βρίσκει τα δεδομένα εισαγωγής, πού να γράφει τα αποτελέσματα και πώς να διατηρεί την εργασία οργανωμένη σε μια εργασία μεγάλης διάρκειας.

Τα συστήματα πρακτόρων θα πρέπει να σχεδιάζονται με την παραδοχή ότι θα δεχτούν επιθέσεις μέσω έγχυσης προτροπών και απόπειρες εξαγωγής δεδομένων. Ο διαχωρισμός του πλαισίου και της υπολογιστικής ισχύος βοηθά να μην εκτίθενται τα στοιχεία σύνδεσης σε περιβάλλοντα όπου εκτελείται κώδικας που δημιουργείται από το μοντέλο.
Επίσης, είναι δυνατή η διαρκής εκτέλεση. Όταν η κατάσταση του πράκτορα εξωτερικεύεται, η απώλεια ενός κοντέινερ απομονωμένου περιβάλλοντος δεν συνεπάγεται απώλεια της εκτέλεσης. Με ενσωματωμένες δυνατότητες λήψης στιγμιοτύπων και επανυδάτωσης, το Agents SDK μπορεί να επαναφέρει την κατάσταση του πράκτορα σε ένα νέο κοντέινερ και να συνεχίσει από το τελευταίο σημείο ελέγχου, αν το αρχικό περιβάλλον αποτύχει ή λήξει.
Τέλος, οι πράκτορες έχουν καλύτερη δυνατότητα κλιμάκωσης. Οι εκτελέσεις πρακτόρων μπορούν να χρησιμοποιούν ένα ή πολλά απομονωμένα περιβάλλοντα, να καλούν απομονωμένα περιβάλλοντα μόνο όταν χρειάζεται, να δρομολογούν υποπράκτορες σε απομονωμένα περιβάλλοντα και να παραλληλοποιούν την εργασία σε κοντέινερ για ταχύτερη εκτέλεση.
Αυτές οι νέες δυνατότητες του Agents SDK είναι γενικά διαθέσιμες σε όλους τους πελάτες μέσω του API και χρεώνονται με τις τυπικές τιμές του API, με βάση τα token και τη χρήση εργαλείων.
Καθώς συνεχίζουμε να αναπτύσσουμε το Agents SDK, θα επεκτείνουμε όσα μπορούν να δημιουργούν οι προγραμματιστές με αυτό, διευκολύνοντάς τους να θέτουν σε παραγωγική λειτουργία πιο ικανούς πράκτορες με λιγότερη προσαρμοσμένη υποδομή, διατηρώντας παράλληλα την ευελιξία και τον έλεγχο που χρειάζονται οι προγραμματιστές για να εντάσσουν τους πράκτορες στα δικά τους περιβάλλοντα.
Οι νέες δυνατότητες harness και sandbox διατίθενται αρχικά σε Python, ενώ η υποστήριξη για TypeScript προγραμματίζεται για μελλοντική έκδοση. Παράλληλα, καταβάλλουμε προσπάθειες για να προσθέσουμε επιπλέον δυνατότητες πράκτορα, συμπεριλαμβανομένων της λειτουργίας κώδικα και των υποπρακτόρων, τόσο στην Python όσο και στην TypeScript.
Επιπλέον, θέλουμε να συμβάλουμε ώστε να ενοποιηθεί με την πάροδο του χρόνου το ευρύτερο οικοσύστημα πρακτόρων, με υποστήριξη για περισσότερους παρόχους sandbox, περισσότερες ενσωματώσεις και περισσότερους τρόπους ώστε οι προγραμματιστές να ενσωματώνουν το SDK στα εργαλεία και τα συστήματα που ήδη χρησιμοποιούν.


