Ανακαλύψτε το AgentKit
Νέα εργαλεία για τη δημιουργία, την ανάπτυξη και τη βελτιστοποίηση πρακτόρων.
Σήμερα λανσάρουμε το AgentKit, ένα ολοκληρωμένο σύνολο εργαλείων για προγραμματιστές και επιχειρήσεις, για τη δημιουργία, ανάπτυξη και βελτιστοποίηση πρακτόρων. Μέχρι σήμερα, η ανάπτυξη πρακτόρων σήμαινε τη διαχείριση κατακερματισμένων εργαλείων — απαιτούσε έναν πολύπλοκο συντονισμό χωρίς σύστημα εκδόσεων, προσαρμοσμένους συνδέσμους, χειροκίνητους μηχανισμούς αξιολόγησης, προσαρμογή προτροπών και εβδομάδες εργασίας στο περιβάλλον του χρήστη, πριν από την κυκλοφορία. Με το AgentKit, οι προγραμματιστές μπορούν πλέον να σχεδιάζουν ροές εργασίας οπτικά και να ενσωματώνουν πιο γρήγορα περιβάλλοντα εργασίας βάσει πράκτορα, χρησιμοποιώντας νέα δομικά στοιχεία όπως τα εξής:
- Agent Builder: ένας οπτικός καμβάς για τη δημιουργία και την έκδοση ροών εργασίας πολλαπλών πρακτόρων
- Μητρώο συνδέσμων: ένα κεντρικό σημείο όπου οι διαχειριστές μπορούν να διαχειρίζονται πώς τα δεδομένα και τα εργαλεία συνδέονται στα προϊόντα της OpenAI
- ChatKit: ένα κιτ εργαλείων για την ενσωμάτωση προσαρμόσιμων εμπειριών συνομιλίας βασισμένων σε πράκτορα στο προϊόν σας
Επεκτείνουμε επίσης τις δυνατότητες αξιολόγησης με νέες λειτουργίες όπως σύνολα δεδομένων, βαθμολόγηση ιχνών, αυτόματη βελτιστοποίηση προτροπών και υποστήριξη μοντέλων τρίτων, ώστε να είναι δυνατή η μέτρηση και η βελτίωση της απόδοσης των πρακτόρων.
Από την κυκλοφορία του Responses API και του Agents SDK τον Μάρτιο, έχουμε δει προγραμματιστές και επιχειρήσεις να δημιουργούν ολοκληρωμένες ροές εργασίας βάσει πράκτορα για έρευνα σε βάθος, υποστήριξη πελατών και άλλα. Η Klarna δημιούργησε έναν πράκτορα υποστήριξης που διαχειρίζεται τα δύο τρίτα όλων των αιτημάτων, ενώ η Clay δεκαπλασίασε την ανάπτυξή της με έναν πράκτορα πωλήσεων. Το AgentKit βασίζεται στο Responses API και βοηθά τους προγραμματιστές να δημιουργούν πράκτορες πιο αποδοτικά και αξιόπιστα.
Καθώς οι ροές εργασίας των πρακτόρων γίνονται πιο περίπλοκες, οι προγραμματιστές χρειάζονται μεγαλύτερη διαφάνεια σχετικά με τον τρόπο λειτουργίας τους. Το Agent Builder(ανοίγει σε νέο παράθυρο) προσφέρει έναν οπτικό καμβά για τη σύνθεση λογικής με κόμβους μεταφοράς και απόθεσης, τη σύνδεση εργαλείων και τη διαμόρφωση προσαρμοσμένων δικλείδων ασφαλείας. Υποστηρίζει δοκιμαστικές εκτελέσεις, ενσωματωμένη διαμόρφωση αξιολογήσεων και πλήρες σύστημα εκδόσεων — ιδανικό για γρήγορες επαναληπτικές διαδικασίες.

Οι δημιουργοί μπορούν να ξεκινήσουν είτε με έναν άδειο καμβά είτε με έτοιμα πρότυπα.
Στη Ramp, η ομάδα πέρασε από έναν άδειο καμβά σε έναν πράκτορα αγορών μέσα σε λίγες ώρες.
Το Agent Builder μετέτρεψε μια διαδικασία που παλαιότερα απαιτούσε μήνες πολύπλοκου συντονισμού, προσαρμοσμένου κώδικα και χειροκίνητων βελτιστοποιήσεων σε υπόθεση λίγων ωρών. Ο οπτικός καμβάς διατηρεί τα τμήματα προϊόντος, νομικού και μηχανικών απολύτως ευθυγραμμισμένα, μειώνοντας τους κύκλους επαναληπτικών διορθώσεων κατά 70% και επιτρέποντας την υλοποίηση ενός πράκτορα σε δύο sprint αντί για δύο τρίμηνα.
Αντίστοιχα, η LY Corporation, κορυφαία ιαπωνική εταιρεία τεχνολογίας και διαδικτυακών υπηρεσιών, δημιούργησε έναν πράκτορα-βοηθό εργασίας με το Agent Builder σε λιγότερο από δύο ώρες.
«Το Agent Builder μάς επέτρεψε να συνθέσουμε πράκτορες με έναν εντελώς νέο τρόπο, με μηχανικούς και ειδικούς επί του αντικειμένου να συνεργάζονται μέσα από ένα ενιαίο περιβάλλον εργασίας. Δημιουργήσαμε την πρώτη μας ροή εργασίας πολλαπλών πρακτόρων και τη θέσαμε σε λειτουργία σε λιγότερο από δύο ώρες, επιταχύνοντας θεαματικά τον χρόνο δημιουργίας και ανάπτυξης πρακτόρων.»
Παρουσιάζουμε επίσης το Μητρώο Συνδέσμων για επιχειρήσεις, ώστε να μπορούν να εποπτεύουν και να διαχειρίζονται δεδομένα σε πολλούς χώρους εργασίας και οργανισμούς. Το Μητρώο Συνδέσμων(ανοίγει σε νέο παράθυρο) ενοποιεί όλες τις πηγές δεδομένων σε έναν ενιαίο πίνακα διαχείρισης για το ChatGPT και το API. Περιλαμβάνει όλους τους προ-ενσωματωμένους συνδέσμους, όπως τα Dropbox, Google Drive, SharePoint και Microsoft Teams, καθώς και εξωτερικά MCP.
Οι προγραμματιστές μπορούν επίσης να ενεργοποιήσουν δικλείδες ασφαλείας(ανοίγει σε νέο παράθυρο) στο Agent Builder, ένα ανοικτού κώδικα, αρθρωτό επίπεδο ασφάλειας που βοηθά στην προστασία των πρακτόρων από ακούσιες ή κακόβουλες συμπεριφορές. Οι δικλείδες ασφαλείας μπορούν να αποκρύπτουν ή να επισημαίνουν προσωπικά δεδομένα (PII), να ανιχνεύουν παρακάμψεις ασφαλείας και να εφαρμόζουν άλλα μέτρα ασφαλείας, διευκολύνοντας τη δημιουργία και την ανάπτυξη αξιόπιστων, ασφαλών πρακτόρων. Οι δικλείδες ασφαλείας μπορούν να αναπτυχθούν αυτόνομα ή μέσω της βιβλιοθήκης των δικλείδων ασφαλείας για Python(ανοίγει σε νέο παράθυρο) και JavaScript(ανοίγει σε νέο παράθυρο).
Η ανάπτυξη περιβαλλόντων συνομιλίας για πράκτορες μπορεί να αποδειχθεί απροσδόκητα περίπλοκη, από τη διαχείριση αποκρίσεων σε ροή και νημάτων έως την προβολή της διαδικασίας σκέψης του μοντέλου και τον σχεδιασμό ελκυστικών εμπειριών εντός συνομιλίας. Το ChatKit(ανοίγει σε νέο παράθυρο) απλοποιεί την ενσωμάτωση πρακτόρων που βασίζονται σε συνομιλία και μοιάζουν φυσικό κομμάτι του προϊόντος σας. Μπορεί να ενσωματωθεί σε εφαρμογές ή ιστότοπους, και να προσαρμοστεί ώστε να ταιριάζει με το θέμα ή την εταιρική σας ταυτότητα.
«Εξοικονομήσαμε πάνω από δύο εβδομάδες δουλειάς, δημιουργώντας έναν πράκτορα υποστήριξης για την κοινότητα Canva Developers με το ChatKit, και τον ενσωματώσαμε σε λιγότερο από μία ώρα. Αυτός ο πράκτορας υποστήριξης θα μεταμορφώσει τον τρόπο που οι προγραμματιστές αλληλεπιδρούν με την τεκμηρίωσή μας, μετατρέποντάς τη σε εμπειρία συνομιλίας και διευκολύνοντας την ανάπτυξη εφαρμογών και ενσωματώσεων στο Canva.»
Το ChatKit ήδη υποστηρίζει μια ευρεία γκάμα χρήσεων, από εσωτερικούς βοηθούς γνώσης και οδηγούς εκπαίδευσης νέων υπαλλήλων έως πρακτόρων υποστήριξης πελατών και έρευνας. Ένα παράδειγμα είναι ο πράκτορας υποστήριξης πελατών της HubSpot(ανοίγει σε νέο παράθυρο).

Η δημιουργία αξιόπιστων και έτοιμων για την παραγωγή πρακτόρων απαιτεί αυστηρές αξιολογήσεις απόδοσης. Πέρυσι, παρουσιάσαμε το Evals(ανοίγει σε νέο παράθυρο) για να βοηθήσουμε τους προγραμματιστές να δοκιμάζουν προτροπές και να μετρούν τη συμπεριφορά των μοντέλων. Τώρα προσθέτουμε τέσσερις νέες δυνατότητες που διευκολύνουν ακόμη περισσότερο τη δημιουργία αξιολογήσεων:
- Σύνολα δεδομένων: Δημιουργήστε γρήγορα αξιολογήσεις πρακτόρων από το μηδέν και επεκτείνετέ τες με την πάροδο του χρόνου με αυτοματοποιημένους αξιολογητές και σημειώσεις από άνθρωπο.
- Βαθμολόγηση ιχνών: Πραγματοποιήστε πλήρεις αξιολογήσεις ροών εργασίας πρακτόρων και αυτοματοποιήστε τη βαθμολόγηση για τον εντοπισμό αδυναμιών.
- Αυτόματη βελτιστοποίηση προτροπών: Δημιουργήστε βελτιωμένες προτροπές βάσει σημειώσεων από άνθρωπο και αποτελεσμάτων αξιολογητών.
- Υποστήριξη μοντέλων τρίτων: Αξιολογήστε μοντέλα από άλλους παρόχους μέσα στην πλατφόρμα Evals της OpenAI.
Ήδη έχουμε παρατηρήσει σημαντικές βελτιώσεις απόδοσης από πελάτες που χρησιμοποιούν την πλατφόρμα Evals.
«Η πλατφόρμα αξιολόγησης μείωσε τον χρόνο ανάπτυξης του πλαισίου ελέγχου μας με πολλαπλά agent κατά περισσότερο από 50% και αύξησε την ακρίβεια των πρακτόρων κατά 30%.»

Η ενισχυτική προσαρμογή(ανοίγει σε νέο παράθυρο) (RFT) επιτρέπει στους προγραμματιστές να προσαρμόζουν τα μοντέλα συλλογισμού μας. Είναι πλέον διαθέσιμη γενικά για το OpenAI o4-mini και σε ιδιωτική έκδοση beta για το GPT‑5. Συνεργαζόμαστε στενά με δεκάδες πελάτες για να βελτιώσουμε το RFT για το GPT‑5 πριν από τη γενικότερη διάθεσή του.
Σήμερα παρουσιάζουμε δύο νέες δυνατότητες στη beta έκδοση του RFT, σχεδιασμένες για να ενισχύσουν ακόμη περισσότερο την απόδοση των πρακτόρων:
- Προσαρμοσμένες κλήσεις εργαλείων: εκπαιδεύστε μοντέλα ώστε να καλούν τα κατάλληλα εργαλεία τη σωστή στιγμή για καλύτερη συλλογιστική
- Προσαρμοσμένοι βαθμολογητές: ορίστε προσαρμοσμένα κριτήρια αξιολόγησης βάσει των αναγκών της περίπτωσής σας
Από σήμερα, το ChatKit και οι νέες δυνατότητες του Evals είναι γενικά διαθέσιμες σε όλους τους προγραμματιστές. Το Agent Builder είναι διαθέσιμο σε έκδοση beta, ενώ το Μητρώο Συνδέσμων ξεκινά τη σταδιακή διάθεση beta σε ορισμένους πελάτες API, ChatGPT Enterprise και Edu, με πρόσβαση στη Γενική Κονσόλα Διαχείρισης(ανοίγει σε νέο παράθυρο) (όπου οι Γενικοί Κάτοχοι μπορούν να διαχειρίζονται τομείς, SSO και πολλαπλούς οργανισμούς API). Η Γενική Κονσόλα Διαχείρισης αποτελεί προαπαιτούμενο για την ενεργοποίηση του Μητρώου Συνδέσμων. Όλα αυτά τα εργαλεία περιλαμβάνονται στην τιμή του τυπικού μοντέλου API.
Σκοπεύουμε να προσθέσουμε σύντομα ένα αυτόνομο Workflows API (Ροών εργασίας) και επιλογές ανάπτυξης πρακτόρων στο ChatGPT.
Ανυπομονούμε να δούμε τι θα δημιουργήσετε.


