Μετάβαση στο κύριο περιεχόμενο
OpenAI

15 Μαΐου 2026

Η Databricks φέρνει το GPT‑5.5 σε ροές εταιρικών πρακτόρων

Το GPT‑5.5 πέτυχε νέα κορυφαία επίδοση στο OfficeQA Pro, το benchmark της Databricks για σύνθετες εργασίες εταιρικών πρακτόρων.

Κεντρική εικόνα ιστορίας πελάτη της Databricks.
Μέγεθος εταιρείας: Εταιρικά
Περιοχή: Βόρεια Αμερική
Βιομηχανία: Τεχνολογία
Προϊόντα: Codex

50%

Ακρίβεια στο benchmark OfficeQA Pro (κορυφαία επίδοση)

46%

Μείωση σφαλμάτων στο benchmark OfficeQA Pro σε σύγκριση με το GPT-5.4

Φόρτωση…

Η Databricks διαθέτει το GPT‑5.5 για ροές εργασίας πρακτόρων πελατών, αφού το μοντέλο πέτυχε νέα κορυφαία επίδοση στο OfficeQA Pro, το benchmark της εταιρείας για σύνθετες εργασίες εταιρικών εγγράφων.

Το OfficeQA Pro αξιολογεί πώς τα μοντέλα χειρίζονται την ανάλυση, την ανάκτηση και τη τεκμηριωμένη συλλογιστική σε ροές εργασίας με σαρωμένα PDF, παλαιά αρχεία και έγγραφα μεγάλου συμφραζομένου, εργασίες που συχνά διακόπτουν συστήματα πρακτόρων παραγωγής.

Στο περιβάλλον agent-harness, το GPT‑5.5 μείωσε τα σφάλματα κατά 46% σε σύγκριση με το GPT‑5.4 και έγινε το πρώτο μοντέλο που ξεπέρασε το 50% ακρίβειας στο OfficeQA Pro.

«Το Codex με το 5.5 είναι πλέον κορυφαίο ανάμεσα σε όλους τους πράκτορες και τα μοντέλα που υπάρχουν.»
–Arnav Singhvi, Μηχανικός Έρευνας

Κορυφαία επίδοση στο OfficeQA Pro

Το OfficeQA Pro περιλαμβάνει μεγάλο αριθμό σαρωμένων ή παλαιών εταιρικών εγγράφων, όπου μικρά σφάλματα εξαγωγής κατά την ανάλυση μπορούν να μεταδοθούν κατάντη σε όλη την υπόλοιπη ροή εργασίας. «Μόλις δεν μπορείς να εξαγάγεις ένα συγκεκριμένο ψηφίο ή αριθμό, αυτό αλλάζει ολόκληρη την πορεία αυτού με το οποίο εργάζεται ο πράκτορας», εξηγεί ο Singhvi.

Η Databricks είδε τα μεγαλύτερα οφέλη από το GPT‑5.5 σε αυτές τις ροές εργασίας με έμφαση στην ανάλυση. «Παλαιότερα μοντέλα όπως το 5.4 δεν μπορούσαν να αναλύσουν σωστά όλα τα ψηφία, αλλά φαίνεται ότι το 5.5 προσφέρει άλμα απόδοσης στην ανάλυση παλαιότερων εγγράφων και σαρωμένων PDF», λέει ο Singhvi.

Η ομάδα είδε επίσης βελτιώσεις στην ενορχήστρωση σε εργασίες πολλών βημάτων. «Ένα πράγμα που είδαμε με το 5.4 είναι ότι μερικές φορές έκανε αυτές τις περιττές παρεκκλίσεις αναζήτησης, και αυτό προκαλούσε πολύ αναποτελεσματικές πορείες», λέει ο Singhvi.

Σε σύγκριση με παλαιότερα μοντέλα, το GPT‑5.5 ήταν πιο αξιόπιστο στην ανάκτηση σχετικού συμφραζομένου και στην ολοκλήρωση σύνθετων ροών εργασίας χωρίς πρόσθετη επίβλεψη.

Ενσωμάτωση του GPT‑5.5 σε ροές εργασίας παραγωγής

Η Databricks διαθέτει πλέον το GPT‑5.5 μέσω του AI Unity Gateway, όπου οι πελάτες χρησιμοποιούν το μοντέλο μέσα σε ροές εργασίας που έχουν δημιουργηθεί με τα AgentBricks και το Agent Supervisor API. Σε αυτά τα συστήματα, το GPT‑5.5 ενορχηστρώνει την ανάλυση, την ανάκτηση και την εκτέλεση σε εξειδικευμένους πράκτορες.

«Θα δούμε πολλούς πελάτες να χρησιμοποιούν τα AgentBricks και το Agent Supervisor API για προσαρμοσμένες ροές εργασίας πρακτόρων», λέει ο Singhvi. «Το να επιβλέπει το GPT‑5.5 αυτές τις ροές εργασίας είναι πραγματικά συναρπαστικό.»

«Το GPT-5.5 είναι εξαιρετικό όσον αφορά την ενίσχυση γνώσης. Είναι μια αλλαγή κλίμακας όσον αφορά τη γνωστική εργασία για εμάς.»
—Arnav Singhvi, Μηχανικός Έρευνας

Μπείτε στη νέα εποχή της εργασίας

Πάνω από 1 εκατομμύριο επιχειρήσεις παγκοσμίως πετυχαίνουν ουσιαστικά αποτελέσματα με την OpenAI.