Η Databricks φέρνει το GPT‑5.5 σε ροές εταιρικών πρακτόρων
Το GPT‑5.5 πέτυχε νέα κορυφαία επίδοση στο OfficeQA Pro, το benchmark της Databricks για σύνθετες εργασίες εταιρικών πρακτόρων.

50%
Ακρίβεια στο benchmark OfficeQA Pro (κορυφαία επίδοση)
46%
Μείωση σφαλμάτων στο benchmark OfficeQA Pro σε σύγκριση με το GPT-5.4
Η Databricks διαθέτει το GPT‑5.5 για ροές εργασίας πρακτόρων πελατών, αφού το μοντέλο πέτυχε νέα κορυφαία επίδοση στο OfficeQA Pro, το benchmark της εταιρείας για σύνθετες εργασίες εταιρικών εγγράφων.
Το OfficeQA Pro αξιολογεί πώς τα μοντέλα χειρίζονται την ανάλυση, την ανάκτηση και τη τεκμηριωμένη συλλογιστική σε ροές εργασίας με σαρωμένα PDF, παλαιά αρχεία και έγγραφα μεγάλου συμφραζομένου, εργασίες που συχνά διακόπτουν συστήματα πρακτόρων παραγωγής.
Στο περιβάλλον agent-harness, το GPT‑5.5 μείωσε τα σφάλματα κατά 46% σε σύγκριση με το GPT‑5.4 και έγινε το πρώτο μοντέλο που ξεπέρασε το 50% ακρίβειας στο OfficeQA Pro.
«Το Codex με το 5.5 είναι πλέον κορυφαίο ανάμεσα σε όλους τους πράκτορες και τα μοντέλα που υπάρχουν.»
Το OfficeQA Pro περιλαμβάνει μεγάλο αριθμό σαρωμένων ή παλαιών εταιρικών εγγράφων, όπου μικρά σφάλματα εξαγωγής κατά την ανάλυση μπορούν να μεταδοθούν κατάντη σε όλη την υπόλοιπη ροή εργασίας. «Μόλις δεν μπορείς να εξαγάγεις ένα συγκεκριμένο ψηφίο ή αριθμό, αυτό αλλάζει ολόκληρη την πορεία αυτού με το οποίο εργάζεται ο πράκτορας», εξηγεί ο Singhvi.
Η Databricks είδε τα μεγαλύτερα οφέλη από το GPT‑5.5 σε αυτές τις ροές εργασίας με έμφαση στην ανάλυση. «Παλαιότερα μοντέλα όπως το 5.4 δεν μπορούσαν να αναλύσουν σωστά όλα τα ψηφία, αλλά φαίνεται ότι το 5.5 προσφέρει άλμα απόδοσης στην ανάλυση παλαιότερων εγγράφων και σαρωμένων PDF», λέει ο Singhvi.
Η ομάδα είδε επίσης βελτιώσεις στην ενορχήστρωση σε εργασίες πολλών βημάτων. «Ένα πράγμα που είδαμε με το 5.4 είναι ότι μερικές φορές έκανε αυτές τις περιττές παρεκκλίσεις αναζήτησης, και αυτό προκαλούσε πολύ αναποτελεσματικές πορείες», λέει ο Singhvi.
Σε σύγκριση με παλαιότερα μοντέλα, το GPT‑5.5 ήταν πιο αξιόπιστο στην ανάκτηση σχετικού συμφραζομένου και στην ολοκλήρωση σύνθετων ροών εργασίας χωρίς πρόσθετη επίβλεψη.
Η Databricks διαθέτει πλέον το GPT‑5.5 μέσω του AI Unity Gateway, όπου οι πελάτες χρησιμοποιούν το μοντέλο μέσα σε ροές εργασίας που έχουν δημιουργηθεί με τα AgentBricks και το Agent Supervisor API. Σε αυτά τα συστήματα, το GPT‑5.5 ενορχηστρώνει την ανάλυση, την ανάκτηση και την εκτέλεση σε εξειδικευμένους πράκτορες.
«Θα δούμε πολλούς πελάτες να χρησιμοποιούν τα AgentBricks και το Agent Supervisor API για προσαρμοσμένες ροές εργασίας πρακτόρων», λέει ο Singhvi. «Το να επιβλέπει το GPT‑5.5 αυτές τις ροές εργασίας είναι πραγματικά συναρπαστικό.»
«Το GPT-5.5 είναι εξαιρετικό όσον αφορά την ενίσχυση γνώσης. Είναι μια αλλαγή κλίμακας όσον αφορά τη γνωστική εργασία για εμάς.»


