15 Μαΐου 2026

Η Databricks φέρνει το GPT‑5.5 σε ροές εταιρικών πρακτόρων

Το GPT‑5.5 πέτυχε νέα κορυφαία επίδοση στο OfficeQA Pro, το benchmark της Databricks για σύνθετες εργασίες εταιρικών πρακτόρων.

Επικοινωνία με πωλήσεις

Κεντρική εικόνα ιστορίας πελάτη της Databricks.

Μέγεθος εταιρείας: Enterprise

Περιοχή: Βόρεια Αμερική

Βιομηχανία: Τεχνολογία

Προϊόντα: Codex

50%

Ακρίβεια στο benchmark OfficeQA Pro (κορυφαία επίδοση)

46%

Μείωση σφαλμάτων στο benchmark OfficeQA Pro σε σύγκριση με το GPT-5.4

Φόρτωση…

Η Databricks διαθέτει το GPT‑5.5 για ροές εργασίας πρακτόρων πελατών, αφού το μοντέλο πέτυχε νέα κορυφαία επίδοση στο OfficeQA Pro, το benchmark της εταιρείας για σύνθετες εργασίες εταιρικών εγγράφων.

Το OfficeQA Pro αξιολογεί πώς τα μοντέλα χειρίζονται την ανάλυση, την ανάκτηση και τη τεκμηριωμένη συλλογιστική σε ροές εργασίας με σαρωμένα PDF, παλαιά αρχεία και έγγραφα μεγάλου συμφραζομένου, εργασίες που συχνά διακόπτουν συστήματα πρακτόρων παραγωγής.

Στο περιβάλλον agent-harness, το GPT‑5.5 μείωσε τα σφάλματα κατά 46% σε σύγκριση με το GPT‑5.4 και έγινε το πρώτο μοντέλο που ξεπέρασε το 50% ακρίβειας στο OfficeQA Pro.

«Το Codex με το 5.5 είναι πλέον κορυφαίο ανάμεσα σε όλους τους πράκτορες και τα μοντέλα που υπάρχουν.»

–Arnav Singhvi, Μηχανικός Έρευνας

Κορυφαία επίδοση στο OfficeQA Pro

Το OfficeQA Pro περιλαμβάνει μεγάλο αριθμό σαρωμένων ή παλαιών εταιρικών εγγράφων, όπου μικρά σφάλματα εξαγωγής κατά την ανάλυση μπορούν να μεταδοθούν κατάντη σε όλη την υπόλοιπη ροή εργασίας. «Μόλις δεν μπορείς να εξαγάγεις ένα συγκεκριμένο ψηφίο ή αριθμό, αυτό αλλάζει ολόκληρη την πορεία αυτού με το οποίο εργάζεται ο πράκτορας», εξηγεί ο Singhvi.

Η Databricks είδε τα μεγαλύτερα οφέλη από το GPT‑5.5 σε αυτές τις ροές εργασίας με έμφαση στην ανάλυση. «Παλαιότερα μοντέλα όπως το 5.4 δεν μπορούσαν να αναλύσουν σωστά όλα τα ψηφία, αλλά φαίνεται ότι το 5.5 προσφέρει άλμα απόδοσης στην ανάλυση παλαιότερων εγγράφων και σαρωμένων PDF», λέει ο Singhvi.

Η ομάδα είδε επίσης βελτιώσεις στην ενορχήστρωση σε εργασίες πολλών βημάτων. «Ένα πράγμα που είδαμε με το 5.4 είναι ότι μερικές φορές έκανε αυτές τις περιττές παρεκκλίσεις αναζήτησης, και αυτό προκαλούσε πολύ αναποτελεσματικές πορείες», λέει ο Singhvi.

Σε σύγκριση με παλαιότερα μοντέλα, το GPT‑5.5 ήταν πιο αξιόπιστο στην ανάκτηση σχετικού συμφραζομένου και στην ολοκλήρωση σύνθετων ροών εργασίας χωρίς πρόσθετη επίβλεψη.

Ενσωμάτωση του GPT‑5.5 σε ροές εργασίας παραγωγής

Η Databricks διαθέτει πλέον το GPT‑5.5 μέσω του AI Unity Gateway, όπου οι πελάτες χρησιμοποιούν το μοντέλο μέσα σε ροές εργασίας που έχουν δημιουργηθεί με τα AgentBricks και το Agent Supervisor API. Σε αυτά τα συστήματα, το GPT‑5.5 ενορχηστρώνει την ανάλυση, την ανάκτηση και την εκτέλεση σε εξειδικευμένους πράκτορες.

«Θα δούμε πολλούς πελάτες να χρησιμοποιούν τα AgentBricks και το Agent Supervisor API για προσαρμοσμένες ροές εργασίας πρακτόρων», λέει ο Singhvi. «Το να επιβλέπει το GPT‑5.5 αυτές τις ροές εργασίας είναι πραγματικά συναρπαστικό.»

«Το GPT-5.5 είναι εξαιρετικό όσον αφορά την ενίσχυση γνώσης. Είναι μια αλλαγή κλίμακας όσον αφορά τη γνωστική εργασία για εμάς.»

—Arnav Singhvi, Μηχανικός Έρευνας

Περάστε στη νέα εποχή της εργασίας

Πάνω από 1 εκατομμύριο επιχειρήσεις σε όλο τον κόσμο επιτυγχάνουν ουσιαστικά αποτελέσματα με την OpenAI.

Επικοινωνία με το τμήμα πωλήσεων

Συνεχίστε να διαβάζετε

How agents are transforming work

Εταιρεία25 Ιουν 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

Εταιρεία24 Ιουν 2026

Helping build shared standards for advanced AI - card image

Συμβολή στη δημιουργία κοινών προτύπων για προηγμένη TN

Διεθνείς Υποθέσεις23 Ιουν 2026