Databricks átadja a GPT‑5.5‑öt vállalati ügynök-munkafolyamatokba
A GPT‑5.5 új legkorszerűbb eredményt ért el az OfficeQA Pro-n, a Databricks összetett vállalati ügynökfeladatokra szolgáló benchmarkján.

50%
Pontosság az OfficeQA Pro benchmarkon (legkorszerűbb)
46%
Hibacsökkenés az OfficeQA Pro benchmarkon a GPT-5.4-hez képest
A Databricks elérhetővé teszi a GPT‑5.5‑öt az ügyfelek ügynök-munkafolyamataihoz, miután a modell új legkorszerűbb eredményt ért el az OfficeQA Pro-n, a vállalat összetett vállalati dokumentumfeladatokra szolgáló benchmarkján.
Az OfficeQA Pro azt értékeli, hogyan kezelik a modellek a feldolgozást, a visszakeresést és a megalapozott érvelést olyan munkafolyamatokban, amelyek szkennelt PDF-eket, régi fájlokat és hosszú kontextusú dokumentumokat érintenek — ezek a feladatok gyakran megtörik az éles ügynökrendszereket.
Az agent-harness beállításban a GPT‑5.5 46%-kal csökkentette a hibákat a GPT‑5.4‑hez képest, és az első modell lett, amely 50% fölötti pontosságot ért el az OfficeQA Pro-n.
„A 5.5-tel működő Codex most már a legkorszerűbb az összes elérhető ügynök és modell között.”
Az OfficeQA Pro nagy számban tartalmaz szkennelt vagy régi vállalati dokumentumokat, ahol a feldolgozás során fellépő apró kinyerési hibák a munkafolyamat további részein végiggyűrűzhetnek. „Ha egy bizonyos számjegyet vagy számot nem lehet kinyerni, az teljesen megváltoztatja annak az irányát, amivel az ügynök dolgozik” — magyarázza Singhvi.
A Databricks ezekben, a feldolgozásra erősen támaszkodó munkafolyamatokban érte el a legnagyobb javulást a GPT‑5.5‑tel. „A korábbi modellek, például az 5.4, nem tudták helyesen feldolgozni az összes számjegyet, de úgy tűnik, hogy az 5.5 ugrásszerű javulást hozott a régebbi dokumentumok és a szkennelt PDF-ek feldolgozásában” — mondja Singhvi.
A csapat a többlépéses feladatok közötti hangszerelésben is javulást tapasztalt. „Az egyik dolog, amit az 5.4-nél láttunk, hogy néha felesleges keresési kitérőkre ment, és ez nagyon nem hatékony folyamatokat eredményezett” — mondja Singhvi.
A korábbi modellekhez képest a GPT‑5.5 megbízhatóbban találta meg a releváns kontextust, és további felügyelet nélkül is végrehajtotta az összetett munkafolyamatokat.
A Databricks most már az AI Unity Gatewayen keresztül teszi elérhetővé a GPT‑5.5‑öt, ahol az ügyfelek az AgentBricks és az Agent Supervisor API segítségével épített munkafolyamatokban használják a modellt. Ezekben a rendszerekben a GPT‑5.5 a feldolgozást, a visszakeresést és a végrehajtást hangolja össze a specializált ügynökök között.
„Sok ügyfelet fogunk látni, akik az AgentBricks-et és az Agent Supervisor API-t egyedi ügynök-munkafolyamatokhoz használják majd” — mondja Singhvi. „Nagyon izgalmas, hogy a GPT‑5.5 felügyeli ezeket a munkafolyamatokat.”
„A GPT-5.5 nagyszerűnek bizonyult a tudásbeli előrelépés szempontjából. Számunkra ez lépcsőzetes változást jelent a tudásmunka terén.”


