Ugrás a fő tartalomra
OpenAI

2026. május 15.

Databricks átadja a GPT‑5.5‑öt vállalati ügynök-munkafolyamatokba

A GPT‑5.5 új legkorszerűbb eredményt ért el az OfficeQA Pro-n, a Databricks összetett vállalati ügynökfeladatokra szolgáló benchmarkján.

Databricks ügyféltörténet főképe.
Vállalat mérete: Enterprise
Régió: Észak-Amerika
Ipar: Technológia
Termékek: Codex

50%

Pontosság az OfficeQA Pro benchmarkon (legkorszerűbb)

46%

Hibacsökkenés az OfficeQA Pro benchmarkon a GPT-5.4-hez képest

Betöltés…

A Databricks elérhetővé teszi a GPT‑5.5‑öt az ügyfelek ügynök-munkafolyamataihoz, miután a modell új legkorszerűbb eredményt ért el az OfficeQA Pro-n, a vállalat összetett vállalati dokumentumfeladatokra szolgáló benchmarkján.

Az OfficeQA Pro azt értékeli, hogyan kezelik a modellek a feldolgozást, a visszakeresést és a megalapozott érvelést olyan munkafolyamatokban, amelyek szkennelt PDF-eket, régi fájlokat és hosszú kontextusú dokumentumokat érintenek — ezek a feladatok gyakran megtörik az éles ügynökrendszereket.

Az agent-harness beállításban a GPT‑5.5 46%-kal csökkentette a hibákat a GPT‑5.4‑hez képest, és az első modell lett, amely 50% fölötti pontosságot ért el az OfficeQA Pro-n.

„A 5.5-tel működő Codex most már a legkorszerűbb az összes elérhető ügynök és modell között.”
–Arnav Singhvi, kutatómérnök

Legkorszerűbb teljesítmény az OfficeQA Pro-n

Az OfficeQA Pro nagy számban tartalmaz szkennelt vagy régi vállalati dokumentumokat, ahol a feldolgozás során fellépő apró kinyerési hibák a munkafolyamat további részein végiggyűrűzhetnek. „Ha egy bizonyos számjegyet vagy számot nem lehet kinyerni, az teljesen megváltoztatja annak az irányát, amivel az ügynök dolgozik” — magyarázza Singhvi.

A Databricks ezekben, a feldolgozásra erősen támaszkodó munkafolyamatokban érte el a legnagyobb javulást a GPT‑5.5‑tel. „A korábbi modellek, például az 5.4, nem tudták helyesen feldolgozni az összes számjegyet, de úgy tűnik, hogy az 5.5 ugrásszerű javulást hozott a régebbi dokumentumok és a szkennelt PDF-ek feldolgozásában” — mondja Singhvi.

A csapat a többlépéses feladatok közötti hangszerelésben is javulást tapasztalt. „Az egyik dolog, amit az 5.4-nél láttunk, hogy néha felesleges keresési kitérőkre ment, és ez nagyon nem hatékony folyamatokat eredményezett” — mondja Singhvi.

A korábbi modellekhez képest a GPT‑5.5 megbízhatóbban találta meg a releváns kontextust, és további felügyelet nélkül is végrehajtotta az összetett munkafolyamatokat.

A GPT‑5.5 bevezetése az éles munkafolyamatokba

A Databricks most már az AI Unity Gatewayen keresztül teszi elérhetővé a GPT‑5.5‑öt, ahol az ügyfelek az AgentBricks és az Agent Supervisor API segítségével épített munkafolyamatokban használják a modellt. Ezekben a rendszerekben a GPT‑5.5 a feldolgozást, a visszakeresést és a végrehajtást hangolja össze a specializált ügynökök között.

„Sok ügyfelet fogunk látni, akik az AgentBricks-et és az Agent Supervisor API-t egyedi ügynök-munkafolyamatokhoz használják majd” — mondja Singhvi. „Nagyon izgalmas, hogy a GPT‑5.5 felügyeli ezeket a munkafolyamatokat.”

„A GPT-5.5 nagyszerűnek bizonyult a tudásbeli előrelépés szempontjából. Számunkra ez lépcsőzetes változást jelent a tudásmunka terén.”
—Arnav Singhvi, kutatómérnök

Csatlakozz a munka új korszakához

Világszerte több mint 1 millió vállalkozás ér el jelentős eredményeket az OpenAI segítségével.