Databricks prináša GPT‑5.5 do podnikových workflow agentov
GPT‑5.5 dosiahol nový najlepší výsledok v OfficeQA Pro, benchmarku Databricks pre komplexné úlohy podnikových agentov.

50%
Presnosť v benchmarku OfficeQA Pro (najlepší výsledok)
46%
Zníženie chýb v benchmarku OfficeQA Pro oproti GPT-5.4
Databricks sprístupňuje GPT‑5.5 pre zákaznícke workflow agentov po tom, čo model dosiahol nový najlepší výsledok v OfficeQA Pro, firemnom benchmarku pre komplexné úlohy s podnikovými dokumentmi.
OfficeQA Pro hodnotí, ako modely zvládajú parsovanie, vyhľadávanie a ukotvené uvažovanie naprieč workflow zahŕňajúcimi skenované PDF, staršie súbory a dokumenty s dlhým kontextom, teda úlohy, ktoré často narúšajú produkčné systémy agentov.
V nastavení agent-harness GPT‑5.5 znížil chybovosť o 46 % v porovnaní s GPT‑5.4 a stal sa prvým modelom, ktorý v OfficeQA Pro prekonal 50 % presnosť.
„Codex s verziou 5.5 je teraz najlepší spomedzi všetkých dostupných agentov a modelov.“
OfficeQA Pro zahŕňa veľké množstvo skenovaných alebo starších podnikových dokumentov, pri ktorých sa malé chyby extrakcie počas parsovania môžu reťazovo prenášať ďalej do zvyšku workflow. „Keď nedokážete extrahovať určitú číslicu alebo číslo, zmení to celú trajektóriu toho, s čím agent pracuje,“ vysvetľuje Singhvi.
Databricks zaznamenal najväčšie prínosy GPT‑5.5 práve v týchto workflow náročných na parsovanie. „Staršie modely ako 5.4 nedokázali správne parsovať všetky číslice, ale zdá sa, že 5.5 prináša skokové zlepšenie pri parsovaní starších dokumentov a skenovaných PDF,“ hovorí Singhvi.
Tím zaznamenal aj zlepšenia v orchestrácii naprieč viacstupňovými úlohami. „Pri verzii 5.4 sme videli, že sa niekedy púšťala do zbytočných odbočiek pri vyhľadávaní, čo viedlo k veľmi neefektívnym trajektóriám,“ hovorí Singhvi.
V porovnaní so staršími modelmi bol GPT‑5.5 spoľahlivejší pri získavaní relevantného kontextu a dokončovaní komplexných workflow bez dodatočného dohľadu.
Databricks teraz sprístupňuje GPT‑5.5 prostredníctvom AI Unity Gateway, kde zákazníci používajú model vo workflow vytvorených pomocou AgentBricks a Agent Supervisor API. V týchto systémoch GPT‑5.5 orchestruje parsovanie, vyhľadávanie a vykonávanie naprieč špecializovanými agentmi.
„Uvidíme veľa zákazníkov, ktorí budú používať AgentBricks a Agent Supervisor API pre vlastné workflow agentov,“ hovorí Singhvi. „Je naozaj vzrušujúce, že GPT‑5.5 dohliada na tieto workflow.“
„GPT-5.5 je skvelý z hľadiska nárastu znalostí. Pre nás je to skoková zmena v oblasti znalostnej práce.“


