Databricks uvaja GPT‑5.5 v poteke dela poslovnih agentov
GPT‑5.5 je dosegel nov najsodobnejši rezultat na OfficeQA Pro, merilu Databricks za kompleksne naloge poslovnih agentov.

50%
Natančnost na merilu OfficeQA Pro (najsodobnejši rezultat)
46%
Zmanjšanje napak na merilu OfficeQA Pro v primerjavi z GPT-5.4
Databricks omogoča GPT‑5.5 za poteke dela agentov strank, po tem ko je model dosegel nov najsodobnejši rezultat na OfficeQA Pro, merilu podjetja za kompleksne naloge s poslovnimi dokumenti.
OfficeQA Pro ocenjuje, kako modeli obvladujejo razčlenjevanje, pridobivanje in utemeljeno sklepanje v potekih dela z optično prebranimi dokumenti PDF, starejšimi datotekami in dokumenti z dolgim kontekstom, pri nalogah, ki jih produkcijski sistemi agentov pogosto ne zmorejo obvladati.
V nastavitvi agent-harness je GPT‑5.5 zmanjšal napake za 46 odstotkov v primerjavi z GPT‑5.4 in postal prvi model, ki je na OfficeQA Pro presegel 50-odstotno natančnost.
»Codex z različico 5.5 je zdaj najsodobnejši med vsemi agenti in modeli.«
OfficeQA Pro vključuje veliko število optično prebranih ali starejših poslovnih dokumentov, kjer se lahko majhne napake pri izluščanju med razčlenjevanjem kaskadno prenesejo naprej skozi preostanek poteka dela. »Ko ne morete izluščiti določene števke ali številke, to spremeni celotno pot tega, s čimer agent dela,« pojasnjuje Singhvi.
Databricks je največje izboljšave pri GPT‑5.5 opazil v teh potekih dela, ki močno temeljijo na razčlenjevanju. »Prejšnji modeli, kot je 5.4, niso bili zmožni pravilno razčleniti vseh številk, vendar se zdi, da ima 5.5 skokovito izboljšanje pri razčlenjevanju starejših dokumentov in optično prebranih dokumentov PDF,« pravi Singhvi.
Ekipa je opazila tudi izboljšave pri orkestraciji večstopenjskih nalog. »Pri 5.4 smo opazili, da je včasih zašel v nepotrebne obvoze pri iskanju, kar je povzročilo zelo neučinkovite poti,« pravi Singhvi.
V primerjavi s prejšnjimi modeli je bil GPT‑5.5 zanesljivejši pri pridobivanju ustreznega konteksta in dokončanju kompleksnih potekov dela brez dodatnega nadzora.
Databricks zdaj omogoča GPT‑5.5 prek AI Unity Gateway, kjer stranke uporabljajo model znotraj potekov dela, zgrajenih z AgentBricks in API-jem Agent Supervisor. V teh sistemih GPT‑5.5 orkestrira razčlenjevanje, pridobivanje in izvajanje med specializiranimi agenti.
»Videli bomo veliko strank, ki bodo uporabljale AgentBricks in API Agent Supervisor za prilagojene poteke dela agentov,« pravi Singhvi. »Zelo vznemirljivo je, da GPT‑5.5 nadzoruje te poteke dela.«
»GPT-5.5 je bil odličen glede povečanja znanja. Za nas je to skokovita sprememba pri opravljanju znanjskega dela.«


