Databricks donosi GPT‑5.5 u poslovne agent radne tokove
GPT‑5.5 je postavio novi najsavremeniji rezultat na OfficeQA Pro, Databricksovom benchmarku za složene poslovne agent zadatke.

50%
Tačnost na OfficeQA Pro benchmarku (najsavremeniji rezultat)
46%
Smanjenje grešaka na OfficeQA Pro benchmarku u odnosu na GPT-5.4
Databricks stavlja GPT‑5.5 na raspolaganje za korisničke agent radne tokove nakon što je model postavio novi najsavremeniji rezultat na OfficeQA Pro, benchmarku kompanije za složene zadatke s poslovnim dokumentima.
OfficeQA Pro procjenjuje kako modeli obrađuju parsiranje, dohvat i utemeljeno rezonovanje kroz radne tokove koji uključuju skenirane PDF-ove, naslijeđene datoteke i dokumente dugog konteksta, zadatke koji često narušavaju produkcijske agent sisteme.
U postavci agent-harness, GPT‑5.5 je smanjio greške za 46% u poređenju s GPT‑5.4 i postao prvi model koji je premašio 50% tačnosti na OfficeQA Pro.
„Codex sa 5.5 sada je najsavremeniji među svim agentima i modelima koji postoje.“
OfficeQA Pro uključuje veliki broj skeniranih ili naslijeđenih poslovnih dokumenata, gdje male greške pri izvlačenju tokom parsiranja mogu izazvati lančane posljedice niz ostatak radnog toka. „Kada ne možete izdvojiti određenu cifru ili broj, to mijenja cijelu putanju onoga s čim agent radi“, objašnjava Singhvi.
Databricks je zabilježio najveća poboljšanja od GPT‑5.5 u ovim radnim tokovima s naglaskom na parsiranje. „Raniji modeli poput 5.4 nisu mogli ispravno parsirati sve cifre, ali izgleda da 5.5 donosi skokovito poboljšanje u parsiranju starijih dokumenata i skeniranih PDF-ova“, kaže Singhvi.
Tim je također uočio poboljšanja u orkestraciji kroz višekoračne zadatke. „Jedna stvar koju smo vidjeli kod 5.4 jeste da bi ponekad krenuo u nepotrebne pretrage i zaobilaznice, a to bi uzrokovalo vrlo neefikasne putanje“, kaže Singhvi.
U poređenju s ranijim modelima, GPT‑5.5 je bio pouzdaniji u dohvaćanju relevantnog konteksta i dovršavanju složenih radnih tokova bez dodatnog nadzora.
Databricks sada nudi GPT‑5.5 putem AI Unity Gatewaya, gdje korisnici koriste model unutar radnih tokova izgrađenih pomoću AgentBricksa i Agent Supervisor API-ja. U ovim sistemima, GPT‑5.5 orkestrira parsiranje, dohvat i izvršavanje kroz specijalizirane agente.
„Vidjet ćemo mnogo korisnika koji koriste AgentBricks i Agent Supervisor API za prilagođene agent radne tokove“, kaže Singhvi. „Zaista je uzbudljivo imati GPT‑5.5 da nadzire ove radne tokove.“
„GPT-5.5 je bio sjajan u pogledu povećanja znanja. To je promjena skokovite veličine kada je riječ o obavljanju rada zasnovanog na znanju za nas.“


