15. maj 2026.

Databricks donosi GPT‑5.5 u poslovne agent radne tokove

GPT‑5.5 je postavio novi najsavremeniji rezultat na OfficeQA Pro, Databricksovom benchmarku za složene poslovne agent zadatke.

Kontaktirajte Odjel prodaje

Glavna slika priče o korisniku Databricksa.

Veličina kompanije: Enterprise

Regija: Sjeverna Amerika

Industrija: Tehnologija

Proizvodi: Codex

50%

Tačnost na OfficeQA Pro benchmarku (najsavremeniji rezultat)

46%

Smanjenje grešaka na OfficeQA Pro benchmarku u odnosu na GPT-5.4

Učitavanje…

Databricks stavlja GPT‑5.5 na raspolaganje za korisničke agent radne tokove nakon što je model postavio novi najsavremeniji rezultat na OfficeQA Pro, benchmarku kompanije za složene zadatke s poslovnim dokumentima.

OfficeQA Pro procjenjuje kako modeli obrađuju parsiranje, dohvat i utemeljeno rezonovanje kroz radne tokove koji uključuju skenirane PDF-ove, naslijeđene datoteke i dokumente dugog konteksta, zadatke koji često narušavaju produkcijske agent sisteme.

U postavci agent-harness, GPT‑5.5 je smanjio greške za 46% u poređenju s GPT‑5.4 i postao prvi model koji je premašio 50% tačnosti na OfficeQA Pro.

„Codex sa 5.5 sada je najsavremeniji među svim agentima i modelima koji postoje.“

–Arnav Singhvi, istraživački inženjer

SOTA učinak na OfficeQA Pro

OfficeQA Pro uključuje veliki broj skeniranih ili naslijeđenih poslovnih dokumenata, gdje male greške pri izvlačenju tokom parsiranja mogu izazvati lančane posljedice niz ostatak radnog toka. „Kada ne možete izdvojiti određenu cifru ili broj, to mijenja cijelu putanju onoga s čim agent radi“, objašnjava Singhvi.

Databricks je zabilježio najveća poboljšanja od GPT‑5.5 u ovim radnim tokovima s naglaskom na parsiranje. „Raniji modeli poput 5.4 nisu mogli ispravno parsirati sve cifre, ali izgleda da 5.5 donosi skokovito poboljšanje u parsiranju starijih dokumenata i skeniranih PDF-ova“, kaže Singhvi.

Tim je također uočio poboljšanja u orkestraciji kroz višekoračne zadatke. „Jedna stvar koju smo vidjeli kod 5.4 jeste da bi ponekad krenuo u nepotrebne pretrage i zaobilaznice, a to bi uzrokovalo vrlo neefikasne putanje“, kaže Singhvi.

U poređenju s ranijim modelima, GPT‑5.5 je bio pouzdaniji u dohvaćanju relevantnog konteksta i dovršavanju složenih radnih tokova bez dodatnog nadzora.

Uvođenje GPT‑5.5 u produkcijske radne tokove

Databricks sada nudi GPT‑5.5 putem AI Unity Gatewaya, gdje korisnici koriste model unutar radnih tokova izgrađenih pomoću AgentBricksa i Agent Supervisor API-ja. U ovim sistemima, GPT‑5.5 orkestrira parsiranje, dohvat i izvršavanje kroz specijalizirane agente.

„Vidjet ćemo mnogo korisnika koji koriste AgentBricks i Agent Supervisor API za prilagođene agent radne tokove“, kaže Singhvi. „Zaista je uzbudljivo imati GPT‑5.5 da nadzire ove radne tokove.“

„GPT-5.5 je bio sjajan u pogledu povećanja znanja. To je promjena skokovite veličine kada je riječ o obavljanju rada zasnovanog na znanju za nas.“

—Arnav Singhvi, istraživački inženjer

Pridruži se novoj eri rada

Više od milion preduzeća širom svijeta postiže značajne rezultate s OpenAI-jem.

Kontaktirajte Odjel prodaje

Nastavite čitati

How agents are transforming work

Kompanija25. jun 2026.

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI i Broadcom otkrivaju čip za LLM inferenciju

Kompanija24. jun 2026.

Helping build shared standards for advanced AI - card image

Pomažemo izgradnju zajedničkih standarda za naprednu AI

Globalni poslovi23. jun 2026.