15. maj 2026

Databricks uvaja GPT‑5.5 v poteke dela poslovnih agentov

GPT‑5.5 je dosegel nov najsodobnejši rezultat na OfficeQA Pro, merilu Databricks za kompleksne naloge poslovnih agentov.

Kontaktirajte oddelek za prodajo

Velikost podjetja: Enterprise

Regija: Severna Amerika

Industrija: Tehnologija

Izdelki: Codex

50%

Natančnost na merilu OfficeQA Pro (najsodobnejši rezultat)

46%

Zmanjšanje napak na merilu OfficeQA Pro v primerjavi z GPT-5.4

Nalaganje …

Databricks omogoča GPT‑5.5 za poteke dela agentov strank, po tem ko je model dosegel nov najsodobnejši rezultat na OfficeQA Pro, merilu podjetja za kompleksne naloge s poslovnimi dokumenti.

OfficeQA Pro ocenjuje, kako modeli obvladujejo razčlenjevanje, pridobivanje in utemeljeno sklepanje v potekih dela z optično prebranimi dokumenti PDF, starejšimi datotekami in dokumenti z dolgim kontekstom, pri nalogah, ki jih produkcijski sistemi agentov pogosto ne zmorejo obvladati.

V nastavitvi agent-harness je GPT‑5.5 zmanjšal napake za 46 odstotkov v primerjavi z GPT‑5.4 in postal prvi model, ki je na OfficeQA Pro presegel 50-odstotno natančnost.

»Codex z različico 5.5 je zdaj najsodobnejši med vsemi agenti in modeli.«

–Arnav Singhvi, raziskovalni inženir

Najsodobnejši rezultat na OfficeQA Pro

OfficeQA Pro vključuje veliko število optično prebranih ali starejših poslovnih dokumentov, kjer se lahko majhne napake pri izluščanju med razčlenjevanjem kaskadno prenesejo naprej skozi preostanek poteka dela. »Ko ne morete izluščiti določene števke ali številke, to spremeni celotno pot tega, s čimer agent dela,« pojasnjuje Singhvi.

Databricks je največje izboljšave pri GPT‑5.5 opazil v teh potekih dela, ki močno temeljijo na razčlenjevanju. »Prejšnji modeli, kot je 5.4, niso bili zmožni pravilno razčleniti vseh številk, vendar se zdi, da ima 5.5 skokovito izboljšanje pri razčlenjevanju starejših dokumentov in optično prebranih dokumentov PDF,« pravi Singhvi.

Ekipa je opazila tudi izboljšave pri orkestraciji večstopenjskih nalog. »Pri 5.4 smo opazili, da je včasih zašel v nepotrebne obvoze pri iskanju, kar je povzročilo zelo neučinkovite poti,« pravi Singhvi.

V primerjavi s prejšnjimi modeli je bil GPT‑5.5 zanesljivejši pri pridobivanju ustreznega konteksta in dokončanju kompleksnih potekov dela brez dodatnega nadzora.

Uvajanje GPT‑5.5 v produkcijske poteke dela

Databricks zdaj omogoča GPT‑5.5 prek AI Unity Gateway, kjer stranke uporabljajo model znotraj potekov dela, zgrajenih z AgentBricks in API-jem Agent Supervisor. V teh sistemih GPT‑5.5 orkestrira razčlenjevanje, pridobivanje in izvajanje med specializiranimi agenti.

»Videli bomo veliko strank, ki bodo uporabljale AgentBricks in API Agent Supervisor za prilagojene poteke dela agentov,« pravi Singhvi. »Zelo vznemirljivo je, da GPT‑5.5 nadzoruje te poteke dela.«

»GPT-5.5 je bil odličen glede povečanja znanja. Za nas je to skokovita sprememba pri opravljanju znanjskega dela.«

—Arnav Singhvi, raziskovalni inženir

Pridružite se novi dobi dela

Več kot milijon podjetij po svetu dosega pomembne rezultate z OpenAI.

Stopite v stik s prodajo

Berite naprej

How agents are transforming work

Podjetje25. jun. 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

Podjetje24. jun. 2026

Helping build shared standards for advanced AI

Iz sveta23. jun. 2026