Databricks diegia GPT‑5.5 į įmonių agentų darbo eigas
GPT‑5.5 pasiekė naują pažangiausią rezultatą OfficeQA Pro – Databricks etalone, skirtame sudėtingoms įmonių agentų užduotims.

50%
Tikslumas OfficeQA Pro etalone (pažangiausias rezultatas)
46%
Klaidų sumažėjimas OfficeQA Pro etalone, palyginti su GPT-5.4
Databricks suteikia galimybę naudoti GPT‑5.5 klientų agentų darbo eigose po to, kai modelis pasiekė naują pažangiausią rezultatą OfficeQA Pro – bendrovės etalone, skirtame sudėtingoms įmonių dokumentų užduotims.
OfficeQA Pro vertina, kaip modeliai tvarkosi su analizavimu, paieška ir pagrįstu protavimu darbo eigose, apimančiose nuskaitytus PDF, senus failus ir ilgo konteksto dokumentus – užduotis, kurios dažnai sutrikdo produkcines agentų sistemas.
Agent-harness aplinkoje GPT‑5.5 sumažino klaidų skaičių 46 %, palyginti su GPT‑5.4, ir tapo pirmuoju modeliu, viršijusiu 50 % tikslumą OfficeQA Pro etalone.
„Codex su 5.5 dabar yra pažangiausias tarp visų agentų ir modelių.“
OfficeQA Pro apima daug nuskaitytų ar senų įmonių dokumentų, kuriuose mažos ištraukimo klaidos analizavimo metu gali grandinine tvarka persiduoti per likusią darbo eigą. „Kai nepavyksta ištraukti tam tikro skaitmens ar skaičiaus, tai pakeičia visą trajektoriją to, su kuo dirba agentas“, – aiškina Singhvi.
Databricks didžiausią naudą iš GPT‑5.5 pastebėjo šiose daug analizavimo reikalaujančiose darbo eigose. „Ankstesni modeliai, tokie kaip 5.4, negalėjo teisingai išanalizuoti visų skaitmenų, tačiau atrodo, kad 5.5 padarė šuolinį proveržį analizuojant senesnius dokumentus ir nuskaitytus PDF“, – sako Singhvi.
Komanda taip pat pastebėjo orkestravimo patobulinimų atliekant kelių žingsnių užduotis. „Vienas dalykas, kurį matėme su 5.4, buvo tai, kad kartais jis leisdavosi į nereikalingus paieškos nukrypimus, o tai sukeldavo labai neefektyvias trajektorijas“, – sako Singhvi.
Palyginti su ankstesniais modeliais, GPT‑5.5 patikimiau surasdavo aktualų kontekstą ir užbaigdavo sudėtingas darbo eigas be papildomos priežiūros.
Databricks dabar suteikia prieigą prie GPT‑5.5 per AI Unity Gateway, kur klientai naudoja modelį darbo eigose, sukurtose su AgentBricks ir Agent Supervisor API. Šiose sistemose GPT‑5.5 orkestruoja analizavimą, paiešką ir vykdymą tarp specializuotų agentų.
„Matysime daug klientų, naudojančių AgentBricks ir Agent Supervisor API pasirinktoms agentų darbo eigoms“, – sako Singhvi. „Labai džiugu, kad GPT‑5.5 prižiūrės šias darbo eigas.“
„GPT-5.5 puikiai padidino žinių lygį. Mums tai yra šuolinis pokytis atliekant žinių darbą.“


