Dinala ng Databricks ang GPT‑5.5 sa mga enterprise agent workflow
Nakapag-set ang GPT‑5.5 ng bagong state of the art sa OfficeQA Pro, benchmark ng Databricks para sa mga complex na enterprise agent task.

50%
Accuracy sa OfficeQA Pro benchmark (state of the art)
46%
Nabawasan ang mga error sa OfficeQA Pro benchmark kumpara sa GPT-5.4
Ginagawang available ng Databricks ang GPT‑5.5 para sa mga customer agent workflow matapos makapag-establish ang model ng bagong state of the art sa OfficeQA Pro, ang benchmark ng kumpanya para sa mga complex na enterprise document task.
Ini-evaluate ng OfficeQA Pro kung paano hina-handle ng mga model ang parsing, retrieval, at grounded reasoning sa mga workflow na may scanned PDF, legacy file, at mga long-context document, mga task na madalas na nakakasira sa production agent system.
Sa agent-harness setting, nabawasan ng GPT‑5.5 ang mga error nang 46% kumpara sa GPT‑5.4 at ito ang unang model na nagkaroong ng mahigit 50% na accuracy sa OfficeQA Pro.
“Ang Codex na may 5.5 ay state-of-the-art na ngayon kumpara sa lahat iba pang agent at model.”
Napakaraming scanned o legacy enterprise document ang OfficeQA Pro. Dito, ang maliliit na error sa extraction habang nagpa-parse ay puwedeng magtuloy-tuloy hanggang sa dulo ng workflow. “Kapag hindi mo na-extract ang isang partikular na digit o number, nababago nito ang buong trajectory ng ginagawa ng agent,” paliwanag ni Singhvi.
Nakita ng Databricks na na-improve nang husto ng GPT‑5.5 ang mga parsing workflow na ito. “Sa mga naunang model tulad ng 5.4, hindi napa-parse nang tama ang lahat ng digit, pero mukhang malaki ang isinulong ng 5.5 sa pag-parse ng mas lumang mga document at scanned PDF,” sabi ni Singhvi.
Nakakita rin ang team ng mga improvement sa coordination ng mga multi-step na task. “Sa 5.4, nakita namin na minsan napupunta ito sa mga hindi kailangang search detour, kaya nagiging napaka-inefficient ng mga trajectory,” sabi ni Singhvi.
Kumpara sa mga naunang model, mas reliable ang GPT‑5.5 sa pag-retrieve ng relevant na context at pagtapos sa mga complex na workflow nang hindi na kailangang ng dagdag na supervision.
Ginagawa na ngayong available ng Databricks ang GPT‑5.5 sa pamamagitan ng AI Unity Gateway. Dito, nagagamit ng mga customer ang model sa mga workflow na na-build gamit ang AgentBricks at ang Agent Supervisor API. Sa mga system na ito, kino-coordinate ng GPT‑5.5 ang parsing, retrieval, at execution sa mga specialized agent.
“Makikita nating darami ang mga customer na gumagamit ng AgentBricks at Agent Supervisor API para sa mga custom agent workflow,” sabi ni Singhvi. “Exciting talaga na GPT‑5.5 na ang nagsu-supervise sa mga workflow na 'to.”
“Napakagaling ng GPT-5.5 pagdating sa pag-improve ng knowledge. Malaking pagbabago ito para sa amin sa paggawa ng mga knowledge work.”


