പ്രധാന ഉള്ളടക്കത്തിലേക്ക് നീങ്ങുക
OpenAI

2026 മേയ് 15

Databricks brings GPT‑5.5 to enterprise agent workflows

GPT‑5.5 set a new state of the art on OfficeQA Pro, Databricks’ benchmark for complex enterprise agent tasks.

Databricks ഉപഭോക്തൃ സ്റ്റോറിയുടെ ഹീറോ ചിത്രം.
കമ്പനിയുടെ വലിപ്പം: AI ഫീച്ചറുകളുടെ ഫലങ്ങൾ
മേഖല: വടക്കേ അമേരിക്ക
ഇൻഡസ്ട്രി: സാങ്കേതികവിദ്യ
ഉൽപ്പന്നങ്ങൾ: Codex

50%

OfficeQA Pro ബെഞ്ച്മാർക്കിലെ കൃത്യത (അത്യാധുനിക നിലവാരം)

46%

OfficeQA Pro ബെഞ്ച്മാർക്കിൽ GPT-5.4നെ അപേക്ഷിച്ച് പിശകുകളിൽ കുറവ്

ലോഡിംഗ്…

Databricks is making GPT‑5.5 available for customer agent workflows after the model established a new state of the art on OfficeQA Pro, the company’s benchmark for complex enterprise document tasks.

OfficeQA Pro evaluates how models handle parsing, retrieval, and grounded reasoning across workflows involving scanned PDFs, legacy files, and long-context documents, tasks that frequently break production agent systems.

In the agent-harness setting, GPT‑5.5 reduced errors by 46% compared to GPT‑5.4 and became the first model to surpass 50% accuracy on OfficeQA Pro.

“5.5 ഉള്ള Codex ഇപ്പോൾ ലഭ്യമായ എല്ലാ ഏജന്റുകളിലും മോഡലുകളിലും അത്യാധുനിക നിലവാരത്തിലുള്ളതാണ്.”
–Arnav Singhvi, റിസർച്ച് എഞ്ചിനീയർ

SOTA performance on OfficeQA Pro

OfficeQA Pro includes large numbers of scanned or legacy enterprise documents, where small extraction errors during parsing can cascade downstream through the rest of the workflow. “Once you can’t extract a certain digit or number, that changes the entire trajectory of what the agent works with,” Singhvi explains.

Databricks saw the largest gains from GPT‑5.5 in these parsing-heavy workflows. “Earlier models like 5.4 were unable to parse all the digits correctly, but it seems like 5.5 has a step-function lift in parsing older documents and scanned PDFs,” Singhvi says.

The team also saw improvements in orchestration across multi-step tasks. “One thing that we saw with 5.4 is sometimes it would go on these unnecessary search detours, and that would cause very inefficient trajectories,” Singhvi says.

Compared to earlier models, GPT‑5.5 was more reliable at retrieving relevant context and completing complex workflows without additional supervision.

Bringing GPT‑5.5 into production workflows

Databricks now makes GPT‑5.5 available through AI Unity Gateway, where customers use the model inside workflows built with AgentBricks and the Agent Supervisor API. In these systems, GPT‑5.5 orchestrates parsing, retrieval, and execution across specialized agents.

“We’re going to see a lot of customers using AgentBricks and Agent Supervisor API for custom agent workflows,” Singhvi says. “Having GPT‑5.5 supervise these workflows is really exciting.”

“അറിവ് വർദ്ധനയുടെ കാര്യത്തിൽ GPT-5.5 വളരെ മികച്ചതാണ്. ഞങ്ങൾക്കായി അറിവ് അടിസ്ഥാനമാക്കിയുള്ള ജോലികൾ ചെയ്യുന്നതിൽ ഇതൊരു വലിയ കുതിച്ചുചാട്ടമാണ്”
—Arnav Singhvi, റിസർച്ച് എഞ്ചിനീയർ

ജോലിയുടെ പുതിയ യുഗത്തിൽ ചേരൂ

ലോകമെമ്പാടുമുള്ള 10 ലക്ഷത്തിലധികം ബിസിനസുകൾ OpenAI ഉപയോഗിച്ച് അർത്ഥവത്തായ ഫലങ്ങൾ നേടുന്നു.