Mayo 15, 2026

Dinala ng Databricks ang GPT‑5.5 sa mga enterprise agent workflow

Nakapag-set ang GPT‑5.5 ng bagong state of the art sa OfficeQA Pro, benchmark ng Databricks para sa mga complex na enterprise agent task.

Kontakin ang sales

Image ng hero ng customer story ng Databricks.

Laki ng kumpanya: Enterprise

Rehiyon: Hilagang Amerika

Industriya: Teknolohiya

Mga Produkto: Codex

50%

Accuracy sa OfficeQA Pro benchmark (state of the art)

46%

Nabawasan ang mga error sa OfficeQA Pro benchmark kumpara sa GPT-5.4

Naglo-load…

Ginagawang available ng Databricks ang GPT‑5.5 para sa mga customer agent workflow matapos makapag-establish ang model ng bagong state of the art sa OfficeQA Pro, ang benchmark ng kumpanya para sa mga complex na enterprise document task.

Ini-evaluate ng OfficeQA Pro kung paano hina-handle ng mga model ang parsing, retrieval, at grounded reasoning sa mga workflow na may scanned PDF, legacy file, at mga long-context document, mga task na madalas na nakakasira sa production agent system.

Sa agent-harness setting, nabawasan ng GPT‑5.5 ang mga error nang 46% kumpara sa GPT‑5.4 at ito ang unang model na nagkaroong ng mahigit 50% na accuracy sa OfficeQA Pro.

“Ang Codex na may 5.5 ay state-of-the-art na ngayon kumpara sa lahat iba pang agent at model.”

–Arnav Singhvi, Research Engineer

SOTA performance sa OfficeQA Pro

Napakaraming scanned o legacy enterprise document ang OfficeQA Pro. Dito, ang maliliit na error sa extraction habang nagpa-parse ay puwedeng magtuloy-tuloy hanggang sa dulo ng workflow. “Kapag hindi mo na-extract ang isang partikular na digit o number, nababago nito ang buong trajectory ng ginagawa ng agent,” paliwanag ni Singhvi.

Nakita ng Databricks na na-improve nang husto ng GPT‑5.5 ang mga parsing workflow na ito. “Sa mga naunang model tulad ng 5.4, hindi napa-parse nang tama ang lahat ng digit, pero mukhang malaki ang isinulong ng 5.5 sa pag-parse ng mas lumang mga document at scanned PDF,” sabi ni Singhvi.

Nakakita rin ang team ng mga improvement sa coordination ng mga multi-step na task. “Sa 5.4, nakita namin na minsan napupunta ito sa mga hindi kailangang search detour, kaya nagiging napaka-inefficient ng mga trajectory,” sabi ni Singhvi.

Kumpara sa mga naunang model, mas reliable ang GPT‑5.5 sa pag-retrieve ng relevant na context at pagtapos sa mga complex na workflow nang hindi na kailangang ng dagdag na supervision.

Dinala ang GPT‑5.5 sa mga production workflow

Ginagawa na ngayong available ng Databricks ang GPT‑5.5 sa pamamagitan ng AI Unity Gateway. Dito, nagagamit ng mga customer ang model sa mga workflow na na-build gamit ang AgentBricks at ang Agent Supervisor API. Sa mga system na ito, kino-coordinate ng GPT‑5.5 ang parsing, retrieval, at execution sa mga specialized agent.

“Makikita nating darami ang mga customer na gumagamit ng AgentBricks at Agent Supervisor API para sa mga custom agent workflow,” sabi ni Singhvi. “Exciting talaga na GPT‑5.5 na ang nagsu-supervise sa mga workflow na 'to.”

“Napakagaling ng GPT-5.5 pagdating sa pag-improve ng knowledge. Malaking pagbabago ito para sa amin sa paggawa ng mga knowledge work.”

—Arnav Singhvi, Research Engineer

Sumali sa bagong panahon ng trabaho.

Higit sa 1 milyong negosyo sa buong mundo ang nakakakamit ng makabuluhang mga resulta dahil sa OpenAI.

Kontakin ang sales

Magpatuloy sa pagbabasa

How agents are transforming work

KumpanyaHun 25, 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

KumpanyaHun 24, 2026

Helping build shared standards for advanced AI - card image

Tumutulong bumuo ng iisang pamantayan para sa advanced AI

Pandaigdigang UgnayanHun 23, 2026