Databricks nggawa GPT‑5.5 menyang alur kerja agen enterprise
GPT‑5.5 nyetel teknologi modern paling anyar ing OfficeQA Pro, benchmark Databricks kanggo tugas agen perusahaan sing kompleks.

50%
Akurasi ing benchmark OfficeQA Pro (paling modern)
46%
Pangurangan kesalahan ing benchmark OfficeQA Pro dibandhingake GPT-5.4
Databricks nyedhiyakake GPT‑5.5 kanggo alur kerja agen pelanggan sawise model iki netepake teknologi modern paling anyar ing OfficeQA Pro, benchmark perusahaan kanggo tugas dokumen perusahaan sing kompleks.
OfficeQA Pro ngevaluasi carane model nangani parsing, retrieval, lan nalar sing adhedhasar konteks ing macem-macem alur kerja sing nglibatake PDF pindai, file lawas, lan dokumen konteks dawa, tugas sing kerep ngrusak sistem agen produksi.
Ing setelan agent-harness, GPT‑5.5 nyuda kesalahan nganti 46% dibandhingake GPT‑5.4 lan dadi model pisanan sing ngluwihi akurasi 50% ing OfficeQA Pro.
“Codex karo 5.5 saiki dadi sing paling modern ing antarane kabeh agen lan model sing ana.”
OfficeQA Pro ngemot akeh dokumen perusahaan sing dipindai utawa lawas, ing ngendi kesalahan ekstraksi cilik nalika parsing bisa nyebar mudhun menyang sisa alur kerja. “Yen sampeyan ora bisa ngekstrak digit utawa angka tartamtu, kuwi bakal ngowahi kabeh arah saka sing digarap agen,” jelas Singhvi.
Databricks ndeleng peningkatan paling gedhe saka GPT‑5.5 ing alur kerja sing abot ing parsing iki. “Model sadurunge kaya 5.4 ora bisa parsing kabeh digit kanthi bener, nanging katone yen 5.5 nduweni peningkatan gedhe ing parsing dokumen lawas lan PDF pindai,” ujare Singhvi.
Tim uga ndeleng perbaikan ing orkestrasi kanggo tugas multi-langkah. “Salah siji sing kita deleng ing 5.4 yaiku kadhang model iki nglakokake panelusuran ulang sing ora perlu, lan kuwi nyebabake alur sing ora efisien banget,” ujare Singhvi.
Dibandhingake model sadurunge, GPT‑5.5 luwih andal nalika njupuk konteks sing relevan lan ngrampungake alur kerja kompleks tanpa pengawasan tambahan.
Databricks saiki nyedhiyakake GPT‑5.5 liwat AI Unity Gateway, ing ngendi pelanggan nggunakake model iki ing njero alur kerja sing dibangun nganggo AgentBricks lan Agent Supervisor API. Ing sistem iki, GPT‑5.5 ngorkestrasi parsing, retrieval, lan eksekusi ing antarane agen khusus.
“Kita bakal ndeleng akeh pelanggan nggunakake AgentBricks lan Agent Supervisor API kanggo alur kerja agen kustom,” ujare Singhvi. “Nduweni GPT‑5.5 kanggo ngawasi alur kerja iki pancen nyenengake.”
“GPT-5.5 apik banget saka sisi peningkatan kawruh. Iki owah-owahan fungsi langkah kanggo nindakake karya kawruh kanggo kita.”


