Liwati menyang isi utama
OpenAI

15 Mei 2026

Databricks nggawa GPT‑5.5 menyang alur kerja agen enterprise

GPT‑5.5 nyetel teknologi modern paling anyar ing OfficeQA Pro, benchmark Databricks kanggo tugas agen perusahaan sing kompleks.

Gambar utama crita pelanggan Databricks.
Ukuran perusahaan: Perusahaan
Wilayah: Amerika Lor
Industri: Teknologi
Produk: Codex

50%

Akurasi ing benchmark OfficeQA Pro (paling modern)

46%

Pangurangan kesalahan ing benchmark OfficeQA Pro dibandhingake GPT-5.4

Lagi dimuat…

Databricks nyedhiyakake GPT‑5.5 kanggo alur kerja agen pelanggan sawise model iki netepake teknologi modern paling anyar ing OfficeQA Pro, benchmark perusahaan kanggo tugas dokumen perusahaan sing kompleks.

OfficeQA Pro ngevaluasi carane model nangani parsing, retrieval, lan nalar sing adhedhasar konteks ing macem-macem alur kerja sing nglibatake PDF pindai, file lawas, lan dokumen konteks dawa, tugas sing kerep ngrusak sistem agen produksi.

Ing setelan agent-harness, GPT‑5.5 nyuda kesalahan nganti 46% dibandhingake GPT‑5.4 lan dadi model pisanan sing ngluwihi akurasi 50% ing OfficeQA Pro.

“Codex karo 5.5 saiki dadi sing paling modern ing antarane kabeh agen lan model sing ana.”
–Arnav Singhvi, Insinyur Riset

Kinerja SOTA ing OfficeQA Pro

OfficeQA Pro ngemot akeh dokumen perusahaan sing dipindai utawa lawas, ing ngendi kesalahan ekstraksi cilik nalika parsing bisa nyebar mudhun menyang sisa alur kerja. “Yen sampeyan ora bisa ngekstrak digit utawa angka tartamtu, kuwi bakal ngowahi kabeh arah saka sing digarap agen,” jelas Singhvi.

Databricks ndeleng peningkatan paling gedhe saka GPT‑5.5 ing alur kerja sing abot ing parsing iki. “Model sadurunge kaya 5.4 ora bisa parsing kabeh digit kanthi bener, nanging katone yen 5.5 nduweni peningkatan gedhe ing parsing dokumen lawas lan PDF pindai,” ujare Singhvi.

Tim uga ndeleng perbaikan ing orkestrasi kanggo tugas multi-langkah. “Salah siji sing kita deleng ing 5.4 yaiku kadhang model iki nglakokake panelusuran ulang sing ora perlu, lan kuwi nyebabake alur sing ora efisien banget,” ujare Singhvi.

Dibandhingake model sadurunge, GPT‑5.5 luwih andal nalika njupuk konteks sing relevan lan ngrampungake alur kerja kompleks tanpa pengawasan tambahan.

Nggawa GPT‑5.5 menyang alur kerja produksi

Databricks saiki nyedhiyakake GPT‑5.5 liwat AI Unity Gateway, ing ngendi pelanggan nggunakake model iki ing njero alur kerja sing dibangun nganggo AgentBricks lan Agent Supervisor API. Ing sistem iki, GPT‑5.5 ngorkestrasi parsing, retrieval, lan eksekusi ing antarane agen khusus.

“Kita bakal ndeleng akeh pelanggan nggunakake AgentBricks lan Agent Supervisor API kanggo alur kerja agen kustom,” ujare Singhvi. “Nduweni GPT‑5.5 kanggo ngawasi alur kerja iki pancen nyenengake.”

“GPT-5.5 apik banget saka sisi peningkatan kawruh. Iki owah-owahan fungsi langkah kanggo nindakake karya kawruh kanggo kita.”
—Arnav Singhvi, Insinyur Riset

Gabung ing era kerja anyar

Luwih saka 1 yuta bisnis ing saindenging donya padha nggayuh asil sing migunani nganggo OpenAI.