Databricks přináší GPT‑5.5 do podnikových agentních workflows
GPT‑5.5 dosáhl nového špičkového výsledku v OfficeQA Pro, benchmarku Databricks pro komplexní podnikové úlohy agentů.

50%
Přesnost v benchmarku OfficeQA Pro (špičková úroveň)
46%
Snížení chybovosti v benchmarku OfficeQA Pro oproti GPT-5.4
Databricks zpřístupňuje GPT‑5.5 pro zákaznické agentní workflows poté, co model dosáhl nového špičkového výsledku v OfficeQA Pro, firemním benchmarku pro komplexní úlohy s podnikovými dokumenty.
OfficeQA Pro hodnotí, jak modely zvládají parsování, vyhledávání a uvažování založené na datech napříč workflow zahrnujícími naskenovaná PDF, starší soubory a dokumenty s dlouhým kontextem, tedy úlohy, které často narušují produkční systémy agentů.
V nastavení agent-harness snížil GPT‑5.5 chybovost o 46 % ve srovnání s GPT‑5.4 a stal se prvním modelem, který v OfficeQA Pro překonal 50% přesnost.
„Codex s verzí 5.5 je nyní na špičkové úrovni mezi všemi dostupnými agenty a modely.“
OfficeQA Pro zahrnuje velké množství naskenovaných nebo starších podnikových dokumentů, kde se malé chyby při extrakci během parsování mohou řetězit dál do zbytku workflow. „Jakmile nedokážete extrahovat určitou číslici nebo číslo, změní to celou trajektorii toho, s čím agent pracuje,“ vysvětluje Singhvi.
Databricks zaznamenal největší přínosy GPT‑5.5 právě v těchto workflow náročných na parsování. „Dřívější modely jako 5.4 nedokázaly správně parsovat všechny číslice, ale zdá se, že 5.5 přináší skokové zlepšení při parsování starších dokumentů a naskenovaných PDF,“ říká Singhvi.
Tým také zaznamenal zlepšení v orchestrace napříč vícekrokovými úlohami. „Jedna věc, kterou jsme u 5.4 viděli, byla, že se někdy vydával na zbytečné odbočky při vyhledávání, a to vedlo k velmi neefektivním trajektoriím,“ říká Singhvi.
Ve srovnání s dřívějšími modely byl GPT‑5.5 spolehlivější při získávání relevantního kontextu a dokončování komplexních workflow bez dodatečného dohledu.
Databricks nyní zpřístupňuje GPT‑5.5 prostřednictvím AI Unity Gateway, kde zákazníci používají model uvnitř workflow vytvořených pomocí AgentBricks a Agent Supervisor API. V těchto systémech GPT‑5.5 orchestruje parsování, vyhledávání a provádění napříč specializovanými agenty.
„Uvidíme mnoho zákazníků, kteří budou používat AgentBricks a Agent Supervisor API pro vlastní agentní workflow,“ říká Singhvi. „Je opravdu vzrušující, že GPT‑5.5 tyto workflow řídí.“
„GPT-5.5 je skvělý z hlediska posunu ve znalostech. Pro nás je to skoková změna v oblasti znalostní práce.“


