Databricks въвежда GPT‑5.5 в корпоративни агентни работни процеси
GPT‑5.5 постави ново най-добро постижение в OfficeQA Pro, бенчмарка на Databricks за сложни корпоративни задачи с Агенти.

50%
Точност в бенчмарка OfficeQA Pro (най-добро постижение)
46%
Намаление на грешките в бенчмарка OfficeQA Pro спрямо GPT-5.4
Databricks прави GPT‑5.5 достъпен за клиентски работни потоци с Агенти, след като моделът постигна ново най-добро постижение в OfficeQA Pro, бенчмарка на компанията за сложни корпоративни задачи с документи.
OfficeQA Pro оценява как моделите се справят с парсване, извличане и структурирано анализиране, основано на контекст, в работни потоци със сканирани PDF файлове, стари файлове и документи с дълъг контекст — задачи, които често нарушават работата на продукционни системи с Агенти.
В средата agent-harness GPT‑5.5 намали грешките с 46% спрямо GPT‑5.4 и стана първият модел, който надхвърля 50% точност в OfficeQA Pro.
„Codex с 5.5 вече е най-доброто решение сред всички налични Агенти и модели.“
OfficeQA Pro включва голям брой сканирани или стари корпоративни документи, при които малки грешки при извличането по време на парсване могат да се натрупат и да повлияят на останалата част от работния поток. „Щом не можете да извлечете определена цифра или число, това променя цялата траектория на работа на Агента“, обяснява Сингви.
Databricks отчита най-големите подобрения от GPT‑5.5 именно в тези работни потоци, натоварени с парсване. „По-ранни модели като 5.4 не успяваха да разчитат правилно всички цифри, но изглежда, че 5.5 носи скокообразно подобрение при парсването на по-стари документи и сканирани PDF файлове“, казва Сингви.
Екипът също така отчете подобрения в оркестрацията при многостъпкови задачи. „Едно нещо, което виждахме при 5.4, е, че понякога моделът поемаше по ненужни отклонения в търсенето и това водеше до много неефективни траектории“, казва Сингви.
В сравнение с по-ранните модели GPT‑5.5 беше по-надежден при извличането на релевантен контекст и завършването на сложни работни потоци без допълнителен надзор.
Databricks вече предоставя GPT‑5.5 чрез AI Unity Gateway, където клиентите използват модела в работни потоци, изградени с AgentBricks и Agent Supervisor API. В тези системи GPT‑5.5 оркестрира парсване, извличане и изпълнение между специализирани Агенти.
„Ще видим много клиенти да използват AgentBricks и Agent Supervisor API за персонализирани работни потоци с Агенти“, казва Сингви. „Наистина е вълнуващо GPT‑5.5 да наблюдава тези работни потоци.“
„GPT-5.5 е отличен по отношение на повишаването на знанията. За нас това е скокообразна промяна в работата със знания.“


