Databricks внедряет GPT‑5.5 в корпоративные агентные процессы
GPT‑5.5 показал новый лучший результат в OfficeQA Pro — бенчмарке Databricks для сложных корпоративных задач агентов.

50%
Точность в бенчмарке OfficeQA Pro (лучший результат)
46%
Снижение числа ошибок в бенчмарке OfficeQA Pro по сравнению с GPT-5.4
Databricks делает GPT‑5.5 доступным для клиентских рабочих процессов агентов после того, как модель показала новый лучший результат в OfficeQA Pro — бенчмарке компании для сложных задач с корпоративными документами.
OfficeQA Pro оценивает, как модели справляются с парсингом, извлечением и обоснованными рассуждениями в рабочих процессах со сканированными PDF, устаревшими файлами и документами с длинным контекстом — задачами, которые часто выводят из строя рабочие системы агентов.
В конфигурации agent-harness GPT‑5.5 сократил число ошибок на 46% по сравнению с GPT‑5.4 и стал первой моделью, превысившей 50% точности в OfficeQA Pro.
«Codex с 5.5 теперь является лучшим среди всех существующих агентов и моделей».
OfficeQA Pro включает большое количество сканированных или устаревших корпоративных документов, где небольшие ошибки извлечения при парсинге могут каскадно распространяться дальше по всему рабочему процессу. «Если не удаётся извлечь определённую цифру или число, это меняет всю траекторию того, с чем работает агент», — объясняет Сингхви.
Databricks увидела наибольший прирост от GPT‑5.5 именно в этих рабочих процессах с интенсивным парсингом. «Более ранние модели, такие как 5.4, не могли правильно распознать все цифры, но, похоже, 5.5 даёт скачкообразный прирост в парсинге старых документов и сканированных PDF», — говорит Сингхви.
Команда также увидела улучшения в оркестрации многошаговых задач. «С 5.4 мы иногда видели, что модель уходила в ненужные поисковые обходы, и это приводило к очень неэффективным траекториям», — говорит Сингхви.
По сравнению с более ранними моделями GPT‑5.5 надёжнее извлекал релевантный контекст и завершал сложные рабочие процессы без дополнительного контроля.
Теперь Databricks предоставляет GPT‑5.5 через AI Unity Gateway, где клиенты используют модель в рабочих процессах, созданных с помощью AgentBricks и Agent Supervisor API. В этих системах GPT‑5.5 координирует парсинг, извлечение и выполнение задач между специализированными агентами.
«Мы увидим, как множество клиентов будут использовать AgentBricks и Agent Supervisor API для пользовательских рабочих процессов агентов», — говорит Сингхви. «То, что GPT‑5.5 будет контролировать эти рабочие процессы, действительно очень вдохновляет».
«GPT-5.5 отлично показал себя с точки зрения прироста знаний. Для нас это скачкообразное изменение в выполнении интеллектуальной работы».


