Databricks leva o GPT‑5.5 aos fluxos de agentes empresariais
O GPT‑5.5 estabeleceu um novo estado da arte no OfficeQA Pro, o benchmark da Databricks para tarefas complexas de agentes empresariais.

50%
Precisão no benchmark OfficeQA Pro (estado da arte)
46%
Redução de erros no benchmark OfficeQA Pro face ao GPT-5.4
A Databricks está a disponibilizar o GPT‑5.5 para fluxos de trabalho de agentes de clientes, depois de o modelo ter estabelecido um novo estado da arte no OfficeQA Pro, o benchmark da empresa para tarefas complexas com documentos empresariais.
O OfficeQA Pro avalia como os modelos lidam com análise, recuperação e raciocínio fundamentado em fluxos de trabalho com PDFs digitalizados, ficheiros antigos e documentos de contexto longo, tarefas que frequentemente fazem falhar sistemas de agentes em produção.
No contexto agent-harness, o GPT‑5.5 reduziu os erros em 46% face ao GPT‑5.4 e tornou-se o primeiro modelo a ultrapassar 50% de precisão no OfficeQA Pro.
“O Codex com 5.5 é agora o estado da arte entre todos os agentes e modelos disponíveis.”
O OfficeQA Pro inclui grandes quantidades de documentos empresariais digitalizados ou antigos, em que pequenos erros de extração durante a análise podem propagar-se a jusante pelo resto do fluxo de trabalho. “Quando não se consegue extrair um determinado dígito ou número, isso altera toda a trajetória do que o agente processa”, explica Singhvi.
A Databricks observou os maiores ganhos com o GPT‑5.5 nestes fluxos de trabalho com forte componente de análise. “Modelos anteriores como o 5.4 não conseguiam analisar corretamente todos os dígitos, mas parece que o 5.5 trouxe um salto de patamar na análise de documentos antigos e PDFs digitalizados”, diz Singhvi.
A equipa também observou melhorias na orquestração de tarefas de várias etapas. “Uma coisa que observámos com o 5.4 é que, por vezes, fazia desvios de pesquisa desnecessários, e isso causava trajetórias muito ineficientes”, diz Singhvi.
Em comparação com modelos anteriores, o GPT‑5.5 foi mais fiável a recuperar contexto relevante e a concluir fluxos de trabalho complexos sem supervisão adicional.
A Databricks disponibiliza agora o GPT‑5.5 através do AI Unity Gateway, onde os clientes usam o modelo em fluxos de trabalho criados com AgentBricks e a Agent Supervisor API. Nestes sistemas, o GPT‑5.5 orquestra a análise, a recuperação e a execução entre agentes especializados.
“Vamos ver muitos clientes a usar o AgentBricks e a Agent Supervisor API para fluxos de trabalho de agentes personalizados”, diz Singhvi. “Ter o GPT‑5.5 a supervisionar estes fluxos de trabalho é realmente entusiasmante.”
“O GPT-5.5 tem sido excelente em termos de aumento de conhecimento. É uma mudança de patamar no que toca ao trabalho do conhecimento para nós.”


