Databricks leva GPT‑5.5 a fluxos de agentes empresariais
O GPT‑5.5 estabeleceu um novo estado da arte no OfficeQA Pro, benchmark da Databricks para tarefas complexas de agentes empresariais.

50%
Precisão no benchmark OfficeQA Pro (estado da arte)
46%
Redução de erros no benchmark OfficeQA Pro vs. GPT-5.4
A Databricks está disponibilizando o GPT‑5.5 para fluxos de trabalho de agentes de clientes após o modelo estabelecer um novo estado da arte no OfficeQA Pro, benchmark da empresa para tarefas complexas com documentos empresariais.
O OfficeQA Pro avalia como os modelos lidam com parsing, recuperação e raciocínio fundamentado em fluxos de trabalho com PDFs digitalizados, arquivos legados e documentos de contexto longo, tarefas que frequentemente quebram sistemas de agentes em produção.
No cenário agent-harness, o GPT‑5.5 reduziu erros em 46% em comparação com o GPT‑5.4 e se tornou o primeiro modelo a superar 50% de precisão no OfficeQA Pro.
“Codex com 5.5 agora é o estado da arte entre todos os agentes e modelos disponíveis.”
O OfficeQA Pro inclui grandes quantidades de documentos empresariais digitalizados ou legados, nos quais pequenos erros de extração durante o parsing podem se propagar pelo restante do fluxo de trabalho. “Quando você não consegue extrair um determinado dígito ou número, isso muda toda a trajetória do que o agente processa”, explica Singhvi.
A Databricks observou os maiores ganhos com o GPT‑5.5 nesses fluxos de trabalho intensivos em parsing. “Modelos anteriores, como o 5.4, não conseguiam analisar todos os dígitos corretamente, mas parece que o 5.5 trouxe um salto de patamar no parsing de documentos antigos e PDFs digitalizados”, diz Singhvi.
A equipe também observou melhorias na orquestração de tarefas em várias etapas. “Uma coisa que vimos com o 5.4 é que às vezes ele fazia desvios de busca desnecessários, e isso causava trajetórias muito ineficientes”, diz Singhvi.
Em comparação com modelos anteriores, o GPT‑5.5 foi mais confiável na recuperação de contexto relevante e na conclusão de fluxos de trabalho complexos sem supervisão adicional.
A Databricks agora disponibiliza o GPT‑5.5 por meio do AI Unity Gateway, onde os clientes usam o modelo em fluxos de trabalho criados com AgentBricks e a Agent Supervisor API. Nesses sistemas, o GPT‑5.5 orquestra parsing, recuperação e execução entre agentes especializados.
“Vamos ver muitos clientes usando AgentBricks e a Agent Supervisor API para fluxos de trabalho de agentes personalizados”, diz Singhvi. “Ter o GPT‑5.5 supervisionando esses fluxos de trabalho é realmente empolgante.”
“GPT-5.5 tem sido excelente em termos de ganho de conhecimento. É uma mudança de patamar em termos de realizar trabalho de conhecimento para nós.”


