Saltar para o conteúdo principal
OpenAI

15 de maio de 2026

Databricks leva o GPT‑5.5 aos fluxos de agentes empresariais

O GPT‑5.5 estabeleceu um novo estado da arte no OfficeQA Pro, o benchmark da Databricks para tarefas complexas de agentes empresariais.

Imagem principal da história de cliente da Databricks.
Dimensão da empresa: Empresas
Região: América do Norte
Setor: Tecnologia
Produtos: Codex

50%

Precisão no benchmark OfficeQA Pro (estado da arte)

46%

Redução de erros no benchmark OfficeQA Pro face ao GPT-5.4

A carregar…

A Databricks está a disponibilizar o GPT‑5.5 para fluxos de trabalho de agentes de clientes, depois de o modelo ter estabelecido um novo estado da arte no OfficeQA Pro, o benchmark da empresa para tarefas complexas com documentos empresariais.

O OfficeQA Pro avalia como os modelos lidam com análise, recuperação e raciocínio fundamentado em fluxos de trabalho com PDFs digitalizados, ficheiros antigos e documentos de contexto longo, tarefas que frequentemente fazem falhar sistemas de agentes em produção.

No contexto agent-harness, o GPT‑5.5 reduziu os erros em 46% face ao GPT‑5.4 e tornou-se o primeiro modelo a ultrapassar 50% de precisão no OfficeQA Pro.

“O Codex com 5.5 é agora o estado da arte entre todos os agentes e modelos disponíveis.”
–Arnav Singhvi, Engenheiro de Investigação

Desempenho de estado da arte no OfficeQA Pro

O OfficeQA Pro inclui grandes quantidades de documentos empresariais digitalizados ou antigos, em que pequenos erros de extração durante a análise podem propagar-se a jusante pelo resto do fluxo de trabalho. “Quando não se consegue extrair um determinado dígito ou número, isso altera toda a trajetória do que o agente processa”, explica Singhvi.

A Databricks observou os maiores ganhos com o GPT‑5.5 nestes fluxos de trabalho com forte componente de análise. “Modelos anteriores como o 5.4 não conseguiam analisar corretamente todos os dígitos, mas parece que o 5.5 trouxe um salto de patamar na análise de documentos antigos e PDFs digitalizados”, diz Singhvi.

A equipa também observou melhorias na orquestração de tarefas de várias etapas. “Uma coisa que observámos com o 5.4 é que, por vezes, fazia desvios de pesquisa desnecessários, e isso causava trajetórias muito ineficientes”, diz Singhvi.

Em comparação com modelos anteriores, o GPT‑5.5 foi mais fiável a recuperar contexto relevante e a concluir fluxos de trabalho complexos sem supervisão adicional.

Levar o GPT‑5.5 para fluxos de trabalho em produção

A Databricks disponibiliza agora o GPT‑5.5 através do AI Unity Gateway, onde os clientes usam o modelo em fluxos de trabalho criados com AgentBricks e a Agent Supervisor API. Nestes sistemas, o GPT‑5.5 orquestra a análise, a recuperação e a execução entre agentes especializados.

“Vamos ver muitos clientes a usar o AgentBricks e a Agent Supervisor API para fluxos de trabalho de agentes personalizados”, diz Singhvi. “Ter o GPT‑5.5 a supervisionar estes fluxos de trabalho é realmente entusiasmante.”

“O GPT-5.5 tem sido excelente em termos de aumento de conhecimento. É uma mudança de patamar no que toca ao trabalho do conhecimento para nós.”
—Arnav Singhvi, Engenheiro de Investigação

Junte-se à nova era do trabalho

Mais de 1 milhão de empresas em todo o mundo estão a alcançar resultados significativos com a OpenAI.