15 de maio de 2026

Databricks leva o GPT‑5.5 aos fluxos de agentes empresariais

O GPT‑5.5 estabeleceu um novo estado da arte no OfficeQA Pro, o benchmark da Databricks para tarefas complexas de agentes empresariais.

Contactar vendas

Imagem principal da história de cliente da Databricks.

Dimensão da empresa: Enterprise

Região: América do Norte

Setor: Tecnologia

Produtos: Codex

50%

Precisão no benchmark OfficeQA Pro (estado da arte)

46%

Redução de erros no benchmark OfficeQA Pro face ao GPT-5.4

A carregar…

A Databricks está a disponibilizar o GPT‑5.5 para fluxos de trabalho de agentes de clientes, depois de o modelo ter estabelecido um novo estado da arte no OfficeQA Pro, o benchmark da empresa para tarefas complexas com documentos empresariais.

O OfficeQA Pro avalia como os modelos lidam com análise, recuperação e raciocínio fundamentado em fluxos de trabalho com PDFs digitalizados, ficheiros antigos e documentos de contexto longo, tarefas que frequentemente fazem falhar sistemas de agentes em produção.

No contexto agent-harness, o GPT‑5.5 reduziu os erros em 46% face ao GPT‑5.4 e tornou-se o primeiro modelo a ultrapassar 50% de precisão no OfficeQA Pro.

“O Codex com 5.5 é agora o estado da arte entre todos os agentes e modelos disponíveis.”

–Arnav Singhvi, Engenheiro de Investigação

Desempenho de estado da arte no OfficeQA Pro

O OfficeQA Pro inclui grandes quantidades de documentos empresariais digitalizados ou antigos, em que pequenos erros de extração durante a análise podem propagar-se a jusante pelo resto do fluxo de trabalho. “Quando não se consegue extrair um determinado dígito ou número, isso altera toda a trajetória do que o agente processa”, explica Singhvi.

A Databricks observou os maiores ganhos com o GPT‑5.5 nestes fluxos de trabalho com forte componente de análise. “Modelos anteriores como o 5.4 não conseguiam analisar corretamente todos os dígitos, mas parece que o 5.5 trouxe um salto de patamar na análise de documentos antigos e PDFs digitalizados”, diz Singhvi.

A equipa também observou melhorias na orquestração de tarefas de várias etapas. “Uma coisa que observámos com o 5.4 é que, por vezes, fazia desvios de pesquisa desnecessários, e isso causava trajetórias muito ineficientes”, diz Singhvi.

Em comparação com modelos anteriores, o GPT‑5.5 foi mais fiável a recuperar contexto relevante e a concluir fluxos de trabalho complexos sem supervisão adicional.

Levar o GPT‑5.5 para fluxos de trabalho em produção

A Databricks disponibiliza agora o GPT‑5.5 através do AI Unity Gateway, onde os clientes usam o modelo em fluxos de trabalho criados com AgentBricks e a Agent Supervisor API. Nestes sistemas, o GPT‑5.5 orquestra a análise, a recuperação e a execução entre agentes especializados.

“Vamos ver muitos clientes a usar o AgentBricks e a Agent Supervisor API para fluxos de trabalho de agentes personalizados”, diz Singhvi. “Ter o GPT‑5.5 a supervisionar estes fluxos de trabalho é realmente entusiasmante.”

“O GPT-5.5 tem sido excelente em termos de aumento de conhecimento. É uma mudança de patamar no que toca ao trabalho do conhecimento para nós.”

—Arnav Singhvi, Engenheiro de Investigação

Junte-se à nova era do trabalho

Mais de 1 milhão de empresas em todo o mundo estão a obter resultados significativos com a OpenAI.

Contacte a equipa de vendas

Continuar a ler

How agents are transforming work

Empresa25/06/2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

Empresa24/06/2026

Helping build shared standards for advanced AI - card image

Ajudar a criar normas comuns para AI avançada

Assuntos globais23/06/2026