15 de maio de 2026

Databricks leva GPT‑5.5 a fluxos de agentes empresariais

O GPT‑5.5 estabeleceu um novo estado da arte no OfficeQA Pro, benchmark da Databricks para tarefas complexas de agentes empresariais.

Fale com vendas

Imagem principal da história de cliente da Databricks.

Tamanho da empresa: Enterprise

Região: América do Norte

Setor: Tecnologia

Produtos: Codex

50%

Precisão no benchmark OfficeQA Pro (estado da arte)

46%

Redução de erros no benchmark OfficeQA Pro vs. GPT-5.4

Carregando…

A Databricks está disponibilizando o GPT‑5.5 para fluxos de trabalho de agentes de clientes após o modelo estabelecer um novo estado da arte no OfficeQA Pro, benchmark da empresa para tarefas complexas com documentos empresariais.

O OfficeQA Pro avalia como os modelos lidam com parsing, recuperação e raciocínio fundamentado em fluxos de trabalho com PDFs digitalizados, arquivos legados e documentos de contexto longo, tarefas que frequentemente quebram sistemas de agentes em produção.

No cenário agent-harness, o GPT‑5.5 reduziu erros em 46% em comparação com o GPT‑5.4 e se tornou o primeiro modelo a superar 50% de precisão no OfficeQA Pro.

“Codex com 5.5 agora é o estado da arte entre todos os agentes e modelos disponíveis.”

–Arnav Singhvi, Engenheiro de Pesquisa

Desempenho de ponta no OfficeQA Pro

O OfficeQA Pro inclui grandes quantidades de documentos empresariais digitalizados ou legados, nos quais pequenos erros de extração durante o parsing podem se propagar pelo restante do fluxo de trabalho. “Quando você não consegue extrair um determinado dígito ou número, isso muda toda a trajetória do que o agente processa”, explica Singhvi.

A Databricks observou os maiores ganhos com o GPT‑5.5 nesses fluxos de trabalho intensivos em parsing. “Modelos anteriores, como o 5.4, não conseguiam analisar todos os dígitos corretamente, mas parece que o 5.5 trouxe um salto de patamar no parsing de documentos antigos e PDFs digitalizados”, diz Singhvi.

A equipe também observou melhorias na orquestração de tarefas em várias etapas. “Uma coisa que vimos com o 5.4 é que às vezes ele fazia desvios de busca desnecessários, e isso causava trajetórias muito ineficientes”, diz Singhvi.

Em comparação com modelos anteriores, o GPT‑5.5 foi mais confiável na recuperação de contexto relevante e na conclusão de fluxos de trabalho complexos sem supervisão adicional.

Levando o GPT‑5.5 para fluxos de trabalho em produção

A Databricks agora disponibiliza o GPT‑5.5 por meio do AI Unity Gateway, onde os clientes usam o modelo em fluxos de trabalho criados com AgentBricks e a Agent Supervisor API. Nesses sistemas, o GPT‑5.5 orquestra parsing, recuperação e execução entre agentes especializados.

“Vamos ver muitos clientes usando AgentBricks e a Agent Supervisor API para fluxos de trabalho de agentes personalizados”, diz Singhvi. “Ter o GPT‑5.5 supervisionando esses fluxos de trabalho é realmente empolgante.”

“GPT-5.5 tem sido excelente em termos de ganho de conhecimento. É uma mudança de patamar em termos de realizar trabalho de conhecimento para nós.”

—Arnav Singhvi, Engenheiro de Pesquisa

Entre na nova era do trabalho

Mais de 1 milhão de empresas em todo o mundo estão alcançando resultados significativos com a OpenAI.

Fale com a gente

Continuar lendo

How agents are transforming work

Empresa25 de jun. de 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

Empresa24 de jun. de 2026

Helping build shared standards for advanced AI - card image

Ajudando a criar padrões compartilhados para AI avançada

Assuntos Globais23 de jun. de 2026