Pular para o conteúdo principal
OpenAI

15 de maio de 2026

Databricks leva GPT‑5.5 a fluxos de agentes empresariais

O GPT‑5.5 estabeleceu um novo estado da arte no OfficeQA Pro, benchmark da Databricks para tarefas complexas de agentes empresariais.

Imagem principal da história de cliente da Databricks.
Tamanho da empresa: Empresarial
Região: América do Norte
Setor: Tecnologia
Produtos: Codex

50%

Precisão no benchmark OfficeQA Pro (estado da arte)

46%

Redução de erros no benchmark OfficeQA Pro vs. GPT-5.4

Carregando…

A Databricks está disponibilizando o GPT‑5.5 para fluxos de trabalho de agentes de clientes após o modelo estabelecer um novo estado da arte no OfficeQA Pro, benchmark da empresa para tarefas complexas com documentos empresariais.

O OfficeQA Pro avalia como os modelos lidam com parsing, recuperação e raciocínio fundamentado em fluxos de trabalho com PDFs digitalizados, arquivos legados e documentos de contexto longo, tarefas que frequentemente quebram sistemas de agentes em produção.

No cenário agent-harness, o GPT‑5.5 reduziu erros em 46% em comparação com o GPT‑5.4 e se tornou o primeiro modelo a superar 50% de precisão no OfficeQA Pro.

“Codex com 5.5 agora é o estado da arte entre todos os agentes e modelos disponíveis.”
–Arnav Singhvi, Engenheiro de Pesquisa

Desempenho de ponta no OfficeQA Pro

O OfficeQA Pro inclui grandes quantidades de documentos empresariais digitalizados ou legados, nos quais pequenos erros de extração durante o parsing podem se propagar pelo restante do fluxo de trabalho. “Quando você não consegue extrair um determinado dígito ou número, isso muda toda a trajetória do que o agente processa”, explica Singhvi.

A Databricks observou os maiores ganhos com o GPT‑5.5 nesses fluxos de trabalho intensivos em parsing. “Modelos anteriores, como o 5.4, não conseguiam analisar todos os dígitos corretamente, mas parece que o 5.5 trouxe um salto de patamar no parsing de documentos antigos e PDFs digitalizados”, diz Singhvi.

A equipe também observou melhorias na orquestração de tarefas em várias etapas. “Uma coisa que vimos com o 5.4 é que às vezes ele fazia desvios de busca desnecessários, e isso causava trajetórias muito ineficientes”, diz Singhvi.

Em comparação com modelos anteriores, o GPT‑5.5 foi mais confiável na recuperação de contexto relevante e na conclusão de fluxos de trabalho complexos sem supervisão adicional.

Levando o GPT‑5.5 para fluxos de trabalho em produção

A Databricks agora disponibiliza o GPT‑5.5 por meio do AI Unity Gateway, onde os clientes usam o modelo em fluxos de trabalho criados com AgentBricks e a Agent Supervisor API. Nesses sistemas, o GPT‑5.5 orquestra parsing, recuperação e execução entre agentes especializados.

“Vamos ver muitos clientes usando AgentBricks e a Agent Supervisor API para fluxos de trabalho de agentes personalizados”, diz Singhvi. “Ter o GPT‑5.5 supervisionando esses fluxos de trabalho é realmente empolgante.”

“GPT-5.5 tem sido excelente em termos de ganho de conhecimento. É uma mudança de patamar em termos de realizar trabalho de conhecimento para nós.”
—Arnav Singhvi, Engenheiro de Pesquisa

Junte-se à nova era do trabalho

Mais de 1 milhão de empresas no mundo todo estão alcançando resultados significativos com a OpenAI.