Databricks lleva GPT‑5.5 a flujos de agentes empresariales
GPT‑5.5 alcanzó el mejor rendimiento hasta ahora en OfficeQA Pro, la evaluación comparativa de Databricks para tareas complejas de agentes empresariales.

50%
La mejor precisión en la evaluación comparativa OfficeQA Pro (de vanguardia)
46%
Reducción de errores en la evaluación comparativa OfficeQA Pro frente a GPT-5.4
Databricks ofrecerá GPT‑5.5 para flujos de trabajo con agentes orientados a clientes, después de que el modelo lograra el mejor rendimiento hasta ahora en OfficeQA Pro, la evaluación comparativa de la empresa para tareas complejas con documentos empresariales.
OfficeQA Pro evalúa cómo los modelos manejan el análisis, la recuperación y el razonamiento fundamentado en flujos de trabajo con PDF escaneados, archivos heredados y documentos de contexto largo, tareas que con frecuencia rompen los sistemas de agentes en producción.
En el entorno con arnés de agentes, GPT‑5.5 redujo los errores en 46 % en comparación con GPT‑5.4 y se convirtió en el primer modelo en superar 50 % de precisión en OfficeQA Pro.
"Codex con 5.5 ahora ofrece el mejor rendimiento entre los agentes y modelos disponibles".
OfficeQA Pro incluye grandes cantidades de documentos empresariales escaneados o heredados, donde pequeños errores de extracción durante el análisis pueden propagarse aguas abajo por el resto del flujo de trabajo. "Cuando no se logra extraer cierta cifra o dato, cambia por completo cómo trabaja el agente", explica Singhvi.
Databricks observó las mayores mejoras de GPT‑5.5 en estos flujos de trabajo con gran carga de análisis. “Los modelos anteriores, como 5.4, no podían analizar correctamente todos los dígitos, pero parece que 5.5 tiene una mejora radical en el análisis de documentos antiguos y PDF escaneados”, dice Singhvi.
El equipo también observó mejoras en la orquestación de tareas de varios pasos. “Algo que vimos con 5.4 es que a veces tomaba desvíos de búsqueda innecesarios, y eso causaba trayectorias muy ineficientes”, dice Singhvi.
En comparación con modelos anteriores, GPT‑5.5 fue más confiable para recuperar contexto relevante y completar flujos de trabajo complejos sin supervisión adicional.
Databricks ahora pone GPT‑5.5 a disposición a través de AI Unity Gateway, donde los clientes utilizan el modelo dentro de flujos de trabajo creados con AgentBricks y la API Agent Supervisor. En estos sistemas, GPT‑5.5 orquesta el análisis, la recuperación y la ejecución entre agentes especializados.
“Vamos a ver a muchos clientes usando AgentBricks y la API Agent Supervisor para flujos de trabajo de agentes personalizados”, dice Singhvi. “Tener a GPT‑5.5 supervisando estos flujos de trabajo es realmente emocionante”.
"GPT-5.5 ha sido excelente en términos de mejora del conocimiento. Para nosotros, esto representa un salto enorme en la forma de hacer trabajo que requiere un conocimiento específico".


