15 de mayo de 2026

Databricks lleva GPT‑5.5 a flujos de agentes empresariales

GPT‑5.5 alcanzó el mejor rendimiento hasta ahora en OfficeQA Pro, la evaluación comparativa de Databricks para tareas complejas de agentes empresariales.

Comunicarse con ventas

Imagen principal de la historia de cliente de Databricks.

Tamaño de la empresa: Empresarial

Región: Norteamérica

Sector: Tecnología

Productos: Codex

50%

La mejor precisión en la evaluación comparativa OfficeQA Pro (de vanguardia)

46%

Reducción de errores en la evaluación comparativa OfficeQA Pro frente a GPT-5.4

Cargando...

Databricks ofrecerá GPT‑5.5 para flujos de trabajo con agentes orientados a clientes, después de que el modelo lograra el mejor rendimiento hasta ahora en OfficeQA Pro, la evaluación comparativa de la empresa para tareas complejas con documentos empresariales.

OfficeQA Pro evalúa cómo los modelos manejan el análisis, la recuperación y el razonamiento fundamentado en flujos de trabajo con PDF escaneados, archivos heredados y documentos de contexto largo, tareas que con frecuencia rompen los sistemas de agentes en producción.

En el entorno con arnés de agentes, GPT‑5.5 redujo los errores en 46 % en comparación con GPT‑5.4 y se convirtió en el primer modelo en superar 50 % de precisión en OfficeQA Pro.

"Codex con 5.5 ahora ofrece el mejor rendimiento entre los agentes y modelos disponibles".

–Arnav Singhvi, ingeniero de investigación

Máximo rendimiento en OfficeQA Pro

OfficeQA Pro incluye grandes cantidades de documentos empresariales escaneados o heredados, donde pequeños errores de extracción durante el análisis pueden propagarse aguas abajo por el resto del flujo de trabajo. "Cuando no se logra extraer cierta cifra o dato, cambia por completo cómo trabaja el agente", explica Singhvi.

Databricks observó las mayores mejoras de GPT‑5.5 en estos flujos de trabajo con gran carga de análisis. “Los modelos anteriores, como 5.4, no podían analizar correctamente todos los dígitos, pero parece que 5.5 tiene una mejora radical en el análisis de documentos antiguos y PDF escaneados”, dice Singhvi.

El equipo también observó mejoras en la orquestación de tareas de varios pasos. “Algo que vimos con 5.4 es que a veces tomaba desvíos de búsqueda innecesarios, y eso causaba trayectorias muy ineficientes”, dice Singhvi.

En comparación con modelos anteriores, GPT‑5.5 fue más confiable para recuperar contexto relevante y completar flujos de trabajo complejos sin supervisión adicional.

Llevar GPT‑5.5 a flujos de trabajo de producción

Databricks ahora pone GPT‑5.5 a disposición a través de AI Unity Gateway, donde los clientes utilizan el modelo dentro de flujos de trabajo creados con AgentBricks y la API Agent Supervisor. En estos sistemas, GPT‑5.5 orquesta el análisis, la recuperación y la ejecución entre agentes especializados.

“Vamos a ver a muchos clientes usando AgentBricks y la API Agent Supervisor para flujos de trabajo de agentes personalizados”, dice Singhvi. “Tener a GPT‑5.5 supervisando estos flujos de trabajo es realmente emocionante”.

"GPT-5.5 ha sido excelente en términos de mejora del conocimiento. Para nosotros, esto representa un salto enorme en la forma de hacer trabajo que requiere un conocimiento específico".

—Arnav Singhvi, ingeniero de investigación

Únete a la nueva era del trabajo

Más de un millón de empresas en todo el mundo logran resultados significativos con OpenAI.

Hablar con un experto

Sigue leyendo

How agents are transforming work

Empresa25 jun 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI y Broadcom presentan chip de inferencia para los LLM

Empresa24 jun 2026

Helping build shared standards for advanced AI - card image

Ayudar a crear estándares compartidos para la IA avanzada

Asuntos Internacionales23 jun 2026