Databricks intègre GPT‑5.5 aux flux d’agent d’entreprise
GPT‑5.5 a établi une nouvelle référence sur OfficeQA Pro, le benchmark de Databricks pour les tâches complexes d’agent en entreprise.

50%
Précision sur le benchmark OfficeQA Pro (fine pointe)
46%
Réduction des erreurs sur le benchmark OfficeQA Pro par rapport à GPT-5.4
Databricks rend GPT‑5.5 accessible pour les flux de travail d’agent des clients après que le modèle a établi une nouvelle référence sur OfficeQA Pro, le benchmark de l’entreprise pour les tâches complexes sur des documents d’entreprise.
OfficeQA Pro évalue comment les modèles gèrent l’analyse, la récupération et le raisonnement fondé dans des flux de travail impliquant des PDF numérisés, des fichiers hérités et des documents à long contexte, des tâches qui font souvent échouer les systèmes d’agent en production.
Dans le contexte agent-harness, GPT‑5.5 a réduit les erreurs de 46 % par rapport à GPT‑5.4 et est devenu le premier modèle à dépasser 50 % de précision sur OfficeQA Pro.
« Codex avec 5.5 est maintenant à la fine pointe parmi tous les agents et modèles offerts. »
OfficeQA Pro comprend un grand nombre de documents d’entreprise numérisés ou hérités, où de petites erreurs d’extraction pendant l’analyse peuvent se répercuter en aval dans le reste du flux de travail. « Dès qu’on n’arrive pas à extraire un certain chiffre ou nombre, cela change toute la trajectoire de ce avec quoi l’agent travaille », explique Singhvi.
Databricks a constaté les gains les plus importants avec GPT‑5.5 dans ces flux de travail fortement axés sur l’analyse. « Les modèles précédents comme 5.4 n’arrivaient pas à analyser correctement tous les chiffres, mais il semble que 5.5 apporte un bond marqué dans l’analyse des anciens documents et des PDF numérisés », dit Singhvi.
L’équipe a aussi constaté des améliorations dans l’orchestration des tâches à plusieurs étapes. « Une chose que nous avons observée avec 5.4, c’est qu’il faisait parfois des détours de recherche inutiles, ce qui entraînait des trajectoires très inefficaces », dit Singhvi.
Comparativement aux modèles précédents, GPT‑5.5 était plus fiable pour récupérer le contexte pertinent et mener à bien des flux de travail complexes sans supervision supplémentaire.
Databricks rend maintenant GPT‑5.5 accessible par l’entremise d’AI Unity Gateway, où les clients utilisent le modèle dans des flux de travail conçus avec AgentBricks et l’API Agent Supervisor. Dans ces systèmes, GPT‑5.5 orchestre l’analyse, la récupération et l’exécution entre des agents spécialisés.
« Nous allons voir beaucoup de clients utiliser AgentBricks et l’API Agent Supervisor pour des flux de travail d’agent personnalisés », dit Singhvi. « C’est vraiment emballant d’avoir GPT‑5.5 pour superviser ces flux de travail. »
« GPT-5.5 a été excellent sur le plan du gain de connaissances. C’est un changement majeur pour le travail du savoir chez nous. »


