Databricks intègre GPT‑5.5 aux workflows d’agent d’entreprise
GPT‑5.5 a établi un nouvel état de l’art sur OfficeQA Pro, le benchmark de Databricks pour les tâches complexes d’agent en entreprise.

50%
Précision sur le benchmark OfficeQA Pro (à la pointe)
46%
Réduction des erreurs sur le benchmark OfficeQA Pro par rapport à GPT-5.4
Databricks met GPT‑5.5 à disposition pour les workflows d’agent de ses clients après que le modèle a établi un nouvel état de l’art sur OfficeQA Pro, le benchmark de l’entreprise pour les tâches documentaires complexes en entreprise.
OfficeQA Pro évalue la manière dont les modèles gèrent l’analyse, la récupération et le raisonnement fondé dans des workflows impliquant des PDF numérisés, des fichiers hérités et des documents à long contexte, des tâches qui font souvent échouer les systèmes d’agent en production.
Dans le cadre agent-harness, GPT‑5.5 a réduit les erreurs de 46 % par rapport à GPT‑5.4 et est devenu le premier modèle à dépasser 50 % de précision sur OfficeQA Pro.
« Codex avec GPT-5.5 établit désormais une nouvelle référence parmi les agents et modèles disponibles. »
OfficeQA Pro comprend un grand nombre de documents d’entreprise numérisés ou hérités, où de petites erreurs d’extraction lors de l’analyse peuvent se répercuter en aval sur le reste du workflow. « Dès qu’on ne peut pas extraire un certain chiffre ou nombre, cela change toute la trajectoire de ce avec quoi l’agent travaille », explique Singhvi.
Databricks a constaté les gains les plus importants avec GPT‑5.5 dans ces workflows fortement axés sur l’analyse. « Les modèles précédents comme 5.4 étaient incapables d’analyser correctement tous les chiffres, mais il semble que 5.5 apporte un bond de performance dans l’analyse des anciens documents et des PDF numérisés », déclare Singhvi.
L’équipe a également constaté des améliorations dans l’orchestration des tâches en plusieurs étapes. « Avec 5.4, nous avons constaté qu’il partait parfois dans des détours de recherche inutiles, ce qui entraînait des trajectoires très inefficaces », explique Singhvi.
Par rapport aux modèles précédents, GPT‑5.5 était plus fiable pour récupérer le contexte pertinent et mener à bien des workflows complexes sans supervision supplémentaire.
Databricks met désormais GPT‑5.5 à disposition via AI Unity Gateway, où les clients utilisent le modèle dans des workflows construits avec AgentBricks et l’API Agent Supervisor. Dans ces systèmes, GPT‑5.5 orchestre l’analyse, la récupération et l’exécution entre des agents spécialisés.
« Nous allons voir beaucoup de clients utiliser AgentBricks et l’API Agent Supervisor pour des workflows d’agent personnalisés », affirme Singhvi. « Le fait que GPT‑5.5 supervise ces workflows est vraiment enthousiasmant. »
« GPT-5.5 a été formidable en matière de gain de connaissances. Pour nous, c’est un véritable changement de cap pour le travail intellectuel. »


