Passer au contenu principal
OpenAI

15 mai 2026

Databricks intègre GPT‑5.5 aux flux d’agent d’entreprise

GPT‑5.5 a établi une nouvelle référence sur OfficeQA Pro, le benchmark de Databricks pour les tâches complexes d’agent en entreprise.

Image principale de l’histoire client de Databricks.
Taille de l’entreprise: Enterprise
Région: Amérique du Nord
Secteur: Technologie
Produits: Codex

50%

Précision sur le benchmark OfficeQA Pro (fine pointe)

46%

Réduction des erreurs sur le benchmark OfficeQA Pro par rapport à GPT-5.4

Chargement…

Databricks rend GPT‑5.5 accessible pour les flux de travail d’agent des clients après que le modèle a établi une nouvelle référence sur OfficeQA Pro, le benchmark de l’entreprise pour les tâches complexes sur des documents d’entreprise.

OfficeQA Pro évalue comment les modèles gèrent l’analyse, la récupération et le raisonnement fondé dans des flux de travail impliquant des PDF numérisés, des fichiers hérités et des documents à long contexte, des tâches qui font souvent échouer les systèmes d’agent en production.

Dans le contexte agent-harness, GPT‑5.5 a réduit les erreurs de 46 % par rapport à GPT‑5.4 et est devenu le premier modèle à dépasser 50 % de précision sur OfficeQA Pro.

« Codex avec 5.5 est maintenant à la fine pointe parmi tous les agents et modèles offerts. »
–Arnav Singhvi, ingénieur de recherche

Performance de pointe sur OfficeQA Pro

OfficeQA Pro comprend un grand nombre de documents d’entreprise numérisés ou hérités, où de petites erreurs d’extraction pendant l’analyse peuvent se répercuter en aval dans le reste du flux de travail. « Dès qu’on n’arrive pas à extraire un certain chiffre ou nombre, cela change toute la trajectoire de ce avec quoi l’agent travaille », explique Singhvi.

Databricks a constaté les gains les plus importants avec GPT‑5.5 dans ces flux de travail fortement axés sur l’analyse. « Les modèles précédents comme 5.4 n’arrivaient pas à analyser correctement tous les chiffres, mais il semble que 5.5 apporte un bond marqué dans l’analyse des anciens documents et des PDF numérisés », dit Singhvi.

L’équipe a aussi constaté des améliorations dans l’orchestration des tâches à plusieurs étapes. « Une chose que nous avons observée avec 5.4, c’est qu’il faisait parfois des détours de recherche inutiles, ce qui entraînait des trajectoires très inefficaces », dit Singhvi.

Comparativement aux modèles précédents, GPT‑5.5 était plus fiable pour récupérer le contexte pertinent et mener à bien des flux de travail complexes sans supervision supplémentaire.

Intégrer GPT‑5.5 aux flux de travail en production

Databricks rend maintenant GPT‑5.5 accessible par l’entremise d’AI Unity Gateway, où les clients utilisent le modèle dans des flux de travail conçus avec AgentBricks et l’API Agent Supervisor. Dans ces systèmes, GPT‑5.5 orchestre l’analyse, la récupération et l’exécution entre des agents spécialisés.

« Nous allons voir beaucoup de clients utiliser AgentBricks et l’API Agent Supervisor pour des flux de travail d’agent personnalisés », dit Singhvi. « C’est vraiment emballant d’avoir GPT‑5.5 pour superviser ces flux de travail. »

« GPT-5.5 a été excellent sur le plan du gain de connaissances. C’est un changement majeur pour le travail du savoir chez nous. »
—Arnav Singhvi, ingénieur de recherche

Entrez dans la nouvelle ère du travail

Plus de 1 million d’entreprises dans le monde obtiennent des résultats concrets avec OpenAI.