15 mai 2026

Databricks intègre GPT‑5.5 aux workflows d’agent d’entreprise

GPT‑5.5 a établi un nouvel état de l’art sur OfficeQA Pro, le benchmark de Databricks pour les tâches complexes d’agent en entreprise.

Contacter le service commercial

Image principale du témoignage client Databricks.

Effectifs de l’entreprise: Enterprise

Région: Amérique du Nord

Secteur: Technologie

Produits: Codex

50%

Précision sur le benchmark OfficeQA Pro (à la pointe)

46%

Réduction des erreurs sur le benchmark OfficeQA Pro par rapport à GPT-5.4

Chargement...

Databricks met GPT‑5.5 à disposition pour les workflows d’agent de ses clients après que le modèle a établi un nouvel état de l’art sur OfficeQA Pro, le benchmark de l’entreprise pour les tâches documentaires complexes en entreprise.

OfficeQA Pro évalue la manière dont les modèles gèrent l’analyse, la récupération et le raisonnement fondé dans des workflows impliquant des PDF numérisés, des fichiers hérités et des documents à long contexte, des tâches qui font souvent échouer les systèmes d’agent en production.

Dans le cadre agent-harness, GPT‑5.5 a réduit les erreurs de 46 % par rapport à GPT‑5.4 et est devenu le premier modèle à dépasser 50 % de précision sur OfficeQA Pro.

« Codex avec 5.5 est désormais à la pointe parmi tous les agents et modèles disponibles. »

–Arnav Singhvi, ingénieur de recherche

Performance de pointe sur OfficeQA Pro

OfficeQA Pro comprend un grand nombre de documents d’entreprise numérisés ou hérités, où de petites erreurs d’extraction lors de l’analyse peuvent se répercuter en aval sur le reste du workflow. « Dès qu’on ne peut pas extraire un certain chiffre ou nombre, cela change toute la trajectoire de ce avec quoi l’agent travaille », explique Singhvi.

Databricks a constaté les gains les plus importants avec GPT‑5.5 dans ces workflows fortement axés sur l’analyse. « Les modèles précédents comme 5.4 étaient incapables d’analyser correctement tous les chiffres, mais il semble que 5.5 apporte un bond de performance dans l’analyse des anciens documents et des PDF numérisés », déclare Singhvi.

L’équipe a également constaté des améliorations dans l’orchestration des tâches en plusieurs étapes. « Avec 5.4, nous avons constaté qu’il partait parfois dans des détours de recherche inutiles, ce qui entraînait des trajectoires très inefficaces », explique Singhvi.

Par rapport aux modèles précédents, GPT‑5.5 était plus fiable pour récupérer le contexte pertinent et mener à bien des workflows complexes sans supervision supplémentaire.

Intégrer GPT‑5.5 aux workflows de production

Databricks met désormais GPT‑5.5 à disposition via AI Unity Gateway, où les clients utilisent le modèle dans des workflows construits avec AgentBricks et l’API Agent Supervisor. Dans ces systèmes, GPT‑5.5 orchestre l’analyse, la récupération et l’exécution entre des agents spécialisés.

« Nous allons voir beaucoup de clients utiliser AgentBricks et l’API Agent Supervisor pour des workflows d’agent personnalisés », affirme Singhvi. « Le fait que GPT‑5.5 supervise ces workflows est vraiment enthousiasmant. »

« GPT-5.5 a été formidable en matière de gain de connaissances. Pour nous, c’est un changement de palier dans le travail de la connaissance. »

—Arnav Singhvi, ingénieur de recherche

Entrez dans une nouvelle ère du travail

Plus d’un million d’entreprises dans le monde obtiennent des résultats concrets grâce à OpenAI.

Contacter le service commercial

Poursuivez votre lecture

How agents are transforming work

Entreprise25 juin 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI et Broadcom : puce d’inférence optimisée pour LLM

Entreprise24 juin 2026

Helping build shared standards for advanced AI - card image

Contribuer à des standards communs pour l’IA avancée

Affaires internationales23 juin 2026