Passer au contenu principal
OpenAI

23 octobre 2025

Consensus utilise GPT‑5 et l’API Responses pour effectuer des semaines de recherche en quelques minutes

Consensus a utilisé GPT‑5 et l’API Responses d’OpenAI pour créer un assistant de recherche multi-agent capable de préparer, lire et synthétiser des preuves, comme le font les scientifiques.

Logo de Consensus en blanc sur un fond bleu sarcelle sombre composé de panneaux texturés verticaux dans différentes nuances de bleu et vert.
Chargement...

Chaque année, le monde scientifique publie des millions d’études, soit bien plus qu’il est humainement possible de lire. 

Pour les scientifiques, la difficulté ne réside pas tant dans l’accès aux connaissances que dans la difficulté à trouver, interpréter et faire le lien entre ces connaissances. Et alors que les grandes découvertes reposent les connaissances de pointe du moment, les chercheurs passent plus de temps à rechercher ces connaissances qu’à les faire progresser.

C’est pour mettre un terme à cette situation qu’est né Consensus(ouverture dans une nouvelle fenêtre), un assistant de recherche qui a déjà séduit plus de 8 millions de personnes. Créée par Christian Salem et Eric Olson, cette plateforme recherche, consulte et résume le contenu d’une base de plus de 220 millions d’articles évalués par des pairs. Sa nouvelle fonctionnalité, Scholar Agent, est un système multi-agent basé sur GPT‑5 et l’API Responses. Elle reproduit la méthode de travail des chercheurs et les aide à répondre aux questions qu’ils se posent en quelques minutes, un processus qui prenait plusieurs semaines auparavant.

Son objectif n’est pas seulement d’accélérer la recherche, mais aussi d’accélérer les découvertes. « La science progresse lorsqu’elle devient plus accessible », juge Christian Salem. « Notre mission est d’aider les chercheurs du monde entier à trouver des données fiables et à les exploiter. »

De moteur de recherche à assistant agentique

La première version de Consensus ressemblait à un moteur de recherche spécialisé dans la science : il indexait des articles scientifiques, récupérait les résultats pertinents pour la recherche demandée et générait des résumés appuyés par des citations. Mais cela ne suffisait pas. 

« La recherche, ce n’est pas que trouver des articles », explique Christian Salem. « C’est aussi interpréter des résultats, comparer des conclusions et faire le lien entre des idées. Plus les scientifiques passent de temps à chercher, lire et interpréter des connaissances qui existent déjà, moins ils en ont pour découvrir des choses et mener de nouvelles recherches. »

Son équipe a donc imaginé un nouveau concept, un système multi-agent baptisé « Scholar Agent ». Sa particularité ? Il travaille comme le fait un chercheur.

Basé sur GPT‑5 et l’API Responses, le système exécute un workflow coordonné réunissant plusieurs agents :

  • L’agent de planification analyse la question de l’utilisateur et décide quelles actions effectuer.
  • L’agent de recherche parcourt l’index de Consensus, la bibliothèque privée de l’utilisateur et le graphe des citations.
  • L’agent de lecture interprète les articles individuellement ou en groupe.
  • L’agent d’analyse synthétise les résultats, détermine la structure et les visuels de la sortie finale et la génère.

Chaque agent dispose d’un champ d’action limité, ce qui préserve l’exactitude du raisonnement et limite les hallucinations. Cette architecture permet aussi à Consensus de décider dans quels cas ne pas répondre. Si les études n’atteignent pas le seuil de qualité requis, l’assistant l’indique.

« En répartissant le workflow entre plusieurs agents, nous réduisons les erreurs et rendons le système bien plus respectueux des instructions », justifie Christian Salem. « Aucun agent n’a trop de responsabilités, ce qui est essentiel pour la fiabilité. »

Diagramme de flux d’agents montrant le traitement de la requête d’un utilisateur par les agents de planification, des agents de recherche s’exécutant en parallèle, des agents de lecture et des agents d’analyse pour générer une sortie basée sur des articles de recherche.

Cette approche est baptisée ingénierie contextuelle par son équipe : elle consiste à réunir les bonnes preuves avant la génération. Chaque réponse s’accompagne d’un « kit contextuel de recherche », à savoir un ensemble d’articles, de métadonnées et de conclusions clés associés à des liens vers les études dont ils proviennent.

« Nous voulons éviter aux chercheurs de perdre du temps à revérifier chaque affirmation », détaille Christian Salem. « Si le système ne peut pas baser sa réponse sur des preuves concrètes, il n’en donne pas. »

Utilisation de l’API Responses

Consensus est passé de Chat Completions à l’API Responses pour pouvoir mettre en place son routage multi-agent. Cette migration a amélioré la fiabilité et réduit le coût de sa solution en donnant à son équipe un contrôle plus fin sur les appels aux sous-agents. Au vu de la capacité de GPT‑5 à raisonner sur des contextes longs et la fiabilité de ses appels aux outils, l’entreprise n’a pas hésité longtemps.

Ses premières évaluations lui ont confirmé qu’elle avait fait le bon choix : GPT‑5 s’est montré plus performant que GPT‑4.1, Sonnet 4 et Gemini 2.5 Pro sur les plans de la précision des appels aux outils et de la stabilité de la planification. L’équipe de Consensus a pu consacrer son attention à la création de comportements d’agent adaptés aux workflows des chercheurs plutôt qu’à la préparation des prompts.

Tableau comparant des indicateurs mesurant la précision dans l’utilisation des outils, la précision de l’extraction des métadonnées, le respect de la structure et la latence pour les modèles OAI, Anthropic et Google.

Une stratégie orientée grand public dans un monde réservé aux institutions

Dès le départ, l’approche commerciale adoptée par Consensus a surpris. Plutôt que de passer par des institutions académiques, l’entreprise a choisi de se concentrer sur celles et ceux qui font la recherche au quotidien, à savoir les étudiants, enseignants et médecins qui ont besoin de réponses sans attendre. Cette approche directe explique à la fois la conception du produit et sa croissance rapide.

« Tout le monde disait qu’on ne peut pas vendre directement au consommateur dans le monde académique, mais ce n’est plus vrai avec l’IA », affirme Christian Salem. « Les utilisateurs n’attendent plus d’approbations officielles, ils se servent directement de ce qui fonctionne. »

On retrouve cet aspect grand public dans le comportement du produit et sa croissance. Consensus ressemble plus à une application moderne classique qu’à un outil académique traditionnel : sa prise en main est rapide, sa conception intuitive et son interface conversationnelle. Le bouche-à-oreille sur les campus et dans les laboratoires a stimulé son adoption.

Les jeunes diplômés et thésards sont devenus les premiers utilisateurs de la solution et le personnel universitaire et les chercheurs d’entreprises privées leur ont rapidement emboîté le bas. Les médecins ont aussi pris le train en marche, en utilisant Consensus pour effectuer de la veille médicale. 

« Au départ, notre solution n’était pas prévue pour les médecins », explique Christian Salem. « Mais le fait est qu’ils ont besoin de la même chose que des chercheurs : un accès rapide à des preuves fiables. »

L’entreprise a récemment signé un contrat avec la bibliothèque médicale de la Mayo Clinic et vient de lancer son « Medical Mode », une fonctionnalité pensée pour les médecins cherchant à obtenir des preuves cliniques.

Une évolutivité adaptée au dynamisme scientifique

Consensus a connu une croissance rapide au cours de l’année passée. L’entreprise a conquis plus de 8 millions de chercheurs dans le monde entier et a vu ses revenus multipliés par 8.

Malgré cette croissance, les priorités du produit n’ont pas changé. Chaque fonctionnalité repose sur des réponses vérifiables, ne laissant que peu de place aux hallucinations. L’équipe a fortement investi dans des pipelines d’évaluation qui évaluent la précision, la traçabilité des citations et la cohérence stylistique des agents.

L’architecture de Consensus a été pensée de façon modulaire à dessein : elle peut prendre en charge de nouveaux agents à mesure que les modèles gagnent en fonctionnalités et en performances. Il peut par exemple s’agir d’agents qui répliquent des expériences, génèrent des figures ou réalisent des analyses statistiques.

« Nous créons l’assistant dont les chercheurs ont besoin dans un monde qui évolue très vite », assure Christian Salem. « Les modèles ne cessent de s’améliorer et notre système évolue avec eux pour contribuer à l’accélération de la science. »