Consensus gebruikt GPT‑5 en de Responses-API om onderzoek dat weken duurde, nu in enkele minuten te voltooien
Met GPT‑5 en de Responses-API heeft Consensus een multi-agent systeem ontworpen dat bewijsmateriaal plant, leest en afstemt op dezelfde manier als onderzoekers dat doen.

Elk jaar worden er miljoenen nieuwe wetenschappelijke papers gepubliceerd: veel meer dan één persoon kan lezen.
Voor wetenschappers is de uitdaging niet de toegang tot kennis, maar de overweldigende taak om al die kennis te vinden, interpreteren en verbinden. Doorbraken vinden plaats aan de grenzen van wat bekend is. Maar onderzoekers besteden het grootste deel van hun tijd aan het zoeken naar die grenzen in plaats van deze te verleggen.
Consensus(opent in een nieuw venster), een onderzoeksassistent die door meer dan 8 miljoen mensen wordt gebruikt, is ontwikkeld om daar verandering in te brengen. Het platform, opgericht door Christian Salem en Eric Olson, doorzoekt, leest en synthetiseert peer-reviewed literatuur uit meer dan 220 miljoen papers. De nieuwste functie, Scholar Agent, is een multi-agent systeem dat is gebouwd op GPT‑5 en de Responses-API. Het sluiten aan op hoe onderzoekers echt werken en helpt ze om binnen enkele minuten in plaats van weken van vraag naar conclusie te komen.
Maar het doel is niet alleen sneller onderzoek. Onderzoekers moeten sneller nieuwe doorbraken bereiken. ‘Wetenschap boekt vooruitgang wanneer ze toegankelijker is’, zegt Salem. ‘Het is onze taak om onderzoekers overal ter wereld bewijsmateriaal te laten vinden, dat te vertrouwen en het in de praktijk te brengen.’
De eerste versie van Consensus werkte als een verticale zoekmachine voor de wetenschap: ze indexeerde academische papers, haalde relevante resultaten op en genereerde samenvattingen op basis van citaten. Maar zoeken alleen was niet genoeg.
‘Onderzoek is niet alleen het vinden van papers’, zegt Salem. Onderzoekers moeten resultaten interpreteren, bevindingen vergelijken en ideeën met elkaar verbinden. Hoe meer tijd wetenschappers besteden aan het zoeken, lezen en interpreteren van kennis uit het verleden voor het juiste onderzoek, hoe minder tijd ze hebben om echt onderzoek te doen en nieuwe ontdekkingen te doen.’
Het team begon dus met het herontwerpen van Consensus rond een nieuw concept: een multi-agent systeem genaamd ‘Scholar Agent’ dat net zo werkt als een menselijke onderzoeker.
Het systeem is gebouwd op GPT‑5 en de Responses-API en voert nu een gecoördineerde workflow van agents uit:
- De Planning Agent ontleedt de vraag van de gebruiker en beslist welke acties vervolgens moeten worden ondernomen.
- De Search Agentdoorzoekt de paper-index van Consensus, de privébibliotheek van een gebruiker en de citatiegrafiek.
- De Reading Agent interpreteert papers afzonderlijk of in batches
- De Analysis Agent voegt resultaten samen, bepaalt structuur en visuals, en stelt de uiteindelijke uitvoer samen.
Elke agent heeft een beperkt toepassingsgebied, waardoor het redeneren nauwkeurig blijft en hallucinaties tot een minimum worden beperkt. Dankzij de architectuur kan Consensus ook beslissen wanneer niet te antwoorden: als er geen relevante studies zijn die aan de kwaliteitsdrempel voldoen, zegt de assistent dat gewoon.
‘Door de workflow over verschillende agents te verdelen, verminderen we fouten en maken we het systeem veel gedisciplineerder’, zegt Salem. ‘Geen enkele agent heeft te veel verantwoordelijkheden. En dat blijkt cruciaal voor de betrouwbaarheid te zijn.’

Deze aanpak wordt door het team context engineering genoemd: het verzamelen van het juiste bewijsmateriaal voordat het genereren begint. Elk antwoord wordt geleverd met een ‘onderzoekscontextpakket’. Dat is een gestructureerde bundel van papers, metadata en belangrijke bevindingen die terug te voeren zijn op de oorspronkelijke studies.
‘We willen niet dat onderzoekers tijd verspillen door alle beweringen te moeten controleren’, zegt Salem. ‘Als het systeem een antwoord niet op echt bewijs kan baseren, geeft het simpelweg geen antwoord.’
Consensus is gemigreerd van Chat Completions naar de Responses-API om de multi-agent routing te ondersteunen. De overstap verbeterde zowel de betrouwbaarheid als de kostenefficiëntie. Hierdoor kreeg het team meer controle over de aanroepen van subagents. Dankzij de GPT‑5‑redeneringen met lange context en betrouwbare toolaanroepen was de keuze duidelijk.
Vroege evaluaties bevestigden de gok: GPT‑5 presteerde beter dan GPT‑4.1, Sonnet 4 en Gemini 2.5 Pro op het gebied van nauwkeurigheid bij toolaanroepen en stabiliteit bij het plannen. Daardoor hoefde het Consensus-team zich minder richten op snelle prompthandelingen en meer op het ontwikkelen van agentgedrag dat direct aansluit bij onderzoeksworkflows.

Vanaf het begin benaderde Consensus de markt anders dan verwacht. In plaats van via instellingen te verkopen, richtte het team zich op de mensen die het onderzoek zelf deden: studenten, docenten en clinici die vandaag nog antwoorden nodig hadden. Deze focus op onderzoekers was bepalend voor zowel het ontwerp van het product als de snelle groei.
‘Iedereen zei dat direct-to-consumer niet mogelijk was in de academische wereld, maar AI heeft daar verandering in gebracht’, zegt Salem. ‘Mensen wachten niet meer op goedkeuring, maar gebruiken gewoon wat werkt.’
Die beslissing bepaalde de toon en de groeicurve van het product. Consensus voelt meer aan als een moderne app voor consumenten dan een traditioneel academisch hulpmiddel: snelle onboarding, intuïtief ontwerp, conversatie-interface. De acceptatie verspreidde zich via mond-tot-mondreclame over campussen en laboratoria.
Afgestudeerde studenten en promovendi werden de eerste intensieve gebruikers, gevolgd door faculteits- en particuliere onderzoekers. Toen kwamen de clinici, die met Consensus aan het werk gingen om de nieuwste bevindingen in hun vakgebied boven water te halen.
‘We waren niet van plan om iets voor artsen te bouwen’, zegt Salem. ‘Maar ze hebben net als onderzoekers snelle toegang tot betrouwbaar bewijs nodig.’
Het bedrijf heeft onlangs een overeenkomst gesloten met de medische bibliotheek van de Mayo Clinic en heeft zojuist ‘Medical Mode’ gelanceerd. Dat is een nieuwe functie die is ontworpen voor artsen die op zoek zijn naar klinisch bewijs.
Het afgelopen jaar is Consensus snel gegroeid, met meer dan 8 miljoen onderzoekers wereldwijd en een omzet die met een factor 8 is gestegen.
Die groei heeft niets veranderd aan de prioriteiten van het product. Elke functie draait nog steeds om verifieerbare antwoorden met weinig hallucinaties. Het team heeft fors geïnvesteerd in evaluatiepijplijnen die de nauwkeurigheid, traceerbaarheid van citaten en stilistische consistentie tussen agents testen.
De architectuur van Consensus is bewust modulair opgezet, zodat nieuwe agents kunnen worden toegevoegd naarmate modellen worden uitgebreid en verbeterd: agents die experimenten repliceren, cijfers genereren of statistische analyses uitvoeren.
‘We bouwen de assistent die onderzoekers echt nodig hebben in een wereld die snel verandert’, zegt Salem. ‘De modellen worden steeds beter, het systeem groeit mee en de wetenschap gaat sneller vooruit.’


