23. oktober 2025

Consensus bruger GPT‑5 og Responses-API'en til at gennemføre ugevis af forskning på minutter.

Ved brug af GPT‑5 og Responses-API'en har Consensus designet et multiagentsystem, der planlægger, læser og syntetiserer beviser, på samme måde som forskere gør.

Indlæser ...

Hvert år udgives millioner af nye videnskabelige artikler – langt flere end hvad én enkelt person kan nå at læse.

For forskere er udfordringen ikke adgang til viden, men den overvældende opgave med at finde, fortolke og forbinde den. Gennembrud sker på grænsen af det, der er kendt, men forskere bruger det meste af deres tid på blot at finde grænserne – i stedet for på at flytte dem.

Consensus⁠(åbner i et nyt vindue), er en forskningsassistent, der bruges af mere end 8 millioner personer, og den er bygget til at ændre dette. Platformen, der er grundlagt af Christian Salem og Eric Olson, søger i, læser og syntetiserer litteratur evalueret af fagfæller på tværs af mere end 220 millioner artikler. Dens seneste funktionalitet, Scholar Agent, er et multiagentsystem bygget på GPT‑5 og Responses-API'en. Den afspejler, hvordan forskere rent faktisk arbejder og hjælper dem med at komme fra spørgsmål til konklusioner på minutter i stedet for uger.

Men målet er ikke bare hurtigere forskning – det er en hurtigere vej til opdagelse. "Videnskaben gør fremskridt, når den er tilgængelig," siger Salem. "Vores job er at give forskere alle steder muligheden for at finde, tro på og handle ud fra beviser."

Fra søgemaskine til agentbaseret assistent

Den første version af Consensus fungerede som en lodret søgemaskine for videnskaben: Den indekserede akademiske artikler, hentede relevante resultater og genererede sammenfatninger baseret på henvisninger. Men søgning alene var ikke nok.

"Forskning handler ikke bare om at finde artikler," siger Salem. "Det gælder om at kunne fortolke resultater, sammenligne konklusioner og forbinde idéer. Jo mere tid forskere bruger på at søge, læse og fortolke tidligere viden relevant for den rette undersøgelse, jo mindre tid har de til at opdage og skabe reel forskning."

Så teamet begyndte at ændre Consensus omkring et nyt koncept: et multiagentsystem kaldet "Scholar Agent", der fungerer på samme måde som en rigtig forsker.

Systemet er bygget på GPT‑5 og Responses-API'en og kører nu en koordineret arbejdsproces af agenter:

Planning Agent udspecificerer brugerens spørgsmål og beslutter, hvilke handlinger der skal foretages
Search Agent kombinerer Consensus’ papirindeks, en brugers private bibliotek og henvisningsgrafen
Reading Agent fortolker artikler individuelt eller i partier
Analysis Agent syntetiserer resultater, fastslår struktur og visuelle elementer og sammensætter det endelige output

Hver agent håndterer et smalt område, således at den avancerede tænkning er præcis, og hallucinationer reduceres. Arkitekturen gør det også muligt for Consensus at beslutte, hvornår der ikke skal svares. Hvis der ikke er nogen relevante undersøgelser, der overholder tærsklen for kvalitet, så siger assistenten det.

"Ved at opdele arbejdsprocessen på tværs af agenter reducerer vi fejlene og gør systemet langt mere disciplineret," siger Salmen. "Ingen agent har for meget ansvar, hvilket er afgørende for pålidelighed."

Grafen over agentprocessen viser, hvordan en brugers forespørgsel behandles gennem agenter for planlægning, parallel søgning, læsning og analyse for at generere et forskningsbaseret output.

Denne tilgang er det, som teamet kalder kontekstudvikling: at samle det rette bevis før genereringen begynder. Hvert svar kommer med en "kontekstpakke for undersøgelse" – en struktureret samling dokumenter, metadata og vigtige resultater, der kan spores tilbage til de oprindelige undersøgelser.

"Vi vil ikke have, at forskere spilder tiden med at kontrollere hver påstand to gange," siger Salem. "Hvis systemet ikke kan basere et svar på rigtige beviser, vil den ikke opfinde det."

Bygning med Responses-API'en

Consensus migrerede fra Chat Completions til Responses-API'en for at understøtte sin multiagentrouting. Denne ændring forbedrede både pålideligheden og omkostningseffektiviteten og gav teamet mere præcis kontrol over underagentopkald. Med avanceret tænkning inden for lang kontekst og pålidelige værktøjsopkald i GPT‑5 var valget tydeligt.

Tidlige evalueringer bekræftede satsningen: GPT‑5 klarede sig bedre end GPT‑4.1, Sonnet 4 og Gemini 2.5 Pro på nøjagtighed af værktøjsopkald og planlægningsstabilitet. Dette gav Consensus-teamet mulighed for at fokusere mindre på forespørgselsdynamikken og mere på at opbygge agentadfærd, der kan knyttes direkte til arbejdsprocesser inden for forskning.

Tabel, der sammenligner GPT-5 Research Agents målinger med OAI, Anthropic og Google-modeller på tværs af nøjagtighed, præcision, struktur og latens.

En satsning på forbruger i en verden af institutioner

Consensus tilnærmede sig fra starten markedet anderledes end forventet. I stedet for at sælge gennem institutioner fokuserede teamet på de personer, der foretager selve forskningen: studerende, fakulteter og klinikere, der behøver svar i dag. Dette fokus, der er rettet direkte mod forskeren, formede både produktets design og dets hurtige vækst.

"Alle sagde, at du ikke kan gå direkte til forbrugere i det akademiske miljø, men AI har ændret dette," siger Salem. "Folk venter ikke længere på godkendelse – de bruger det, der fungerer."

Denne beslutning formede produktets tone og vækstkurve. Consensus føles mere som en moderne forbrugerapp end et traditionelt akademisk værktøj: hurtig registrering, intuitivt design, samtalebaseret grænseflade. Ibrugtagning spredt gennem mund til mund-metoden på tværs af campusser og laboratorier.

Kandidatstuderende og PhD-kandidater blev de første superbrugere, efterfulgt af fakulteter og private forskere. Derefter kom klinikere, der begyndte at bruge Consensus for at vise de seneste beviser inden for deres felter.

"Vi havde ikke planlagt at bygge til læger," siger Salmen. Men de behøver det samme, som forskere gør: hurtig adgang til pålidelige beviser."

Virksomheden har for nylig indgået en aftale med Mayo Clinics medicinske bibliotek og har netop lanceret "Medical Mode", som er en ny funktion, der er designet til praktiserende læger, der søger efter kliniske beviser.

Skalering med videnskaben

I det seneste år har Consensus udvidet sig hurtigt, er vokset til mere end 8 millioner forskere verden over og ottedoblet sine indtægter.

Denne vækst har ikke ændret produktets prioriteter. Hver funktion drejer sig stadig om verificerbare svar med lav hallucination. Teamet har investeret kraftigt i evalueringsprocesser, der tester nøjagtighed, sporbarhed af henvisninger og stilistisk overensstemmelse på tværs af agenter.

Consensus’ arkitektur er bevidst modulær og designet således, at nye agenter kan passe ind, efterhånden som modeller udvides og forbedres – agenter, der replikerer eksperimenter, genererer tal eller kører statistiske analyser.

"Vi er ved at opbygge den assistent, som forskere rent faktisk behøver i en verden, der ændrer sig hurtigt," siger Salem. "Modellerne bliver bedre og bedre, systemet vokser med dem, og videnskaben bevæger sig hurtigere."

OpenAI <3 startups. Kom i gang med at udvikle med os.

Bliv en del af fællesskabet Kom i gang med at udvikle

Læs videre

A scorecard for the AI age

Virksomhed17. jul. 2026

Why teens deserve access to safe AI

Sikkerhed16. jul. 2026

How Cars24 scales conversations and builds faster with OpenAI

16. jul. 2026