23. oktober 2025

Consensus bruker GPT‑5 og Responses API til å fullføre uker med forskning på minutter

Ved å bruke GPT‑5 og Responses API designet Consensus et system med flere agenter som planlegger, leser og syntetiserer bevis slik forskere gjør.

Laster inn …

Hvert år blir det publisert millioner av nye vitenskapelige artikler – langt flere enn én person kan lese.

For forskere er ikke utfordringen tilgang til kunnskap, men den overveldende oppgaven å finne, tolke og knytte den sammen. Gjennombrudd skjer ved grensen av det som er kjent, men forskere bruker likevel mye av tiden sin på å finne grensene i stedet for å flytte dem.

Consensus⁠(åpnes i et nytt vindu), en forskningsassistent som brukes av over 8 millioner mennesker, ble bygget for å endre på det. Plattformen, som ble grunnlagt av Christian Salem og Eric Olson, søker, leser og syntetiserer fagfellevurdert litteratur på tvers av 220 millioner artikler. Den nyeste funksjonen, Scholar Agent, er et multiagentsystem som er bygget på GPT‑5 og Responses API Den speiler hvordan forskere faktisk jobber, og hjelper dem fra å gå fra spørsmål til konklusjon på minutter i stedet for uker.

Men målet er ikke bare raskere forskning – det er en raskere vei til oppdagelser. «Vitenskapen gjør større fremskritt når den er tilgjengelig», sier Salem. Vår jobb er å gi forskere overalt muligheten til å finne, stole på og handle ut fra bevis.

Fra søkemotor til agentassistent

Den første versjonen av Consensus fungerte som en vertikal søkemotor for vitenskap: den sorterte vitenskapelige artikler, hentet relevante resultater og genererte sammendrag basert på kilder. Men kun søk var ikke nok.

«Forskning er ikke bare å finne artikler», sa Salem. «Det er å tolke resultater, sammenligne funn og knytte sammen ideer. Jo mer tid forskere bruker på å søke, lese og tolke tidligere kunnskap for å finne den rette studien, jo mindre tid har de til å oppdage og utføre ekte forskning.»

Så begynte teamet å omstrukturere Consensus rundt et nytt konsept: et multiagentsystem kalt «Scholar Agent», som jobber på samme måte som en menneskelig forsker.

Systemet er bygget på GPT‑5 og Responses API, og kjører nå en koordinert arbeidsflyt for agenter:

Planleggingsagenten analyserer brukerens spørsmål og bestemmer hvilke handlinger som skal utføres videre.
Søkeagenten går gjennom Consensus’ dokumenter, en brukers private bibliotek og siteringsgrafen.
Leseagenten tolker artikler individuelt eller i grupper.
Analyseagenten syntetiserer resultater, bestemmer struktur og visuelle elementer, og setter sammen det endelige resultatet.

Hver agent har et smalt omfang, noe som gjør resonnering presist og minimerer hallusinasjoner. Arkitekturen lar også Consensus bestemme når den ikke skal svare; hvis ingen relevante studier oppfyller kvalitetsgrensen, sier assistenten ifra.

«Ved å dele arbeidsflyten på flere agenter reduserer vi feil og gjør systemet langt mer disiplinert», sier Salem. «Ingen agent har for mye ansvar, noe som viser seg å være nøkkelen for pålitelighet.»

Et flytdiagram for agenter som viser hvordan en brukerforespørsel behandles gjennom agenter for planlegging, parallelle søk, lesing og analyse for å generere forskningsbaserte resultater.

Denne tilnærmingen kaller teamet kontekstteknikk: å finne riktige bevis før genereringen begynner. Hvert svar kommer med en «forskningskontekstpakke» – en strukturert samling av artikler, metadata og viktige funn som kan spores tilbake til sine opprinnelige studier.

«Vi ønsker ikke at forskere skal kaste bort tid på å dobbeltsjekke alle påstander», sa Salem. «Dersom systemet ikke kan begrunne svaret med ekte bevis, finner det ikke på et.»

Bygger med Responses API

Consensus migrerte fra Chat Completions til Responses API for å støtte ruting mellom flere agenter. Byttet forbedret både pålitelighet og kostnadseffektivitet, og ga teamet bedre kontroll over kall til underagenter. Med GPT‑5 sin evne til resonnering av lang kontekst og pålitelige verktøykall, var valget enkelt.

Tidlige evalueringer bekreftet valget: GPT‑5 var bedre enn GPT‑4.1, Sonnet 4 og Gemini 2.5 Pro når det gjaldt nøyaktighet ved verktøykall og planleggingsstabilitet. Dette gjorde at Consensus-teamet kunne fokusere mindre på utforming av meldinger, og mer på å bygge agentadferd som er direkte knyttet til forskningsarbeidsflyter.

Tabell som sammenligner GPT-5 forskningsagent-beregninger for OAI-, Anthropic- og Google-modeller gjennom nøyaktighet, presisjon, struktur og ventetid.

En forbrukersatsing i en verden full av institusjoner

Helt fra starten møtte Consensus markedet på en annen måte enn forventet. I stedet for å selge gjennom institusjoner, fokuserte teamet på menneskene som utførte selve forskningen: studenter, fakultet og fagpersoner som trengte svar i dag. Fokuset på å gå direkte til forskeren formet produktets design og raske vekst.

«Alle sier at man ikke kan gå direkte til forbrukeren i akademia, men AI har endret på det», sa Salem. «Folk venter ikke lenger på godkjenning – de bruker det som fungerer.»

Den avgjørelsen formet produktets uttrykk og vekst. Consensus føles mer som en moderne forbrukerapp enn et tradisjonelt akademisk verktøy: rask innføring, intuitivt design og samtalegrensesnitt. Bruken spredte seg gjennom jungeltelegrafen på skoler og laboratorier.

Doktorgradsstudenter og -kandidater ble de første storbrukerne, tett fulgt av fakulteter og uavhengige forskere. Så kom legene, som begynte å bruke Consensus for å finne de nyeste bevisene i sine felt.

«Vi startet ikke dette med leger i tankene», sa Salem. «Men de trenger det samme som forskere: rask tilgang til pålitelige bevis.»

Selskapet signerte nylig Mayo Clinics medisinske bibliotek og lanserte nettopp «Medical Mode», en ny funksjon designet for leger som søker etter kliniske bevis.

Skalere med vitenskapen

I det siste året har Consensus vokst raskt og har nå over 8 millioner forskere over hele verden, og inntektene har åttedoblet seg.

Veksten har ikke endret produktets prioriteter. Hver funksjon dreier seg fortsatt om verifiserbare svar med lav forekomst av hallusinasjoner. Teamet har investert tungt i evalueringsprosesser som tester nøyaktighet, sporbarhet av sitater og stilistisk jevnhet på tvers av agenter.

Consensus’ arkitektur er bevisst modulær, designet slik at nye agenter kan integreres etter hvert som modeller utvides og forbedres – agenter som replikerer eksperimenter, genererer tall eller kjører statistiske analyser.

«Vi bygger assistentene forskere faktisk trenger i en verden i endring», sa Salem. «Modellene blir stadig bedre, systemet vokser med dem, og vitenskapen går raskere fremover.»

OpenAI <3 oppstartsbedrifter. Kom og bygg med oss.

Bli med i fellesskapet Begynn å bygge

Les videre

A scorecard for the AI age

Selskap17. juli 2026

Why teens deserve access to safe AI — card image

Hvorfor tenåringer fortjener tilgang til trygg KI

Sikkerhet16. juli 2026

How Cars24 scales conversations and builds faster with OpenAI

16. juli 2026