Gå direkt till huvudinnehåll
OpenAI

23 oktober 2025

Consensus använder GPT‑5 och Svar-API för att slutföra flera veckors forskning på några minuter

Med hjälp av GPT‑5 och Svar-API byggde Consensus ett system med flera agenter som planerar, läser och syntetiserar evidens på samma sätt som forskare gör.

En Consensus-logotyp i vitt mitt på en mörkblå bakgrund i olika nyanser av blått och grönt.
Laddar …

Varje år publiceras miljontals nya vetenskapliga artiklar – mycket mer än vad en enskild person kan läsa. 

För forskare är utmaningen inte tillgången till kunskap utan den överväldigande uppgiften att hitta, tolka och koppla samman den. Genombrott sker i gränslandet av vad som är känt, och forskare ägnar större delen av sin tid åt att bara hitta gränserna istället för att tänja på dem.

Consensus(öppnas i ett nytt fönster), en forskningsassistent som används av fler än åtta miljoner människor, byggdes för att ändra på det. Plattformen, som grundades av Christian Salem och Eric Olson, söker, läser och syntetiserar vetenskaplig litteratur från mer än 220 miljoner artiklar. Dess senaste funktion, Scholar Agent, är ett system med flera agenter byggt på GPT‑5 och Svar-API. Det speglar hur forskare faktiskt arbetar och hjälper dem att ta sig från fråga till slutsats på några minuter istället för flera veckor.

Men målet är inte bara snabbare forskning – det är en snabbare väg till upptäckter. ”Vetenskapen går framåt när den är mer tillgänglig”, säger Salem. ”Vårt jobb är att ge forskare världen över möjligheten att hitta, lita på och agera utifrån evidens.”

Från sökmotor till agentbaserad assistent

Den första versionen av Consensus fungerade som en vertikal sökmotor för vetenskap: den indexerade akademiska artiklar, hämtade relevanta resultat och genererade sammanfattningar baserade på källhänvisningar. Men det räckte inte med att bara leta. 

”Forskning handlar inte bara om att hitta artiklar”, säger Salem. ”Det handlar om att tolka resultat, jämföra upptäckter och koppla samman idéer.” Ju mer tid forskare lägger på att söka, läsa och tolka tidigare kunskap för att hitta rätt studie, desto mindre tid har de att upptäcka och skapa riktig forskning.

Så teamet började omstrukturera Consensus kring ett nytt koncept: ett system med flera agenter som kallas Scholar Agent och som fungerar på samma sätt som en mänsklig forskare.

Systemet, som bygger på GPT‑5 och Svar-API, kör nu ett samordnat arbetsflöde för agenter:

  • Planning Agent bryter ner användarens fråga och beslutar vilka åtgärder som ska vidtas härnäst
  • Search Agent söker igenom Consensus pappersindex, en användares privata bibliotek och grafen för källhänvisningar
  • Reading Agent tolkar artiklar var och en för sig eller i batcher
  • Analysis Agent syntetiserar resultat, bestämmer struktur och visuella element och sammanställer slutresultatet

Varje agent har en begränsad omfattning, vilket gör resonemanget precist och minimerar synvillor. Arkitekturen gör det också möjligt för Consensus att bestämma när den inte ska svara – om inga relevanta studier uppfyller dess kvalitetsgräns säger assistenten helt enkelt till.

”Genom att dela upp arbetsflödet mellan agenterna minskar vi antalet fel och gör systemet mycket mer disciplinerat”, säger Salem. ”Ingen enskild agent har för mycket ansvar, vilket är avgörande för tillförlitligheten.”

Ett agentflödesdiagram som visar hur en användarfråga bearbetas genom planerings-, parallellsöknings-, läsnings- och analysagenter för att generera forskningsbaserade resultat.

Teamet kallar denna metod kontextteknik: att samla rätt evidens innan genereringen börjar. I varje svar medföljer ett forskningskontextpaket – ett strukturerat paket med artiklar, metadata och viktiga resultat som kan spåras tillbaka till originalstudier.

”Vi vill inte att forskare slösar tid på att dubbelkolla varje påstående”, säger Salem. ”Om systemet inte kan grunda ett svar i verkliga evidens, kommer det inte att hitta på något.”

Bygga med Svar-API

Consensus migrerade från slutförda chattar till Svar-API för att stödja dess routning mellan flera agenter. Bytet förbättrade både tillförlitligheten och kostnadseffektiviteten, vilket gav teamet bättre kontroll över samtal till underagenter. Med GPT‑5‑resonemang i långa kontexter och tillförlitligt verktygsanrop var valet självklart.

Tidiga utvärderingar bekräftade detta: GPT‑5 överträffade GPT‑4.1, Sonnet 4 och Gemini 2.5 Pro vad gäller riktighet för verktygsanrop och planeringsstabilitet. Det gjorde det möjligt för Consensus-teamet att fokusera mindre på promptutveckling och mer på att bygga upp agentbeteenden som är direkt kopplade till forskningsarbetsflöden.

En tabell som jämför GPT-5 Research Agent-mätvärden för OAI-, Anthropic- och Google-modeller gällande riktighet, precision, struktur och latens.

En konsumentsatsning i en institutionell värld

Ända från början närmade sig Consensus marknaden på ett annat sätt än förväntat. Istället för att sälja via institutioner fokuserade teamet på de personer som utför själva forskningen: studenter, skolor och läkare som behövde svar idag. Att fokusera direkt på forskarna formade både produktens design och dess snabba tillväxt.

”Alla sa att man inte kan gå direkt till konsumenten inom den akademiska världen, men AI har ändrat på det”, säger Salem. ”Folk väntar inte längre på godkännande – de använder det som fungerar.”

Det beslutet formade produktens ton och tillväxtkurva. Consensus känns mer som en modern konsumentapp än ett traditionellt akademiskt verktyg: snabb onboarding, intuitiv design, samtalsgränssnitt. Användningen spreds genom mun till mun över campus och laboratorier.

Doktorander blev de första användarna, följt av fakulteten och privata forskare. Sedan kom läkare som började använda Consensus för att lyfta fram de senaste evidensen inom sina områden. 

”Vi hade inte för avsikt att bygga för läkare”, säger Salem. ”Men de behöver samma sak som forskare: snabb tillgång till tillförlitliga evidens.”

Företaget tecknade nyligen avtal med Mayo Clinics medicinska bibliotek och har precis lanserat Medical Mode, en ny funktion utformad för läkare som söker efter kliniska evidens.

Skala upp med vetenskapen

Under det senaste året har Consensus expanderat snabbt och har nu fler än åtta miljoner forskare världen över och en åttafaldig ökning av intäkterna.

Den här tillväxten har inte förändrat produktens prioriteringar. Varje funktion kretsar fortfarande kring verifierbara svar med få synvillor. Teamet har investerat mycket i utvärderingsprocesser som testar riktighet, spårbarhet av källhänvisningar och stilistisk konsekvens mellan agenter.

Consensus arkitektur är modulär och utformad så att nya agenter kan integreras allt eftersom modeller expanderar och förbättras – agenter som replikerar experiment, genererar siffror eller kör statistiska analyser.

”Vi bygger de assisterande forskare som faktiskt behövs i en värld som förändras snabbt”, säger Salem. ”Modellerna blir bara bättre, systemet växer med dem och vetenskapen rör sig snabbare.”

OpenAI <3 startupföretag. Kom och skapa med oss.