Siirry pääsisältöön
OpenAI

23. lokakuuta 2025

Consensus käyttää GPT‑5:tä ja Responses API:a ennen viikkoja kestäneiden tutkimusten suorittamiseen minuuteissa

Consensus suunnitteli GPT‑5:n ja Responses API:n avulla moniagenttisen järjestelmän, joka suunnittelee, lukee ja syntetisoi todisteita aivan kuten tutkijat.

Valkoinen Consensus-logo tummansinisellä taustalla, jossa on pystysuoria kuvioituja paneeleja sinisen ja vihreän sävyissä.
Ladataan...

Miljoonia uusia tieteellisiä artikkeleita julkaistaan vuosittain, paljon enemmän kuin kukaan yksittäinen ihminen pystyy lukemaan. 

Tutkijoiden haasteena ei ole tiedonsaanti, vaan sen löytäminen, tulkinta ja yhdistäminen on usein ylivoimainen tehtävä. Läpimurtoja tapahtuu tunnetun rajoilla, mutta tutkijat käyttävät suurimman osan ajastaan ​​vain rajojen etsimiseen sen sijaan, että yrittäisivät ylittää ne.

Tutkimusavustaja Consensus(avautuu uudessa ikkunassa), jolla on yli kahdeksan miljoonaa käyttäjää, rakennettiin muuttamaan sitä. Christian Salemin ja Eric Olsonin perustama alusta etsii, lukee ja syntetisoi vertaisarvioitua kirjallisuutta yli 220 miljoonasta artikkelista. Sen uusin ominaisuus, Scholar Agent, on GPT‑5:een ja Responses API:in perustuva moniagenttinen järjestelmä. Se vastaa tutkijoiden todellista tapaa työskennellä ja auttaa heitä pääsemään kysymyksestä johtopäätökseen minuuteissa viikkojen sijaan.

Tavoitteena ei kuitenkaan ole vain nopeampi tutkimus vaan nopeampi tapa löytöihin. “Tiede edistyy, kun se on helpommin saatavilla“, Salem sanoo. “Meidän tehtävämme on antaa tutkijoille kaikkialla mahdollisuus löytää näyttöä, luottaa siihen ja toimia sen perusteella.“

Hakukoneesta agenttipohjaiseksi avustajaksi

Consensuksen ensimmäinen versio toimi kuin vertikaalinen tiedehakukone: se indeksoi akateemisia artikkeleita, haki asiaankuuluvia tuloksia ja loi viittauksiin perustuvia yhteenvetoja. Pelkkä hakutoiminto ei kuitenkaan ollut riittävä. 

“Tutkimus ei ole vain tiedeartikkeleiden löytämistä“, Salem sanoo. “Kyse on tulosten tulkinnasta, löydösten vertailusta ja ideoiden yhdistämisestä. Mitä enemmän aikaa tutkijat käyttävät etsimiseen, lukemiseen ja aiemman tiedon tulkitsemiseen juuri oikeaan tutkimukseen, sitä vähemmän aikaa heillä on löytää ja tehdä todellista tutkimusta.“

Tiimi alkoi sen vuoksi suunnitella Consensuksen uudelleen uuden konseptin pohjalta: moniagenttijärjestelmä nimeltä Scholar Agent, joka toimii samalla tavalla kuin ihmistutkija.

GPT‑5:een ja Responses API:in perustuva järjestelmä käyttää nyt agenttien koordinoitua työnkulkua:

  • Suunnitteluagentti analysoi käyttäjän kysymyksen ja päättää, mitä toimenpiteitä tehdään seuraavaksi
  • Hakuagentti tekee hakemisen Consensuksen julkaisuhakemistosta, käyttäjän yksityisestä kirjastosta ja viitekaaviosta.
  • Lukuagentti tulkitsee julkaisuja yksittäin tai erissä
  • Analyysiagentti syntetisoi tulokset, määrittää rakenteen ja visualisoinnit ja kokoaa lopullisen tuotoksen.

Jokaisella agentilla on kapea soveltamisala, mikä pitää päättelyn tarkkana ja minimoi hallusinaatiot. Arkkitehtuurin ansiosta Consensus voi myös päättää, milloin se ei vastaa: jos mikään asiaankuuluva tutkimus ei täytä sen laatukynnystä, avustaja ilmoittaa siitä.

“Jakamalla työnkulun agenttien kesken vähennämme virheitä ja teemme järjestelmästä paljon kurinalaisemman“, Salem sanoo. “Yhdelläkään agentilla ei ole liikaa vastuuta, mikä on avainasemassa luotettavuuden suhteen.“

Agentin vuokaaviossa esitetään, miten käyttäjäkysely käsitellään suunnittelu-, rinnakkaishaku-, luku- ja analyysiagenttien avulla luomaan tutkimukseen perustuva tuotos.

Tätä lähestymistapaa tiimi kutsuu kontekstisuunnitteluksi: juuri oikeiden todisteiden kokoamista jo ennen luomisen aloittamista. Jokaiseen vastaukseen sisältyy “tutkimuksen kontekstipaketti“, joka on jäsennelty aineisto artikkeleita, metadataa ja keskeisiä havaintoja, jotka johdattavat alkuperäisiin tutkimuksiin.

“Emme halua tutkijoiden tuhlaavan aikaa jokaisen väitteen tarkastamiseen“, Salem sanoo. “Jos järjestelmä ei pysty perustelemaan vastausta todellisilla todisteilla, se ei keksi sellaista.“

Rakentaminen Responses API:n avulla

Consensus siirtyi Chat Completions API:sta Responses API:in tukemaan sen reititystä useamman agentin kesken. Vaihto paransi sekä luotettavuutta että kustannustehokkuutta, ja antoi tiimin hallita tarkemmin aliagenttien kutsuja. GPT‑5:n pitkän kontekstipäättelyn ja luotettavien työkalukutsujen ansiosta valinta oli selvä.

Alustavat arvioinnit vahvistivat veikkauksen: GPT‑5 suoriutui paremmin kuin GPT‑4.1, Sonnet 4 ja Gemini 2.5 Pro työkalukutsujen tarkkuudessa ja suunnittelun vakaudessa. Sen ansiosta Consensus-tiimi saattoi keskittyä vähemmän kehotteisiin ja enemmän luomaan agenteille käyttäytymismalleja, jotka vastaavat suoraan tutkimuksen työnkulkuja.

Taulukko, jossa vertaillaan GPT-5:n tutkimusagentin arvoja OAI-, Anthropic- ja Google-malleihin tarkkuuden, täsmällisyyden, rakenteen ja viiveen suhteen.

Kuluttajan osuus instituutioiden maailmassa

Consensus lähestyi markkinoita alusta alkaen eri tavalla odotusten vastaisesti. Sen sijaan, että tiimi olisi myynyt laitosten kautta, se keskittyi itse tutkimuksen tekijöihin: opiskelijoihin, tiedekuntaan ja kliinikoihin, jotka tarvitsivat vastauksia nopeasti. Tuo lähestymistapa eli keskittyminen suoraan tutkijoihin muovasi sekä tuotteen suunnittelua että sen nopeaa kasvua.

“Yleisesti ajatellaan, että akateemisesta maailmasta ei voi mennä suoraan kuluttajille, mutta tekoäly on muuttanut sen“, Salem sanoo. “Ihmiset eivät enää odota hyväksyntää vaan käyttävät sitä, mikä toimii.“

Tuo päätös muovasi tuotteen sävyä ja kasvukäyrää. Consensus vaikuttaa enemmän modernilta kuluttajasovellukselta kuin perinteiseltä akateemiselta työkalulta: nopea käyttöönotto, intuitiivinen design ja keskusteleva käyttöliittymä. Käyttöönotto levisi puskaradion kautta kampuksilla ja laboratorioissa.

Jatko-opiskelijat ja tohtorikoulutettavat olivat ensimmäisiä tehokäyttäjiä, ja heidän jälkeensä tulivat tiedekunnan jäsenet ja yksityiset tutkijat. Sitten tulivat kliinikot, jotka alkoivat käyttää Consensusta tuomaan esiin uusimpia näyttöjä omilta aloiltaan. 

“Meillä ei ollut aikomusta rakentaa lääkäreille“, Salem sanoo. “He kuitenkin tarvitsevat samaa kuin tutkijat: luotettavan näytön käyttöönsä nopeasti.“

Yritys allekirjoitti hiljattain sopimuksen Mayo Clinicin lääketieteellisen kirjaston kanssa ja julkisti juuri Medical Mode -ominaisuuden, joka on suunniteltu kliinistä näyttöä etsiville tutkijoille.

Skaalautuvuutta tieteen avulla

Viimeisen vuoden aikana Consensus on laajentunut nopeasti, ja sitä käyttää yli 8 miljoonaa tutkijaa maailmanlaajuisesti. Sen tulot ovat kasvaneet kahdeksankertaisiksi.

Tuollainen kasvu ei ole muuttanut tuotteen prioriteetteja. Jokainen ominaisuus toimii edelleen todennettavien, vähähallusinaatioisten vastausten perusteella. Tiimi on investoinut voimakkaasti arviointeihin, joilla testataan tarkkuutta, viittausten jäljitettävyyttä ja tyylillistä yhdenmukaisuutta eri agenttien välillä.

Consensuksen arkkitehtuuri on tarkoituksella modulaarinen ja suunniteltu siten, että uusia agentteja voidaan lisätä mallien laajentuessa ja parantuessa, eli agentteja, jotka toistavat kokeita, tuottavat lukuja tai suorittavat tilastollisia analyysejä.

“Rakennamme avustavia tutkijoita, joita todella tarvitaan nopeasti muuttuvassa maailmassa“, Salem sanoo. “Mallit kehittyvät jatkuvasti ja järjestelmä kasvaa niiden mukana, mutta tiede kehittyy nopeammin.“

OpenAI <3 startup-yritykset. Rakenna yhdessä kanssamme.