23 ta’ Ottubru 2025

Consensus juża GPT‑5 u r-Responses API biex itemm ġimgħat ta’ riċerka f’minuti

Bl-użu ta’ GPT‑5 u r-Responses API, Consensus iddisinja sistema multi-aġent li tippjana, taqra u tissintetizza l-evidenza bħalma jagħmlu r-riċerkaturi.

Qed jillowdja…

Kull sena, jiġu ppubblikati miljuni ta’ karti xjentifiċi ġodda—ferm aktar milli jista’ jaqra persuna waħda.

Għax-xjenzati, l-isfida mhijiex l-aċċess għall-għarfien iżda l-kompitu kbir li jsibuh, jinterpretawh u jqabbdauh flimkien. L-iskoperti jseħħu fit-tarf ta’ dak li hu magħruf, iżda r-riċerkaturi jqattgħu l-biċċa l-kbira taż-żmien tagħhom sempliċement isibu dawk it-truf minflok jaqbżu lil hinn minnhom.

Consensus⁠(jinfetaħ f’tieqa ġdida), assistent tar-riċerka użat minn aktar minn 8 miljun persuna, inbena biex ibiddel dan. Imwaqqfa minn Christian Salem u Eric Olson, il-pjattaforma tfittex, taqra u tissintetizza letteratura riveduta minn pari fuq aktar minn 220 miljun karta. L-aktar kapaċità ġdida tagħha, Scholar Agent, hija sistema multi-aġent mibnija fuq GPT‑5 u r-Responses API. Tirrifletti kif fil-fatt jaħdmu r-riċerkaturi, u tgħinhom jaslu mill-mistoqsija għall-konklużjoni f’minuti minflok ġimgħat.

Iżda l-għan mhuwiex biss riċerka aktar mgħaġġla—huwa triq aktar mgħaġġla għall-iskoperta. “Ix-xjenza tavvanza meta tkun aktar aċċessibbli,” jgħid Salem. “Ix-xogħol tagħna hu li nagħtu lir-riċerkaturi kullimkien il-ħila li jsibu, jafdaw u jaġixxu fuq l-evidenza.”

Mill-magna tat-tiftix għal assistent aġentiku

L-ewwel verżjoni ta’ Consensus kienet taħdem bħal magna tat-tiftix vertikali għax-xjenza: kienet tindika karti akkademiċi, iġġib riżultati rilevanti u tiġġenera sommarji bbażati fuq ċitazzjonijiet. Iżda t-tiftix waħdu ma kienx biżżejjed.

“Ir-riċerka mhijiex biss li ssib karti,” jgħid Salem. “Hija li tinterpreta r-riżultati, tqabbel is-sejbiet u torbot l-ideat. Aktar ma x-xjenzati jqattgħu ħin ifittxu, jaqraw u jinterpretaw l-għarfien tal-passat għall-istudju t-tajjeb, inqas ikollhom ħin biex jiskopru u jagħmlu riċerka vera.”

Għalhekk it-tim beda jerġa’ jfassal l-arkitettura ta’ Consensus madwar kunċett ġdid: sistema multi-aġent imsejħa “Scholar Agent” li taħdem bħalma jaħdem riċerkatur uman.

Mibnija fuq GPT‑5 u r-Responses API, is-sistema issa tmexxi fluss tax-xogħol ikkoordinat ta’ aġenti:

Planning Agent jaqsam il-mistoqsija tal-utent u jiddeċiedi liema azzjonijiet għandu jieħu wara
Search Agent ifittex fl-indiċi tal-karti ta’ Consensus, fil-librerija privata ta’ utent, u fil-graff taċ-ċitazzjonijiet
Reading Agent jinterpreta karti individwalment jew f’lottijiet
Analysis Agent jissintetizza r-riżultati, jiddetermina l-istruttura u l-viżwali, u jikkomponi l-output finali

Kull aġent għandu ambitu limitat, li jżomm ir-raġunament preċiż u jimminimizza l-alluċinazzjonijiet. L-arkitettura tippermetti wkoll lil Consensus tiddeċiedi meta ma tweġibx; jekk l-ebda studju rilevanti ma jilħaq il-limitu ta’ kwalità tagħha, l-assistent sempliċement jgħid hekk.

“Billi naqsmu l-fluss tax-xogħol bejn l-aġenti, innaqqsu l-iżbalji u nagħmlu s-sistema ferm aktar dixxiplinata,” jgħid Salem. “L-ebda aġent wieħed ma għandu wisq responsabbiltà, u dan jirriżulta essenzjali għall-affidabbiltà.”

Dijagramma tal-fluss tal-aġent li turi kif mistoqsija tal-utent tiġi pproċessata permezz ta’ aġenti ta’ ppjanar, tfittxija parallela, qari u analiżi biex jinħoloq output ibbażat fuq ir-riċerka.

Dan l-approċċ huwa dak li t-tim isejjaħ context engineering: jiġbor l-evidenza t-tajba qabel ma tibda l-ġenerazzjoni. Kull tweġiba tiġi b’“pakkett ta’ kuntest tar-riċerka”—ġabra strutturata ta’ karti, metadata u sejbiet ewlenin li jistgħu jiġu rintraċċati lura għall-istudji oriġinali.

“Ma rridux li r-riċerkaturi jaħlu l-ħin jiċċekkjaw darbtejn kull stqarrija,” jgħid Salem. “Jekk is-sistema ma tistax tgħaqqad tweġiba ma’ evidenza reali, ma tivvintahiex.”

Bini bir-Responses API

Consensus emigra minn Chat Completions għar-Responses API biex jappoġġa r-routing multi-aġent tiegħu. Il-bidla tejbet kemm l-affidabbiltà kif ukoll l-effiċjenza fl-ispejjeż, u tat lit-tim kontroll aktar fin fuq is-sejħiet tas-sub-aġenti. Bil-kapaċità ta’ raġunament b’kuntest twil ta’ GPT‑5 u sejħiet affidabbli ta’ għodod, l-għażla kienet ċara.

Evalwazzjonijiet bikrija kkonfermaw l-imħatra: GPT‑5 qabeż lil GPT‑4.1, Sonnet 4 u Gemini 2.5 Pro fil-preċiżjoni tas-sejħiet tal-għodod u fl-istabbiltà tal-ippjanar. Dan ippermetta lit-tim ta’ Consensus jiffoka inqas fuq il-ginnastika tal-prompt u aktar fuq il-bini ta’ mġibiet tal-aġenti li jimmappjaw direttament mal-flussi tax-xogħol tar-riċerka.

Tabella li tqabbel il-metriċi tal-GPT-5 Research Agent għall-mudelli ta’ OAI, Anthropic u Google fil-preċiżjoni, l-eżattezza, l-istruttura u l-latenza.

Imħatra fuq il-konsumatur f’dinja ta’ istituzzjonijiet

Mill-bidu, Consensus avviċina s-suq b’mod differenti minn kif kien mistenni. Minflok ibigħ permezz ta’ istituzzjonijiet, it-tim iffoka fuq in-nies li fil-fatt jagħmlu r-riċerka: studenti, fakultà u kliniċisti li kellhom bżonn tweġibiet illum. Dak il-fokus dirett fuq ir-riċerkatur ifforma kemm id-disinn tal-prodott kif ukoll it-tkabbir rapidu tiegħu.

“Kulħadd qal li ma tistax tmur direct-to-consumer fl-akkademja, iżda l-IA biddlet dan,” jgħid Salem. “In-nies m’għadhomx jistennew l-approvazzjoni—jużaw dak li jaħdem.”

Dik id-deċiżjoni sawret it-ton tal-prodott u l-kurva tat-tkabbir tiegħu. Consensus iħossu aktar bħal app moderna għall-konsumatur milli għodda akkademika tradizzjonali: onboarding rapidu, disinn intuwittiv, interfaċċa konversazzjonali. L-adozzjoni nfirxet bil-fomm fuq il-kampusijiet u fil-laboratorji.

Studenti gradwati u kandidati għal PhD saru l-ewwel utenti intensivi, segwiti mill-fakultà u r-riċerkaturi privati. Imbagħad ġew il-kliniċisti, li bdew jużaw Consensus biex joħorġu l-aħħar evidenza fl-oqsma tagħhom.

“Ma bdejniex biex nibnu għat-tobba,” jgħid Salem. “Imma għandhom bżonn l-istess ħaġa li għandhom bżonn ir-riċerkaturi: aċċess rapidu għal evidenza affidabbli.”

Il-kumpanija reċentement iffirmat mal-librerija medika tal-Mayo Clinic u għadha kif nediet ‘Medical Mode,’ karatteristika ġdida mfassla għal prattikanti li qed ifittxu evidenza klinika.

Skalar max-xjenza

Fl-aħħar sena, Consensus espandiet malajr, kibret għal aktar minn 8 miljun riċerkatur madwar id-dinja u żiedet id-dħul bi 8 darbiet.

Dan it-tkabbir ma biddilx il-prijoritajiet tal-prodott. Kull karatteristika għadha ddur madwar tweġibiet verifikabbli b’alluċinazzjoni baxxa. It-tim investa ħafna f’pipelines ta’ evalwazzjoni li jittestjaw il-preċiżjoni, it-traċċabbiltà taċ-ċitazzjonijiet u l-konsistenza stilistika bejn l-aġenti.

L-arkitettura ta’ Consensus hija intenzjonalment modulari, iddisinjata biex aġenti ġodda jkunu jistgħu jidħlu hekk kif il-mudelli jespandu u jtejbu ruħhom—aġenti li jirreplikaw esperimenti, jiġġeneraw figuri jew imexxu analiżijiet statistiċi.

“Qed nibnu l-assistent li r-riċerkaturi verament jeħtieġu f’dinja li qed tinbidel malajr,” jgħid Salem. “Il-mudelli jkomplu jitjiebu, is-sistema tikber magħhom, u x-xjenza timxi aktar malajr.”