Consensus, GPT‑5 और Responses API का इस्तेमाल करके हफ़्तों लगने वाली रिसर्च को मिनटों में पूरा कर देता है
GPT‑5 और Responses API का इस्तेमाल करते हुए, Consensus ने एक मल्टी-एजेंट सिस्टम तैयार किया है जो रिसर्चर्स की तरह सबूतों को प्लैन करता है, पढ़ता है और उन्हें एनालाइज़ करके उनका सार तैयार करता है.

हर साल लाखों नए साइंटिफ़िक पेपर्सर पब्लिश होते हैं—इतने ज़्यादा कि कोई एक व्यक्ति उन सबको नहीं पढ़ सकता.
साइंटिस्ट के लिए चुनौती नॉलेज को एक्सेस कर पाने की नहीं, बल्कि उसे खोजने, समझने, और आपस में जोड़ने के मुश्किल काम की है. नई खोजें हमेशा वहीं होती हैं जहां पहले से पता होने वाले ज्ञान की सीमाएं खत्म होती हैं, लेकिन रिसर्चर्स अपना ज़्यादातर समय उन सीमाओं को आगे बढ़ाने के बजाय उन्हीं को ढूंढने में बिता देते हैं.
8 मिलियन से ज़्यादा लोगों द्वारा इस्तेमाल किया जाने वाला एक रिसर्च असिस्टेंट, Consensus(एक नई विंडो में खुलेगा), इसे बदलने के लिए ही बनाया गया था. Christian Salem और Eric Olson द्वारा बनाया गया ये प्लैटफ़ॉर्म 220 मिलियन से ज़्यादा पेपर्स में पीयर-रिव्यू किए गए साहित्य को खोजता, पढ़ता और उनका सार प्रस्तुत करता है. इसकी सबसे नई कैपेबिलिटी, स्कॉलर एजेंट, GPT‑5 और Responses API पर बनाया गया एक मल्टी-एजेंट सिस्टम है. ये दर्शाता है कि रिसर्चर्स वाकई में कैसे काम करते हैं, और उन्हें सवाल से नतीजे तक पहुंचने में हफ़्तों के बजाय मिनटों में पहुंचने में मदद करता है.
लेकिन लक्ष्य सिर्फ़ तेज़ रिसर्च नहीं है—बल्कि खोज तक पहुंचने का रास्ता तेज़ बनाना है. Salem कहते हैं, "विज्ञान तभी आगे बढ़ता है जब उसे सब तक पहुंचाया जाए." "हमारा काम हर जगह रिसर्चर्स को सबूत खोजने, उन पर भरोसा करने और उनके आधार पर काम करने की क्षमता देना है."
Consensus का पहला वर्ज़न विज्ञान के लिए एक वर्टिकल सर्च इंजन की तरह काम करता था: ये अकादमिक पेपर्स को इंडेक्स करता था, सही रिज़ल्ट्स निकालता था, और साइटेशन्स पर आधारित समरी जेनरेट करता था. लेकिन सिर्फ़ सर्च ही काफ़ी नहीं थी.
Salem कहते हैं, "रिसर्च का मतलब सिर्फ़ पेपर्स खोजना नहीं है." “ये रिज़ट्स को समझन, उनकी तुलना करना, और आईडिया को कनेक्ट करना है. जितना ज़्यादा समय साइंटिस्ट सही स्टडी के लिए पुराने नॉलेज को खोजने, पढ़ने, और समझने में लगाते हैं, उतना ही कम समय उनके पास नई खोजें करने और असली रिसर्च में लगाने के लिए बचता है.
इसलिए टीम ने Consensus को एक नए कॉन्सेप्ट के आधार पर दोबारा तैयार करना शुरू किया: एक मल्टी-एजेंट सिस्टम, जिसे “स्कॉलर एजेंट” कहा जाता है, जो बिल्कुल एक ह्यूमन रिसर्चर की तरह काम करता है.
GPT‑5 और Responses API पर निर्मित, ये सिस्टम अब एजेंट्स कई एजेंट्स के जुड़े हुए वर्कफ़्लो पर रन करता है:
- प्लैनिंग एजेंट यूज़र के सवाल को एनालाइज़ करता है और फ़ैसला लेता है कि आगे क्या एक्शन लिए जाएं
- सर्च एजेंट, Consensus के पेपर इंडेक्स, एक यूज़र की प्राइवेट लाइब्रेरी, और साइटेशन ग्राफ़ को खंगालता है
- रीडिंग एजेंट एक-एक करके या बैचों में पेपर्स को पढ़कर उन्हें एनालाइज़ करता है
- एनैलिसिस एजेंट रिज़ल्ट्स को एनैलाइज़ करता है, स्ट्रक्चर और विज़ुअल्स तय करता है, और फ़ाइनल आउटपुट तैयार करता है
हरेक एजेंट का दायरा बहुत छोटा होता है, जिससे रीज़निंग सटीक रहती है और गलत जानकारी (हैलुसिनेशन) कम होती है. ये आर्किटेक्चर से Consensus ये फ़ैसला ले सकता है कि कब जवाब न दिया जाए; अगर कोई सही स्टडी उसकी क्वालिटी स्टैंडर्ड पर खरा नहीं उतरती, तो असिस्टेंट बस इतना ही कह देता है.
Salem कहते हैं, "एजेंट्स के बीच वर्कफ़्लो को बांटने से, हम एरर कम कर सकते हैं और सिस्टम को बहुत ज़्यादा व्यवस्थित बना सकते हैं." "किसी भी एजेंट पर हद से ज़्यादा जिम्मेदारी नहीं होती, जो भरोसे के लिए अहम साबित होती है."

इस अप्रोच को टीम कॉन्टेक्स्ट इंजीनियरिंग कहती है: प्रोडक्शन शुरू होने से पहले सही सबूत जमा करना. हरेक जवाब के साथ एक "रिसर्च कॉन्टेक्स्ट पैक” आता है जिसमें पेपर्स, मेटाडेटा, और अहम नतीजे शामिल होते हैं जो ओरिजिनल स्टडीज़ से जुड़े होते हैं.
Salem कहते हैं, "हम नहीं चाहते कि रिसर्चर्स हर क्लेम की दोबारा जांच करने में अपना समय बर्बाद करें." "अगर सिस्टम असली सबूत के आधार पर जवाब नहीं दे सकता, तो वो कोई जवाब खुद से नहीं बनाएगा."
Consensus ने अपने मल्टी-एजेंट रूटिंग को सपोर्ट करने के लिए चैट कम्पलीशन्स से Responses API पर माइग्रेट किया. इस बदलाव ने सिस्टम को भरोसेमंद और किफ़ायती बनाया, साथ ही टीम को सब-एजेंट कॉल्स पर बेहतर कंट्रोल दिया. GPT‑5 के लॉन्ग-कॉन्टेक्स्ट रीज़निंग और भरोसेमंद टूल-कॉलिंग के साथ, चॉइस क्लियर थी.
शुरूआती इवैल्यूएशन्स ने इस दांव को सही साबित किया: टूल-कॉलिंग एक्यूरेसी और प्लैनिंग की स्थिरता पर GPT‑5 ने GPT‑4.1, Sonnet 4 और Gemini 2.5 Pro से बेहतर परफ़ॉर्म किया. इससे Consensus टीम को प्रॉम्प्ट जिम्नास्टिक पर कम ध्यान देने और एजेंट बिहेवियर बनाने पर ज़्यादा फ़ोकस करने में मदद मिली, जो सीधे रिसर्च वर्कफ़्लो से मैच करता है.

शुरू से ही, Consensus ने मार्केट को उस तरह से नहीं देखा जैसा लोग उम्मीद कर रहे थे. इंस्टिट्यूशन्स को टार्गेट करने के बजाय, टीम ने उन लोगों पर फ़ोकस किया जो सीधे रिसर्च में लगे थे: स्टूडेंट्स, फ़ैकल्टी, और क्लिनिशियन्स जिन्हें तुरंत जवाब चाहिए थे. रिसर्चर्स पर सीधे फ़ोकस के कारण प्रोडक्ट की डिज़ाइन और इसकी तेज़ी से बढ़ती सफ़लता मुमकिन हुई.
Salem कहते हैं, "सब कहते थे कि अकादमिक दुनिया में सीधे कंज़्युमर तक पहुंचना मुमकिन नहीं, लेकिन AI ने इसे बदल दिया." “लोग अब अप्रूवल का इंतज़ार नहीं करते—वे वही इस्तेमाल करते हैं जो कारगर होता है.”
उस फ़ैसले ने तय किया कि प्रोडक्ट का लहज़ा कैसा होगा और इसकी बढ़ती सफ़लता की रफ़्तार कैसी होगी. Consensus एक पुराने अकादमिक टूल के मुकाबले एक मॉडर्न कंज़्युमर ऐप की तरह ज़्यादा लगता है: तेज़ ऑनबोर्डिंग, समझने में आसान डिज़ाइन, बातचीत जैसा इंटरफ़ेस. सारे कैंपस और लैब्स में मुंह-जुबानी चर्चा के ज़रिये इसे अपनाने की बात फ़ैल गई.
ग्रेजुएट स्टूडेंट्सर और PhD कैंडिडेट्स पहले पॉवर यूज़र्स बने, उसके बाद फ़ैकल्टी और प्राइवेट रिसर्चर्स आए. इसके बाद क्लिनिशियन्स आए, जिन्होंने अपनी फ़ील्ड्स में लेटेस्ट सबूत सामने लाने के लिए Consensus का इस्तेमाल करना शुरू किया.
Salem कहते हैं, "हमने डॉक्टर्स के लिए बनाने का सोचा ही नहीं था." "लेकिन उन्हें भी वही चीज़ चाहिए जो रिसर्चर्स को चाहिए: भरोसेमंद सबूत के लिए तेज़ एक्सेस."
कंपनी ने हाल ही में Mayo Clinic की मेडिकल लाइब्रेरी पर साइन किए हैं और 'मेडिकल मोड' लॉन्च किया है, जो क्लिनिकल सबूत सर्च करने वाले चिकित्सकों के लिए डिज़ाइन किया गया एक नया फ़ीचर है.
पिछले साल, Consensus का तेज़ी से विस्तार हुआ है, और दुनिया भर में इसके रिसर्चर्स की संख्या 8 मिलियन से भी ज़्यादा हो गई है और रेवेन्यु में 8 गुना बढ़ोतरी हुई है.
इस बढ़ोतरी से प्रोडक्ट की प्रायोरिटीज़ नहीं बदली हैं. हरेक फ़ीचर अब भी उन्हीं जवाबों के चारों ओर डिज़ाइन किया गया है जो भरोसेमंद और गलतियां कम करते हैं. टीम ने इवैल्यूएशन पाइपलाइन्स में भारी निवेश किया है जो एजेंट्स में एक्यूरेसी, साइटेशन ट्रेसिएबिलिटी और स्टाइल की स्थिरता को परखती है.
Consensus का आर्किटेक्चर जानबूझकर मॉड्यूलर है, जिसे इस तरह से डिज़ाइन किया गया है कि जैसे-जैसे मॉडल एक्स्पैंड और बेहतर होता जाता है, नए एजेंट इसमें शामिल हो सकें—ऐसे एजेंट्स जो एक्सपेरिमेंट्स दोहराते हैं, आंकड़े तैयार करते हैं, या स्टैटिस्टिकल एनैलिसिस रन करते हैं.
Salem कहते हैं, "हम तेज़ी से बदलती दुनिया में रिसर्चर्स के लिए ज़रूरी असिस्टेंट बना रहे हैं." "मॉडल बेहतर होते जा रहे हैं, सिस्टम उनके साथ आगे बढ़ता जा रहा है, और विज्ञान भी तेज़ी से आगे बढ़ रहा है."


