स्किप करके मेन कंटेंट पर जाऍं
OpenAI

23 अक्टूबर 2025

Consensus, GPT‑5 और Responses API का इस्तेमाल करके हफ़्तों लगने वाली रिसर्च को मिनटों में पूरा कर देता है

GPT‑5 और Responses API का इस्तेमाल करते हुए, Consensus ने एक मल्टी-एजेंट सिस्टम तैयार किया है जो रिसर्चर्स की तरह सबूतों को प्लैन करता है, पढ़ता है और उन्हें एनालाइज़ करके उनका सार तैयार करता है.

नीले और हरे रंग के अलग-अलग शेड्स में वर्टिकल टेक्सचर वाले पैनल्स के साथ गहरे टील रंग के बैकग्राउंड के बीचों-बीच सफ़ेद रंग में Consensus का लोगो.
लोड किया जा रहा है...

हर साल लाखों नए साइंटिफ़िक पेपर्सर पब्लिश होते हैं—इतने ज़्यादा कि कोई एक व्यक्ति उन सबको नहीं पढ़ सकता. 

साइंटिस्ट के लिए चुनौती नॉलेज को एक्सेस कर पाने की नहीं, बल्कि उसे खोजने, समझने, और आपस में जोड़ने के मुश्किल काम की है. नई खोजें हमेशा वहीं होती हैं जहां पहले से पता होने वाले ज्ञान की सीमाएं खत्म होती हैं, लेकिन रिसर्चर्स अपना ज़्यादातर समय उन सीमाओं को आगे बढ़ाने के बजाय उन्हीं को ढूंढने में बिता देते हैं.

8 मिलियन से ज़्यादा लोगों द्वारा इस्तेमाल किया जाने वाला एक रिसर्च असिस्टेंट, Consensus(एक नई विंडो में खुलेगा), इसे बदलने के लिए ही बनाया गया था. Christian Salem और Eric Olson द्वारा बनाया गया ये प्लैटफ़ॉर्म 220 मिलियन से ज़्यादा पेपर्स में पीयर-रिव्यू किए गए साहित्य को खोजता, पढ़ता और उनका सार प्रस्तुत करता है. इसकी सबसे नई कैपेबिलिटी, स्कॉलर एजेंट, GPT‑5 और Responses API पर बनाया गया एक मल्टी-एजेंट सिस्टम है. ये दर्शाता है कि रिसर्चर्स वाकई में कैसे काम करते हैं, और उन्हें सवाल से नतीजे तक पहुंचने में हफ़्तों के बजाय मिनटों में पहुंचने में मदद करता है.

लेकिन लक्ष्य सिर्फ़ तेज़ रिसर्च नहीं है—बल्कि खोज तक पहुंचने का रास्ता तेज़ बनाना है. Salem कहते हैं, "विज्ञान तभी आगे बढ़ता है जब उसे सब तक पहुंचाया जाए." "हमारा काम हर जगह रिसर्चर्स को सबूत खोजने, उन पर भरोसा करने और उनके आधार पर काम करने की क्षमता देना है."

सर्च इंजन से एजेंटिक असिस्टेंट तक

Consensus का पहला वर्ज़न विज्ञान के लिए एक वर्टिकल सर्च इंजन की तरह काम करता था: ये अकादमिक पेपर्स को इंडेक्स करता था, सही रिज़ल्ट्स निकालता था, और साइटेशन्स पर आधारित समरी जेनरेट करता था. लेकिन सिर्फ़ सर्च ही काफ़ी नहीं थी. 

Salem कहते हैं, "रिसर्च का मतलब सिर्फ़ पेपर्स खोजना नहीं है." “ये रिज़ट्स को समझन, उनकी तुलना करना, और आईडिया को कनेक्ट करना है. जितना ज़्यादा समय साइंटिस्ट सही स्टडी के लिए पुराने नॉलेज को खोजने, पढ़ने, और समझने में लगाते हैं, उतना ही कम समय उनके पास नई खोजें करने और असली रिसर्च में लगाने के लिए बचता है.

इसलिए टीम ने Consensus को एक नए कॉन्सेप्ट के आधार पर दोबारा तैयार करना शुरू किया: एक मल्टी-एजेंट सिस्टम, जिसे “स्कॉलर एजेंट” कहा जाता है, जो बिल्कुल एक ह्यूमन रिसर्चर की तरह काम करता है.

GPT‑5 और Responses API पर निर्मित, ये सिस्टम अब एजेंट्स कई एजेंट्स के जुड़े हुए वर्कफ़्लो पर रन करता है:

  • प्लैनिंग एजेंट यूज़र के सवाल को एनालाइज़ करता है और फ़ैसला लेता है कि आगे क्या एक्शन लिए जाएं
  • सर्च एजेंट, Consensus के पेपर इंडेक्स, एक यूज़र की प्राइवेट लाइब्रेरी, और साइटेशन ग्राफ़ को खंगालता है
  • रीडिंग एजेंट एक-एक करके या बैचों में पेपर्स को पढ़कर उन्हें एनालाइज़ करता है
  • एनैलिसिस एजेंट रिज़ल्ट्स को एनैलाइज़ करता है, स्ट्रक्चर और विज़ुअल्स तय करता है, और फ़ाइनल आउटपुट तैयार करता है

हरेक एजेंट का दायरा बहुत छोटा होता है, जिससे रीज़निंग सटीक रहती है और गलत जानकारी (हैलुसिनेशन) कम होती है. ये आर्किटेक्चर से Consensus ये फ़ैसला ले सकता है कि कब जवाब दिया जाए; अगर कोई सही स्टडी उसकी क्वालिटी स्टैंडर्ड पर खरा नहीं उतरती, तो असिस्टेंट बस इतना ही कह देता है.

Salem कहते हैं, "एजेंट्स के बीच वर्कफ़्लो को बांटने से, हम एरर कम कर सकते हैं और सिस्टम को बहुत ज़्यादा व्यवस्थित बना सकते हैं." "किसी भी एजेंट पर हद से ज़्यादा जिम्मेदारी नहीं होती, जो भरोसे के लिए अहम साबित होती है."

एजेंट फ़्लो डायग्राम ये दिखाता है कि रिसर्च-बेस्ड आउटपुट जेनरेट करने के लिए यूज़र्स क्वेरी को प्लैनिंग, पैरेलल सर्च, रीडिंग, और एनैलिसिस एजेंट्स के ज़रिये कैसे प्रोसेस किया जाता है.

इस अप्रोच को टीम कॉन्टेक्स्ट इंजीनियरिंग कहती है: प्रोडक्शन शुरू होने से पहले सही सबूत जमा करना. हरेक जवाब के साथ एक "रिसर्च कॉन्टेक्स्ट पैक” आता है जिसमें पेपर्स, मेटाडेटा, और अहम नतीजे शामिल होते हैं जो ओरिजिनल स्टडीज़ से जुड़े होते हैं.

Salem कहते हैं, "हम नहीं चाहते कि रिसर्चर्स हर क्लेम की दोबारा जांच करने में अपना समय बर्बाद करें." "अगर सिस्टम असली सबूत के आधार पर जवाब नहीं दे सकता, तो वो कोई जवाब खुद से नहीं बनाएगा."

Responses API की मदद से बनाना

Consensus ने अपने मल्टी-एजेंट रूटिंग को सपोर्ट करने के लिए चैट कम्पलीशन्स से Responses API पर माइग्रेट किया. इस बदलाव ने सिस्टम को भरोसेमंद और किफ़ायती बनाया, साथ ही टीम को सब-एजेंट कॉल्स पर बेहतर कंट्रोल दिया. GPT‑5 के लॉन्ग-कॉन्टेक्स्ट रीज़निंग और भरोसेमंद टूल-कॉलिंग के साथ, चॉइस क्लियर थी.

शुरूआती इवैल्यूएशन्स ने इस दांव को सही साबित किया: टूल-कॉलिंग एक्यूरेसी और प्लैनिंग की स्थिरता पर GPT‑5 ने GPT‑4.1, Sonnet 4 और Gemini 2.5 Pro से बेहतर परफ़ॉर्म किया. इससे Consensus टीम को प्रॉम्प्ट जिम्नास्टिक पर कम ध्यान देने और एजेंट बिहेवियर बनाने पर ज़्यादा फ़ोकस करने में मदद मिली, जो सीधे रिसर्च वर्कफ़्लो से मैच करता है.

एक्यूरेसी, प्रिसिशन, स्ट्रक्चर, और लेटेंसी के आधार पर OAI, Anthropic और Google मॉडल्स के GPT-5 रिसर्च एजेंट मीट्रिक्स की तुलना करने वाली टेबल.

इंस्टिट्यूशन्स की दुनिया में कंज़्युमर का एक दांव

शुरू से ही, Consensus ने मार्केट को उस तरह से नहीं देखा जैसा लोग उम्मीद कर रहे थे. इंस्टिट्यूशन्स को टार्गेट करने के बजाय, टीम ने उन लोगों पर फ़ोकस किया जो सीधे रिसर्च में लगे थे: स्टूडेंट्स, फ़ैकल्टी, और क्लिनिशियन्स जिन्हें तुरंत जवाब चाहिए थे. रिसर्चर्स पर सीधे फ़ोकस के कारण प्रोडक्ट की डिज़ाइन और इसकी तेज़ी से बढ़ती सफ़लता मुमकिन हुई.

Salem कहते हैं, "सब कहते थे कि अकादमिक दुनिया में सीधे कंज़्युमर तक पहुंचना मुमकिन नहीं, लेकिन AI ने इसे बदल दिया." “लोग अब अप्रूवल का इंतज़ार नहीं करते—वे वही इस्तेमाल करते हैं जो कारगर होता है.”

उस फ़ैसले ने तय किया कि प्रोडक्ट का लहज़ा कैसा होगा और इसकी बढ़ती सफ़लता की रफ़्तार कैसी होगी. Consensus एक पुराने अकादमिक टूल के मुकाबले एक मॉडर्न कंज़्युमर ऐप की तरह ज़्यादा लगता है: तेज़ ऑनबोर्डिंग, समझने में आसान डिज़ाइन, बातचीत जैसा इंटरफ़ेस. सारे कैंपस और लैब्स में मुंह-जुबानी चर्चा के ज़रिये इसे अपनाने की बात फ़ैल गई.

ग्रेजुएट स्टूडेंट्सर और PhD कैंडिडेट्स पहले पॉवर यूज़र्स बने, उसके बाद फ़ैकल्टी और प्राइवेट रिसर्चर्स आए. इसके बाद क्लिनिशियन्स आए, जिन्होंने अपनी फ़ील्ड्स में लेटेस्ट सबूत सामने लाने के लिए Consensus का इस्तेमाल करना शुरू किया. 

Salem कहते हैं, "हमने डॉक्टर्स के लिए बनाने का सोचा ही नहीं था." "लेकिन उन्हें भी वही चीज़ चाहिए जो रिसर्चर्स को चाहिए: भरोसेमंद सबूत के लिए तेज़ एक्सेस."

कंपनी ने हाल ही में Mayo Clinic की मेडिकल लाइब्रेरी पर साइन किए हैं और 'मेडिकल मोड' लॉन्च किया है, जो क्लिनिकल सबूत सर्च करने वाले चिकित्सकों के लिए डिज़ाइन किया गया एक नया फ़ीचर है.

विज्ञान के साथ आगे बढ़ना

पिछले साल, Consensus का तेज़ी से विस्तार हुआ है, और दुनिया भर में इसके रिसर्चर्स की संख्या 8 मिलियन से भी ज़्यादा हो गई है और रेवेन्यु में 8 गुना बढ़ोतरी हुई है.

इस बढ़ोतरी से प्रोडक्ट की प्रायोरिटीज़ नहीं बदली हैं. हरेक फ़ीचर अब भी उन्हीं जवाबों के चारों ओर डिज़ाइन किया गया है जो भरोसेमंद और गलतियां कम करते हैं. टीम ने इवैल्यूएशन पाइपलाइन्स में भारी निवेश किया है जो एजेंट्स में एक्यूरेसी, साइटेशन ट्रेसिएबिलिटी और स्टाइल की स्थिरता को परखती है.

Consensus का आर्किटेक्चर जानबूझकर मॉड्यूलर है, जिसे इस तरह से डिज़ाइन किया गया है कि जैसे-जैसे मॉडल एक्स्पैंड और बेहतर होता जाता है, नए एजेंट इसमें शामिल हो सकें—ऐसे एजेंट्स जो एक्सपेरिमेंट्स दोहराते हैं, आंकड़े तैयार करते हैं, या स्टैटिस्टिकल एनैलिसिस रन करते हैं.

Salem कहते हैं, "हम तेज़ी से बदलती दुनिया में रिसर्चर्स के लिए ज़रूरी असिस्टेंट बना रहे हैं." "मॉडल बेहतर होते जा रहे हैं, सिस्टम उनके साथ आगे बढ़ता जा रहा है, और विज्ञान भी तेज़ी से आगे बढ़ रहा है."

OpenAI <3 स्टार्टअप्स. हमारे साथ आकर निर्माण करो.