23 अक्टूबर 2025

Consensus, GPT‑5 और Responses API का इस्तेमाल करके हफ़्तों लगने वाली रिसर्च को मिनटों में पूरा कर देता है

GPT‑5 और Responses API का इस्तेमाल करते हुए, Consensus ने एक मल्टी-एजेंट सिस्टम तैयार किया है जो रिसर्चर्स की तरह सबूतों को प्लैन करता है, पढ़ता है और उन्हें एनालाइज़ करके उनका सार तैयार करता है.

नीले और हरे रंग के अलग-अलग शेड्स में वर्टिकल टेक्सचर वाले पैनल्स के साथ गहरे टील रंग के बैकग्राउंड के बीचों-बीच सफ़ेद रंग में Consensus का लोगो.

लोड किया जा रहा है...

हर साल लाखों नए साइंटिफ़िक पेपर्सर पब्लिश होते हैं—इतने ज़्यादा कि कोई एक व्यक्ति उन सबको नहीं पढ़ सकता.

साइंटिस्ट के लिए चुनौती नॉलेज को एक्सेस कर पाने की नहीं, बल्कि उसे खोजने, समझने, और आपस में जोड़ने के मुश्किल काम की है. नई खोजें हमेशा वहीं होती हैं जहां पहले से पता होने वाले ज्ञान की सीमाएं खत्म होती हैं, लेकिन रिसर्चर्स अपना ज़्यादातर समय उन सीमाओं को आगे बढ़ाने के बजाय उन्हीं को ढूंढने में बिता देते हैं.

8 मिलियन से ज़्यादा लोगों द्वारा इस्तेमाल किया जाने वाला एक रिसर्च असिस्टेंट, Consensus⁠(एक नई विंडो में खुलेगा), इसे बदलने के लिए ही बनाया गया था. Christian Salem और Eric Olson द्वारा बनाया गया ये प्लैटफ़ॉर्म 220 मिलियन से ज़्यादा पेपर्स में पीयर-रिव्यू किए गए साहित्य को खोजता, पढ़ता और उनका सार प्रस्तुत करता है. इसकी सबसे नई कैपेबिलिटी, स्कॉलर एजेंट, GPT‑5 और Responses API पर बनाया गया एक मल्टी-एजेंट सिस्टम है. ये दर्शाता है कि रिसर्चर्स वाकई में कैसे काम करते हैं, और उन्हें सवाल से नतीजे तक पहुंचने में हफ़्तों के बजाय मिनटों में पहुंचने में मदद करता है.

लेकिन लक्ष्य सिर्फ़ तेज़ रिसर्च नहीं है—बल्कि खोज तक पहुंचने का रास्ता तेज़ बनाना है. Salem कहते हैं, "विज्ञान तभी आगे बढ़ता है जब उसे सब तक पहुंचाया जाए." "हमारा काम हर जगह रिसर्चर्स को सबूत खोजने, उन पर भरोसा करने और उनके आधार पर काम करने की क्षमता देना है."

सर्च इंजन से एजेंटिक असिस्टेंट तक

Consensus का पहला वर्ज़न विज्ञान के लिए एक वर्टिकल सर्च इंजन की तरह काम करता था: ये अकादमिक पेपर्स को इंडेक्स करता था, सही रिज़ल्ट्स निकालता था, और साइटेशन्स पर आधारित समरी जेनरेट करता था. लेकिन सिर्फ़ सर्च ही काफ़ी नहीं थी.

Salem कहते हैं, "रिसर्च का मतलब सिर्फ़ पेपर्स खोजना नहीं है." “ये रिज़ट्स को समझन, उनकी तुलना करना, और आईडिया को कनेक्ट करना है. जितना ज़्यादा समय साइंटिस्ट सही स्टडी के लिए पुराने नॉलेज को खोजने, पढ़ने, और समझने में लगाते हैं, उतना ही कम समय उनके पास नई खोजें करने और असली रिसर्च में लगाने के लिए बचता है.

इसलिए टीम ने Consensus को एक नए कॉन्सेप्ट के आधार पर दोबारा तैयार करना शुरू किया: एक मल्टी-एजेंट सिस्टम, जिसे “स्कॉलर एजेंट” कहा जाता है, जो बिल्कुल एक ह्यूमन रिसर्चर की तरह काम करता है.

GPT‑5 और Responses API पर निर्मित, ये सिस्टम अब एजेंट्स कई एजेंट्स के जुड़े हुए वर्कफ़्लो पर रन करता है:

प्लैनिंग एजेंट यूज़र के सवाल को एनालाइज़ करता है और फ़ैसला लेता है कि आगे क्या एक्शन लिए जाएं
सर्च एजेंट, Consensus के पेपर इंडेक्स, एक यूज़र की प्राइवेट लाइब्रेरी, और साइटेशन ग्राफ़ को खंगालता है
रीडिंग एजेंट एक-एक करके या बैचों में पेपर्स को पढ़कर उन्हें एनालाइज़ करता है
एनैलिसिस एजेंट रिज़ल्ट्स को एनैलाइज़ करता है, स्ट्रक्चर और विज़ुअल्स तय करता है, और फ़ाइनल आउटपुट तैयार करता है

हरेक एजेंट का दायरा बहुत छोटा होता है, जिससे रीज़निंग सटीक रहती है और गलत जानकारी (हैलुसिनेशन) कम होती है. ये आर्किटेक्चर से Consensus ये फ़ैसला ले सकता है कि कब जवाब न दिया जाए; अगर कोई सही स्टडी उसकी क्वालिटी स्टैंडर्ड पर खरा नहीं उतरती, तो असिस्टेंट बस इतना ही कह देता है.

Salem कहते हैं, "एजेंट्स के बीच वर्कफ़्लो को बांटने से, हम एरर कम कर सकते हैं और सिस्टम को बहुत ज़्यादा व्यवस्थित बना सकते हैं." "किसी भी एजेंट पर हद से ज़्यादा जिम्मेदारी नहीं होती, जो भरोसे के लिए अहम साबित होती है."

एजेंट फ़्लो डायग्राम ये दिखाता है कि रिसर्च-बेस्ड आउटपुट जेनरेट करने के लिए यूज़र्स क्वेरी को प्लैनिंग, पैरेलल सर्च, रीडिंग, और एनैलिसिस एजेंट्स के ज़रिये कैसे प्रोसेस किया जाता है.

इस अप्रोच को टीम कॉन्टेक्स्ट इंजीनियरिंग कहती है: प्रोडक्शन शुरू होने से पहले सही सबूत जमा करना. हरेक जवाब के साथ एक "रिसर्च कॉन्टेक्स्ट पैक” आता है जिसमें पेपर्स, मेटाडेटा, और अहम नतीजे शामिल होते हैं जो ओरिजिनल स्टडीज़ से जुड़े होते हैं.

Salem कहते हैं, "हम नहीं चाहते कि रिसर्चर्स हर क्लेम की दोबारा जांच करने में अपना समय बर्बाद करें." "अगर सिस्टम असली सबूत के आधार पर जवाब नहीं दे सकता, तो वो कोई जवाब खुद से नहीं बनाएगा."

Responses API की मदद से बनाना

Consensus ने अपने मल्टी-एजेंट रूटिंग को सपोर्ट करने के लिए चैट कम्पलीशन्स से Responses API पर माइग्रेट किया. इस बदलाव ने सिस्टम को भरोसेमंद और किफ़ायती बनाया, साथ ही टीम को सब-एजेंट कॉल्स पर बेहतर कंट्रोल दिया. GPT‑5 के लॉन्ग-कॉन्टेक्स्ट रीज़निंग और भरोसेमंद टूल-कॉलिंग के साथ, चॉइस क्लियर थी.

शुरूआती इवैल्यूएशन्स ने इस दांव को सही साबित किया: टूल-कॉलिंग एक्यूरेसी और प्लैनिंग की स्थिरता पर GPT‑5 ने GPT‑4.1, Sonnet 4 और Gemini 2.5 Pro से बेहतर परफ़ॉर्म किया. इससे Consensus टीम को प्रॉम्प्ट जिम्नास्टिक पर कम ध्यान देने और एजेंट बिहेवियर बनाने पर ज़्यादा फ़ोकस करने में मदद मिली, जो सीधे रिसर्च वर्कफ़्लो से मैच करता है.

एक्यूरेसी, प्रिसिशन, स्ट्रक्चर, और लेटेंसी के आधार पर OAI, Anthropic और Google मॉडल्स के GPT-5 रिसर्च एजेंट मीट्रिक्स की तुलना करने वाली टेबल.

इंस्टिट्यूशन्स की दुनिया में कंज़्युमर का एक दांव

शुरू से ही, Consensus ने मार्केट को उस तरह से नहीं देखा जैसा लोग उम्मीद कर रहे थे. इंस्टिट्यूशन्स को टार्गेट करने के बजाय, टीम ने उन लोगों पर फ़ोकस किया जो सीधे रिसर्च में लगे थे: स्टूडेंट्स, फ़ैकल्टी, और क्लिनिशियन्स जिन्हें तुरंत जवाब चाहिए थे. रिसर्चर्स पर सीधे फ़ोकस के कारण प्रोडक्ट की डिज़ाइन और इसकी तेज़ी से बढ़ती सफ़लता मुमकिन हुई.

Salem कहते हैं, "सब कहते थे कि अकादमिक दुनिया में सीधे कंज़्युमर तक पहुंचना मुमकिन नहीं, लेकिन AI ने इसे बदल दिया." “लोग अब अप्रूवल का इंतज़ार नहीं करते—वे वही इस्तेमाल करते हैं जो कारगर होता है.”

उस फ़ैसले ने तय किया कि प्रोडक्ट का लहज़ा कैसा होगा और इसकी बढ़ती सफ़लता की रफ़्तार कैसी होगी. Consensus एक पुराने अकादमिक टूल के मुकाबले एक मॉडर्न कंज़्युमर ऐप की तरह ज़्यादा लगता है: तेज़ ऑनबोर्डिंग, समझने में आसान डिज़ाइन, बातचीत जैसा इंटरफ़ेस. सारे कैंपस और लैब्स में मुंह-जुबानी चर्चा के ज़रिये इसे अपनाने की बात फ़ैल गई.

ग्रेजुएट स्टूडेंट्सर और PhD कैंडिडेट्स पहले पॉवर यूज़र्स बने, उसके बाद फ़ैकल्टी और प्राइवेट रिसर्चर्स आए. इसके बाद क्लिनिशियन्स आए, जिन्होंने अपनी फ़ील्ड्स में लेटेस्ट सबूत सामने लाने के लिए Consensus का इस्तेमाल करना शुरू किया.

Salem कहते हैं, "हमने डॉक्टर्स के लिए बनाने का सोचा ही नहीं था." "लेकिन उन्हें भी वही चीज़ चाहिए जो रिसर्चर्स को चाहिए: भरोसेमंद सबूत के लिए तेज़ एक्सेस."

कंपनी ने हाल ही में Mayo Clinic की मेडिकल लाइब्रेरी पर साइन किए हैं और 'मेडिकल मोड' लॉन्च किया है, जो क्लिनिकल सबूत सर्च करने वाले चिकित्सकों के लिए डिज़ाइन किया गया एक नया फ़ीचर है.

विज्ञान के साथ आगे बढ़ना

पिछले साल, Consensus का तेज़ी से विस्तार हुआ है, और दुनिया भर में इसके रिसर्चर्स की संख्या 8 मिलियन से भी ज़्यादा हो गई है और रेवेन्यु में 8 गुना बढ़ोतरी हुई है.

इस बढ़ोतरी से प्रोडक्ट की प्रायोरिटीज़ नहीं बदली हैं. हरेक फ़ीचर अब भी उन्हीं जवाबों के चारों ओर डिज़ाइन किया गया है जो भरोसेमंद और गलतियां कम करते हैं. टीम ने इवैल्यूएशन पाइपलाइन्स में भारी निवेश किया है जो एजेंट्स में एक्यूरेसी, साइटेशन ट्रेसिएबिलिटी और स्टाइल की स्थिरता को परखती है.

Consensus का आर्किटेक्चर जानबूझकर मॉड्यूलर है, जिसे इस तरह से डिज़ाइन किया गया है कि जैसे-जैसे मॉडल एक्स्पैंड और बेहतर होता जाता है, नए एजेंट इसमें शामिल हो सकें—ऐसे एजेंट्स जो एक्सपेरिमेंट्स दोहराते हैं, आंकड़े तैयार करते हैं, या स्टैटिस्टिकल एनैलिसिस रन करते हैं.

Salem कहते हैं, "हम तेज़ी से बदलती दुनिया में रिसर्चर्स के लिए ज़रूरी असिस्टेंट बना रहे हैं." "मॉडल बेहतर होते जा रहे हैं, सिस्टम उनके साथ आगे बढ़ता जा रहा है, और विज्ञान भी तेज़ी से आगे बढ़ रहा है."

OpenAI <3 स्टार्टअप्स. हमारे साथ आकर निर्माण करो.

समुदाय में शामिल हों बनाना शुरू करें

पढ़ते रहें

How Deutsche Telekom is rewiring telecommunications with AI

10 जुलाई 2026

ChatGPT के साथ शुरू करें | OpenAI

OpenAI Academy10 जुलाई 2026

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 अब Microsoft 365 Copilot में पसंदीदा मॉडल है

प्रोडक्ट9 जुलाई 2026