लाइफ साइंसेज़ रिसर्च के लिए GPT‑Rosalind पेश किया जा रहा है
वैज्ञानिक रिसर्च और ड्रग डिस्कवरी को तेज़ करने के लिए बनाया गया एक नया purpose-built मॉडल.
आज हम GPT‑Rosalind पेश कर रहे हैं, जो हमारा फ्रंटियर रीजनिंग मॉडल है, जिसे बायोलॉजी, ड्रग डिस्कवरी और ट्रांसलेशनल मेडिसिन में रिसर्च को सपोर्ट करने के लिए बनाया गया है. लाइफ साइंसेज़ मॉडल सीरीज़ को वैज्ञानिक वर्कफ़्लोज़ के लिए ऑप्टिमाइज़ किया गया है, जो बेहतर टूल उपयोग को केमिस्ट्री, प्रोटीन इंजीनियरिंग और जीनोमिक्स की गहरी समझ के साथ जोड़ता है.
औसतन, संयुक्त राज्य में किसी नई दवा के लिए टार्गेट डिस्कवरी से रेगुलेटरी अप्रूवल तक पहुँचने में लगभग 10 से 15 साल लगते हैं. डिस्कवरी के शुरुआती चरणों में हुई प्रगति आगे चलकर बेहतर टार्गेट चयन, मजबूत बायोलॉजिकल हाइपोथेसिस और उच्च-गुणवत्ता वाले प्रयोगों में कई गुना बढ़कर असर दिखाती है. लाइफ साइंसेज़ में प्रगति केवल मूल विज्ञान की कठिनाई से ही नहीं, बल्कि रिसर्च वर्कफ़्लोज़ की जटिलता से भी सीमित होती है. नए विचारों को विकसित और मूल्यांकन करने के लिए वैज्ञानिकों को बड़ी मात्रा में साहित्य, विशेष डेटाबेस, प्रयोगात्मक डेटा और विकसित होती हाइपोथेसिस के साथ काम करना पड़ता है. ये वर्कफ़्लोज़ अक्सर समय लेने वाले, बिखरे हुए और स्केल करना कठिन होते हैं.
हमारा मानना है कि एडवांस्ड AI सिस्टम्स शोधकर्ताओं को इन वर्कफ़्लोज़ के माध्यम से तेज़ी से आगे बढ़ने में मदद कर सकते हैं — न केवल मौजूदा काम को अधिक कुशल बनाकर, बल्कि वैज्ञानिकों को अधिक संभावनाओं की खोज करने, छूट जाने वाले कनेक्शन्स को सामने लाने और बेहतर हाइपोथेसिस तक जल्दी पहुँचने में मदद करके. एविडेंस सिंथेसिस, हाइपोथेसिस जनरेशन, एक्सपेरिमेंटल प्लानिंग और अन्य मल्टी-स्टेप रिसर्च टास्क्स को सपोर्ट करके, यह मॉडल शोधकर्ताओं को डिस्कवरी के शुरुआती चरणों को तेज़ करने में मदद करने के लिए बनाया गया है. समय के साथ, ये सिस्टम्स लाइफ साइंसेज़ संगठनों को ऐसे ब्रेकथ्रू खोजने में मदद कर सकते हैं जो अन्यथा संभव नहीं होते, और वह भी कहीं अधिक सफलता दर के साथ.
GPT‑Rosalind अब ChatGPT, Codex और API में एक रिसर्च प्रीव्यू के रूप में हमारे ट्रस्टेड एक्सेस प्रोग्राम के जरिए योग्य ग्राहकों के लिए उपलब्ध है. हम Codex के लिए एक फ्रीली एक्सेसिबल लाइफ साइंसेज़ रिसर्च प्लगइन भी पेश कर रहे हैं, जो वैज्ञानिकों को मॉडलों को 50 से अधिक वैज्ञानिक टूल्स और डेटा सोर्सेज से कनेक्ट करने में मदद करता है. हम Amgen, Moderna, Allen Institute, Thermo Fisher Scientific और अन्य ग्राहकों के साथ मिलकर GPT‑Rosalind को उन वर्कफ़्लोज़ में अप्लाई कर रहे हैं जो रिसर्च और डिस्कवरी को तेज़ करते हैं.
इस मॉडल का नाम Rosalind Franklin के नाम पर रखा गया है, जिनकी कठोर रिसर्च ने DNA की संरचना को उजागर करने में मदद की और आधुनिक मॉलेक्युलर बायोलॉजी की नींव रखी.
रॉ डेटा से ठोस डिस्कवरी निर्णयों तक, देखें कि हमारा purpose-built मॉडल रिसर्च वर्कफ़्लोज़ को कैसे तेज़ करता है.
GPT‑Rosalind लाइफ साइंसेज़ मॉडल सीरीज़ को प्रकाशित साक्ष्यों, डेटा, टूल्स और प्रयोगों के साथ आधुनिक वैज्ञानिक कार्य के लिए बनाया गया है. हमारे इवैल्यूएशन्स में, यह उन कार्यों में सबसे बेहतर परफॉर्मेंस देता है जिनमें अणुओं, प्रोटीन, जीन, पाथवे और रोग-संबंधित बायोलॉजी पर रीजनिंग की जरूरत होती है, और यह लिटरेचर रिव्यू, सीक्वेंस-टू-फंक्शन इंटरप्रिटेशन, एक्सपेरिमेंटल प्लानिंग और डेटा एनालिसिस जैसे मल्टी-स्टेप वर्कफ़्लोज़ में वैज्ञानिक टूल्स और डेटाबेस का अधिक प्रभावी उपयोग करता है.
यह GPT‑Rosalind लाइफ साइंसेज़ मॉडल सीरीज़ का पहला रिलीज़ है, और हम लंबे समय तक चलने वाले और टूल-हेवी वैज्ञानिक वर्कफ़्लोज़ में मॉडल की बायोकेमिकल रीजनिंग क्षमताओं की सीमाओं को आगे बढ़ाते रहेंगे. OpenAI का कंप्यूट इंफ्रास्ट्रक्चर हमें वास्तविक वैज्ञानिक कार्यों के आधार पर लगातार ट्रेनिंग, इवैल्यूएटिंग और अधिक सक्षम डोमेन मॉडलों को इम्प्रूव करने की क्षमता देता है—जिससे ये सिस्टम्स वर्कफ़्लोज़ के अधिक जटिल होने के साथ और उपयोगी बनते जाते हैं.
एविडेंस-आधारित डिस्कवरी इनसाइट्स से हाई-इम्पैक्ट एक्सपेरिमेंट्स तक, देखें कि हमारे सॉल्यूशंस का सूट आपके रिसर्च वर्कफ़्लोज़ में मापने योग्य सुधार कैसे लाता है.
हम अग्रणी फार्मास्यूटिकल, बायोटेक्नोलॉजी और रिसर्च ग्राहकों के साथ-साथ लाइफ साइंसेज़ टेक्नोलॉजी संगठनों के साथ काम कर रहे हैं, ताकि GPT‑Rosalind को उन वर्कफ़्लोज़ में लागू किया जा सके जो डिस्कवरी को आगे बढ़ाते हैं.
“लाइफ साइंसेज़ क्षेत्र हर चरण में सटीकता की मांग करता है. सवाल बहुत जटिल होते हैं, डेटा बेहद अनोखा होता है, और दांव बहुत बड़े होते हैं. OpenAI के साथ हमारी अनूठी सहयोग हमें उनकी सबसे उन्नत क्षमताओं और टूल्स को नए और इनोवेटिव तरीकों से लागू करने में सक्षम बनाती है, जिससे मरीजों तक दवाएं पहुंचाने की गति तेज़ हो सकती है.”
हमने GPT‑Rosalind का मूल्यांकन वैज्ञानिक खोज और इंडस्ट्री रिसर्च के लिए जरूरी कई क्षमताओं पर किया. ये मूल्यांकन वैज्ञानिक उप-क्षेत्रों में कोर रीजनिंग को मापते हैं, जिनमें केमिकल रिएक्शन मैकेनिज़्म, प्रोटीन स्ट्रक्चर, म्यूटेशन इफेक्ट्स और इंटरैक्शन्स, और DNA सीक्वेंस का फायलोजेनेटिक इंटरप्रिटेशन शामिल है. ये यह भी आकलन करते हैं कि क्या मॉडल वास्तविक रिसर्च वर्कफ़्लोज़ को सपोर्ट कर सकते हैं — एक्सपेरिमेंटल आउटपुट्स की व्याख्या करके, विशेषज्ञ-प्रासंगिक पैटर्न पहचानकर और बाहरी जानकारी को सिंथेसाइज़ करके फॉलो-अप एक्सपेरिमेंट्स डिजाइन करने में. अंत में, ये यह जांचते हैं कि क्या मॉडल सही कंप्यूटेशनल टूल्स, डेटाबेस और डोमेन-विशिष्ट क्षमताओं का चयन और उपयोग करके अपनी रीजनिंग को बेहतर बना सकते हैं. कुल मिलाकर, ये मूल्यांकन वैज्ञानिक रिसर्च की एंड-टू-एंड प्रक्रिया में प्रगति दिखाते हैं और यह संकेत देते हैं कि यह मॉडल शोधकर्ताओं को चुनौतीपूर्ण डिस्कवरी टास्क्स को बेहतर तरीके से पूरा करने में अधिक सक्षम है.
हमने GPT‑Rosalind का मूल्यांकन कई पब्लिक बेंचमार्क्स पर किया. BixBench पर, जो रियल-वर्ल्ड बायोइन्फॉर्मेटिक्स और डेटा एनालिसिस पर आधारित एक बेंचमार्क है, GPT‑Rosalind ने पब्लिश्ड स्कोर्स वाले मॉडलों में अग्रणी परफॉर्मेंस हासिल की.
LABBench2 पर, जो लिटरेचर रिट्रीवल, डेटाबेस एक्सेस, सीक्वेंस मैनिपुलेशन और प्रोटोकॉल डिज़ाइन जैसे विभिन्न रिसर्च टास्क्स पर परफॉर्मेंस मापता है, GPT‑Rosalind ने 11 में से 6 टास्क्स में GPT‑5.4 से बेहतर प्रदर्शन किया. सबसे उल्लेखनीय सुधार CloningQA में देखा गया, जिसमें मॉलिक्युलर क्लोनिंग प्रोटोकॉल्स के लिए DNA और एंज़ाइम रिएजेंट्स का एंड-टू-एंड डिज़ाइन करना होता है.
हमने Dyno Therapeutics, जो AI-डिज़ाइन किए गए जीन थेरेपी में अग्रणी कंपनी है, के साथ मिलकर इस मॉडल का मूल्यांकन RNA सीक्वेंस-टू-फंक्शन प्रिडिक्शन और जनरेशन टास्क पर किया, जिसमें अप्रकाशित और बिना दूषित सीक्वेंस का उपयोग किया गया. परफॉर्मेंस की तुलना AI-बायो क्षेत्र के मानव विशेषज्ञों के 57 ऐतिहासिक स्कोर्स से की गई. Codex ऐप में सीधे मूल्यांकन करने पर, best-of-ten मॉडल सबमिशन्स प्रिडिक्शन टास्क में मानव विशेषज्ञों के 95वें पर्सेंटाइल से ऊपर और सीक्वेंस जनरेशन टास्क में लगभग 84वें पर्सेंटाइल के आसपास रहे.
ये मूल्यांकन उन वर्कफ़्लोज़ पर परफॉर्मेंस का एक महत्वपूर्ण संकेत देते हैं जिन पर वैज्ञानिक रोज़ाना साक्ष्य तैयार करने, जटिल डेटा का विश्लेषण करने और भरोसेमंद जैविक निष्कर्षों तक पहुँचने के लिए निर्भर रहते हैं.
वैज्ञानिक Codex के लिए हमारे नए Life Sciences रिसर्च प्लगइन(एक नई विंडो में खुलेगा) का उपयोग कर सकते हैं, जो आज GitHub पर उपलब्ध है. इस पैकेज में अधिकांश सामान्य रिसर्च वर्कफ़्लोज़ के लिए मॉड्यूलर स्किल्स का एक व्यापक सेट शामिल है, जिसे उपयोगकर्ताओं को ह्यूमन जेनेटिक्स, फंक्शनल जीनोमिक्स, प्रोटीन स्ट्रक्चर, बायोकेमिस्ट्री, क्लिनिकल एविडेंस और पब्लिक स्टडी डिस्कवरी में काम करने में मदद करने के लिए डिज़ाइन किया गया है.

ये स्किल्स एक ऑर्केस्ट्रेशन लेयर की तरह काम करती हैं, जो वैज्ञानिकों को व्यापक, अस्पष्ट और मल्टी-स्टेप प्रश्नों पर अधिक प्रभावी ढंग से काम करने में मदद करती हैं. ये 50 से अधिक पब्लिक मल्टी-ओमिक्स डेटाबेस, लिटरेचर सोर्सेज और बायोलॉजी टूल्स तक एक्सेस प्रदान करती हैं, और प्रोटीन स्ट्रक्चर लुकअप, सीक्वेंस सर्च, लिटरेचर रिव्यू और पब्लिक डेटासेट डिस्कवरी जैसे सामान्य दोहराए जाने वाले वर्कफ़्लोज़ के लिए एक लचीला शुरुआती बिंदु देती हैं.
योग्य Enterprise यूज़र्स इस प्लगइन का उपयोग GPT‑Rosalind के साथ रिसर्च वर्कफ़्लोज़ में गहरी बायोलॉजिकल रीजनिंग के लिए कर सकते हैं, जबकि सभी यूज़र्स इस प्लगइन पैकेज का उपयोग हमारे मेनलाइन मॉडलों के साथ कर सकते हैं.
हम इन क्षमताओं को उन वैज्ञानिकों और रिसर्च संगठनों तक उपलब्ध कराना चाहते हैं जो मानव स्वास्थ्य को आगे बढ़ाने की सबसे अच्छी स्थिति में हैं, साथ ही बायोलॉजिकल दुरुपयोग के खिलाफ मजबूत सुरक्षा उपाय बनाए रखते हुए. लाइफ साइंसेज़ मॉडल की शुरुआत यू.एस. में योग्य Enterprise ग्राहकों के लिए ट्रस्टेड-एक्सेस डिप्लॉयमेंट स्ट्रक्चर के माध्यम से की जा रही है, जिसमें पात्रता, एक्सेस मैनेजमेंट और संगठनात्मक गवर्नेंस पर नियंत्रण शामिल हैं. साथ ही, हम कनेक्टर्स के एक सेट और लाइफ साइंसेज़ रिसर्च प्लगइन को व्यापक रूप से उपलब्ध करा रहे हैं, ताकि शोधकर्ता हमारे मेनलाइन मॉडलों का उपयोग लाइफ साइंसेज़ रिसर्च टास्क्स के लिए अधिक प्रभावी तरीके से कर सकें.
लाइफ साइंसेज़ मॉडल को बेहतर एंटरप्राइज़-ग्रेड सिक्योरिटी कंट्रोल्स और मजबूत एक्सेस मैनेजमेंट के साथ विकसित किया गया है, जिससे नियंत्रित रिसर्च एनवायरनमेंट्स में प्रोफेशनल वैज्ञानिक उपयोग संभव हो सके. हम एक्सेस का मूल्यांकन तीन मुख्य सिद्धांतों के आधार पर करते हैं: लाभकारी उपयोग, मजबूत गवर्नेंस और सेफ्टी ओवरसाइट, और एंटरप्राइज़-ग्रेड सिक्योरिटी के साथ नियंत्रित एक्सेस. व्यवहार में, इसका मतलब है कि भाग लेने वाले संगठनों को स्पष्ट सार्वजनिक लाभ वाले वैध वैज्ञानिक रिसर्च करना चाहिए; उचित गवर्नेंस, कंप्लायंस और दुरुपयोग-रोकथाम नियंत्रण बनाए रखना चाहिए; और सुरक्षित, अच्छी तरह प्रबंधित एनवायरनमेंट्स में केवल स्वीकृत यूज़र्स तक एक्सेस सीमित रखना चाहिए. संगठनों को लाइफ साइंसेज़ रिसर्च प्रीव्यू की शर्तों से सहमत होना होगा और OpenAI की यूसेज पॉलिसीज़ का पालन करना होगा, और हम ऑनबोर्डिंग या निरंतर भागीदारी के हिस्से के रूप में अतिरिक्त जानकारी भी मांग सकते हैं.
संगठन हमारे क्वालिफिकेशन और सेफ्टी रिव्यू प्रोसेस के जरिए एक्सेस का अनुरोध कर सकते हैं.
रिसर्च प्रीव्यू के दौरान, इस मॉडल का उपयोग मौजूदा क्रेडिट्स या टोकन्स का उपयोग नहीं करेगा—दुरुपयोग सुरक्षा उपायों के अधीन. प्रोग्राम के विस्तार के साथ हम प्राइसिंग और उपलब्धता पर और जानकारी साझा करेंगे.
लाइफ साइंसेज़ मॉडल को इस तरह बनाया गया है कि वैज्ञानिक संगठन बेहतर गुणवत्ता का काम तेज़ी से कर सकें, ऐसे एनवायरनमेंट्स में जहां तकनीकी क्षमता और ऑपरेशनल कंट्रोल दोनों जरूरी होते हैं. हमारी समर्पित लाइफ साइंसेज़ टीम—साथ ही एडवाइजरी पार्टनर्स जैसे McKinsey & Company, Boston Consulting Group (BCG) और Bain & Company—संगठनों को हाई-इम्पैक्ट यूज़ केस पहचानने, मॉडल को एंटरप्राइज़ एनवायरनमेंट्स में इंटीग्रेट करने और मापने योग्य परिणाम हासिल करने में मदद करती है. अगर आप यह जानना चाहते हैं कि OpenAI Life Sciences आपके काम को कैसे सपोर्ट कर सकता है, तो आप हमारी लाइफ साइंसेज़ टीम से संपर्क कर सकते हैं.
यह हमारी लाइफ साइंसेज़ मॉडल सीरीज़ का पहला रिलीज़ है, और हम इसे ऐसे AI बनाने की लंबी अवधि की प्रतिबद्धता की शुरुआत के रूप में देखते हैं जो मानव स्वास्थ्य से लेकर व्यापक बायोलॉजिकल रिसर्च तक, समाज के लिए महत्वपूर्ण क्षेत्रों में वैज्ञानिक खोज को तेज़ कर सके. हम मॉडल की बायोलॉजिकल रीजनिंग को लगातार बेहतर बनाएंगे, टूल-हेवी और लॉन्ग-होराइजन रिसर्च वर्कफ़्लोज़ के लिए सपोर्ट बढ़ाएंगे, और वास्तविक प्रभाव का मूल्यांकन करने के लिए प्रमुख वैज्ञानिक संस्थानों के साथ मिलकर काम करेंगे. इसमें Los Alamos National Laboratory जैसे नेशनल लैबोरेटरीज़ के साथ जारी पार्टनरशिप शामिल है, जहां हम AI-गाइडेड प्रोटीन और कैटेलिस्ट डिज़ाइन पर काम कर रहे हैं, जिसमें AI सिस्टम्स की यह क्षमता भी शामिल है कि वे जैविक संरचनाओं को संशोधित करते हुए उनकी महत्वपूर्ण कार्यात्मक विशेषताओं को बनाए रखें या बेहतर बनाएं.
समय के साथ, हम उम्मीद करते हैं कि ये सिस्टम्स डिस्कवरी में और अधिक सक्षम पार्टनर बनेंगे—वैज्ञानिकों को सवाल से साक्ष्य तक, साक्ष्य से इनसाइट तक, और इनसाइट से मरीजों के लिए नए उपचार तक तेज़ी से पहुँचने में मदद करते हुए.


