बच्चों के दुर्लभ आनुवंशिक रोगों के निदान में चिकित्सकों की मदद के लिए AI
NEJM AI अध्ययन में, विशेषज्ञों ने 376 पहले अनसुलझे मामलों का पुनर्विश्लेषण कर 18 निदानों के सुराग सामने लाने के लिए OpenAI रीज़निंग मॉडल का उपयोग किया.
जीनोमिक सीक्वेंसिंग के बावजूद, दुर्लभ रोगों वाले कई लोगों को कभी स्पष्ट आनुवंशिक निदान नहीं मिल पाता. व्यापक परीक्षण और विशेषज्ञ समीक्षा के बाद भी लगभग आधे मामले अनिदानित रह जाते हैं. उनके चिकित्सीय डेटा में सुराग हो सकते हैं, लेकिन उन्हें खोजने के लिए हजारों से लाखों संभावित आनुवंशिक वैरिएंट, बिखरे हुए क्लिनिकल रिकॉर्ड और तेज़ी से बदलते वैज्ञानिक साहित्य को खंगालना पड़ सकता है.
जैसे-जैसे नए जीन-रोग संबंध, केस रिपोर्ट और वर्गीकरण साक्ष्य जमा होते हैं, अनसुलझे मामलों की नई व्याख्या संभव हो सकती है.
बोस्टन चिल्ड्रंस हॉस्पिटल के मेंटन सेंटर फॉर ऑर्फन डिज़ीज़ रिसर्च, हार्वर्ड यूनिवर्सिटी और OpenAI के शोधकर्ताओं ने पहले विश्लेषित लेकिन अनसुलझे रहे 376 मामलों की डी-आइडेंटिफाइड क्लिनिकल और जीनोमिक जानकारी का विश्लेषण करने के लिए OpenAI o3 डीप रिसर्च रीज़निंग मॉडल का उपयोग किया. मॉडल ने शोधकर्ताओं और चिकित्सकों की समीक्षा के लिए साक्ष्य से जुड़ी संभावित व्याख्याएं सामने रखीं. विशेषज्ञ समीक्षा, अतिरिक्त परीक्षण और क्लिनिकल पुष्टि के बाद, चिकित्सकों ने 18 मामलों में निदान स्थापित किए—विशेषज्ञों के पहले के विश्लेषण के बाद 4.8% की अतिरिक्त निदान यील्ड. यह अध्ययन 18 जून 2026 को NEJM AI में प्रकाशित हुआ था और दिखाता है कि सबसे कठिन मामलों में से कुछ पर दोबारा विचार करते समय AI-सहायता प्राप्त शोध वर्कफ़्लो विशेषज्ञों को सुराग पैदा करने में कैसे मदद कर सकता है.
इनमें से कई मामले वर्षों के विशेषज्ञ विश्लेषण के बावजूद अनसुलझे रहे थे. इस अध्ययन में, OpenAI o3 डीप रिसर्च ने शोधकर्ताओं को ऐसे सुराग पहचानने में मदद की जिनका बाद में स्थापित क्लिनिकल प्रक्रियाओं के माध्यम से आकलन किया गया, जिससे संकेत मिलता है कि विशेषज्ञ-नेतृत्व वाला आवधिक पुनर्विश्लेषण ज्ञान के विकसित होने के साथ अधिक स्केलेबल हो सकता है. मॉडल ने किसी रोगी का निदान नहीं किया और न ही कोई क्लिनिकल निर्णय लिया. इसने विशेषज्ञों की समीक्षा के लिए साक्ष्य-समर्थित परिकल्पनाएं तैयार कीं और जहां उचित था, अतिरिक्त परीक्षण के माध्यम से उनकी जांच करने तथा क्लिनिकल प्रयोगशाला में पुष्टि करने में मदद की.
अनिर्णायक आनुवंशिक परीक्षण हमेशा स्थायी निष्कर्ष नहीं होता. किसी रोगी के फीनोटाइप विवरण, परीक्षण परिणाम और पारिवारिक इतिहास अलग-अलग पहचानकर्ताओं, फ़ॉर्मैट और शब्दावलियों का उपयोग करने वाले डेटाबेस में बंटे हो सकते हैं. उन रिकॉर्डों को जोड़ना कठिन है, इसलिए विशेषज्ञ भी निदान चूक सकते हैं. विशेषज्ञ किसी बच्चे के जीनोम को उस समय भी सीक्वेंस कर सकते हैं जब संबंधित जीन या उसके वैरिएंट अभी रोग से जुड़े न पाए गए हों. वैज्ञानिक ज्ञान के आगे बढ़ने पर वही डेटा ऐसे उत्तर दिखा सकता है जिन्हें पहले खोजना असंभव था.
दुर्लभ-रोग पुनर्विश्लेषण वैज्ञानिक समस्या भी है और रखरखाव की समस्या भी. रोगी का जीनोम वही रह सकता है, लेकिन उसके आसपास का साक्ष्य बदलता रहता है: शोधकर्ता नए जीन और वैरिएंट को रोग से जोड़ते हैं, लैब पुराने वैरिएंट का पुनर्वर्गीकरण करती हैं, और केस डेटाबेस तथा शोधपत्रों में नए अवलोकन जुड़ते रहते हैं. हर अपडेट किसी पुराने अनिर्णायक मामले को फिर से देखने लायक बना सकता है, इसलिए कई संस्थानों के पास जीनोम का बढ़ता बैकलॉग होता है जिसे बदलते ज्ञान-आधार के साथ समन्वित रखना पड़ता है.
इस अध्ययन में, शोधकर्ताओं ने वर्कफ़्लो इस तरह बनाया कि मॉडल मौजूदा जीनोमिक पाइपलाइनों के ऊपर व्याख्या-प्रथम रीज़निंग परत की तरह काम करे. केवल रैंक किया गया जीन लौटाने के बजाय, उससे क्लिनिकल विशेषताओं, वंशानुक्रम पैटर्न, वैरिएंट साक्ष्य और वैज्ञानिक साहित्य को ऐसी दलील में जोड़ने को कहा गया जिसे मानव समीक्षक परख सके.
हर मामले के लिए, टीम ने एक डी-आइडेंटिफाइड पैकेट तैयार किया जिसमें रोगी की क्लिनिकल प्रस्तुति बताने वाले मानकीकृत Human Phenotype Ontology शब्द, कभी-कभी चिकित्सक के नोट और कोई वर्णनात्मक क्लिनिकल निदान, उम्र और लिंग जैसे मेटाडेटा, तथा फ़िल्टर की गई वैरिएंट तालिका शामिल थी. तालिका में प्रत्येक वैरिएंट की दुर्लभता, एन्कोडेड प्रोटीन पर उसका अनुमानित प्रभाव, ClinVar वर्गीकरण और उपलब्ध परिवार सदस्यों में सिग्नल गुणवत्ता दर्ज थी. अधिकांश मामलों में बच्चे और दोनों जैविक माता-पिता का डेटा शामिल था.
टीम ने मॉडल से सबसे संभावित आणविक व्याख्या प्रस्तावित करने और अपना तर्क दिखाने को कहा. फिर शोधकर्ताओं ने आउटपुट की समीक्षा उसी ACMG/AMP फ़्रेमवर्क से की जिसका उपयोग क्लिनिकल लैब आनुवंशिक वैरिएंट वर्गीकृत करने के लिए करती हैं. हर उम्मीदवार की कम-से-कम दो टीम सदस्यों ने समीक्षा की, असहमतियां सहमति से हल की गईं, और मॉडल आउटपुट को कभी निदान नहीं माना गया. किसी निष्कर्ष को निदान तभी माना गया जब योग्य विशेषज्ञों ने साक्ष्य की समीक्षा की, वैरिएंट को रोगजनक या संभवतः रोगजनक वर्गीकृत किया गया, CLIA-प्रमाणित प्रयोगशाला ने इसकी पुष्टि की, और क्लिनिकल टीम ने परिणाम परिवार को लौटाया.
अनसुलझे मामलों का विश्लेषण करने से पहले, टीम ने स्थापित निदान वाले मामलों पर वर्कफ़्लो को परिष्कृत किया. विभिन्न दुर्लभ स्थितियों वाले 51 में से 48 मामलों में इसने डुप्लिकेट रन में सही जीन और वैरिएंट फिर से पहचान लिए. 57 न्यूरोमस्कुलर मामलों के एक सेट में, वर्कफ़्लो ने 45 मामलों में डुप्लिकेट रन में सही निदान लौटाया. 15 मामलों वाले लॉन्ग-रीड जीनोम सेट में, इसने हर मामले में सही जीन और 12 मामलों में दोनों रोग-कारक एलील बताए. इन मूल्यांकनों ने प्रॉम्प्ट विकास में मदद की और दिखाया कि विशेषज्ञ समीक्षा कहां अब भी आवश्यक थी.
इन पहले से सुलझे मामलों में मॉडल के स्वयं बताए कॉन्फिडेंस स्कोर सही निदान से मेल खाते थे: लगातार सही कॉल के लिए औसत न्यूनतम स्कोर 85.6 था और गलत या अज्ञात कॉल के लिए 42.1. स्कोर कैलिब्रेटेड संभावनाएं नहीं थे, और टीम ने उन्हें साक्ष्य या क्लिनिकल निर्णय का विकल्प नहीं माना. लेकिन उन्होंने विशेषज्ञ समीक्षकों को सबसे आशाजनक उम्मीदवार निदानों पर ध्यान केंद्रित करने में मदद की.
इसके बाद टीम ने वर्कफ़्लो को पहले अनसुलझे मामलों के चार समूहों पर लागू किया: न्यूरोडेवलपमेंटल स्थितियों वाले बच्चे, दुर्लभ न्यूरोमस्कुलर रोग वाले लोग, प्रारंभिक मनोविकृति वाले बच्चे और किशोर, तथा बाल चिकित्सा में अचानक अप्रत्याशित मृत्यु के मामले. ये पहली समीक्षा की प्रतीक्षा कर रहे नए मामले नहीं थे. कई मामलों की कई वाणिज्यिक या संस्थागत पाइपलाइनों द्वारा पहले ही जांच हो चुकी थी और बहु-विषयक टीमों में चर्चा भी हो चुकी थी.
कोहोर्ट | मामले | सामने आए निदान | यील्ड |
न्यूरोडेवलपमेंटल | 100 | 10 | 10.0% |
न्यूरोमस्कुलर रोग | 61 | 4 | 6.6% |
बाल चिकित्सा में अचानक अप्रत्याशित मृत्यु | 200 | 2 | 1.0% |
प्रारंभिक मनोविकृति | 15 | 2 | 13.3% |
कुल | 376 | 18 | 4.8% |
प्रारंभिक मनोविकृति कोहोर्ट छोटा था, इसलिए उसके प्रतिशत का कॉन्फिडेंस इंटरवल व्यापक है. यील्ड यह भी दर्शाती है कि प्रत्येक कोहोर्ट में एकल-जीन व्याख्या होने की संभावना कितनी थी.
मॉडल द्वारा उम्मीदवार सामने रखने और विशेषज्ञों द्वारा समीक्षा तथा क्लिनिकल पुष्टि पूरी करने के बाद, चिकित्सकों ने 4.8% मामलों में निदान स्थापित किए. इस आबादी में यह दर मामूली लेकिन सार्थक है, क्योंकि पिछले विशेषज्ञ समीक्षाओं से मामले हल नहीं हुए थे. समान पुनर्विश्लेषण अध्ययनों में गहन समीक्षा वाले मामलों में एकल-अंकीय लाभ बताए जाते हैं; अधिक यील्ड आमतौर पर उन अध्ययनों से आती है जिनमें नए मामले या आनुवंशिक पुष्टि की प्रतीक्षा कर रहे प्रसिद्ध विकार शामिल होते हैं.
18 निदानों में से 7 पुनर्खोज थे: ऐसे निदान जो स्थानीय शोध वर्कफ़्लो से बाहर स्थापित हुए थे, लेकिन टीम द्वारा समीक्षा किए गए रिकॉर्ड में मौजूद नहीं थे. कई मामलों में, वैरिएंट सार्वजनिक डेटाबेस में पहले से ही रोगजनक या संभवतः रोगजनक के रूप में सूचीबद्ध थे, जो डेटा स्रोतों के बीच जानकारी को संश्लेषित करने की परिचालन चुनौती को रेखांकित करता है.
प्रारंभिक मनोविकृति के एक मामले में, मॉडल ने जीनोम में एक संरचनात्मक घटना का अनुमान लगाया जो इनपुट डेटा में सूचीबद्ध नहीं थी. इसने क्रोमोसोम 22 पर कम-गुणवत्ता वाली कॉल की एक शृंखला को बच्चे की हृदय, प्रतिरक्षा, न्यूरोडेवलपमेंटल और मनोरोग संबंधी विशेषताओं से जोड़ा, फिर DiGeorge सिंड्रोम से संबद्ध 22q11.2 डिलीशन की परिकल्पना की. इस परिकल्पित वैरिएंट की पुष्टि फॉलो-अप जीनोम सीक्वेंसिंग से हुई.
हालांकि प्रॉम्प्ट में एक मोनोजेनिक कारण मांगा गया था, मॉडल ने कभी-कभी दो जीन सामने रखे जो जटिल प्रस्तुति को बेहतर समझाते थे. एक मामले में LAMA2 और FOXP1 के वैरिएंट ने मिलकर मांसपेशीय और न्यूरोडेवलपमेंटल विशेषताओं को समझाने में मदद की; दूसरे में TTN और SRPK3 से जुड़ी पहले न पहचानी गई डाइजेनिक व्याख्या थी.
निदानों के अलावा, मॉडल ने vitiligo नामक स्थिति के लिए एक संभावित नई यांत्रिक व्याख्या भी पहचानी. एक न्यूरोडेवलपमेंटल मामले में, मॉडल ने vitiligo वाले व्यक्ति में S1PR1 में 11-अमीनो-अम्ल डिलीशन को रेखांकित किया. S1PR1 सिग्नलिंग, प्रतिरक्षा-कोशिका गति और ऊतक जीवविज्ञान में शामिल कोशिका-सतह रिसेप्टर को एन्कोड करता है. मॉडल ने ऐसे साक्ष्यों को जोड़ा जो संकेत देते थे कि डिलीशन रिसेप्टर संरचना और सिग्नलिंग को इस तरह बदल सकता है जिससे पिगमेंट उत्पादन घटे और प्रतिरक्षा कोशिकाओं को त्वचा में बने रहने में भी मदद मिले.
प्रस्तावित S1PR1-vitiligo संबंध को अतिरिक्त प्रायोगिक सत्यापन की आवश्यकता है, लेकिन यह दिखाता है कि संरचनात्मक जीवविज्ञान, प्रतिरक्षा विज्ञान और क्लिनिकल जेनेटिक्स से बिखरे निष्कर्षों को ठोस, परीक्षण योग्य परिकल्पनाओं में बदलने में AI की भूमिका कितनी प्रभावशाली हो सकती है.
टीम ने न्यूरोमस्कुलर कोहोर्ट में संभावित फीनोटाइप विस्तार भी देखा. HSPB8 और CDK13 में नुकसानदेह वैरिएंट जीनों के सबसे प्रसिद्ध विकारों से पूरी तरह मेल नहीं खाते थे, जिससे व्यापक क्लिनिकल स्पेक्ट्रम का संकेत मिलता है जिसकी जांच के लिए अधिक मामलों और प्रयोगशाला कार्य की आवश्यकता होगी.
केस स्टडी: करीब दो दशक बाद काइरा का निदान
शुरुआत कराटे क्लास में हुई, जब काइरा की मां ने देखा कि उनकी 9 वर्षीय बेटी अपने स्टांस में पहले जितना नीचे नहीं बैठ पा रही थी. काइरा फुटबॉल अभ्यास के दौरान भी धीमी पड़ रही थी और चलते-दौड़ते समय पंजों पर रहती थी. उसके बाल रोग विशेषज्ञ उसकी मांसपेशियों की कमजोरी का कारण नहीं पहचान सके, इसलिए उन्होंने उसे विशेषज्ञ के पास भेजा. इसके बाद लगभग 20 साल तक परीक्षणों, उपचारों और परामर्शों का सफर चला, लेकिन निदान नहीं मिला.
काइरा का मामला न्यूरोमस्कुलर कोहोर्ट में सामने आए चार निदानों में से एक था. टीम ने उसकी स्थिति को HSPB8 में फ्रेमशिफ्ट वैरिएंट से जोड़ा और मायोफाइब्रिलर मायोपैथी के एक रूप का निदान किया, जिसमें असामान्य प्रोटीन संरचनाएं मांसपेशी रेशों में जमा होकर कमजोरी में योगदान देती हैं. मेंटन सेंटर के एक जेनेटिक काउंसलर ने काइरा को उसके 28वें जन्मदिन से करीब एक सप्ताह पहले फोन किया.
तब तक काइरा ने अपने जीवन का बड़ा हिस्सा इस रोग के साथ खुद को ढालते हुए बिताया था. 13 साल की उम्र तक वह वेंटिलेटर और व्हीलचेयर पर निर्भर हो गई थी, हालांकि तब से उसकी स्थिति स्थिर बनी हुई है. हालांकि काइरा की मायोफाइब्रिलर मायोपैथी का रूप इतना दुर्लभ है कि इसके दीर्घकालिक क्रम के बारे में बहुत कम जानकारी है, निदान ने कुछ हद तक स्पष्टता दी है.
यह अध्ययन दिखाता है कि सामान्य-उद्देश्य रीज़निंग मॉडल फीनोटाइप, वंशानुक्रम, वैरिएंट एनोटेशन, डेटा-गुणवत्ता पैटर्न और वैज्ञानिक साहित्य को जोड़कर समीक्षा योग्य परिकल्पनाएं बनाते हुए पूर्वव्यापी जीनोमिक पुनर्विश्लेषण में योगदान दे सकता है. यह यह भी दिखाता है कि आवधिक पुनर्विश्लेषण क्यों मायने रखता है: कुछ उत्तर तभी सामने आते हैं जब ज्ञान आगे बढ़ता है या बिखरे रिकॉर्ड एक साथ लाए जाते हैं.
यह शोध इस बात का साक्ष्य नहीं है कि रोगियों, चिकित्सकों या ग्राहकों को रोग का निदान करने या चिकित्सीय निर्णय लेने के लिए OpenAI मॉडल का उपयोग करना चाहिए. यह निदान के लिए OpenAI o3 डीप रिसर्च, ChatGPT या किसी अन्य OpenAI उत्पाद के अभिप्रेत ग्राहक उपयोग का वर्णन या समर्थन नहीं करता. मॉडल ने किसी प्रतिभागी का निदान नहीं किया; चिकित्सकों और अन्य योग्य क्लिनिकल विशेषज्ञों ने स्थापित समीक्षा, परीक्षण और क्लिनिकल-पुष्टि प्रक्रियाओं के माध्यम से हर निदान किया.
अध्ययन पूर्वव्यापी था, कोहोर्ट विविध थे, और समीक्षक मॉडल के कॉन्फिडेंस से अनभिज्ञ नहीं रखे गए थे. शोधकर्ताओं ने बचाए गए समय, लागत, चिकित्सकीय प्रयास, झूठे-सकारात्मक कार्यभार या देखभाल में बदलावों को नहीं मापा. उन्होंने संरचनात्मक वैरिएंट, रिपीट एक्सपैंशन, डीप-इंट्रॉनिक बदलाव या मोज़ेकिज़्म जैसे आनुवंशिक विविधता के अन्य रूपों का व्यवस्थित मूल्यांकन भी नहीं किया.
LLM संदर्भ को गलत पढ़ सकते हैं या ऐसी संभावित लगने वाली व्याख्याएं दे सकते हैं जो करीब से जांचने पर टिकती नहीं हैं. इसलिए हर परिणाम मानव निर्णय और क्लिनिकल पुष्टि से गुजरा. मॉडल ने खोज का दायरा बढ़ाया और बाद के मानव-नेतृत्व वाले विश्लेषण को केंद्रित किया; इसने यह तय नहीं किया कि परिवार को कौन-सी जानकारी या निदान लौटाया जाना चाहिए.
इस अध्ययन में डी-आइडेंटिफाइड जानकारी का उपयोग किया गया, और कोई संरक्षित स्वास्थ्य जानकारी अनुमोदित वातावरणों के बाहर उपयोग या प्रेषित नहीं की गई. व्यापक क्लिनिकल तैनाती के लिए गोपनीयता, सुरक्षा, ऑडिटेबिलिटी और स्थानीय विनियमन पर वही ध्यान देना होगा जो सभी चिकित्सा देखभाल पर लागू होता है. मॉडल तक पहुंच सीक्वेंसिंग अवसंरचना, आनुवंशिक परामर्श, पुष्टिकारी परीक्षण या विशेषज्ञ निर्णय की जगह नहीं लेती.

“सबसे बड़ी बाधा समय है. एक विशेषज्ञ अपने दिन का केवल सीमित हिस्सा ही किसी एक खास व्यक्ति को दे सकता है.”
डॉ. कैथरीन ब्राउनस्टीन, बोस्टन चिल्ड्रंस हॉस्पिटल का मेंटन सेंटर फॉर ऑर्फन डिज़ीज़ रिसर्च

“कैथरीन और मेरे जैसे शोधकर्ता 8,000 अलग-अलग रोगों को अपने दिमाग में रखना संभव ही नहीं कर सकते. यही AI की ताकत है.”
एलन बेग्स, मेंटन सेंटर फॉर ऑर्फन डिज़ीज़ रिसर्च के निदेशक
भावी, बहु-केंद्र अध्ययनों को LLM-सहायता प्राप्त पुनर्विश्लेषण की तुलना मानक अभ्यास से निदान यील्ड, उम्मीदवार तक पहुंचने के समय, चिकित्सकीय प्रयास, झूठे-सकारात्मक बोझ, लागत और देखभाल पर प्रभावों के आधार पर करनी चाहिए. पुनरुत्पादकता और सुरक्षा के लिए संस्करणित प्रॉम्प्ट, संदर्भ जांच, ऑडिट लॉग और कैलिब्रेटेड अनिश्चितता महत्वपूर्ण होंगे. ऐसे अध्ययनों में फिर भी योग्य चिकित्सकों को साक्ष्य का मूल्यांकन करने, उपयुक्त परीक्षण लिखने और कोई भी निदान या उपचार निर्णय लेने की आवश्यकता होगी.
इस अध्ययन में OpenAI o3 डीप रिसर्च का उपयोग किया गया. नए सामान्य-उद्देश्य मॉडल अधिक वैज्ञानिक सामग्री खोज और संश्लेषित कर सकते हैं, जबकि GPT‑Rosalind जैसे उद्देश्य-निर्मित सिस्टम अधिक गहन जीवन-विज्ञान कार्यों के लिए डिज़ाइन किए गए हैं, जिनमें प्रोटीन संरचना और कार्य पर वैरिएंट प्रभाव शामिल हैं. इन क्षमताओं का यहां परीक्षण नहीं किया गया और इनके लिए अलग मूल्यांकन तथा पहुंच नियंत्रण की आवश्यकता होगी.
हालांकि OpenAI ने इस प्रारंभिक शोध अध्ययन में सहायता की, काम के अगले चरण का नेतृत्व मेंटन सेंटर OpenAI Foundation के अनुदान से करेगा. यह अनुदान केंद्र के उस व्यापक प्रयास का समर्थन करेगा जिसमें प्लेटफ़ॉर्म-निरपेक्ष, कम-लागत वाला जेनेटिक्स AI कोपायलट विकसित किया जाएगा, जो क्लिनिकल टीमों को दुर्लभ रोग मामलों का अधिक तेज़ी और निरंतरता से विश्लेषण करने में मदद करे.
दीर्घकालिक शोध अवसर यह पता लगाना है कि क्या विशेषज्ञ-नेतृत्व वाला AI-सहायता प्राप्त पुनर्विश्लेषण वैज्ञानिक समझ को खोज की गति के साथ बनाए रखने में मदद कर सकता है. वादे का अर्थ यह नहीं है कि AI डॉक्टर के निदान की जगह लेता है, बल्कि यह है कि सावधानी से मूल्यांकित शोध उपकरण विशेषज्ञों को जांच योग्य साक्ष्य पहचानने में मदद कर सकते हैं. हजारों परिवारों के लिए, आज के अनुत्तरित प्रश्न हमेशा अनुत्तरित रहने जरूरी नहीं हैं.
- 2026


