استفاده از AI برای کمک به پزشکان در تشخیص بیماریهای ژنتیکی نادر کودکان
در مطالعهای در NEJM AI، متخصصان با یک مدل استدلال OpenAI، ۳۷۶ مورد پیشتر حلنشده را بازتحلیل کردند و سرنخهایی برای ۱۸ تشخیص احتمالی به دست آوردند.
حتی با وجود توالییابی ژنومی، بسیاری از افراد مبتلا به بیماریهای نادر هرگز تشخیص ژنتیکی روشنی دریافت نمیکنند. تقریباً نیمی از آنها پس از آزمایشهای گسترده و بررسی متخصصان همچنان بدون تشخیص میمانند. دادههای پزشکی آنها ممکن است سرنخهایی داشته باشد، اما یافتن آنها میتواند مستلزم غربال کردن هزاران تا میلیونها واریانت ژنتیکی احتمالی، پروندههای بالینی پراکنده و ادبیات علمیِ بهسرعت در حال تغییر باشد.
با انباشته شدن روابط تازه ژن و بیماری، گزارشهای موردی و شواهد طبقهبندی، موارد حلنشده میتوانند دوباره قابل تفسیر شوند.
پژوهشگران مرکز منتون برای پژوهش بیماریهای یتیم در بیمارستان کودکان بوستون، دانشگاه هاروارد و OpenAI از مدل استدلال OpenAI o3 تحقیق عمیق برای تحلیل اطلاعات بالینی و ژنومیِ هویتزداییشده از ۳۷۶ مورد پیشتر بررسیشدهای استفاده کردند که همچنان حلنشده باقی مانده بودند. مدلهای توضیحیِ احتمالی متکی به شواهد را برای بررسی پژوهشگران و پزشکان مطرح کرد. پس از بررسی متخصصان، آزمایشهای تکمیلی و تأیید بالینی، پزشکان در ۱۸ مورد به تشخیص رسیدند؛ یعنی بازده تشخیصی افزوده ۴٫۸٪ پس از تحلیل پیشین متخصصان. این مطالعه در ۱۸ ژوئن ۲۰۲۶ در NEJM AI منتشر شد و نشان میدهد یک روند کاری پژوهشی با کمک AI چگونه میتواند هنگام بازنگری در برخی از دشوارترین موارد، به متخصصان در ارائه سرنخهای تشخیصی کمک کرد.
بسیاری از این موارد سالها از تحلیل متخصصان گریخته بودند. در این مطالعه، OpenAI o3 تحقیق عمیق به پژوهشگران کمک کرد سرنخهایی را شناسایی کنند که بعداً از طریق فرایندهای بالینی تثبیتشده ارزیابی شدند؛ این امر نشان میدهد بازتحلیل دورهای به رهبری متخصصان میتواند با تحول دانش، مقیاسپذیرتر شود. مدل هیچ بیماری را تشخیص نداد و هیچ تصمیم بالینی نگرفت. این مدل فرضیههای متکی به شواهد تولید کرد تا متخصصان آنها را بررسی کنند و، در صورت لزوم، با آزمایشهای تکمیلی پیگیری کرده و در آزمایشگاه بالینی تأیید کنند.
یک آزمایش ژنتیکیِ بینتیجه همیشه یافتهای دائمی نیست. توصیفهای فنوتیپی بیمار، نتایج آزمایشها و سابقه خانوادگی ممکن است در پایگاههای دادهای پراکنده باشند که شناسهها، قالبها و واژگان متفاوتی به کار میبرند. پیوند دادن این سوابق دشوار است؛ بنابراین حتی متخصصان نیز ممکن است تشخیصی را از دست بدهند. همچنین ممکن است متخصصان ژنوم کودک را پیش از آن توالییابی کنند که یک ژن مرتبط یا واریانتهای آن با بیماری پیوند داده شده باشند. با پیشرفت دانش علمی، همان دادهها میتوانند پاسخهایی را آشکار کنند که پیشتر کشفشان ناممکن بود.
بازتحلیل بیماریهای نادر هم مسئلهhd علمی است و هم مسئله مرتبط با نگهداری و بهروزرسانی دادهها. ژنوم بیمار ممکن است ثابت بماند، اما شواهد پیرامون آن پیوسته تغییر میکند: پژوهشگران ژنها و واریانتهای تازهای را با بیماری پیوند میدهند، آزمایشگاهها واریانتهای قدیمی را دوباره طبقهبندی میکنند و پایگاههای موردی و مقالهها مشاهدات تازهای انباشته میکنند. هر بهروزرسانی میتواند بازنگری در یک پرونده قدیمیِ بینتیجه را ارزشمند کند؛ ازاینرو بسیاری از مؤسسات با انبوه فزایندهای از ژنومها روبهرو میشوند که باید با یک پایگاه دانش در حال حرکت هماهنگ بمانند.
در این مطالعه، پژوهشگران روند کاری را چنان طراحی کردند که مدل بهعنوان لایهای استدلالی و توضیحمحور روی خطوط پردازش ژنومی موجود عمل کند. بهجای آنکه فقط یک ژن رتبهبندیشده برگرداند، از مدل خواسته شد ویژگیهای بالینی، الگوی وراثت، شواهد واریانت و ادبیات علمی را در قالب توجیهی به هم وصل کند که بازبین انسانی بتواند آن را وارسی کند.
برای هر مورد، تیم بستهای هویتزداییشده آماده کرد که شامل اصطلاحات استاندارد Human Phenotype Ontology برای توصیف تظاهر بالینی بیمار، یادداشتهای گاهبهگاه پزشک و هر تشخیص بالینی توصیفی، فرادادههایی مانند سن و جنسیت، و یک جدول پالایششده از واریانتها بود. این جدول نادر بودن هر واریانت، اثر پیشبینیشده آن بر پروتئین کدشده، طبقهبندی ClinVar و کیفیت سیگنال را در میان اعضای خانواده موجود ثبت میکرد. بیشتر موارد شامل دادههایی از کودک و هر دو والد زیستی بود.
تیم از مدل خواست محتملترین توضیح مولکولی را پیشنهاد کند و نحوه رسیدن به نتیجه را نشان دهد. سپس پژوهشگران خروجیها را با همان چارچوب ACMG/AMP بررسی کردند که آزمایشگاههای بالینی برای طبقهبندی واریانتهای ژنتیکی به کار میبرند. دستکم دو عضو تیم هر مورد پیشنهادی را بررسی کردند، اختلافنظرها با اجماع حل شد و خروجی مدل هرگز بهعنوان تشخیص تلقی نشد. یک یافته فقط زمانی تشخیص محسوب میشد که متخصصان واجد صلاحیت شواهد را بررسی کرده باشند، واریانت بهعنوان بیماریزا یا احتمالاً بیماریزا طبقهبندی شده باشد، یک آزمایشگاه دارای گواهی CLIA آن را تأیید کرده باشد و نتیجه به خانواده اعلام شده باشد.
پیش از تحلیل موارد حلنشده، تیم روند کاری را روی مواردی با تشخیصهای تثبیتشده اصلاح کرد. این روند در اجراهای تکراری، ژن و واریانت صحیح را در ۴۸ مورد از ۵۱ موردِ شامل انواعی از بیماریهای نادر شناسایی کرد. در مجموعهای شامل ۵۷ مورد عصبیعضلانی، این روند در ۴۵ موردِ اجراهای تکراری به تشخیص صحیح رسید. در یک مجموعه ۱۵ موردی از ژنومهای خوانشبلند، در همه موارد ژن صحیح را شناسایی کرد و در ۱۲ مورد هر دو آلل بیماریزا را مشخص کرد. این ارزیابیها به بهبود اعلانها کمک کردند و نشان دادند در چه مواردی بررسی متخصصان همچنان ضروری است.
امتیازهای اطمینانِ خودگزارششده مدل با تشخیصهای صحیح در این مواردِ پیشتر حلشده همبستگی داشت: میانگین حداقل امتیاز برای تشخیصهای همواره درست ۸۵٫۶ و برای تشخیصهای نادرست یا نامشخص ۴۲٫۱ بود. این امتیازها احتمالهای کالیبرهشده نبودند و تیم از آنها بهعنوان جایگزینی برای شواهد یا قضاوت بالینی استفاده نکرد. با این حال، این امتیازها به بازبینان متخصص کمک میکردند توجه خود را بر امیدوارکنندهترین تشخیصهای احتمالی متمرکز کنند.
سپس تیم این روند کاری را بر چهار گروه از موارد پیشتر حلنشده اعمال کرد: کودکان دارای وضعیتهای تکامل عصبی، افراد مبتلا به بیماری عصبیعضلانی نادر، کودکان و نوجوانان مبتلا به روانپریشی زودهنگام، و موارد مرگ ناگهانی و غیرمنتظره در کودکان. اینها موارد تازهای نبودند که در انتظار نخستین بررسی باشند. بسیاری از آنها پیشتر با چندین خط پردازش تجاری یا سازمانی بررسی شده و در تیمهای چندرشتهای مطرح شده بودند.
گروه | موارد | تشخیصهای شناساییشده | بازده |
تکامل عصبی | 100 | 10 | 10.0% |
بیماری عصبیعضلانی | 61 | 4 | 6.6% |
مرگ ناگهانی و غیرمنتظره در کودکان | 200 | 2 | 1.0% |
روانپریشی زودهنگام | 15 | 2 | 13.3% |
مجموع | 376 | 18 | 4.8% |
به دلیل کوچک بودن گروه روانپریشی زودهنگام، درصد گزارششده با عدمقطعیت بیشتری همراه است. بازده همچنین نشان میدهد هر گروه تا چه حد احتمال داشت توضیحی تکژنی داشته باشد.
پس از آنکه مدل گزینههای احتمالی را شناسایی کرد و متخصصان بررسی و تأیید بالینی را کامل کردند، پزشکان در ۴٫۸٪ موارد به تشخیص رسیدند. این نرخ متوسط اما در این جمعیت معنادار است، زیرا بررسیهای پیشین متخصصان نتوانسته بود موارد را حل کند. مطالعات مشابه بازتحلیل در مواردی که بهدقت بررسی شدهاند، افزایشهای تکرقمی گزارش میکنند؛ بازدههای بالاتر معمولاً از مطالعاتی به دست میآیند که شامل موارد تازه یا اختلالات شناختهشده در انتظار تأیید ژنتیکی هستند.
از ۱۸ تشخیص، ۷ مورد کشف دوباره بود: تشخیصهایی که بیرون از روند کاری پژوهشی محلی تثبیت شده بودند، اما در سوابقی که تیم بررسی کرد وجود نداشتند. در چند مورد، واریانتها از پیش در پایگاههای داده عمومی بهعنوان بیماریزا یا احتمالاً بیماریزا فهرست شده بودند؛ موضوعی که چالش عملیاتی ترکیب اطلاعات از منابع دادهای مختلف را برجسته میکند.
در یکی از موارد روانپریشی زودهنگام، مدل یک رخداد ساختاری در ژنوم را استنباط کرد که در دادههای ورودی فهرست نشده بود. این مدل زنجیرهای از خوانشهای کمکیفیت روی کروموزوم ۲۲ را با ویژگیهای قلبی، ایمنی، تکامل عصبی و روانپزشکی کودک مرتبط کرد و سپس حذف 22q11.2 را، که با نشانگان دیجورج مرتبط است، بهعنوان فرضیه مطرح کرد. این واریانت فرضی با توالییابی تکمیلی ژنوم تأیید شد.
گرچه اعلان خواسته بود یک علت تکژنی ارائه شود، مدل گاهی دو ژن را شناسایی میکرد که یک تظاهر پیچیده را بهتر توضیح میدادند. واریانتهای LAMA2 و FOXP1 در کنار هم به توضیح ویژگیهای عضلانی و تکامل عصبی در یک مورد کمک کردند؛ مورد دیگری نیز توضیحی دوژنی و پیشتر ناشناخته داشت که TTN و SRPK3 را دربر میگرفت.
افزون بر تشخیصها، مدل یک توضیح سازوکاریِ احتمالاً نو برای بیماریای به نام ویتیلیگو نیز شناسایی کرد. در یکی از موارد تکامل عصبی، مدل حذف ۱۱ اسیدآمینهای در S1PR1 را در فردی مبتلا به ویتیلیگو برجسته کرد. S1PR1 گیرندهای سطح سلولی را کد میکند که در پیامرسانی، حرکت سلولهای ایمنی و زیستشناسی بافت نقش دارد. مدل شواهدی را یکپارچه کرد که نشان میداد این حذف میتواند ساختار و پیامرسانی گیرنده را به شیوههایی تغییر دهد که تولید رنگدانه را کاهش میدهد و در عین حال به ماندگاری سلولهای ایمنی در پوست کمک میکند.
رابطه پیشنهادی میان S1PR1 و ویتیلیگو به اعتبارسنجی تجربی بیشتری نیاز دارد، اما نقش قدرتمند AI را در تبدیل یافتههای پراکنده از زیستشناسی ساختاری، ایمنیشناسی و ژنتیک بالینی به فرضیههای ملموس و آزمونپذیر نشان میدهد.
تیم همچنین در گروه عصبیعضلانی گسترش احتمالی فنوتیپ را مشاهده کرد. واریانتهای آسیبزننده در HSPB8 و CDK13 با شناختهشدهترین اختلالات این ژنها کاملاً منطبق نبودند؛ موضوعی که طیف بالینی گستردهتری را مطرح میکند و برای آزمودن آن به موارد بیشتر و کار آزمایشگاهی نیاز است.
مطالعه موردی: تشخیص کایرا پس از نزدیک به دو دهه
همهچیز از کلاس کاراته شروع شد؛ وقتی مادر کایرا متوجه شد دختر ۹ سالهاش دیگر مثل گذشته در حالتهای ایستادن پایین نمیرود. کایرا هنگام تمرین فوتبال هم کندتر شده بود و هنگام راه رفتن و دویدن روی پنجههای پا میماند. پزشک کودکان او نتوانست علت ضعف عضلانیاش را شناسایی کند، بنابراین او را به متخصص ارجاع داد. پس از آن سفری نزدیک به ۲۰ سال از آزمایشها، درمانها و مشاورهها آغاز شد، بیآنکه تشخیصی به دست آید.
پرونده کایرا یکی از چهار تشخیصی بود که در گروه عصبیعضلانی مطرح شد. تیم وضعیت او را به یک واریانت تغییر قاب خوانش در HSPB8 پیوند داد و نوعی میوپاتی میوفیبریلار را تشخیص داد؛ بیماریای که در آن ساختارهای پروتئینی غیرطبیعی در فیبرهای عضلانی تجمع مییابند و به ضعف کمک میکنند. یک مشاور ژنتیک از مرکز منتون حدود یک هفته پیش از تولد ۲۸ سالگی کایرا با او تماس گرفت.
تا آن زمان، کایرا بخش بزرگی از زندگیاش را صرف سازگار شدن با بیماری کرده بود. او تا ۱۳ سالگی به ونتیلاتور وابسته و روی ویلچر بود، هرچند وضعیتش از آن زمان تاکنون ثابت مانده است. گرچه نوع میوپاتی میوفیبریلار کایرا آنقدر نادر است که درباره سیر بلندمدت آن اطلاعات کمی وجود دارد، این تشخیص تا حدی به بلاتکلیفی پایان داده است.
این مطالعه نشان میدهد که یک مدل استدلال عمومی میتواند با ترکیب فنوتیپ، وراثت، حاشیهنویسیهای واریانت، الگوهای کیفیت داده و ادبیات علمی در قالب فرضیههای قابل بررسی، به بازتحلیل ژنومی گذشتهنگر کمک کند. همچنین نشان میدهد چرا بازتحلیل دورهای اهمیت دارد: برخی پاسخها فقط پس از پیشرفت دانش یا کنار هم قرار گرفتن سوابق پراکنده آشکار میشوند.
این پژوهش شواهدی نیست مبنی بر اینکه بیماران، پزشکان یا مشتریان باید از مدلهای OpenAI برای تشخیص بیماری یا گرفتن تصمیمهای پزشکی استفاده کنند. این مطالعه هیچ کاربرد مورد نظر برای مشتریان را در زمینه تشخیص با OpenAI o3 تحقیق عمیق، ChatGPT یا هر محصول دیگر OpenAI توصیف یا تأیید نمیکند. مدل هیچ شرکتکنندهای را تشخیص نداد؛ پزشکان و دیگر متخصصان بالینی واجد صلاحیت همه تشخیصها را از طریق فرایندهای تثبیتشده بررسی، آزمایش و تأیید بالینی انجام دادند.
این مطالعه گذشتهنگر بود، گروهها ناهمگون بودند و بازبینان نسبت به اطمینان مدل کور نشده بودند. پژوهشگران زمان صرفهجوییشده، هزینه، تلاش پزشک، حجم کار ناشی از مثبتهای کاذب یا تغییرات در مراقبت را اندازهگیری نکردند. آنها همچنین دیگر شکلهای تنوع ژنتیکی، مانند واریانتهای ساختاری، گسترشهای تکراری، تغییرات عمیق دروناینترونی یا موزاییسم را بهطور نظاممند ارزیابی نکردند.
الگوهای زبانی بزرگ میتوانند زمینه را نادرست بخوانند یا توضیحهایی باورپذیر تولید کنند که با بررسی دقیقتر ناکام میمانند. بنابراین هر نتیجه از داوری انسانی و تأیید بالینی گذشت. مدل دامنه جستوجو را گسترش داد و تحلیل بعدیِ تحت رهبری انسان را متمرکز کرد؛ اما درباره اینکه چه اطلاعات یا تشخیصی باید به خانواده ارائه شود تصمیم نگرفت.
این مطالعه از اطلاعات هویتزداییشده استفاده کرد و هیچ اطلاعات سلامت حفاظتشدهای خارج از محیطهای تأییدشده به کار گرفته یا منتقل نشد. استقرار بالینی گستردهتر به همان توجه به حریم خصوصی، امنیت، قابلیت حسابرسی و مقررات محلی نیاز خواهد داشت که برای همه مراقبتهای پزشکی لازم است. دسترسی به مدل، جایگزین زیرساخت توالییابی، مشاوره ژنتیک، آزمایش تأییدی یا قضاوت متخصص نمیشود.

«گلوگاه، زمان است. یک متخصص فقط میتواند مقدار محدودی از روز خود را به هر فرد مشخص اختصاص دهد.»
دکتر کاترین براونستین، مرکز منتون برای پژوهش بیماریهای یتیم در بیمارستان کودکان بوستون

«پژوهشگرانی مثل کاترین و من نمیتوانیم ۸۰۰۰ بیماری مختلف را در ذهنمان نگه داریم. قدرت AI همین است.»
آلن بگز، مدیر مرکز منتون برای پژوهش بیماریهای یتیم
مطالعات آیندهنگر و چندمرکزی باید بازتحلیل با کمک الگوهای زبانی بزرگ (LLM) را از نظر بازده تشخیصی، زمان لازم برای رسیدن به یک تشخیص احتمالی، بار کاری پزشک، میزان نتایج مثبت کاذب، هزینه و تأثیر بر مراقبت با رویه استاندارد مقایسه کنند. اعلانهای نسخهبندیشده، راستیآزمایی منابع، گزارشهای حسابرسی و برآوردهای کالیبرهشده از عدمقطعیت برای بازتولیدپذیری و ایمنی اهمیت خواهند داشت. چنین مطالعاتی همچنان به پزشکان واجد صلاحیت نیاز خواهند داشت تا شواهد را ارزیابی کنند، آزمایشهای مناسب را تجویز کنند و هرگونه تصمیم تشخیصی یا درمانی را بگیرند.
این مطالعه از OpenAI o3 تحقیق عمیق استفاده کرد. مدلهای عمومی جدیدتر میتوانند حجم بیشتری از منابع علمی را جستوجو و ترکیب کنند، در حالی که سامانههای اختصاصی مانند GPT‑Rosalind برای کارهای عمیقتر در علوم زیستی طراحی شدهاند؛ از جمله بررسی اثر واریانتها بر ساختار و عملکرد پروتئین. این قابلیتها در این مطالعه آزموده نشدند و به ارزیابیها و کنترلهای دسترسی جداگانه نیاز خواهند داشت.
اگرچه OpenAI در پشتیبانی از این مطالعه پژوهشی اولیه نقش داشت، مرکز منتون مرحله بعدی این پروژه را با استفاده از کمکهزینهای از بنیاد OpenAI هدایت خواهد کرد. این کمکهزینه از تلاش گستردهتر مرکز برای توسعه یک دستیار ژنتیک مبتنی بر هوش مصنوعی، کمهزینه و مستقل از پلتفرم پشتیبانی میکند که به تیمهای بالینی کمک میکند موارد بیماریهای نادر را سریعتر و با ثبات بیشتری تحلیل کنند.
فرصت پژوهشی بلندمدت این است که بررسی شود آیا بازتحلیلِ به رهبری متخصص و با کمک AI میتواند به همگام ماندن فهم علمی با کشفیات کمک کند یا نه. وعده این نیست که AI جایگزین تشخیص پزشک شود، بلکه این است که ابزارهای پژوهشیِ با دقت ارزیابیشده ممکن است به متخصصان کمک کنند شواهد ارزشمند برای پیگیری را شناسایی کنند. برای هزاران خانواده، پرسشهای بیپاسخ امروز لازم نیست برای همیشه بیپاسخ بمانند.
- ۲۰۲۶


