پرش به محتوای اصلی
OpenAI

۲۸ خرداد ۱۴۰۵

AI کاربردی

استفاده از AI برای کمک به پزشکان در تشخیص بیماری‌های ژنتیکی نادر کودکان

در مطالعه‌ای در NEJM AI، متخصصان با یک مدل استدلال OpenAI، ۳۷۶ مورد پیش‌تر حل‌نشده را بازتحلیل کردند و سرنخ‌هایی برای ۱۸ تشخیص احتمالی به دست آوردند.

در حال بارگذاری…

حتی با وجود توالی‌یابی ژنومی، بسیاری از افراد مبتلا به بیماری‌های نادر هرگز تشخیص ژنتیکی روشنی دریافت نمی‌کنند. تقریباً نیمی از آن‌ها پس از آزمایش‌های گسترده و بررسی متخصصان همچنان بدون تشخیص می‌مانند. داده‌های پزشکی آن‌ها ممکن است سرنخ‌هایی داشته باشد، اما یافتن آن‌ها می‌تواند مستلزم غربال کردن هزاران تا میلیون‌ها واریانت ژنتیکی احتمالی، پرونده‌های بالینی پراکنده و ادبیات علمیِ به‌سرعت در حال تغییر باشد.

با انباشته شدن روابط تازه ژن و بیماری، گزارش‌های موردی و شواهد طبقه‌بندی، موارد حل‌نشده می‌توانند دوباره قابل تفسیر شوند.

پژوهشگران مرکز منتون برای پژوهش بیماری‌های یتیم در بیمارستان کودکان بوستون، دانشگاه هاروارد و OpenAI از مدل استدلال OpenAI o3 تحقیق عمیق برای تحلیل اطلاعات بالینی و ژنومیِ هویت‌زدایی‌شده از ۳۷۶ مورد پیش‌تر بررسی‌شده‌ای استفاده کردند که همچنان حل‌نشده باقی مانده بودند. مدل‌های توضیحیِ احتمالی متکی به شواهد را برای بررسی پژوهشگران و پزشکان مطرح کرد. پس از بررسی متخصصان، آزمایش‌های تکمیلی و تأیید بالینی، پزشکان در ۱۸ مورد به تشخیص رسیدند؛ یعنی بازده تشخیصی افزوده ۴٫۸٪ پس از تحلیل پیشین متخصصان. این مطالعه در ۱۸ ژوئن ۲۰۲۶ در NEJM AI منتشر شد و نشان می‌دهد یک روند کاری پژوهشی با کمک AI چگونه می‌تواند هنگام بازنگری در برخی از دشوارترین موارد، به متخصصان در ارائه سرنخ‌های تشخیصی کمک کرد.

بسیاری از این موارد سال‌ها از تحلیل متخصصان گریخته بودند. در این مطالعه، OpenAI o3 تحقیق عمیق به پژوهشگران کمک کرد سرنخ‌هایی را شناسایی کنند که بعداً از طریق فرایندهای بالینی تثبیت‌شده ارزیابی شدند؛ این امر نشان می‌دهد بازتحلیل دوره‌ای به رهبری متخصصان می‌تواند با تحول دانش، مقیاس‌پذیرتر شود. مدل هیچ بیماری را تشخیص نداد و هیچ تصمیم بالینی نگرفت. این مدل فرضیه‌های متکی به شواهد تولید کرد تا متخصصان آن‌ها را بررسی کنند و، در صورت لزوم، با آزمایش‌های تکمیلی پیگیری کرده و در آزمایشگاه بالینی تأیید کنند.

چرا یک پرونده قدیمی می‌تواند پاسخی تازه در خود داشته باشد

یک آزمایش ژنتیکیِ بی‌نتیجه همیشه یافته‌ای دائمی نیست. توصیف‌های فنوتیپی بیمار، نتایج آزمایش‌ها و سابقه خانوادگی ممکن است در پایگاه‌های داده‌ای پراکنده باشند که شناسه‌ها، قالب‌ها و واژگان متفاوتی به کار می‌برند. پیوند دادن این سوابق دشوار است؛ بنابراین حتی متخصصان نیز ممکن است تشخیصی را از دست بدهند. همچنین ممکن است متخصصان ژنوم کودک را پیش از آن توالی‌یابی کنند که یک ژن مرتبط یا واریانت‌های آن با بیماری پیوند داده شده باشند. با پیشرفت دانش علمی، همان داده‌ها می‌توانند پاسخ‌هایی را آشکار کنند که پیش‌تر کشفشان ناممکن بود.

بازتحلیل بیماری‌های نادر هم مسئلهhd علمی است و هم مسئله مرتبط با نگهداری و به‌روزرسانی داده‌ها. ژنوم بیمار ممکن است ثابت بماند، اما شواهد پیرامون آن پیوسته تغییر می‌کند: پژوهشگران ژن‌ها و واریانت‌های تازه‌ای را با بیماری پیوند می‌دهند، آزمایشگاه‌ها واریانت‌های قدیمی را دوباره طبقه‌بندی می‌کنند و پایگاه‌های موردی و مقاله‌ها مشاهدات تازه‌ای انباشته می‌کنند. هر به‌روزرسانی می‌تواند بازنگری در یک پرونده قدیمیِ بی‌نتیجه را ارزشمند کند؛ ازاین‌رو بسیاری از مؤسسات با انبوه فزاینده‌ای از ژنوم‌ها روبه‌رو می‌شوند که باید با یک پایگاه دانش در حال حرکت هماهنگ بمانند.

در این مطالعه، پژوهشگران روند کاری را چنان طراحی کردند که مدل به‌عنوان لایه‌ای استدلالی و توضیح‌محور روی خطوط پردازش ژنومی موجود عمل کند. به‌جای آنکه فقط یک ژن رتبه‌بندی‌شده برگرداند، از مدل خواسته شد ویژگی‌های بالینی، الگوی وراثت، شواهد واریانت و ادبیات علمی را در قالب توجیهی به هم وصل کند که بازبین انسانی بتواند آن را وارسی کند. 

بازتحلیل چگونه انجام شد

برای هر مورد، تیم بسته‌ای هویت‌زدایی‌شده آماده کرد که شامل اصطلاحات استاندارد Human Phenotype Ontology برای توصیف تظاهر بالینی بیمار، یادداشت‌های گاه‌به‌گاه پزشک و هر تشخیص بالینی توصیفی، فراداده‌هایی مانند سن و جنسیت، و یک جدول پالایش‌شده از واریانت‌ها بود. این جدول نادر بودن هر واریانت، اثر پیش‌بینی‌شده آن بر پروتئین کدشده، طبقه‌بندی ClinVar و کیفیت سیگنال را در میان اعضای خانواده موجود ثبت می‌کرد. بیشتر موارد شامل داده‌هایی از کودک و هر دو والد زیستی بود.

تیم از مدل خواست محتمل‌ترین توضیح مولکولی را پیشنهاد کند و نحوه رسیدن به نتیجه را نشان دهد. سپس پژوهشگران خروجی‌ها را با همان چارچوب ACMG/AMP بررسی کردند که آزمایشگاه‌های بالینی برای طبقه‌بندی واریانت‌های ژنتیکی به کار می‌برند. دست‌کم دو عضو تیم هر مورد پیشنهادی را بررسی کردند، اختلاف‌نظرها با اجماع حل شد و خروجی مدل هرگز به‌عنوان تشخیص تلقی نشد. یک یافته فقط زمانی تشخیص محسوب می‌شد که متخصصان واجد صلاحیت شواهد را بررسی کرده باشند، واریانت به‌عنوان بیماری‌زا یا احتمالاً بیماری‌زا طبقه‌بندی شده باشد، یک آزمایشگاه دارای گواهی CLIA آن را تأیید کرده باشد و نتیجه به خانواده اعلام شده باشد.

پیش از تحلیل موارد حل‌نشده، تیم روند کاری را روی مواردی با تشخیص‌های تثبیت‌شده اصلاح کرد. این روند در اجراهای تکراری، ژن و واریانت صحیح را در ۴۸ مورد از ۵۱ موردِ شامل انواعی از بیماری‌های نادر شناسایی کرد. در مجموعه‌ای شامل ۵۷ مورد عصبی‌عضلانی، این روند در ۴۵ موردِ اجراهای تکراری به تشخیص صحیح رسید. در یک مجموعه ۱۵ موردی از ژنوم‌های خوانش‌بلند، در همه موارد ژن صحیح را شناسایی کرد و در ۱۲ مورد هر دو آلل بیماری‌زا را مشخص کرد. این ارزیابی‌ها به بهبود اعلان‌ها کمک کردند و نشان دادند در چه مواردی بررسی متخصصان همچنان ضروری است.

امتیازهای اطمینانِ خودگزارش‌شده مدل با تشخیص‌های صحیح در این مواردِ پیش‌تر حل‌شده همبستگی داشت: میانگین حداقل امتیاز برای تشخیص‌های همواره درست ۸۵٫۶ و برای تشخیص‌های نادرست یا نامشخص ۴۲٫۱ بود. این امتیازها احتمال‌های کالیبره‌شده نبودند و تیم از آن‌ها به‌عنوان جایگزینی برای شواهد یا قضاوت بالینی استفاده نکرد. با این حال، این امتیازها به بازبینان متخصص کمک می‌کردند توجه خود را بر امیدوارکننده‌ترین تشخیص‌های احتمالی متمرکز کنند. 

نمودار روند کاری با عنوان «روند کاری AI با هدایت انسان برای بازتحلیل ژنومی بیماری‌های نادر» که نشان می‌دهد داده‌های هویت‌زدایی‌شده بیمار از تصمیم‌های انسانی، ترکیب شواهد توسط الگوهای زبانی بزرگ (LLM)، بررسی متخصص، آزمایش، تأیید بالینی و بازگرداندن نتایج به خانواده عبور می‌کند.

پژوهشگران چه یافتند

سپس تیم این روند کاری را بر چهار گروه از موارد پیش‌تر حل‌نشده اعمال کرد: کودکان دارای وضعیت‌های تکامل عصبی، افراد مبتلا به بیماری عصبی‌عضلانی نادر، کودکان و نوجوانان مبتلا به روان‌پریشی زودهنگام، و موارد مرگ ناگهانی و غیرمنتظره در کودکان. این‌ها موارد تازه‌ای نبودند که در انتظار نخستین بررسی باشند. بسیاری از آن‌ها پیش‌تر با چندین خط پردازش تجاری یا سازمانی بررسی شده و در تیم‌های چندرشته‌ای مطرح شده بودند.

نتایج بر اساس گروه

گروه

موارد

تشخیص‌های شناسایی‌شده

بازده

تکامل عصبی

100

10

10.0%

بیماری عصبی‌عضلانی

61

4

6.6%

مرگ ناگهانی و غیرمنتظره در کودکان

200

2

1.0%

روان‌پریشی زودهنگام

15

2

13.3%

مجموع

376

18

4.8%

به دلیل کوچک بودن گروه روان‌پریشی زودهنگام، درصد گزارش‌شده با عدم‌قطعیت بیشتری همراه است. بازده همچنین نشان می‌دهد هر گروه تا چه حد احتمال داشت توضیحی تک‌ژنی داشته باشد.

پس از آنکه مدل گزینه‌های احتمالی را شناسایی کرد و متخصصان بررسی و تأیید بالینی را کامل کردند، پزشکان در ۴٫۸٪ موارد به تشخیص رسیدند. این نرخ متوسط اما در این جمعیت معنادار است، زیرا بررسی‌های پیشین متخصصان نتوانسته بود موارد را حل کند. مطالعات مشابه بازتحلیل در مواردی که به‌دقت بررسی شده‌اند، افزایش‌های تک‌رقمی گزارش می‌کنند؛ بازده‌های بالاتر معمولاً از مطالعاتی به دست می‌آیند که شامل موارد تازه یا اختلالات شناخته‌شده در انتظار تأیید ژنتیکی هستند.

از ۱۸ تشخیص، ۷ مورد کشف دوباره بود: تشخیص‌هایی که بیرون از روند کاری پژوهشی محلی تثبیت شده بودند، اما در سوابقی که تیم بررسی کرد وجود نداشتند. در چند مورد، واریانت‌ها از پیش در پایگاه‌های داده عمومی به‌عنوان بیماری‌زا یا احتمالاً بیماری‌زا فهرست شده بودند؛ موضوعی که چالش عملیاتی ترکیب اطلاعات از منابع داده‌ای مختلف را برجسته می‌کند.

نشان دادن انعطاف‌پذیری در شناسایی واریانت‌ها

در یکی از موارد روان‌پریشی زودهنگام، مدل یک رخداد ساختاری در ژنوم را استنباط کرد که در داده‌های ورودی فهرست نشده بود. این مدل زنجیره‌ای از خوانش‌های کم‌کیفیت روی کروموزوم ۲۲ را با ویژگی‌های قلبی، ایمنی، تکامل عصبی و روان‌پزشکی کودک مرتبط کرد و سپس حذف 22q11.2 را، که با نشانگان دی‌جورج مرتبط است، به‌عنوان فرضیه مطرح کرد. این واریانت فرضی با توالی‌یابی تکمیلی ژنوم تأیید شد.

گرچه اعلان خواسته بود یک علت تک‌ژنی ارائه شود، مدل گاهی دو ژن را شناسایی می‌کرد که یک تظاهر پیچیده را بهتر توضیح می‌دادند. واریانت‌های LAMA2 و FOXP1 در کنار هم به توضیح ویژگی‌های عضلانی و تکامل عصبی در یک مورد کمک کردند؛ مورد دیگری نیز توضیحی دوژنی و پیش‌تر ناشناخته داشت که TTN و SRPK3 را دربر می‌گرفت.

تولید فرضیه‌ای آزمون‌پذیر و از نظر زیستی منسجم

افزون بر تشخیص‌ها، مدل یک توضیح سازوکاریِ احتمالاً نو برای بیماری‌ای به نام ویتیلیگو نیز شناسایی کرد. در یکی از موارد تکامل عصبی، مدل حذف ۱۱ اسیدآمینه‌ای در S1PR1 را در فردی مبتلا به ویتیلیگو برجسته کرد. S1PR1 گیرنده‌ای سطح سلولی را کد می‌کند که در پیام‌رسانی، حرکت سلول‌های ایمنی و زیست‌شناسی بافت نقش دارد. مدل شواهدی را یکپارچه کرد که نشان می‌داد این حذف می‌تواند ساختار و پیام‌رسانی گیرنده را به شیوه‌هایی تغییر دهد که تولید رنگدانه را کاهش می‌دهد و در عین حال به ماندگاری سلول‌های ایمنی در پوست کمک می‌کند.

رابطه پیشنهادی میان S1PR1 و ویتیلیگو به اعتبارسنجی تجربی بیشتری نیاز دارد، اما نقش قدرتمند AI را در تبدیل یافته‌های پراکنده از زیست‌شناسی ساختاری، ایمنی‌شناسی و ژنتیک بالینی به فرضیه‌های ملموس و آزمون‌پذیر نشان می‌دهد.

تیم همچنین در گروه عصبی‌عضلانی گسترش احتمالی فنوتیپ را مشاهده کرد. واریانت‌های آسیب‌زننده در HSPB8 و CDK13 با شناخته‌شده‌ترین اختلالات این ژن‌ها کاملاً منطبق نبودند؛ موضوعی که طیف بالینی گسترده‌تری را مطرح می‌کند و برای آزمودن آن به موارد بیشتر و کار آزمایشگاهی نیاز است.

مطالعه موردی: تشخیص کایرا پس از نزدیک به دو دهه

همه‌چیز از کلاس کاراته شروع شد؛ وقتی مادر کایرا متوجه شد دختر ۹ ساله‌اش دیگر مثل گذشته در حالت‌های ایستادن پایین نمی‌رود. کایرا هنگام تمرین فوتبال هم کندتر شده بود و هنگام راه رفتن و دویدن روی پنجه‌های پا می‌ماند. پزشک کودکان او نتوانست علت ضعف عضلانی‌اش را شناسایی کند، بنابراین او را به متخصص ارجاع داد. پس از آن سفری نزدیک به ۲۰ سال از آزمایش‌ها، درمان‌ها و مشاوره‌ها آغاز شد، بی‌آنکه تشخیصی به دست آید.

پرونده کایرا یکی از چهار تشخیصی بود که در گروه عصبی‌عضلانی مطرح شد. تیم وضعیت او را به یک واریانت تغییر قاب خوانش در HSPB8 پیوند داد و نوعی میوپاتی میوفیبریلار را تشخیص داد؛ بیماری‌ای که در آن ساختارهای پروتئینی غیرطبیعی در فیبرهای عضلانی تجمع می‌یابند و به ضعف کمک می‌کنند. یک مشاور ژنتیک از مرکز منتون حدود یک هفته پیش از تولد ۲۸ سالگی کایرا با او تماس گرفت.

تا آن زمان، کایرا بخش بزرگی از زندگی‌اش را صرف سازگار شدن با بیماری کرده بود. او تا ۱۳ سالگی به ونتیلاتور وابسته و روی ویلچر بود، هرچند وضعیتش از آن زمان تاکنون ثابت مانده است. گرچه نوع میوپاتی میوفیبریلار کایرا آن‌قدر نادر است که درباره سیر بلندمدت آن اطلاعات کمی وجود دارد، این تشخیص تا حدی به بلاتکلیفی پایان داده است.

محدودیت‌ها

این مطالعه نشان می‌دهد که یک مدل استدلال عمومی می‌تواند با ترکیب فنوتیپ، وراثت، حاشیه‌نویسی‌های واریانت، الگوهای کیفیت داده و ادبیات علمی در قالب فرضیه‌های قابل بررسی، به بازتحلیل ژنومی گذشته‌نگر کمک کند. همچنین نشان می‌دهد چرا بازتحلیل دوره‌ای اهمیت دارد: برخی پاسخ‌ها فقط پس از پیشرفت دانش یا کنار هم قرار گرفتن سوابق پراکنده آشکار می‌شوند.

این پژوهش شواهدی نیست مبنی بر اینکه بیماران، پزشکان یا مشتریان باید از مدل‌های OpenAI برای تشخیص بیماری یا گرفتن تصمیم‌های پزشکی استفاده کنند. این مطالعه هیچ کاربرد مورد نظر برای مشتریان را در زمینه تشخیص با OpenAI o3 تحقیق عمیق، ChatGPT یا هر محصول دیگر OpenAI توصیف یا تأیید نمی‌کند. مدل هیچ شرکت‌کننده‌ای را تشخیص نداد؛ پزشکان و دیگر متخصصان بالینی واجد صلاحیت همه تشخیص‌ها را از طریق فرایندهای تثبیت‌شده بررسی، آزمایش و تأیید بالینی انجام دادند.

این مطالعه گذشته‌نگر بود، گروه‌ها ناهمگون بودند و بازبینان نسبت به اطمینان مدل کور نشده بودند. پژوهشگران زمان صرفه‌جویی‌شده، هزینه، تلاش پزشک، حجم کار ناشی از مثبت‌های کاذب یا تغییرات در مراقبت را اندازه‌گیری نکردند. آن‌ها همچنین دیگر شکل‌های تنوع ژنتیکی، مانند واریانت‌های ساختاری، گسترش‌های تکراری، تغییرات عمیق درون‌اینترونی یا موزاییسم را به‌طور نظام‌مند ارزیابی نکردند.

الگوهای زبانی بزرگ می‌توانند زمینه را نادرست بخوانند یا توضیح‌هایی باورپذیر تولید کنند که با بررسی دقیق‌تر ناکام می‌مانند. بنابراین هر نتیجه از داوری انسانی و تأیید بالینی گذشت. مدل دامنه جست‌وجو را گسترش داد و تحلیل بعدیِ تحت رهبری انسان را متمرکز کرد؛ اما درباره اینکه چه اطلاعات یا تشخیصی باید به خانواده ارائه شود تصمیم نگرفت.

این مطالعه از اطلاعات هویت‌زدایی‌شده استفاده کرد و هیچ اطلاعات سلامت حفاظت‌شده‌ای خارج از محیط‌های تأییدشده به کار گرفته یا منتقل نشد. استقرار بالینی گسترده‌تر به همان توجه به حریم خصوصی، امنیت، قابلیت حسابرسی و مقررات محلی نیاز خواهد داشت که برای همه مراقبت‌های پزشکی لازم است. دسترسی به مدل، جایگزین زیرساخت توالی‌یابی، مشاوره ژنتیک، آزمایش تأییدی یا قضاوت متخصص نمی‌شود.

پس‌زمینه گرادیانی آبی انتزاعی با گذارهای نرم میان آبی روشن، فیروزه‌ای و آبی تیره که جلوه‌ای صاف و محو ایجاد می‌کند.

«گلوگاه، زمان است. یک متخصص فقط می‌تواند مقدار محدودی از روز خود را به هر فرد مشخص اختصاص دهد.»

دکتر کاترین براونستین، مرکز منتون برای پژوهش بیماری‌های یتیم در بیمارستان کودکان بوستون

پس‌زمینه گرادیانی آبی انتزاعی با گذارهای نرم میان آبی روشن، فیروزه‌ای و آبی تیره که جلوه‌ای صاف و محو ایجاد می‌کند.

«پژوهشگرانی مثل کاترین و من نمی‌توانیم ۸۰۰۰ بیماری مختلف را در ذهنمان نگه داریم. قدرت AI همین است.»

آلن بگز، مدیر مرکز منتون برای پژوهش بیماری‌های یتیم

گام بعدی چیست

مطالعات آینده‌نگر و چندمرکزی باید بازتحلیل با کمک الگوهای زبانی بزرگ (LLM) را از نظر بازده تشخیصی، زمان لازم برای رسیدن به یک تشخیص احتمالی، بار کاری پزشک، میزان نتایج مثبت کاذب، هزینه و تأثیر بر مراقبت با رویه استاندارد مقایسه کنند. اعلان‌های نسخه‌بندی‌شده، راستی‌آزمایی منابع، گزارش‌های حسابرسی و برآوردهای کالیبره‌شده از عدم‌قطعیت برای بازتولیدپذیری و ایمنی اهمیت خواهند داشت. چنین مطالعاتی همچنان به پزشکان واجد صلاحیت نیاز خواهند داشت تا شواهد را ارزیابی کنند، آزمایش‌های مناسب را تجویز کنند و هرگونه تصمیم تشخیصی یا درمانی را بگیرند.

این مطالعه از OpenAI o3 تحقیق عمیق استفاده کرد. مدل‌های عمومی جدیدتر می‌توانند حجم بیشتری از منابع علمی را جست‌وجو و ترکیب کنند، در حالی که سامانه‌های اختصاصی مانند GPT‑Rosalind برای کارهای عمیق‌تر در علوم زیستی طراحی شده‌اند؛ از جمله بررسی اثر واریانت‌ها بر ساختار و عملکرد پروتئین. این قابلیت‌ها در این مطالعه آزموده نشدند و به ارزیابی‌ها و کنترل‌های دسترسی جداگانه نیاز خواهند داشت.

اگرچه OpenAI در پشتیبانی از این مطالعه پژوهشی اولیه نقش داشت، مرکز منتون مرحله بعدی این پروژه را با استفاده از کمک‌هزینه‌ای از بنیاد OpenAI هدایت خواهد کرد. این کمک‌هزینه از تلاش گسترده‌تر مرکز برای توسعه یک دستیار ژنتیک مبتنی بر هوش مصنوعی، کم‌هزینه و مستقل از پلتفرم پشتیبانی می‌کند که به تیم‌های بالینی کمک می‌کند موارد بیماری‌های نادر را سریع‌تر و با ثبات بیشتری تحلیل کنند.

فرصت پژوهشی بلندمدت این است که بررسی شود آیا بازتحلیلِ به رهبری متخصص و با کمک AI می‌تواند به همگام ماندن فهم علمی با کشفیات کمک کند یا نه. وعده این نیست که AI جایگزین تشخیص پزشک شود، بلکه این است که ابزارهای پژوهشیِ با دقت ارزیابی‌شده ممکن است به متخصصان کمک کنند شواهد ارزشمند برای پیگیری را شناسایی کنند. برای هزاران خانواده، پرسش‌های بی‌پاسخ امروز لازم نیست برای همیشه بی‌پاسخ بمانند.

  • ۲۰۲۶

نویسنده

OpenAI