Как ИИ помогает врачам диагностировать редкие генетические заболевания у детей
В исследовании, опубликованном в NEJM AI, эксперты использовали модель рассуждений OpenAI для повторного анализа 376 ранее недиагностированных случаев, что позволило обнаружить наводки для постановки 18 диагнозов.
Даже при геномном секвенировании многие люди с редкими заболеваниями так и не получают четкого генетического диагноза. Примерно половина пациентов остается без диагноза даже после всестороннего тестирования и консилиума специалистов. В их медицинских данных могут крыться важные зацепки, однако их поиск требует просеивания тысяч или миллионов потенциальных генетических вариантов, разрозненных клинических записей и быстро меняющейся научной литературы.
По мере накопления новых данных о связях между генами и заболеваниями, описаний клинических случаев и критериев классификации, ранее недиагностированные случаи могут поддаваться новой интерпретации.
Исследователи из Центра исследований орфанных заболеваний им. Мантона при Бостонской детской больнице, Гарвардского университета и OpenAI использовали модель рассуждений OpenAI o3 для глубокого исследования, чтобы проанализировать обезличенную клиническую и геномную информацию по 376 ранее изученным, но оставшимся недиагностированными случаям. Модель выявляла для исследователей и врачей-клиницистов возможные объяснения, подкрепленные доказательствами, для дальнейшего рассмотрения. После экспертной проверки, дополнительного тестирования и клинического подтверждения врачи установили диагнозы в 18 случаях — дополнительная эффективность диагностики составила 4,8% после более раннего анализа специалистами. Исследование было опубликовано 18 июня 2026 года в NEJM AI и показывает, как исследовательский процесс с поддержкой AI может помочь экспертам находить зацепки при повторном рассмотрении некоторых из самых сложных случаев.
Многие из этих случаев годами не поддавались экспертному анализу. В этом исследовании модель OpenAI o3 для глубокого исследования помогла исследователям выявить зацепки, которые затем оценивались в рамках установленных клинических процессов; это указывает на то, что периодический повторный анализ под руководством экспертов может стать более масштабируемым по мере развития знаний. Модель не ставила диагноз ни одному пациенту и не принимала никаких клинических решений. Она формировала подкрепленные доказательствами гипотезы, чтобы специалисты могли их рассмотреть и при необходимости изучить с помощью дополнительных тестов и подтвердить в клинической лаборатории.
Неопределенный результат генетического теста не всегда является окончательным. Описания фенотипа пациента, результаты тестов и семейный анамнез могут быть распределены по разным базам данных, использующим различные идентификаторы, форматы и номенклатуры. Связать эти записи трудно, поэтому даже специалисты могут пропустить диагноз. Эксперты также могут секвенировать геном ребенка до того, как соответствующий ген или его варианты будут связаны с заболеванием. По мере развития научных знаний те же данные могут раскрывать ответы, которые раньше было невозможно обнаружить.
Повторный анализ редких заболеваний —Повторный анализ редких заболеваний — это одновременно научная задача и задача технической поддержки (актуализации данных). Геном пациента может оставаться тем же, но научные данные о нем постоянно меняются: исследователи связывают с заболеваниями новые гены и варианты, лаборатории переклассифицируют старые варианты, а базы клинических случаев и статьи накапливают новые наблюдения. Каждое обновление может сделать старый неопределенный случай достойным повторного рассмотрения, поэтому во многих учреждениях накапливается растущий бэклог геномов, которые необходимо синхронизировать с меняющейся базой знаний.
В этом исследовании ученые спроектировали процесс так, чтобы модель выступала в качестве слоя модели рассуждений, ориентированного прежде всего на объяснения, поверх существующих геномных конвейеров. Вместо того чтобы выдавать лишь ранжированный список генов, систему просили связать клинические признаки, характер наследования, доказательную базу вариантов и научную литературу в единое обоснование, которое эксперт-человек мог бы верифицировать.
Для каждого случая команда собирала обезличенный пакет данных, содержащий стандартизированные термины Онтологии фенотипов человека (HPO) для описания клинической картины пациента, сопутствующие заметки врачей и любые описательные клинические диагнозы, метаданные (такие как возраст и пол), а также отфильтрованную таблицу генетических вариантов. В таблице фиксировались редкость каждого варианта, его прогнозируемое влияние на кодируемый белок, классификация ClinVar и качество данных секвенирования у доступных членов семьи. Большинство клинических случаев содержали данные ребенка и обоих биологических родителей.
Команда попросила модель предложить наиболее правдоподобное молекулярное объяснение и показать ход работы. Затем исследователи проверяли результаты с использованием той же системы ACMG/AMP, которую клинические лаборатории применяют для классификации генетических вариантов. Каждого кандидата рассматривали как минимум два члена команды, разногласия решались консенсусом, а вывод модели никогда не считался диагнозом. Находка засчитывалась как диагноз только после того, как квалифицированные эксперты проверяли доказательства, вариант классифицировался как патогенный или вероятно-патогенный, лаборатория, сертифицированная CLIA, подтверждала его, а клиническая команда сообщала результат семье.
Прежде чем анализировать недиагностированные случаи, команда отточила рабочий процесс на случаях с уже установленными диагнозами. В ходе двух независимых запусков процесс правильно определил нужный ген и вариант в 48 из 51 случая, включавших самые разные редкие патологии. В наборе из 57 нейромышечных заболеваний система выдала верный диагноз в обоих запусках для 45 случаев. В наборе из 15 геномов, секвенированных длинными прочтениями, модель указала правильный ген в каждом из случаев и оба патогенных аллеля в 12 случаях. Эти тесты помогли в оптимизации промптов и наглядно показали, на каких этапах участие экспертов остается критически важным.
Выставляемые моделью оценки уверенности коррелировали с правильными диагнозами в этих случаях с уже известным анамнезом: средний минимальный балл составлял 85,6 для стабильно верных результатов определения и 42,1 — для неверных или неизвестных. Эти оценки не являлись калиброванными вероятностями, и команда не использовала их в качестве замены доказательной базе или официальному клиническому заключению. Однако они помогали экспертам сосредоточить внимание на наиболее перспективных потенциальных диагнозах.
Затем команда применила рабочий процесс к четырем группам ранее недиагностированных случаев: детям с расстройствами нейропсихического развития, пациентам с редкими нейромышечными заболеваниями, детям и подросткам с ранним психозом, а также к случаям внезапной детской смерти. Это не были новые случаи, ожидавшие первичного осмотра. Многие из них уже исследовались с помощью различных коммерческих программ или внутренних биоинформатических платформ медицинских центров, а также обсуждались на междисциплинарных консилиумах.
Когорта | Случаев | Выявлено диагнозов | Результативность |
Нарушения нейроразвития | 100 | 10 | 10,0% |
Нервно-мышечные заболевания | 61 | 4 | 6,6% |
Внезапная неожиданная смерть в педиатрии | 200 | 2 | 1,0% |
Ранний психоз | 15 | 2 | 13,3% |
Итого | 376 | 18 | 4,8% |
Группа пациентов с ранним психозом была небольшой, поэтому расчетная доля имеет широкий доверительный интервал. Эффективность диагностики в данном случае также отражает то, насколько вероятным для каждой выборки было наличие моногенной причины заболевания.
После того как модель выявила кандидатов, а эксперты завершили проверку и клиническое подтверждение, врачи установили диагнозы в 4,8% случаев. Этот показатель невелик, но значим для этой популяции, потому что предыдущие экспертные проверки не смогли разрешить эти случаи. Похожие исследования повторного анализа сообщают об однозначном процентном приросте в тщательно рассмотренных случаях; более высокая результативность обычно наблюдается в исследованиях с новыми случаями или хорошо известными расстройствами, ожидающими генетического подтверждения.
Из 18 диагнозов 7 были повторными открытиями: диагнозами, установленными вне локального исследовательского процесса, но отсутствовавшими в записи, которую рассматривала команда. В нескольких случаях варианты уже были указаны как патогенные или вероятно-патогенные в публичных базах данных, что подчеркивает операционную сложность синтеза информации из разных источников.
В одном из клинических случаев с ранним психозом модель предположила наличие структурной перестройки в геноме, которая не была указана во входных данных. ИИ связал последовательность низкокачественных прочтений на 22-й хромосоме с кардиологическими, иммунными, психиатрическими нарушениями и особенностями нейропсихического развития ребенка, после чего выдвинул гипотезу о наличии делеции 22q11.2, характерной для синдрома ДиДжорджи. Этот предполагаемый генетический вариант был успешно подтвержден в ходе последующего секвенирования генома.
Хотя в промпте запрашивалась одна моногенная причина, модель иногда выявляла два гена, которые точнее объясняли сложную клиническую картину. Так, в одном случае генетические варианты в генах LAMA2 и FOXP1 в совокупности позволили объяснить мышечные нарушения и особенности нейропсихического развития пациента, а в другом — было выявлено ранее не распознанное дигенное наследование с участием генов TTN и SRPK3.
Помимо постановки диагнозов, модель предложила возможное объяснение нового молекулярного механизма развития витилиго. В одном из клинических случаев, связанных с расстройством нейропсихического развития, модель выявила делецию одиннадцати аминокислот в гене S1PR1 у пациента с витилиго. S1PR1 кодирует рецептор клеточной поверхности, участвующий в передаче клеточных сигналов, миграции иммунных клеток и физиологии тканей. Модель обобщила данные, указывающие на то, что эта делеция способна изменить структуру рецептора и внутриклеточный сигнальный путь таким образом, что это снижает выработку пигмента и одновременно помогает иммунным клеткам закрепляться в коже.
Предложенная связь между геном S1PR1 и витилиго требует дополнительной экспериментальной проверки, однако она наглядно демонстрирует важнейшую роль ИИ в объединении разрозненных данных структурной биологии, иммунологии и клинической генетики и их преобразовании в конкретные, проверяемые гипотезы.
Команда также выявила возможное расширение фенотипа в группе пациентов с нейромышечными заболеваниями. Патогенные варианты в генах HSPB8 и CDK13 не полностью соответствовали клинической картине наиболее известных заболеваний, связанных с этими генами. Это указывает на более широкий клинический спектр их проявлений, который еще предстоит проверить на большем объеме клинических данных и в лабораторных исследованиях.
Клинический случай: диагноз Кайры спустя почти два десятилетия
Все началось на занятии карате, когда мама Кайры заметила, что ее 9-летняя дочь уже не садится в стойках так низко, как раньше. Кайра также стала медленнее двигаться на футбольных тренировках и ходила и бегала, приподнимаясь на носках. Ее педиатр не смог определить причину мышечной слабости и направил ее к специалисту. Затем последовал почти 20-летний путь через анализы, лечение и консультации без диагноза.
Случай Кайры стал одним из четырех диагнозов, поставленных в группе пациентов с нейромышечными заболеваниями. Команда связала её состояние с вариантом со сдвигом рамки считывания в гене HSPB8 и диагностировала форму миофибриллярной миопатии. При этой патологии в мышечных волокнах накапливаются аномальные белковые структуры, что и приводит к развитию мышечной слабости. Генетический консультант из Центра им. Мантона позвонил Кайре примерно за неделю до её 28-летия.
К тому времени Кайра провела значительную часть жизни, приспосабливаясь к болезни. К 13 годам она уже зависела от аппарата ИВЛ и передвигалась в инвалидной коляске, хотя с тех пор ее состояние стабилизировалось. Форма миофибриллярной миопатии у Кайры настолько редка, что о ее долгосрочном течении известно мало, диагноз внес некоторую ясность.
Это исследование показывает, что модель рассуждений общего назначения может эффективно применяться для ретроспективного повторного геномного анализа. Она способна объединять данные о фенотипе, типе наследования, аннотациях генетических вариантов, показателях качества данных и научной литературе в обоснованные гипотезы, готовые к экспертной проверке. Проект также наглядно иллюстрирует важность периодического повторного анализа: некоторые ответы удается найти только по мере прогресса в научных знаниях или после объединения разрозненных медицинских данных.
Данное исследование не является основанием для того, чтобы пациенты, медицинские специалисты или пользователи применяли модели OpenAI для диагностики заболеваний либо принятия медицинских решений. Оно не описывает и не одобряет использование по прямому назначению модели OpenAI o3 для глубокого исследования, ChatGPT или любых других продуктов OpenAI в целях диагностики. Модель не ставила диагноз ни одному из участников исследования; каждый диагноз устанавливался исключительно врачами и другими квалифицированными медицинскими экспертами в рамках стандартных процедур анализа, тестирования и клинического подтверждения.
Исследование было ретроспективным, выборки пациентов — гетерогенными (разнородными), а оценка проводилась открытым методом, при котором эксперты знали об уровне уверенности модели. Исследователи не замеряли такие показатели, как экономия времени, финансовые затраты, трудозатраты врачей, нагрузка, связанная с ложноположительными результатами, или изменения в тактике лечения. Они также систематически не оценивали другие типы генетических вариантов, такие как структурные варианты, экспансии нуклеотидных повторов, глубокие интронные мутации или мозаицизм.
Большие языковые модели могут неверно считывать контекст или создавать правдоподобные объяснения, которые не выдерживают более тщательной проверки. Поэтому каждый результат проходил человеческий арбитраж и клиническое подтверждение. Модель расширяла поиск и фокусировала последующий анализ, проводимый людьми; она не решала, какую информацию или диагноз следует сообщить семье.
В исследовании использовались деидентифицированные (обезличенные) данные; сведения, составляющие врачебную тайну, и персональные данные пациентов не применялись и не передавались за пределы защищенного контура авторизованных систем. Масштабное клиническое внедрение технологии потребует соблюдения тех же строгих стандартов конфиденциальности, безопасности, возможности проведения аудита и требований местного законодательства, которые применяются ко всей системе здравоохранения. Доступ к модели не заменяет собой инфраструктуру секвенирования, генетическое консультирование, подтверждающее тестирование или экспертное заключение профильных специалистов.

«Узкое место — это время. Эксперт может посвятить одному конкретному человеку лишь ограниченную часть своего дня».
Д-р Кэтрин Браунштейн, Центр исследований орфанных заболеваний им. Мантона при Бостонской детской больнице

«Такие исследователи, как Кэтрин и я, просто физически не могут держать в голове 8000 различных заболеваний. И именно в этом заключается сила ИИ».
Алан Беггс, директор Центра исследований орфанных заболеваний им. Мантона
Проспективные многоцентровые исследования должны сопоставить повторный анализ с поддержкой LLM со стандартной практикой по таким критериям, как эффективность диагностики, время поиска потенциального диагноза, трудозатраты врачей, нагрузка в виде ложноположительных результатов, стоимость и влияние на процесс лечения. Версионирование промптов, проверка перекрестных ссылок, журналы аудита и калиброванные показатели неопределенности будут иметь важное значение для воспроизводимости результатов и безопасности. Подобные исследования по-прежнему потребуют участия квалифицированных клиницистов для оценки доказательной базы, назначения соответствующих тестов и принятия любых диагностических или лечебных решений.
В этом исследовании использовалась модель OpenAI o3 для глубокого исследования. Более новые модели общего назначения способны искать и обобщать большие объемы научной литературы, в то время как специализированные системы, такие как GPT‑Rosalind, созданы для более глубоких биомедицинских исследований, включая анализ влияния генетических вариантов на структуру и функции белков. Эти возможности в рамках данного исследования не тестировались — они потребуют отдельных оценок и настройки прав доступа.
Хотя компания OpenAI оказала поддержку на начальном этапе этого исследования, следующим этапом работы будет руководить Центр им. Мантона за счет гранта от фонда OpenAI Foundation. Грант пойдет на финансирование более масштабного проекта Центра по созданию не зависящего от конкретной платформы (кроссплатформенного) и доступного по стоимости ИИ-ассистента в области генетики, который поможет медицинским специалистам быстрее и с более стабильным качеством анализировать случаи редких заболеваний.
Долгосрочная исследовательская возможность заключается в том, чтобы изучить, может ли повторный анализ с поддержкой ИИ под руководством экспертов помочь научному пониманию успевать за открытиями. Суть перспективы не в том, что ИИ заменит диагноз врача, а в том, что тщательно оцененные исследовательские инструменты могут помочь специалистам находить доказательства, заслуживающие изучения. Для тысяч семей вопросы, оставшиеся без ответа сегодня, не должны оставаться без ответа навсегда.
- 2026


