18 червня 2026 р.

Прикладний ШІ

Використання ШІ для допомоги в діагностиці рідкісних генетичних захворювань у дітей

У дослідженні NEJM AI експерти використали модель міркування OpenAI для повторного аналізу 376 недіагностованих випадків і пошуку зачіпок для 18 діагнозів.

Читати анотацію дослідження в NEJM AI

Завантаження…

Навіть за умови проведення геномного секвенування багато людей із рідкісними захворюваннями так і не отримують чіткого генетичного діагнозу. Приблизно половина залишається без діагнозу після ґрунтовного тестування та огляду фахівців. Їхні медичні дані можуть містити підказки, але щоб їх знайти, іноді потрібно просіяти від тисяч до мільйонів можливих генетичних варіантів, фрагментовані клінічні записи та наукову літературу, що швидко змінюється.

У міру накопичення нових зв’язків між генами й хворобами, описів випадків і доказів для класифікації недіагностовані випадки можуть ставати придатними для нового тлумачення.

Дослідники з Manton Center for Orphan Disease Research Бостонської дитячої лікарні, Гарвардського університету та OpenAI використали модель міркування OpenAI o3 для поглибленого дослідження, щоб проаналізувати деідентифіковану клінічну й геномну інформацію з 376 раніше проаналізованих випадків, які залишалися недіагностованими. Модель виявляла пов’язані з доказами кандидатні пояснення для перегляду дослідниками та клініцистами. Після експертного перегляду, додаткового тестування та клінічного підтвердження лікарі встановили діагнози у 18 випадках — додатковий діагностичний вихід 4,8% після попереднього аналізу фахівцями. Це дослідження було опубліковане 18 червня 2026 року в NEJM AI, і воно показує, як дослідницький процес за допомогою ШІ може допомагати експертам знаходити зачіпки під час повторного розгляду деяких із найскладніших випадків.

Багато з цих випадків роками не піддавалися експертному аналізу. У цьому дослідженні OpenAI o3 у режимі Deep Research допоміг дослідникам визначити зачіпки, які згодом оцінювали через усталені клінічні процеси; це свідчить про те, що періодичний повторний аналіз під керівництвом експертів може ставати масштабованішим у міру розвитку знань. Модель не діагностувала жодного пацієнта й не ухвалювала жодного клінічного рішення. Вона створювала пов’язані з доказами гіпотези для перегляду фахівцями та, за потреби, для подальшого дослідження додатковими тестами й підтвердження в клінічній лабораторії.

Чому старий випадок може містити нову відповідь

Непереконливий генетичний тест не завжди є остаточним результатом. Описи фенотипу пацієнта, результати тестів і сімейний анамнез можуть бути розділені між базами даних, що використовують різні ідентифікатори, формати й словники. Пов’язувати такі записи складно, тому навіть фахівці можуть пропустити діагноз. Експерти також можуть секвенувати геном дитини ще до того, як відповідний ген або його варіанти буде пов’язано з хворобою. У міру розвитку наукових знань ті самі дані можуть відкривати відповіді, які раніше було неможливо знайти.

Повторний аналіз рідкісних захворювань є водночас науковою та операційною проблемою. Геном пацієнта може залишатися тим самим, але докази навколо нього постійно змінюються: дослідники пов’язують нові гени й варіанти з хворобами, лабораторії перекласифіковують старі варіанти, а бази даних випадків і статті накопичують нові спостереження. Кожне оновлення може зробити старий непереконливий випадок вартим повторного розгляду, тож багато установ успадковують дедалі більший список геномів, які потрібно синхронізувати з постійним ростом бази знань.

У цьому дослідженні науковці спроєктували робочий процес так, щоб модель діяла як орієнтований передусім на пояснення шар міркування поверх наявних геномних конвеєрів. Замість повертати лише ранжований ген, її попросили поєднати клінічні ознаки, модель успадкування, докази щодо варіанта й наукову літературу в обґрунтування, яке міг би перевірити рецензент-людина.

Як працював повторний аналіз

Для кожного випадку команда зібрала деідентифікований пакет зі стандартизованими термінами Human Phenotype Ontology для опису клінічної картини пацієнта, окремими нотатками клініцистів і будь-яким описовим клінічним діагнозом, метаданими на кшталт віку та статі, а також відфільтрованою таблицею варіантів. Таблиця фіксувала рідкісність кожного варіанта, його прогнозований вплив на закодований білок, класифікацію ClinVar і якість сигналу серед доступних до контакту членів родини. Більшість випадків містила дані дитини й обох біологічних батьків.

Команда попросила модель запропонувати найімовірніше молекулярне пояснення та показати хід роботи. Потім дослідники переглянули результати за тими самими принципами ACMG/AMP, які клінічні лабораторії використовують для класифікації генетичних варіантів. Кожну пропозицію переглядали щонайменше двоє членів команди, розбіжності вирішували консенсусом; вихідні дані моделі ніколи не розглядали як діагноз. Знахідка вважалася діагнозом лише після того, як кваліфіковані експерти переглядали докази, варіант класифікували як патогенний або ймовірно патогенний, лабораторія з сертифікацією CLIA підтверджувала його, а клінічна команда повідомляла результат родині.

Перед аналізом недіагностованих випадків команда вдосконалила робочий процес на випадках із встановленими діагнозами. У повторних запусках вона відновила правильний ген і варіант у 48 із 51 випадку, що охоплювали різні рідкісні стани. У наборі з 57 нервово-м’язових випадків робочий процес у повторних запусках повернув правильний діагноз для 45 випадків. У наборі з 15 випадків довгопрочитаного геному він назвав правильний ген у кожному випадку та обидва хвороботворні алелі у 12 випадках. Ці оцінювання допомогли розробити запит і показали, де експертний перегляд залишався необхідним.

Оцінки впевненості, які модель повідомляла сама, узгоджувалися з правильними діагнозами в цих раніше розв’язаних випадках: середній мінімальний бал становив 85,6 для стабільно правильних викликів і 42,1 для неправильних або невідомих викликів. Оцінки не були каліброваними ймовірностями, і команда не використовувала їх як заміну доказам або клінічному розгляду. Але вони допомагали спрямовувати експертів-рецензентів на найперспективніші варіанти діагнозів.

Схема робочого процесу під назвою «Робочий процес ШІ під керівництвом людини для геномного повторного аналізу рідкісних захворювань»: деідентифіковані дані пацієнтів проходять через рішення людей, збір доказів LLM, експертний перегляд, тестування, клінічне підтвердження та передачу результатів родині.

Що виявили дослідники

Далі команда застосувала робочий процес до чотирьох груп раніше недіагностованих випадків: дітей із порушеннями нейророзвитку, людей із рідкісним нервово-м’язовим захворюванням, дітей і підлітків із раннім психозом та випадків раптової смерті в ранньому віці. Це не були нові випадки, які чекали на перший перегляд. Багато з них уже досліджували кілька комерційних або інституційних конвеєрів і обговорювали мультидисциплінарні команди.

Результати за когортами

Когорта	Випадки	Отримані діагнози	Вихід
Порушення нейророзвитку	100	10	10,0%
Нервово-м’язове захворювання	61	4	6,6%
Раптова несподівана смерть у ранньому віці	200	2	1,0%
Ранній психоз	15	2	13,3%
Загалом	376	18	4,8%

Когорта раннього психозу була невеликою, тому її відсоток має широкий довірчий інтервал. Вихід також відображає ймовірність того, що кожна когорта мала моногенне пояснення.

Після того як модель виявила потенційні варіанти діагнозів, а експерти завершили перегляд і клінічне підтвердження, лікарі встановили остаточні діагнози у 4,8% випадків. Цей показник скромний, але значущий для цієї популяції, оскільки попередні експертні перегляди взагалі не дали змоги поставити діагноз. Подібні дослідження повторного аналізу повідомляють про однозначні прирости у ретельно переглянутих випадках; вищі виходи зазвичай дають дослідження з новими випадками або добре відомими розладами, що очікують генетичного підтвердження.

Із 18 діагнозів 7 були повторними відкриттями: діагнозами, встановленими поза локальним дослідницьким процесом, але відсутніми в записі, який переглядала команда. У кількох випадках варіанти вже були зазначені як патогенні або ймовірно патогенні в публічних базах даних, що підкреслює операційний виклик збору інформації з різних джерел даних.

Демонстрація гнучкості у виявленні варіантів

В одному випадку раннього психозу модель вивела структурну подію в геномі, якої не було зазначено у вхідних даних. Вона пов’язала серію низькоякісних викликів на хромосомі 22 із серцевими, імунними, нейророзвитковими та психіатричними симптомами дитини, а потім висунула гіпотезу про делецію 22q11.2, пов’язану із синдромом Ді Георга. Цей гіпотетичний варіант підтвердили подальшим секвенуванням геному.

Хоча запит вимагав одну моногенну причину, модель іноді виявляла два гени, які краще пояснювали складну клінічну картину. Варіанти в LAMA2 і FOXP1 разом допомогли пояснити м’язові та нейророзвиткові ознаки в одному випадку; в іншому було раніше нерозпізнане дигенне пояснення за участю TTN і SRPK3.

Створення придатної до перевірок, біологічно узгодженої гіпотези

Окрім діагнозів, модель також визначила можливе нове механістичне пояснення стану, який називається вітиліго. В одному випадку порушення нейророзвитку модель виділила делецію 11 амінокислот у S1PR1 в людини з вітиліго. S1PR1 кодує рецептор клітинної поверхні, залучений до сигналізації, руху імунних клітин і біології тканин. Модель інтегрувала докази, які свідчили, що делеція може змінювати структуру рецептора й сигналізацію так, що це зменшує вироблення пігменту й водночас допомагає імунним клітинам зберігатися в шкірі.

Запропонований зв’язок між S1PR1 і вітиліго потребує додаткової експериментальної перевірки, але він ілюструє потужну роль ШІ у перетворенні розрізнених знахідок зі структурної біології, імунології та клінічної генетики на конкретні, перевірювані гіпотези.

Команда також побачила можливе розширення фенотипу в нервово-м’язовій когорті. Шкідливі варіанти в HSPB8 і CDK13 не повністю відповідали найвідомішим розладам, пов’язаним із цими генами, що вказує на ширший клінічний спектр, який потрібно буде перевірити на більшій кількості випадків і в лабораторній роботі.

Клінічний випадок Кайри: діагностування після майже двох десятиліть хвороби

Усе почалося на занятті з карате, коли мама Кайри помітила, що її 9-річна донька вже не опускається в стійках так низько, як раніше. Кайра також сповільнювалася на футбольних тренуваннях і під час ходьби та бігу трималася на носках. Її педіатр не зміг визначити причину м’язової слабкості, тож направив її до фахівця. Далі почалася майже 20-річна історія тестів, лікування та консультацій без діагнозу.

Випадок Кайри був одним із чотирьох діагнозів, виявлених у нервово-м’язовій когорті. Команда пов’язала її стан із варіантом зсуву рамки зчитування в HSPB8 і діагностувала форму міофібрилярної міопатії, за якої аномальні білкові структури накопичуються в м’язових волокнах і сприяють слабкості. Генетичний консультант із Manton Center повідомив Кайрі про її діагноз приблизно за тиждень до її 28-го дня народження.

На той час Кайра вже провела значну частину життя, пристосовуючись до хвороби. До 13 років вона залежала від апарата ШВЛ і пересувалася на кріслі колісному; відтоді її стан стабілізувався. Хоча форма міофібрилярної міопатії Кайри настільки рідкісна, що про її довгостроковий перебіг відомо мало, діагноз дав певну визначеність.

Обмеження

Це дослідження показує, що модель міркування загального призначення може допомагати ретроспективному геномному повторному аналізу, поєднуючи фенотип, успадкування, анотації варіантів, патерни якості даних і наукову літературу в гіпотези, придатні для перегляду. Воно також показує, чому періодичний повторний аналіз важливий: деякі відповіді з’являються лише після розвитку знань або об’єднання фрагментованих записів.

Це дослідження не є доказом того, що пацієнти, клініцисти чи клієнти мають використовувати моделі OpenAI для діагностики хвороб або ухвалення медичних рішень. Воно не описує й не схвалює передбачене використання клієнтами OpenAI o3 для поглибленого дослідження, ChatGPT чи будь-якого іншого продукту OpenAI для діагностики. Модель не діагностувала жодного учасника; лікарі та інші кваліфіковані клінічні експерти встановлювали кожен діагноз через усталені процеси перегляду, тестування та клінічного підтвердження.

Дослідження було ретроспективним, когорти — неоднорідними, а рецензенти знали про впевненість моделі. Дослідники не вимірювали зекономлений час, вартість, зусилля клініцистів, навантаження від хибнопозитивних результатів або зміни в лікуванні. Вони також систематично не оцінювали інші форми генетичної варіації, як-от структурні варіанти, повторні експансії, глибоко інтронні зміни або мозаїцизм.

Великі мовні моделі можуть неправильно зчитувати контекст або створювати правдоподібні пояснення, які згодом не витримують ретельнішої перевірки. Тому кожен результат проходив людський розгляд і клінічне підтвердження. Модель розширювала пошук і фокусувала подальший аналіз під керівництвом людей; вона не вирішувала, яку інформацію чи діагноз слід повідомити родині.

У цьому дослідженні використовували деідентифіковану інформацію; захищену медичну інформацію не використовували й не передавали за межі схвалених середовищ. Ширше клінічне впровадження вимагатиме такої самої уваги до приватності, безпеки, контрольованості та місцевого регулювання, яка застосовується до всієї сфери медичної допомоги. Доступ до моделі не замінює інфраструктуру секвенування, генетичне консультування, підтверджувальне тестування чи судження фахівця.

Абстрактний синій градієнтний фон із м’якими переходами між світло-синіми, блакитними та темно-синіми тонами, що створюють плавний розмитий ефект.

«Наше головне обмеження — час. Експерт може присвятити одній певній людині лише обмежену частину свого дня».

Докторка Кетрін Браунстайн, Manton Center for Orphan Disease Research Бостонської дитячої лікарні

«Дослідники на кшталт Кетрін і мене просто не можуть тримати в голові 8 000 різних хвороб. У цьому сила ШІ».

Алан Беггс, директор Manton Center for Orphan Disease Research

Що далі

Перспективні багатоцентрові дослідження мають порівняти повторний аналіз за допомогою LLM зі стандартною практикою за діагностичним виходом, часом до виявлення кандидата, зусиллями клініцистів, тягарем хибнопозитивних результатів, вартістю та впливом на лікування. Версійовані запити, перевірки посилань, журнали аудиту та калібрована невизначеність будуть важливими для відтворюваності й безпеки. Такі дослідження все одно потребуватимуть участі кваліфікованих клініцистів, які оцінюватимуть докази, призначатимуть відповідні тести та ухвалюватимуть будь-які рішення щодо діагнозу чи лікування.

У цьому дослідженні використовували OpenAI o3 для поглибленого дослідження. Новіші моделі загального призначення можуть шукати й синтезувати більше наукових матеріалів, тоді як спеціалізовані системи, як-от GPT‑Rosalind, створені для глибшої роботи в науках про життя, зокрема щодо впливу варіантів на структуру й функцію білків. Ці можливості тут не тестувалися й потребуватимуть власних оцінювань і засобів контролю доступу.

Хоча OpenAI допомогла підтримати це початкове дослідницьке дослідження, наступний етап роботи очолить Manton Center завдяки гранту від OpenAI Foundation. Грант підтримає ширші зусилля Центру зі створення платформно незалежного, недорогого ШІ-помічника з генетики, який допомагатиме клінічним командам швидше й послідовніше аналізувати випадки рідкісних захворювань.

Довгострокова дослідницька можливість полягає в тому, щоб з’ясувати, чи може повторний аналіз за допомогою ШІ під керівництвом експертів допомогти науковому розумінню встигати за відкриттями. Обіцянка не в тому, що ШІ замінить лікарський діагноз, а в тому, що ретельно оцінені дослідницькі інструменти можуть допомогти фахівцям знаходити докази, варті подальшого вивчення. Для тисяч родин сьогоднішні запитання без відповіді не мусять залишатися такими назавжди.

2026

Автор

OpenAI

Продовжити читати

Переглянути всі

A near-autonomous AI chemist improves a challenging reaction

Майже автономний ШІ-хімік оптимізував складну реакцію в медичній хімії

Дослідження17 черв. 2026 р.

Представляємо нові можливості GPT-Rosalind

Продукт3 черв. 2026 р.

GPT-5 знизив вартість безклітинного синтезу білків

Дослідження5 лют. 2026 р.