Преминаване към основното съдържание
OpenAI

18 юни 2026 г.

Приложен AI

Използване на AI в помощ на лекарите при диагностициране на редки генетични заболявания при деца

В проучване в NEJM AI експерти използваха модел със структурирано анализиране на OpenAI, за да прегледат отново 376 нерешени случая и да открият насоки за 18 диагнози.

Зареждане…

Дори при геномно секвениране много хора с редки заболявания никога не получават ясна генетична диагноза. Приблизително половината остават без диагноза след обстойни изследвания и преглед от специалисти. Медицинските им данни може да съдържат улики, но намирането им може да изисква пресяване на хиляди до милиони възможни генетични варианти, фрагментирани клинични записи и бързо променяща се научна литература.

С натрупването на нови връзки между гени и заболявания, описания на случаи и доказателства за класификация нерешените случаи могат да станат новоразгадаеми.

Изследователи от Manton Center for Orphan Disease Research към Boston Children’s Hospital, Harvard University и OpenAI използваха модела със структурирано анализиране OpenAI o3 дълбоко проучване, за да анализират деидентифицирана клинична и геномна информация от 376 вече анализирани, но останали нерешени случая. Моделът изведе подкрепени с доказателства кандидат-обяснения, които изследователи и клиницисти да прегледат. След експертен преглед, допълнителни изследвания и клинично потвърждение лекарите установиха диагнози в 18 случая — допълнителна диагностична резултатност от 4,8% след предходен анализ от специалисти. Проучването беше публикувано на 18 юни 2026 г. в NEJM AI и показва как подпомогнат от AI изследователски работен процес може да помогне на експертите да откриват насоки при повторен преглед на някои от най-трудните случаи.

Много от тези случаи бяха устояли на години експертен анализ. В това проучване OpenAI o3 дълбоко проучване помогна на изследователите да идентифицират насоки, които по-късно бяха оценени чрез установени клинични процеси, което подсказва, че воденият от експерти периодичен повторен анализ може да стане по-мащабируем с развитието на знанието. Моделът не постави диагноза на нито един пациент и не взе нито едно клинично решение. Той създаде подкрепени с доказателства хипотези, които специалистите да прегледат и, когато е уместно, да проучат чрез допълнителни изследвания и да потвърдят в клинична лаборатория.

Защо стар случай може да съдържа нов отговор

Неубедителният генетичен тест невинаги е окончателна констатация. Описанията на фенотипа на пациента, резултатите от изследванията и фамилната анамнеза могат да бъдат разпръснати в бази данни, които използват различни идентификатори, формати и речници. Свързването на тези записи е трудно, затова дори специалистите могат да пропуснат диагноза. Експертите може също да са секвенирали генома на дете, преди съответен ген или негови варианти да бъдат свързани със заболяване. С напредването на научното знание същите данни могат да разкрият отговори, които преди е било невъзможно да бъдат открити.

Повторният анализ при редки заболявания е едновременно научен и поддържащ проблем. Геномът на пациента може да остава същият, но доказателствата около него непрекъснато се променят: изследователите свързват нови гени и варианти със заболявания, лабораториите прекласифицират стари варианти, а базите данни със случаи и научните публикации натрупват нови наблюдения. Всяка актуализация може да направи стар неубедителен случай заслужаващ нов преглед, така че много институции наследяват растящ списък от геноми, които трябва да поддържат синхронизирани с променяща се база знания.

В това проучване изследователите проектираха работния процес така, че моделът да действа като слой за структурирано анализиране, насочен първо към обяснение, върху съществуващите геномни процеси. Вместо да връща само класиран ген, от него се изискваше да свърже клиничните особености, модела на унаследяване, доказателствата за варианта и научната литература в обосновка, която човешки рецензент може да проверява критично. 

Как работеше повторният анализ

За всеки случай екипът състави деидентифициран пакет, съдържащ стандартизирани термини от Human Phenotype Ontology за описание на клиничната картина на пациента, отделни лекарски бележки и всяка описателна клинична диагноза, метаданни като възраст и пол и филтрирана таблица с варианти. Таблицата обхващаше рядкостта на всеки вариант, прогнозирания му ефект върху кодирания протеин, класификацията в ClinVar и качеството на сигнала сред наличните членове на семейството. Повечето случаи включваха данни от детето и двамата биологични родители.

Екипът поиска от модела да предложи най-правдоподобното молекулярно обяснение и да покаже работата си. След това изследователите прегледаха резултатите, използвайки същата рамка ACMG/AMP, която клиничните лаборатории използват за класифициране на генетични варианти. Всеки кандидат беше прегледан от поне двама членове на екипа, несъгласията се решаваха с консенсус, а резултат от модел никога не се третираше като диагноза. Дадена находка се считаше за диагноза едва след като квалифицирани експерти прегледат доказателствата, вариантът бъде класифициран като патогенен или вероятно патогенен, сертифицирана по CLIA лаборатория го потвърди и клиничният екип съобщи резултата на семейството.

Преди да анализира нерешените случаи, екипът усъвършенства работния процес върху случаи с установени диагнози. Той възпроизведе правилния ген и вариант при двойни изпълнения за 48 от 51 случая, включващи разнообразни редки състояния. В набор от 57 невромускулни случая работният процес върна правилната диагноза при двойни изпълнения за 45 от случаите. В набор от 15 случая с дългочетящо геномно секвениране той посочи правилния ген във всеки случай и двата болестотворни алела в 12 случая. Тези оценки помогнаха за разработването на подканите и показаха къде експертният преглед остава съществен.

Самооценените от модела стойности на увереност съответстваха на правилните диагнози в тези предварително решени случаи: средната минимална стойност беше 85,6 за последователно правилни отчитания и 42,1 за неправилни или неизвестни отчитания. Стойностите не бяха калибрирани вероятности и екипът не ги използва като заместител на доказателства или клинично решение. Но те бяха полезни, за да насочат експертните рецензенти към най-обещаващите кандидат-диагнози. 

Диаграма на работен процес със заглавие „Воден от човека AI работен процес за геномен повторен анализ при редки заболявания“, показваща как деидентифицирани данни за пациенти преминават през човешки решения, синтез на доказателства от големи езикови модели, експертен преглед, изследвания, клинично потвърждение и връщане на резултатите на семейството.

Какво установиха изследователите

След това екипът приложи работния процес към четири групи от предварително нерешени случаи: деца с невроразвитийни състояния, хора с рядко невромускулно заболяване, деца и юноши с ранна психоза и случаи на внезапна неочаквана смърт в педиатрията. Това не бяха нови случаи, очакващи първи преглед. Много от тях вече бяха изследвани от множество търговски или институционални процеси и обсъждани от мултидисциплинарни екипи.

Резултати по кохорти

Кохорта

Случаи

Открити диагнози

Резултатност

Невроразвитийни

100

10

10,0%

Невромускулно заболяване

61

4

6,6%

Внезапна неочаквана смърт в педиатрията

200

2

1,0%

Ранна психоза

15

2

13,3%

Общо

376

18

4,8%

Кохортата с ранна психоза беше малка, затова процентът ѝ има широк доверителен интервал. Резултатността отразява и доколко вероятно е всяка кохорта да има едногенно обяснение.

След като моделът изведе кандидати, а експертите завършиха прегледа и клиничното потвърждение, лекарите установиха диагнози в 4,8% от случаите. Този процент е скромен, но значим за тази популация, защото предишните експертни прегледи не бяха решили случаите. Подобни проучвания за повторен анализ съобщават едноцифрени подобрения при силно преглеждани случаи; по-висока резултатност обикновено идва от проучвания с нови случаи или добре познати нарушения, очакващи генетично потвърждение.

От 18-те диагнози 7 бяха преоткривания: диагнози, установени извън местния изследователски работен процес, но липсващи в записа, който екипът прегледа. В няколко случая вариантите вече бяха посочени като патогенни или вероятно патогенни в публични бази данни, което подчертава оперативното предизвикателство да се синтезира информация от различни източници на данни.

Демонстриране на гъвкавост при идентифициране на варианти

В един случай на ранна психоза моделът изведе структурно събитие в генома, което не беше посочено във входните данни. Той свърза поредица от нискокачествени отчитания на хромозома 22 със сърдечните, имунните, невроразвитийните и психиатричните особености на детето, след което предположи делеция 22q11.2, свързана със синдрома на DiGeorge. Този предполагаем вариант беше потвърден с последващо геномно секвениране.

Въпреки че подканата изискваше една моногенна причина, моделът понякога извеждаше два гена, които обясняваха по-добре сложната клинична картина. Варианти в LAMA2 и FOXP1 заедно помогнаха да се обяснят мускулните и невроразвитийните особености в един случай; в друг имаше неразпознато досега дигенно обяснение, включващо TTN и SRPK3.

Създаване на проверима, биологично съгласувана хипотеза

Освен диагнозите, моделът идентифицира и възможно ново механистично обяснение за състояние, наречено витилиго. В един невроразвитиен случай моделът открои делеция от 11 аминокиселини в S1PR1 при човек с витилиго. S1PR1 кодира рецептор на клетъчната повърхност, участващ в сигнализацията, движението на имунни клетки и биологията на тъканите. Моделът интегрира доказателства, подсказващи, че делецията може да промени структурата и сигнализацията на рецептора по начини, които намаляват производството на пигмент и същевременно помагат на имунните клетки да се задържат в кожата.

Предложената връзка между S1PR1 и витилиго изисква допълнително експериментално валидиране, но илюстрира мощна роля на AI в превръщането на разпръснати находки от структурната биология, имунологията и клиничната генетика в конкретни, проверими хипотези.

Екипът видя и възможно разширяване на фенотипа в невромускулната кохорта. Увреждащи варианти в HSPB8 и CDK13 не съвпадаха напълно с най-известните нарушения, свързани с тези гени, което предполага по-широк клиничен спектър, който ще трябва да бъде проверен с повече случаи и лабораторна работа.

Казус: диагнозата на Kyra след почти две десетилетия

Всичко започнало в час по карате, когато майката на Kyra забелязала, че 9-годишната ѝ дъщеря вече не слиза толкова ниско в стойките, както преди. Kyra също започнала да се забавя по време на футболни тренировки и да ходи и тича на пръсти. Педиатърът ѝ не успял да установи причината за мускулната ѝ слабост и я насочил към специалист. Последвало почти 20-годишно пътуване през изследвания, лечения и консултации без диагноза.

Случаят на Kyra беше една от четирите диагнози, изведени в невромускулната кохорта. Екипът свърза състоянието ѝ с вариант с изместване на рамката на четене в HSPB8 и диагностицира форма на миофибриларна миопатия, при която анормални протеинови структури се натрупват в мускулните влакна и допринасят за слабост. Генетичен консултант от Manton Center се обади на Kyra около седмица преди 28-ия ѝ рожден ден.

Дотогава Kyra беше прекарала голяма част от живота си, приспособявайки се към заболяването. До 13-годишна възраст тя вече зависеше от вентилатор и беше в инвалидна количка, макар че оттогава състоянието ѝ се е стабилизирало. Въпреки че формата на миофибриларна миопатия на Kyra е толкова рядка, че се знае малко за дългосрочния ѝ ход, диагнозата донесе известно усещане за завършеност.

Ограничения

Това проучване показва, че модел със структурирано анализиране с общо предназначение може да допринесе за ретроспективния геномен повторен анализ, като комбинира фенотип, унаследяване, анотации на варианти, модели в качеството на данните и научна литература в хипотези, подходящи за преглед. То показва и защо периодичният повторен анализ е важен: някои отговори се появяват едва след като знанието напредне или фрагментираните записи бъдат обединени.

Това изследване не е доказателство, че пациенти, клиницисти или клиенти трябва да използват модели на OpenAI за диагностициране на заболявания или вземане на медицински решения. То не описва и не одобрява предвидена клиентска употреба на OpenAI o3 дълбоко проучване, ChatGPT или друг продукт на OpenAI за диагностика. Моделът не диагностицира нито един участник; лекарите и други квалифицирани клинични експерти поставиха всяка диагноза чрез установени процеси на преглед, изследване и клинично потвърждение.

Проучването беше ретроспективно, кохортите бяха хетерогенни, а рецензентите не бяха заслепени за увереността на модела. Изследователите не измериха спестено време, разходи, усилие на клиницистите, натоварване от фалшиво положителни резултати или промени в грижите. Не оцениха систематично и други форми на генетична вариация, като структурни варианти, повторни експанзии, дълбокоинтронни промени или мозаицизъм.

Големите езикови модели могат да разчитат погрешно контекста или да създават правдоподобни обяснения, които не издържат при по-внимателна проверка. Затова всеки резултат премина през човешка преценка и клинично потвърждение. Моделът разшири търсенето и фокусира последващия воден от хора анализ; той не решаваше каква информация или диагноза трябва да бъде съобщена на семейството.

Това проучване използва деидентифицирана информация, без защитена здравна информация да бъде използвана или предавана извън одобрени среди. По-широкото клинично внедряване ще изисква същото внимание към поверителността, сигурността, одитируемостта и местната регулация, което се прилага за всички медицински грижи. Достъпът до модел не заменя инфраструктурата за секвениране, генетичното консултиране, потвърждаващите изследвания или преценката на специалист.

Абстрактен син градиентен фон с плавни преходи между светлосини, цианови и тъмносини тонове, създаващ мек, размазан ефект.

„Тясното място е времето. Един експерт може да отдели само ограничена част от деня си на конкретен човек.“

Д-р Catherine Brownstein, Manton Center for Orphan Disease Research към Boston Children’s Hospital

Абстрактен син градиентен фон с плавни преходи между светлосини, цианови и тъмносини тонове, създаващ мек, размазан ефект.

„Изследователи като Catherine и мен не могат да държат в главите си 8000 различни заболявания. В това е силата на AI.“

Alan Beggs, директор на Manton Center for Orphan Disease Research

Какво следва

Проспективни многоцентрови проучвания трябва да сравнят подпомогнатия от големи езикови модели повторен анализ със стандартната практика по диагностична резултатност, време до кандидат, усилие на клинициста, тежест от фалшиво положителни резултати, разходи и ефекти върху грижите. Версионираните подкани, проверките на референциите, одитните журнали и калибрираната несигурност ще бъдат важни за възпроизводимостта и безопасността. Такива проучвания все пак ще изискват квалифицирани клиницисти да оценяват доказателствата, да назначават подходящи изследвания и да поставят всяка диагноза или да вземат всяко решение за лечение.

Това проучване използва OpenAI o3 дълбоко проучване. По-новите модели с общо предназначение могат да търсят и синтезират повече научни материали, докато специализираните системи като GPT‑Rosalind са проектирани за по-задълбочена работа в науките за живота, включително ефектите на варианти върху структурата и функцията на протеините. Тези възможности не бяха тествани тук и ще изискват собствени оценки и контрол на достъпа.

Въпреки че OpenAI помогна за подкрепата на това първоначално изследователско проучване, Manton Center ще ръководи следващия етап от работата чрез грант от OpenAI Foundation. Грантът ще подкрепи по-широкото усилие на Центъра да разработи платформено независим, нискоразходен AI копилот за генетика, който помага на клиничните екипи да анализират случаи на редки заболявания по-бързо и последователно.

По-дългосрочната изследователска възможност е да се проучи дали воденият от експерти и подпомаган от AI повторен анализ може да помогне на научното разбиране да поддържа темпо с откритията. Обещанието не е, че AI заменя лекарската диагноза, а че внимателно оценени изследователски инструменти могат да помогнат на специалистите да идентифицират доказателства, които си струва да бъдат проучени. За хиляди семейства днешните въпроси без отговор не е нужно да останат без отговор завинаги.

  • 2026 г.

Автор

OpenAI