18 јуни 2026 г.

Применета вештачка интелигенција

Користење на вештачка интелигенција за дијагноза на ретки генетски болести кај деца.

Во NEJM AI студија, експерти користеа модел за расудување на OpenAI за повторна анализа на 376 претходно нерешени случаи и идентификуваа потенцијални насоки за 18 дијагнози.

Прочитајте го апстрактот на студијата во NEJM AI

Се вчитува...

И покрај геномското секвенционирање, многу луѓе со ретки болести никогаш не добиваат јасна генетска дијагноза. Околу половина остануваат недијагностицирани и по обемни тестирања и прегледи од специјалисти. Нивните медицински податоци може да содржат траги, но нивното откривање бара анализа на илјадници до милиони можни генетски варијанти, фрагментирани клинички записи и брзо менување на научната литература.

Како што се акумулираат нови односи меѓу гени и болести, извештаи од случаи и докази за класификација, нерешените случаи можат да станат повторно интерпретабилни.

Истражувачи од Центарот за истражување на болести кај сирачиња „Мантон“ при Детската болница во Бостон, Универзитетот Харвард и OpenAI го користеа моделот на расудување со длабоко истражување на OpenAI o3 за да анализираат деидентификувани клинички и геномски информации од 376 претходно анализирани случаи кои останаа нерешени. Моделот идентификуваше потенцијални објаснувања поткрепени со докази, кои потоа беа разгледани од истражувачи и клиничари. По експертска ревизија, дополнителни тестирања и клиничка потврда, лекарите поставија дијагноза во 18 случаи — дополнителен дијагностички принос од 4,8 % по претходната анализа од специјалисти. Студијата беше објавена на 18 јуни 2026 година во NEJM AI и покажува како истражувачки работен процес потпомогнат со вештачка интелегенција може да им помогне на експертите да откријат нови насоки при повторно разгледување на некои од најсложените случаи.

Многу од овие случаи биле неразрешени и покрај години експертска анализа. Во оваа студија, длабокото истражување на OpenAI o3 им помогна на истражувачите да идентификуваат насоки кои подоцна беа проценети преку стандардни клинички процеси, што сугерира дека периодична повторна анализа водена од експерти може да стане поскалабилна како што се развива знаењето. Моделот не поставил дијагноза ниту донел клиничка одлука за ниту еден пациент. Наместо тоа, генерирал хипотези поврзани со докази за преглед од специјалисти и, каде што било соодветно, за понатамошно испитување преку дополнителни тестирања и потврда во клиничка лабораторија.

Зошто стар случај може да содржи нов одговор

Непотврдениот генетски тест не е секогаш траен резултат. Описите на фенотипот на пациентот, резултатите од тестовите и семејната историја може да бидат распределени низ различни бази на податоци кои користат различни идентификатори, формати и вокабулар. Поврзувањето на тие записи е тешко, па дури и специјалисти можат да пропуштат дијагноза. Експертите исто така може да го секвенционираат геномот на детето пред релевантен ген или неговите варијанти да бидат поврзани со болест. Како што научното знаење напредува, истите податоци можат да откријат одговори кои претходно било невозможно да се најдат.

Реанализата на ретки болести е и научен и „проблем на одржување“. Геномот на пациентот може да остане ист, но доказите околу него постојано се менуваат: истражувачите поврзуваат нови гени и варијанти со болести, лабораториите рекласифицираат стари варијанти, а базите на податоци и научните трудови собираат нови набљудувања. Секоја нова ажурирана информација може да направи стар, неубедлив случај повторно вреден за анализа, па затоа многу институции наследуваат растечки заостаток од геноми што треба да се усогласат со знаење кое постојано се менува.

Во оваа студија, истражувачите го осмислија работниот тек така што моделот дејствуваше како слој за расудување што прво дава објаснување врз постојните геномски процеси. Наместо да врати само рангиран ген, од него беше побарано да ги поврзе клиничките карактеристики, образецот на наследување, доказите за варијантата и научната литература во образложение што човечки рецензент може да го испита.

Како функционираше реанализата

За секој случај, тимот состави деидентификуван пакет што содржеше стандардизирани термини од Human Phenotype Ontology за опис на клиничката слика на пациентот, повремени белешки од клиничари и секоја описна клиничка дијагноза, метаподатоци како возраст и пол, и филтрирана табела со варијанти. Табелата ја опфати реткоста на секоја варијанта, нејзиниот предвиден ефект врз кодираниот протеин, класификацијата во ClinVar и квалитетот на сигналот кај достапните членови на семејството. Повеќето случаи вклучуваа податоци од детето и од двајцата биолошки родители.

Тимот побара од моделот да го предложи најверојатното молекуларно објаснување и да го прикаже своето образложение. Потоа истражувачите ги прегледаа излезите користејќи ја истата рамка ACMG/AMP што клиничките лаборатории ја користат за класифицирање генетски варијанти. Најмалку двајца членови на тимот го прегледаа секој кандидат, несогласувањата се решаваа со консензус, а излез од моделот никогаш не се третираше како дијагноза. Наод се сметаше за дијагноза само откако квалификувани експерти ги прегледаа доказите, варијантата беше класифицирана како патогена или веројатно патогена, лабораторија сертифицирана од CLIA ја потврди, а клиничкиот тим го врати резултатот на семејството.

Пред да ги анализира нерешените случаи, тимот го доработи работниот тек на случаи со веќе утврдени дијагнози. Во дупликатни извршувања ги пронајде точниот ген и варијанта кај 48 од 51 случај што опфаќаа различни ретки состојби. Во група од 57 невромускулни случаи, работниот тек ја врати точната дијагноза во дупликатни извршувања кај 45 од случаите. Во група од 15 случаи со геноми секвенционирани со долги читања, го именуваше точниот ген во секој случај и двата алела што ја предизвикуваат болеста во 12 случаи. Овие евалуации помогнаа во развојот на промптот и покажаа каде експертскиот преглед останува неопходен.

Самопријавените оценки на доверба на моделот се совпаѓаа со точните дијагнози во овие претходно решени случаи: средната минимална оценка беше 85,6 за доследно точни повици и 42,1 за неточни или непознати повици. Оценките не беа калибрирани веројатности, а тимот не ги користеше како замена за докази или клиничка проценка. Но тие беа корисни за насочување на експертските рецензенти да се фокусираат на најперспективните кандидатски дијагнози.

Дијаграм на работен тек со наслов „Работен тек со вештачка интелегенција воден од луѓе за геномска реанализа на ретки болести“, кој прикажува како деидентификувани податоци за пациенти минуваат низ човечки одлуки, синтеза на докази од големи јазични модели (LLM), експертски преглед, тестирање, клиничка потврда и враќање на резултатите на семејството.

Што открија истражувачите

Потоа тимот го примени работниот тек на четири групи претходно нерешени случаи: деца со невроразвојни состојби, лица со ретка невромускулна болест, деца и адолесценти со рана психоза и случаи на ненадејна неочекувана смрт кај деца. Ова не беа нови случаи кои чекаа прв преглед. Многу од нив веќе беа испитани од повеќе комерцијални или институционални канали и дискутирани од мултидисциплинарни тимови.

Резултати по кохорта

Кохорта	Случаи	Идентификувани дијагнози	Принос
Невроразвојни	100	10	10,0 %
Невромускулна болест	61	4	6,6 %
Ненадејна неочекувана смрт кај деца	200	2	1,0 %
Рана психоза	15	2	13,3 %
Вкупно	376	18	4,8 %

Кохортата со рана психоза беше мала, па нејзиниот процент има широк интервал на доверба. Приносот ја одразува и веројатноста секоја кохорта да има едногенско објаснување.

Откако моделот посочи кандидати, а експертите го завршија прегледот и клиничката потврда, лекарите поставија дијагнози во 4,8 % од случаите. Таа стапка е скромна, но значајна кај оваа популација бидејќи претходните експертски прегледи не ги решиле случаите. Слични студии за реанализа пријавуваат едноцифрени добивки во случаи што биле темелно прегледани; повисоки приноси обично доаѓаат од студии со нови случаи или добро познати нарушувања што чекаат генетска потврда.

Од 18-те дијагнози, 7 беа повторни откритија: дијагнози што биле утврдени надвор од локалниот истражувачки работен тек, но не биле присутни во записите што тимот ги прегледувал. Во неколку случаи, варијантите веќе биле наведени како патогени или веројатно патогени во јавни бази на податоци, што ја истакнува оперативната предизвик-улога на синтезата на информации од повеќе извори на податоци.

Покажување флексибилност при идентификување варијанти

Во еден случај на рана психоза, моделот изведе заклучок за структурен настан во геномот што не беше наведен во влезните податоци. Тој поврза низа повици со низок квалитет на хромозомот 22 со срцевите, имунолошките, невроразвојните и психијатриските карактеристики на детето, а потоа претпостави делеција 22q11.2 поврзана со синдромот ДиЏорџ. Оваа претпоставена варијанта беше потврдена со дополнително секвенционирање на геномот.

Иако промптот бараше една моногенска причина, моделот понекогаш посочуваше два гена што подобро ја објаснуваа сложената клиничка слика. Варијантите во LAMA2 и FOXP1 заедно помогнаа да се објаснат мускулните и невроразвојните карактеристики во еден случај; во друг имаше претходно непрепознаено дигенско објаснување што ги вклучуваше TTN и SRPK3.

Создавање проверлива, биолошки кохерентна хипотеза

Покрај дијагнози, моделот идентификуваше и можна нова механистичка објаснувачка врска за состојба наречена витилиго. Во еден невроразвоен случај, моделот истакна делеција од 11 аминокиселини во S1PR1 кај лице со витилиго. S1PR1 кодира рецептор на клеточната површина што е вклучен во сигнализација, движење на имуните клетки и биологијата на ткивата. Моделот интегрираше докази што укажуваат дека делецијата може да ги промени структурата и сигнализацијата на рецепторот на начини што го намалуваат производството на пигмент, а истовремено им помагаат на имуните клетки да опстанат во кожата.

Предложената врска меѓу S1PR1 и витилиго бара дополнителна експериментална валидација, но ја илустрира моќната улога на вештачката интелегенција во претворањето расфрлани наоди од структурната биологија, имунологијата и клиничката генетика во конкретни, проверливи хипотези.

Тимот забележа и можно проширување на фенотипот во невромускулната кохорта. Штетните варијанти во HSPB8 и CDK13 не се совпаѓаа совршено со најпознатите нарушувања поврзани со тие гени, што укажува на поширок клинички спектар што ќе треба да се провери со повеќе случаи и лабораториски истражувања.

Студија на случај: Дијагнозата на Кира по речиси две децении

Сè започна на тренинг по карате, кога мајката на Кира забележа дека нејзината 9-годишна ќерка повеќе не се спушта толку ниско во ставовите како порано. Кира исто така забавуваше на тренинзите по фудбал и одеше и трчаше на прсти. Нејзиниот педијатар не можеше да ја утврди причината за мускулната слабост, па ја упати кај специјалист. Следеше речиси 20-годишно патување низ тестови, третмани и консултации без дијагноза.

Случајот на Кира беше еден од четирите дијагнози откриени во неуромускулната кохорта. Тимот нејзината состојба ја поврза со рамкосменувачка (frameshift) варијанта во HSPB8 и дијагностицираше форма на миофибриларна миопатија, при која абнормални протеински структури се натрупуваат во мускулните влакна и придонесуваат за слабост. Генетски советник од Центарот „Мантон“ ја контактираше Кира околу една недела пред нејзиниот 28-ми роденден.

Дотогаш, Кира веќе поминала голем дел од својот живот прилагодувајќи се на болеста. Таа била зависна од вентилатор и во инвалидска количка уште на 13-годишна возраст, иако нејзината состојба оттогаш се стабилизирала. Иако нејзината форма на миофибриларна миопатија е толку ретка што малку се знае за нејзиниот долгорочен тек, дијагнозата сепак ѝ донела одредено појаснување.

Ограничувања

Оваа студија покажува дека модел со расудување за општа намена може да придонесе за ретроспективна геномска реанализа со комбинирање фенотип, наследување, анотации на варијанти, обрасци на квалитет на податоците и научна литература во хипотези што може да се прегледуваат. Таа покажува и зошто периодичната реанализа е важна: некои одговори се појавуваат дури откако знаењето ќе напредне или фрагментираните записи ќе се поврзат.

Ова истражување не е доказ дека пациентите, клиничарите или клиентите треба да користат модели на OpenAI за дијагностицирање болести или за носење медицински одлуки. Тоа не опишува ниту поддржува наменета клиентска употреба на длабоко истражување на OpenAI o3, ChatGPT или кој било друг производ на OpenAI за дијагноза. Моделот не дијагностицираше ниту еден учесник; лекарите и другите квалификувани клинички експерти ја поставија секоја дијагноза преку воспоставени процеси на преглед, тестирање и клиничка потврда.

Студијата беше ретроспективна, кохортите беа хетерогени, а рецензентите не беа заслепени за довербата на моделот. Истражувачите не го измерија заштеденото време, трошокот, напорот на клиничарите, работното оптоварување од лажно позитивни наоди или промените во грижата. Ниту систематски ги оценија другите форми на генетска варијација, како структурни варијанти, повторувачки експанзии, длабоко-интронски промени или мозаицизам.

Големите јазични модели можат погрешно да го протолкуваат контекстот или да генерираат навидум веродостојни објаснувања кои не издржуваат подетална проверка. Затоа, секој резултат беше предмет на човечка проценка и клиничка потврда. Моделот го прошири опсегот на пребарување и ја насочи понатамошната анализа водена од експерти; тој не одлучуваше кои информации или дијагноза треба да ѝ бидат соопштени на семејството.

Оваа студија користеше деидентификувани податоци, при што не беа користени ниту пренесувани заштитени здравствени информации надвор од одобрените средини. Пошироката клиничка примена ќе бара исто ниво на внимание кон приватноста, безбедноста, можноста за ревизија и усогласеноста со локалните регулативи како и секоја друга медицинска грижа. Пристапот до моделот не претставува замена за инфраструктурата за секвенционирање, генетското советување, потврдното тестирање или стручната проценка на специјалистите.

Апстрактна сина градиентна заднина со меки премини меѓу светлосини, цијан и темносини тонови, создавајќи мазен, заматен ефект.

„Ботленекот е времето. Експерт може да посвети само одреден дел од својот ден на секој поединечен пациент.“

Д-р Кетрин Браунштајн, Центар „Мантон“ за истражување на ретки болести при детската болница во Бостон.

„Истражувачи како Кетрин и јас не можеме да држиме 8.000 различни болести во главата. Тоа е моќта на вештачката интелегенција.“

Alan Beggs, директор на Центарот за истражување на болести кај сирачиња „Мантон“

Што следува

Проспективни, повеќецентрични студии треба да ја споредат реанализата потпомогната од големи јазични модели (LLM) со стандардната практика според дијагностичкиот принос, времето до кандидат, напорот на клиничарите, товарот од лажно позитивни наоди, трошокот и ефектите врз грижата. Верзионирани промптови, проверки на референци, ревизорски дневници и калибрирана несигурност ќе бидат важни за репродуцибилност и безбедност. Таквите студии и понатаму би барале квалификувани клиничари да ги оценуваат доказите, да нарачуваат соодветни тестови и да донесуваат секоја дијагностичка или терапевтска одлука.

Оваа студија го користеше длабокото истражување на OpenAI o3. Поновите модели за општа намена можат да пребаруваат и синтетизираат повеќе научен материјал, додека наменски изградените системи како GPT‑Rosalind се дизајнирани за подлабока работа во животните науки, вклучувајќи ги ефектите на варијантите врз структурата и функцијата на протеините. Овие способности не беа тестирани во оваа студија и ќе бараат сопствени евалуации и контроли на пристап.

Иако OpenAI помогна во поддршката на оваа почетна истражувачка студија, Центарот „Мантон“ ќе ја води следната фаза од работата преку грант од OpenAI Foundation. Грантот ќе ја поддржи пошироката иницијатива на Центарот за развој на платформа-агностички, нискобуџетен генетски AI копилот кој им помага на клиничките тимови побрзо и поконзистентно да анализираат случаи на ретки болести.

Подолгорочната истражувачка можност е да се испита дали реанализата водена од експерти и потпомогната со вештачка интелегенција може да му помогне на научното разбирање да држи чекор со откритијата. Ветувањето не е дека вештачката интелегенција ја заменува лекарската дијагноза, туку дека внимателно оценети истражувачки алатки може да им помогнат на специјалистите да идентификуваат докази што вреди да се истражат. За илјадници семејства, денешните неодговорени прашања не мора засекогаш да останат неодговорени.

2026

Автор

OpenAI

Продолжи да читаш

Види ги сите

A near-autonomous AI chemist improves a challenging reaction

Речиси автономен AI хемичар подобрува предизвикувачка реакција во медицинската хемија

Истражување17 јун. 2026 г.

Воведуваме нови можности во GPT-Rosalind

Производ3 јун. 2026 г.

GPT-5 ги намалува трошоците за синтеза на протеини без клетки.

Истражување5 фев. 2026 г.