Пређите на главни садржај
OpenAI

18. јун 2026.

Примењени AI

Коришћење AI-ја да помогне лекарима у дијагностици ретких генских болести код деце

У студији NEJM AI, стручњаци су користили OpenAI модел резоновања да поново анализирају 376 раније нерешених случајева и издвоје трагове за 18 дијагноза.

Учитавање…

Чак и уз геномско секвенцирање, многи људи са ретким болестима никада не добију јасну генску дијагнозу. Око половине остаје без дијагнозе после опсежних тестирања и прегледа специјалиста. Њихови медицински подаци могу садржати трагове, али њихово проналажење може захтевати претрагу хиљада до милиона могућих генских варијаната, фрагментираних клиничких картона и научне литературе која се брзо мења.

Како се нагомилавају нове везе између гена и болести, извештаји о случајевима и докази за класификацију, нерешени случајеви могу постати поново доступни за тумачење.

Истраживачи из Центра Мантон за истраживање болести код сирочади у Бостонској дечијој болници, са Универзитета Харвард и из привредног друштва OpenAI користили су модел резоновања OpenAI o3 за дубоко истраживање да анализирају деидентификоване клиничке и геномске информације из 376 раније анализираних случајева који су остали нерешени. Модел је издвојио објашњења кандидата повезана са доказима, како би их истраживачи и клиничари прегледали. Након стручног прегледа, додатног тестирања и клиничке потврде, лекари су поставили дијагнозе у 18 случајева – додатни дијагностички учинак од 4,8% после раније анализе специјалиста. Ова студија је објављена 18. јуна 2026. у NEJM AI и показује како истраживачки ток рада уз помоћ AI-ја може да помогне стручњацима да пронађу трагове при поновном разматрању неких од најтежих случајева.

Многи од ових случајева годинама су измицали стручним анализама. У овој студији, модел OpenAI o3 дубоко истраживање помогао је истраживачима да препознају трагове који су касније процењени кроз установљене клиничке процесе, што указује да би периодична поновна анализа коју воде стручњаци могла постати скалабилнија како се знање развија. Модел није дијагностиковао ниједног пацијента нити донео било какву клиничку одлуку. Стварао је хипотезе повезане са доказима које специјалисти треба да прегледају и, када је прикладно, испитају додатним тестирањем и потврде у клиничкој лабораторији.

Зашто стари случај може садржати нов одговор

Неодређен резултат генског теста није увек трајан налаз. Описи фенотипа пацијента, резултати тестова и породична анамнеза могу бити распршени по базама података које користе различите идентификаторе, формате и речнике. Повезивање тих записа је тешко, па чак и специјалисти могу пропустити дијагнозу. Стручњаци такође могу секвенцирати геном детета пре него што релевантан ген или његове варијанте буду повезани са болешћу. Како научно знање напредује, исти подаци могу открити одговоре које раније није било могуће пронаћи.

Поновна анализа ретких болести истовремено је научни проблем и проблем одржавања. Геном пацијента може остати исти, али се докази око њега стално мењају: истраживачи повезују нове гене и варијанте са болешћу, лабораторије прекласификују старе варијанте, а базе случајева и радови акумулирају нова запажања. Свако ажурирање може учинити да стари неодређен случај вреди поново размотрити, па многе институције наслеђују све већи заостатак генома које треба усклађивати са базом знања која се непрестано помера.

У овој студији, истраживачи су осмислили ток рада тако да модел делује као слој резоновања усмерен на објашњење, изнад постојећих геномских канала. Уместо да врати само рангирани ген, од њега је тражено да повеже клиничке карактеристике, образац наслеђивања, доказе о варијанти и научну литературу у образложење које људски рецензент може да испита. 

Како је поновна анализа функционисала

За сваки случај, тим је саставио деидентификовани пакет који је садржао стандардизоване термине људске онтологије фенотипа за опис клиничке слике пацијента, повремене белешке клиничара и сваку описну клиничку дијагнозу, метаподатке као што су узраст и пол, као и филтрирану табелу варијаната. Табела је бележила реткост сваке варијанте, њен предвиђени ефекат на кодирани протеин, класификацију у архиви ClinVar и квалитет сигнала код доступних чланова породице. Већина случајева укључивала је податке детета и оба биолошка родитеља.

Тим је од модела затражио да предложи највероватније молекуларно објашњење и да прикаже свој рад. Истраживачи су затим прегледали резултате користећи исти ACMG/AMP оквир који клиничке лабораторије користе за класификацију генских варијаната. Најмање два члана тима прегледала су сваког кандидата, неслагања су решавана консензусом, а излаз модела никада није третиран као дијагноза. Налаз се рачунао као дијагноза тек након што су квалификовани стручњаци прегледали доказе, варијанта била класификована као патогена или вероватно патогена, лабораторија са сертификатом CLIA је потврдила, а клинички тим вратио резултат породици.

Пре анализе нерешених случајева, тим је усавршио ток рада на случајевима са утврђеним дијагнозама. У дуплираним покретањима пронашао је тачан ген и варијанту у 48 од 51 случаја који су обухватали различита ретка стања. У скупу од 57 неуромишићних случајева, ток рада је у дуплираним покретањима вратио тачну дијагнозу у 45 случајева. У скупу од 15 генома секвенцираних дугим очитавањем, именовао је тачан ген у сваком случају и оба алела који изазивају болест у 12 случајева. Ове процене су помогле у развоју инструкција и показале где је стручни преглед и даље неопходан.

Оцене поузданости које је модел сам пријавио пратиле су тачне дијагнозе у овим раније решеним случајевима: средња минимална оцена била је 85,6 за доследно тачне позиве и 42,1 за нетачне или непознате позиве. Оцене нису биле калибрисане вероватноће и тим их није користио као замену за доказе или клиничко пресуђивање. Али биле су корисне јер су усмеравале стручне рецензенте да се фокусирају на најперспективније кандидатске дијагнозе. 

Дијаграм тока рада под насловом „Ток рада уз људско вођење AI-ја за геномску поновну анализу ретких болести”, који приказује како деидентификовани подаци пацијента пролазе кроз људске одлуке, синтезу доказа великим језичким моделом (LLM), стручни преглед, тестирање, клиничку потврду и враћање резултата породици.

Шта су истраживачи открили

Тим је затим применио ток рада на четири групе раније нерешених случајева: децу са неуроразвојним стањима, особе са ретком неуромишићном болешћу, децу и адолесценте са раном психозом и случајеве изненадне неочекиване смрти у педијатрији. То нису били нови случајеви који чекају први преглед. Многи су већ били испитани кроз више комерцијалних или институционалних процеса и разматрани у мултидисциплинарним тимовима.

Резултати по кохорти

Kohorta

Slučajevi

Dijagnoze su se pojavile

Prinos

Neurorazvojni

100

10

10.0%

Neuromuskularna bolest

61

4

6.6%

Iznenadna neočekivana smrt u pedijatriji

200

2

1.0%

Rana psihoza

15

2

13.3%

Ukupno

376

18

4.8%

Кохорта ране психозе била је мала, па њен проценат има широк интервал поузданости. Учинак одражава и то колико је вероватно да свака кохорта има једногенско објашњење.

Након што је модел издвојио кандидате, а стручњаци завршили преглед и клиничку потврду, лекари су поставили дијагнозе у 4,8% случајева. Та стопа је скромна, али значајна у овој популацији, јер претходни стручни прегледи нису решили случајеве. Сличне студије поновне анализе пријављују једноцифрене добитке у случајевима који су већ детаљно прегледани; већи учинак обично долази из студија које садрже нове случајеве или добро познате поремећаје који чекају генску потврду.

Од 18 дијагноза, 7 су била поновна открића: дијагнозе утврђене изван локалног истраживачког тока рада, али одсутне из записа који је тим прегледао. У неколико случајева, варијанте су већ биле наведене као патогене или вероватно патогене у јавним базама података, што истиче оперативни изазов синтетизовања информација из различитих извора података.

Показивање флексибилности при препознавању варијаната

У једном случају ране психозе, модел је закључио да у геному постоји структурни догађај који није био наведен у улазним подацима. Повезао је низ позива ниског квалитета на хромозому 22 са срчаним, имунолошким, неуроразвојним и психијатријским особинама детета, а затим претпоставио делецију 22q11.2 повезану са Диџорџовим синдромом. Ова претпостављена варијанта потврђена је накнадним секвенцирањем генома.

Иако је инструкција тражила један моногенски узрок, модел је понекад издвајао два гена која су боље објашњавала сложену клиничку слику. Варијанте у LAMA2 и FOXP1 заједно су помогле да се објасне мишићне и неуроразвојне карактеристике у једном случају; у другом је постојало раније непрепознато дигенско објашњење које је укључивало TTN и SRPK3.

Стварање проверљиве, биолошки кохерентне хипотезе

Поред дијагноза, модел је идентификовао и могуће ново механистичко објашњење за стање које се назива витилиго. У једном неуроразвојном случају, модел је истакао делецију 11 аминокиселина у S1PR1 код особе са витилигом. S1PR1 кодира рецептор на површини ћелије који учествује у сигнализацији, кретању имуних ћелија и биологији ткива. Модел је интегрисао доказе који сугеришу да делеција може изменити структуру и сигнализацију рецептора на начине који смањују производњу пигмента, а истовремено помажу имуним ћелијама да опстану у кожи.

Предложена веза између S1PR1 и витилига захтева додатну експерименталну проверу, али илуструје снажну улогу AI-ја у превођењу расутих налаза из структурне биологије, имунологије и клиничке генетике у конкретне, проверљиве хипотезе.

Тим је у неуромишићној кохорти уочио и могуће проширење фенотипа. Штетне варијанте у HSPB8 и CDK13 нису се савршено поклапале са најпознатијим поремећајима тих гена, што указује на шири клинички спектар који ће бити потребно проверити на више случајева и лабораторијским радом.

Студија случаја: Кирина дијагноза после скоро две деценије

Почело је на часу каратеа, када је Кирина мајка приметила да се њена деветогодишња ћерка више не спушта тако ниско у ставовима као раније. Kyra је такође успоравала на фудбалским тренинзима и ходала и трчала на прстима. Њен педијатар није могао да утврди узрок мишићне слабости, па ју је упутио специјалисти. Уследило је скоро 20 година тестова, терапија и консултација без дијагнозе.

Кирин случај био је једна од четири дијагнозе издвојене у неуромишићној кохорти. Тим је њено стање повезао са варијантом померања оквира читања у HSPB8 и дијагностиковао облик миофибриларне миопатије, код које се абнормалне протеинске структуре накупљају у мишићним влакнима и доприносе слабости. Генски саветник из Центра Мантон позвао је Киру око недељу дана пре њеног 28. рођендана.

До тада је Кира провела велики део живота прилагођавајући се болести. До 13. године зависила је од респиратора и користила инвалидска колица, иако се њено стање од тада стабилизовало. Иако је Кирин облик миофибриларне миопатије толико редак да се мало зна о његовом дугорочном току, дијагноза јој је донела извесно разрешење.

Ограничења

Ова студија показује да модел резоновања опште намене може допринети ретроспективној геномској поновној анализи комбиновањем фенотипа, наслеђивања, анотација варијанти, образаца квалитета података и научне литературе у хипотезе које се могу прегледати. Такође показује зашто је периодична поновна анализа важна: неки одговори се појаве тек након што знање напредује или се фрагментирани записи обједине.

Ово истраживање није доказ да пацијенти, клиничари или клијенти треба да користе OpenAI моделе за дијагностиковање болести или доношење медицинских одлука. Оно не описује нити подржава предвиђену употребу модела OpenAI o3 дубоко истраживање, услуге ChatGPT или било ког другог OpenAI производа за дијагностику од стране клијената. Модел није дијагностиковао ниједног учесника; лекари и други квалификовани клинички стручњаци поставили су сваку дијагнозу кроз установљене процесе прегледа, тестирања и клиничке потврде.

Студија је била ретроспективна, кохорте су биле хетерогене, а рецензенти нису били заслепљени за поузданост модела. Истраживачи нису мерили уштеду времена, трошкове, напор клиничара, оптерећење лажно позитивним налазима нити промене у нези. Нису ни систематски процењивали друге облике генске варијације, као што су структурне варијанте, експанзије понављања, дубоко интронске промене или мозаицизам.

Велики језички модели могу погрешно прочитати контекст или произвести уверљива објашњења која не издрже пажљивију проверу. Зато је сваки резултат прошао кроз људско просуђивање и клиничку потврду. Модел је проширио претрагу и усмерио накнадну анализу коју воде људи; није одлучивао које информације или дијагнозу треба вратити породици.

Ова студија је користила деидентификоване информације, без коришћења или преноса заштићених здравствених информација изван одобрених окружења. Шира клиничка примена захтеваће исту пажњу према приватности, безбедности, могућности ревизије и локалним прописима која важи за сву медицинску негу. Приступ моделу не замењује инфраструктуру за секвенцирање, генско саветовање, потврдно тестирање нити просуђивање специјалисте.

Апстрактна плава градијентна позадина са меким прелазима између светлоплавих, цијан и тамноплавих тонова, која ствара гладак, замућен ефекат.

„Уско грло је време. Стручњак може посветити само ограничен део свог дана било којој конкретној особи.”

Др Кетрин Браунстин, Центра Мантон за истраживање болести код сирочади у Бостонској дечијој болници

Апстрактна плава градијентна позадина са меким прелазима између светлоплавих, цијан и тамноплавих тонова, која ствара гладак, замућен ефекат.

„Истраживачи као што смо Кетрин и ја не могу у глави држати 8000 различитих болести. У томе је снага AI-ја.”

Алан Бегс, директор Центра Мантон за истраживање болести код сирочади

Шта следи

Проспективне, вишецентарске студије треба да упореде поновну анализу уз помоћ великих језичких модела (LLM) са стандардном праксом у погледу дијагностичког учинка, времена до кандидата, напора клиничара, оптерећења лажно позитивним налазима, трошкова и утицаја на негу. Верзионисане инструкције, провере референци, евиденције ревизије и калибрисана неизвесност биће важни за поновљивост и безбедност. Такве студије би и даље захтевале квалификоване клиничаре да процене доказе, наруче одговарајуће тестове и донесу сваку дијагностичку или терапијску одлуку.

Ова студија је користила OpenAI o3 Deep Research. Новији модели опште намене могу да претражују и синтетизују више научног материјала, док су наменски системи као што је GPT‑Rosalind осмишљени за дубљи рад у наукама о животу, укључујући ефекте варијанти на структуру и функцију протеина. Те могућности овде нису тестиране и захтеваће сопствене процене и контроле приступа.

Иако је привредно друштво OpenAI помогло да подржи ову почетну истраживачку студију, Центар Мантон ће водити следећу фазу рада кроз субвенцију фондације OpenAI Foundation. Субвенција ће подржати шири напор Центра да развије платформски независног, јефтиног AI копилота за генетику који помаже клиничким тимовима да брже и доследније анализирају случајеве ретких болести.

Дугорочна истраживачка прилика је да се испита може ли поновна анализа уз помоћ AI-ја, коју воде стручњаци, помоћи да научно разумевање држи корак са открићима. Обећање није у томе да AI замени лекарску дијагнозу, већ да пажљиво процењени истраживачки алати могу помоћи специјалистима да препознају доказе вредне испитивања. За хиљаде породица, питања која су данас без одговора не морају заувек остати без одговора.

  • 2026.

Аутор

OpenAI