Preskočiť na hlavný obsah
OpenAI

18. júna 2026

Aplikovaná AI

Využitie AI na pomoc lekárom pri diagnostike zriedkavých genetických chorôb detí

V štúdii NEJM AI odborníci použili uvažovací model OpenAI na opätovnú analýzu 376 nevyriešených prípadov a našli stopy k 18 diagnózam.

Načítava sa…

Ani pri sekvenovaní genómu mnohí ľudia so zriedkavými ochoreniami nikdy nedostanú jasnú genetickú diagnózu. Približne polovica zostáva bez diagnózy aj po rozsiahlych testoch a posúdení špecialistami. Ich zdravotné údaje môžu obsahovať stopy, no ich nájdenie môže vyžadovať prehľadávanie tisícov až miliónov možných genetických variantov, roztrieštených klinických záznamov a rýchlo sa meniacej vedeckej literatúry.

Ako pribúdajú nové vzťahy medzi génmi a chorobami, kazuistiky a dôkazy na klasifikáciu, nevyriešené prípady sa môžu stať nanovo interpretovateľnými.

Výskumníci z Manton Center for Orphan Disease Research pri Boston Children’s Hospital, Harvardovej univerzity a OpenAI použili uvažovací model OpenAI o3 Deep Research na analýzu deidentifikovaných klinických a genomických informácií z 376 už skôr analyzovaných prípadov, ktoré zostali nevyriešené. Model odhalil kandidátne vysvetlenia podložené dôkazmi, ktoré mohli preskúmať výskumníci a klinickí odborníci. Po odbornom posúdení, dodatočnom testovaní a klinickom potvrdení lekári stanovili diagnózy v 18 prípadoch – dodatočnú diagnostickú výťažnosť 4,8 % po predchádzajúcej analýze špecialistami. Táto štúdia bola publikovaná 18. júna 2026 v NEJM AI a ukazuje, ako môže výskumný pracovný postup s podporou AI pomôcť odborníkom vytvárať stopy pri opätovnom skúmaní niektorých z najťažších prípadov.

Mnohé z týchto prípadov roky odolávali odbornej analýze. V tejto štúdii OpenAI o3 Deep Research pomohol výskumníkom identifikovať stopy, ktoré sa neskôr posudzovali zavedenými klinickými postupmi, čo naznačuje, že pravidelná opätovná analýza vedená odborníkmi by sa s vývojom poznania mohla stať škálovateľnejšou. Model nediagnostikoval žiadneho pacienta ani neurobil žiadne klinické rozhodnutie. Vytvoril hypotézy podložené dôkazmi, ktoré mali špecialisti posúdiť a tam, kde to bolo vhodné, ďalej preskúmať dodatočným testovaním a potvrdiť v klinickom laboratóriu.

Prečo môže starý prípad obsahovať novú odpoveď

Nejednoznačný genetický test nemusí byť trvalým záverom. Opisy fenotypu pacienta, výsledky testov a rodinná anamnéza môžu byť rozdelené medzi databázy, ktoré používajú odlišné identifikátory, formáty a slovníky. Prepojiť tieto záznamy je náročné, takže diagnózu môžu prehliadnuť aj špecialisti. Odborníci tiež môžu sekvenovať genóm dieťaťa ešte predtým, ako sa príslušný gén alebo jeho varianty spoja s ochorením. Ako vedecké poznanie napreduje, tie isté údaje môžu odhaliť odpovede, ktoré predtým nebolo možné nájsť.

Opätovná analýza zriedkavých ochorení je vedecký aj udržiavací problém. Genóm pacienta môže zostať rovnaký, no dôkazy okolo neho sa neustále menia: výskumníci spájajú nové gény a varianty s ochoreniami, laboratóriá preklasifikúvajú staré varianty a databázy prípadov aj články prinášajú nové pozorovania. Každá aktualizácia môže stáť za opätovné preskúmanie starého nejednoznačného prípadu, takže mnohé inštitúcie dedia rastúci zoznam genómov, ktoré treba udržiavať v súlade s pohyblivou bázou poznatkov.

V tejto štúdii výskumníci navrhli pracovný postup tak, aby model fungoval ako vrstva uvažovania zameraná najprv na vysvetlenie nad existujúcimi genomickými postupmi. Namiesto toho, aby vrátil iba zoradený gén, mal prepojiť klinické znaky, vzorec dedičnosti, dôkazy o variante a vedeckú literatúru do zdôvodnenia, ktoré môže ľudský posudzovateľ preverovať. 

Ako fungovala opätovná analýza

Pre každý prípad tím zostavil deidentifikovaný balík obsahujúci štandardizované termíny Human Phenotype Ontology na opis klinického prejavu pacienta, príležitostné poznámky lekárov a akúkoľvek opisnú klinickú diagnózu, metadáta ako vek a pohlavie a filtrovanú tabuľku variantov. Tabuľka zachytávala vzácnosť každého variantu, jeho predpokladaný účinok na kódovaný proteín, klasifikáciu ClinVar a kvalitu signálu naprieč dostupnými členmi rodiny. Väčšina prípadov zahŕňala údaje od dieťaťa a oboch biologických rodičov.

Tím požiadal model, aby navrhol najpravdepodobnejšie molekulárne vysvetlenie a ukázal svoj postup. Výskumníci potom výstupy posudzovali pomocou rovnakého rámca ACMG/AMP, aký klinické laboratóriá používajú na klasifikáciu genetických variantov. Každého kandidáta posúdili najmenej dvaja členovia tímu, nezhody sa riešili konsenzom a výstup modelu sa nikdy nepovažoval za diagnózu. Nález sa počítal ako diagnóza až vtedy, keď kvalifikovaní odborníci preskúmali dôkazy, variant bol klasifikovaný ako patogénny alebo pravdepodobne patogénny, laboratórium certifikované podľa CLIA ho potvrdilo a klinický tím odovzdal výsledok rodine.

Pred analýzou nevyriešených prípadov tím pracovný postup dolaďoval na prípadoch so stanovenými diagnózami. V duplikovaných behoch obnovil správny gén a variant v 48 z 51 prípadov, ktoré zahŕňali rôzne zriedkavé ochorenia. V súbore 57 neuromuskulárnych prípadov pracovný postup v duplikovaných behoch vrátil správnu diagnózu v 45 prípadoch. V 15 prípadoch s dlhočítaným sekvenovaním genómu pomenoval správny gén v každom prípade a obe ochorenie spôsobujúce alely v 12 prípadoch. Tieto hodnotenia pomohli pri vývoji príkazu a ukázali, kde zostáva odborné posúdenie nevyhnutné.

Sebahodnotené skóre dôvery modelu v týchto predtým vyriešených prípadoch zodpovedalo správnym diagnózam: priemerné minimálne skóre bolo 85,6 pri konzistentne správnych volaniach a 42,1 pri nesprávnych alebo neznámych volaniach. Skóre neboli kalibrované pravdepodobnosti a tím ich nepoužíval ako náhradu dôkazov ani klinického posúdenia. Pomáhali však odborným posudzovateľom zamerať sa na najsľubnejšie kandidátne diagnózy. 

Schéma pracovného postupu s názvom „Pracovný postup AI riadený človekom pre genomickú opätovnú analýzu zriedkavých chorôb“, zobrazujúca tok deidentifikovaných údajov pacientov cez ľudské rozhodnutia, syntézu dôkazov LLM, odborné posúdenie, testovanie, klinické potvrdenie a odovzdanie výsledkov rodine.

Čo výskumníci zistili

Tím následne uplatnil tento pracovný postup na štyri skupiny doteraz nevyriešených prípadov: deti s poruchami neurovývinu, ľudia so zriedkavými neuromuskulárnymi ochoreniami, deti a dospievajúci s včasnou psychózou a prípady náhlej neočakávanej smrti v pediatrii. Nešlo o nové prípady čakajúce na prvé posúdenie. Mnohé z nich už prešli viacerými komerčnými alebo inštitucionálnymi postupmi a boli prerokované multidisciplinárnymi tímami.

Výsledky podľa kohorty

Kohorta

Prípady

Odhalené diagnózy

Výťažnosť

Neurovývinové

100

10

10,0 %

Neuromuskulárne ochorenie

61

4

6,6 %

Náhle neočakávané úmrtie v pediatrii

200

2

1,0 %

Skorá psychóza

15

2

13,3 %

Spolu

376

18

4,8 %

Kohorta skorej psychózy bola malá, preto má jej percentuálny podiel široký interval spoľahlivosti. Výťažnosť odráža aj to, aká pravdepodobná bola v jednotlivých kohortách jednogénová príčina.

Po tom, čo model odhalil kandidátov a odborníci dokončili posúdenie a klinické potvrdenie, lekári stanovili diagnózy v 4,8 % prípadov. Táto miera je skromná, ale v tejto populácii významná, pretože predchádzajúce odborné posúdenia prípady nevyriešili. Podobné štúdie opätovnej analýzy uvádzajú pri intenzívne posudzovaných prípadoch jednociferné prírastky; vyššia výťažnosť zvyčajne pochádza zo štúdií s novými prípadmi alebo dobre známymi poruchami čakajúcimi na genetické potvrdenie.

Z 18 diagnóz bolo 7 znovuobjavených: diagnózy stanovené mimo miestneho výskumného pracovného postupu, ktoré však chýbali v zázname posudzovanom tímom. V niekoľkých prípadoch už boli varianty vo verejných databázach uvedené ako patogénne alebo pravdepodobne patogénne, čo poukazuje na prevádzkovú výzvu syntetizovať informácie naprieč zdrojmi údajov.

Preukázanie flexibility pri identifikácii variantov

V jednom prípade skorej psychózy model odvodil štruktúrnu udalosť v genóme, ktorá nebola uvedená vo vstupných údajoch. Sériu nekvalitných volaní na chromozóme 22 spojil so srdcovými, imunitnými, neurovývinovými a psychiatrickými prejavmi dieťaťa a následne vyslovil hypotézu o delécii 22q11.2 spojenej s DiGeorgeovým syndrómom. Tento predpokladaný variant sa potvrdil následným sekvenovaním genómu.

Hoci príkaz žiadal jednu monogénnu príčinu, model niekedy odhalil dva gény, ktoré lepšie vysvetľovali komplexný klinický obraz. Varianty v génoch LAMA2 a FOXP1 spolu pomohli vysvetliť svalové a neurovývinové prejavy v jednom prípade; v inom išlo o dovtedy nerozpoznané digénne vysvetlenie zahŕňajúce TTN a SRPK3.

Vytvorenie testovateľnej, biologicky súdržnej hypotézy

Okrem diagnóz model identifikoval aj možné nové mechanistické vysvetlenie ochorenia nazývaného vitiligo. V jednom neurovývinovom prípade model upozornil na deléciu 11 aminokyselín v géne S1PR1 u osoby s vitiligom. S1PR1 kóduje receptor na povrchu bunky zapojený do signalizácie, pohybu imunitných buniek a biológie tkanív. Model integroval dôkazy naznačujúce, že delécia by mohla meniť štruktúru a signalizáciu receptora spôsobmi, ktoré znižujú tvorbu pigmentu a zároveň pomáhajú imunitným bunkám pretrvávať v koži.

Navrhovaný vzťah medzi S1PR1 a vitiligo si vyžaduje ďalšie experimentálne overenie, no ilustruje silnú úlohu AI pri premene roztrúsených zistení zo štrukturálnej biológie, imunológie a klinickej genetiky na konkrétne, testovateľné hypotézy.

Tím zaznamenal aj možné rozšírenie fenotypu v neuromuskulárnej kohorte. Poškodzujúce varianty v génoch HSPB8 a CDK13 sa dokonale nezhodovali s najznámejšími poruchami spojenými s týmito génmi, čo naznačuje širšie klinické spektrum, ktoré bude potrebné overiť na ďalších prípadoch a laboratórnou prácou.

Prípadová štúdia: Kyrina diagnóza po takmer dvoch desaťročiach

Začalo sa to na hodine karate, keď si Kyrina matka všimla, že jej 9-ročná dcéra už v postojoch neklesá tak nízko ako kedysi. Kyra tiež spomaľovala na futbalových tréningoch a pri chôdzi aj behu zostávala na špičkách. Jej pediater nedokázal určiť príčinu svalovej slabosti, preto ju odoslal k špecialistovi. Nasledovala takmer 20-ročná cesta testami, liečbami a konzultáciami bez diagnózy.

Kyrin prípad bol jednou zo štyroch diagnóz odhalených v neuromuskulárnej kohorte. Tím spojil jej stav s variantom s posunom čítacieho rámca v géne HSPB8 a diagnostikoval formu myofibrilárnej myopatie, pri ktorej sa vo svalových vláknach hromadia abnormálne proteínové štruktúry a prispievajú k slabosti. Genetická poradkyňa z Manton Center zavolala Kyre asi týždeň pred jej 28. narodeninami.

Dovtedy Kyra strávila veľkú časť života prispôsobovaním sa chorobe. Už v 13 rokoch bola odkázaná na ventilátor a invalidný vozík, hoci jej stav sa odvtedy stabilizoval. Hoci je Kyrina forma myofibrilárnej myopatie taká vzácna, že o jej dlhodobom priebehu sa vie len málo, diagnóza priniesla určité uzavretie.

Obmedzenia

Táto štúdia ukazuje, že všeobecný uvažovací model môže prispieť k retrospektívnej genomickej opätovnej analýze tým, že spája fenotyp, dedičnosť, anotácie variantov, vzorce kvality údajov a vedeckú literatúru do preskúmateľných hypotéz. Ukazuje tiež, prečo je pravidelná opätovná analýza dôležitá: niektoré odpovede sa objavia až po pokroku poznania alebo po prepojení roztrieštených záznamov.

Tento výskum nie je dôkazom, že pacienti, klinickí odborníci alebo zákazníci by mali používať modely OpenAI na diagnostiku chorôb alebo prijímanie medicínskych rozhodnutí. Neopisuje ani neschvaľuje zamýšľané použitie OpenAI o3 Deep Research, ChatGPT ani žiadneho iného produktu OpenAI zákazníkmi na diagnostiku. Model nediagnostikoval žiadneho účastníka; každú diagnózu stanovili lekári a ďalší kvalifikovaní klinickí odborníci prostredníctvom zavedených procesov posúdenia, testovania a klinického potvrdenia.

Štúdia bola retrospektívna, kohorty boli heterogénne a posudzovatelia neboli zaslepení voči dôvere modelu. Výskumníci nemerali ušetrený čas, náklady, úsilie klinikov, pracovnú záťaž spôsobenú falošne pozitívnymi nálezmi ani zmeny v starostlivosti. Systematicky nehodnotili ani iné formy genetickej variability, ako sú štruktúrne varianty, expanzie repetícií, hlboko intronické zmeny či mozaicizmus.

Veľké jazykové modely môžu nesprávne prečítať kontext alebo vytvoriť vierohodné vysvetlenia, ktoré pri bližšom preskúmaní neobstoja. Preto každý výsledok prešiel ľudským posúdením a klinickým potvrdením. Model rozšíril vyhľadávanie a zameral následnú analýzu vedenú ľuďmi; nerozhodoval o tom, aké informácie alebo diagnóza sa majú odovzdať rodine.

Táto štúdia použila deidentifikované informácie, pričom mimo schválených prostredí sa nepoužili ani nepreniesli žiadne chránené zdravotné informácie. Širšie klinické nasadenie si vyžiada rovnakú pozornosť súkromiu, bezpečnosti, auditovateľnosti a miestnej regulácii, aká platí pre všetku zdravotnú starostlivosť. Prístup k modelu nenahrádza sekvenačnú infraštruktúru, genetické poradenstvo, potvrdzujúce testovanie ani úsudok špecialistu.

Abstraktné modré gradientové pozadie s jemnými prechodmi medzi svetlomodrými, tyrkysovými a sýtomodrými tónmi, vytvárajúce hladký rozmazaný efekt.

„Úzkym miestom je čas. Odborník môže venovať konkrétnemu človeku len určitú časť svojho dňa.“

Dr. Catherine Brownstein, Manton Center for Orphan Disease Research pri Boston Children’s Hospital

Abstraktné modré gradientové pozadie s jemnými prechodmi medzi svetlomodrými, tyrkysovými a sýtomodrými tónmi, vytvárajúce hladký rozmazaný efekt.

„Výskumníci ako Catherine a ja si jednoducho nemôžeme držať v hlave 8 000 rôznych chorôb. V tom je sila AI.“

Alan Beggs, riaditeľ Manton Center for Orphan Disease Research

Čo bude ďalej

Prospektívne multicentrické štúdie by mali porovnať opätovnú analýzu s podporou LLM so štandardnou praxou z hľadiska diagnostickej výťažnosti, času po kandidáta, úsilia klinikov, záťaže falošne pozitívnymi nálezmi, nákladov a vplyvu na starostlivosť. Verziované príkazy, kontroly referencií, auditné záznamy a kalibrovaná neistota budú dôležité pre reprodukovateľnosť a bezpečnosť. Takéto štúdie by stále vyžadovali kvalifikovaných klinikov, ktorí vyhodnotia dôkazy, nariadia vhodné testy a urobia akékoľvek diagnostické alebo liečebné rozhodnutie.

Táto štúdia použila OpenAI o3 Deep Research. Novšie všeobecné modely dokážu vyhľadávať a syntetizovať viac vedeckého materiálu, zatiaľ čo špecializované systémy, napríklad GPT‑Rosalind, sú navrhnuté na hlbšiu prácu v biologických vedách vrátane účinkov variantov na štruktúru a funkciu proteínov. Tieto schopnosti sa tu netestovali a budú si vyžadovať vlastné hodnotenia a kontroly prístupu.

Hoci OpenAI pomohla podporiť túto úvodnú výskumnú štúdiu, ďalšiu etapu práce povedie Manton Center prostredníctvom grantu od OpenAI Foundation. Grant podporí širšie úsilie centra vyvinúť platformovo nezávislého, nízkonákladového genetického AI kopilota, ktorý pomôže klinickým tímom analyzovať prípady zriedkavých chorôb rýchlejšie a konzistentnejšie.

Dlhodobejšou výskumnou príležitosťou je preskúmať, či opätovná analýza s podporou AI a vedená odborníkmi môže pomôcť vedeckému porozumeniu držať krok s objavmi. Prísľub nespočíva v tom, že AI nahradí lekársku diagnózu, ale v tom, že starostlivo vyhodnotené výskumné nástroje môžu špecialistom pomôcť identifikovať dôkazy, ktoré stoja za preskúmanie. Pre tisíce rodín nemusia dnešné nezodpovedané otázky zostať nezodpovedané navždy.

  • 2026

Autor

OpenAI