Přeskoč na hlavní obsah
OpenAI

18. června 2026

Aplikovaná AI

Využití AI, aby lékařům pomohla s diagnostikou vzácných genetických onemocnění u dětí

Ve studii NEJM AI odborníci použili model OpenAI s uvažováním k reanalýze 376 dříve nevyřešených případů a nalezení vodítek pro 18 diagnóz.

Načítání…

I při sekvenování genomu mnoho lidí se vzácnými onemocněními nikdy nedostane jasnou genetickou diagnózu. Zhruba polovina zůstává bez diagnózy i po rozsáhlém testování a posouzení specialisty. Jejich zdravotní data mohou obsahovat vodítka, jejich nalezení však může vyžadovat probírání tisíců až milionů možných genetických variant, roztříštěných klinických záznamů a rychle se měnící vědecké literatury.

Jak přibývají nové vztahy mezi geny a nemocemi, kazuistiky a klasifikační důkazy, objevují se možnosti nové interpretace nevyřešených případů.

Výzkumníci z Manton Center for Orphan Disease Research při Boston Children’s Hospital, Harvard University a OpenAI použili model s uvažováním OpenAI o3 Deep Research k analýze deidentifikovaných klinických a genomických informací z 376 dříve analyzovaných případů, které zůstaly nevyřešené. Model předložil výzkumníkům a lékařům kandidáty na vysvětlení podložená důkazy k posouzení. Po odborném posouzení, dalším testování a klinickém potvrzení lékaři stanovili diagnózy v 18 případech — což představuje diagnostický výtěžek ve výši 4,8 % navíc po předchozí analýze provedené specialisty. Studie byla publikována 18. června 2026 v NEJM AI a ukazuje, jak může výzkumný postup s podporou AI pomáhat expertům nacházet vodítka při přezkoumávání případů řadících se mezi nejobtížnější.

Mnohé z těchto případů celá léta odolávaly odborné analýze. V této studii pomohl OpenAI o3 Deep Research výzkumníkům najít hypotézy, které byly později posouzeny podle zavedených klinických postupů. To naznačuje, že pravidelná reanalýza vedená odborníky by se s vývojem poznání mohla stát škálovatelnější. Model u žádného pacienta nestanovil diagnózu ani neučinil žádné klinické rozhodnutí. Vytvořil hypotézy podložené důkazy, které měli specialisté posoudit a případně prověřit dalším testováním a potvrdit v klinické laboratoři.

Proč může starý případ obsahovat novou odpověď

Genetický test bez jasného závěru nemusí být definitivním nálezem. Popisy fenotypu pacienta, výsledky testů a rodinná anamnéza mohou být rozptýlené v databázích, které používají různé identifikátory, formáty a slovníky. Usouvztažnění těchto záznamů je obtížné, takže diagnózy si nemusí všimnout ani specialisté. Odborníci také mohou sekvenovat genom dítěte dříve, než je zjištěna souvislost relevantního genu nebo jeho varianty s onemocněním. S postupem vědeckého poznání mohou stejná data odhalit odpovědi, u kterých to dříve nebylo možné.

Reanalýza vzácných onemocnění je zároveň vědeckým i provozním problémem. Genom pacienta se sice nemění, ale neustále se proměňují důkazy kolem něj: výzkumníci propojují nové geny a jejich varianty s nemocemi, laboratoře překlasifikovávají staré varianty a databáze případů i články shromažďují nová pozorování. Každá aktualizace může u starého neuzavřeného případu otevřít nové možnosti opětovné prozkoumání, takže mnoha institucím se rozrůstá katalog genomů, které je třeba synchronizovat s proměnlivou znalostní bází.

V této studii výzkumníci navrhli pracovní postup tak, aby model fungoval jako vrstva uvažování zaměřená nejprve na vysvětlení nad existujícími genomickými postupy. Místo aby vrátil jen seřazený seznam genů, měl propojit klinické projevy, vzorec dědičnosti, důkazy o variantě a vědeckou literaturu do zdůvodnění, které by mohl přezkoumat lidský hodnotitel. 

Jak reanalýza probíhala

Pro každý případ tým sestavil deidentifikovaný balíček obsahující standardizované termíny Human Phenotype Ontology k popisu klinického obrazu pacienta, příležitostné poznámky klinických pracovníků a případnou popisnou klinickou diagnózu, metadata jako věk a pohlaví a filtrovanou tabulku variant. Tabulka zachycovala vzácnost každé varianty, její předpokládaný účinek na kódovaný protein, klasifikaci ClinVar a kvalitu signálu napříč dostupnými členy rodiny. Většina případů zahrnovala data od dítěte i obou biologických rodičů.

Tým požádal model, aby navrhl nejpravděpodobnější molekulární vysvětlení a ukázal, jak k němu dospěl. Výzkumníci poté výstupy posuzovali pomocí stejného rámce ACMG/AMP, který klinické laboratoře používají ke klasifikaci genetických variant. Každou hypotézu posoudili nejméně dva členové týmu, neshody se řešily konsenzem a výstup modelu nikdy nebyl považován za diagnózu. Nález se počítal jako diagnóza teprve poté, co kvalifikovaní odborníci posoudili důkazy, varianta byla klasifikována jako patogenní nebo pravděpodobně patogenní, laboratoř certifikovaná podle CLIA ji potvrdila a klinický tým výsledek sdělil rodině.

Před analýzou nevyřešených případů tým pracovní postup vyladil na případech se stanovenými diagnózami. Ve dvojích bězích správně našel gen i variantu u 48 z 51 případů, které zahrnovaly různé vzácné poruchy. V souboru 57 neuromuskulárních případů pracovní postup ve dvojích bězích vrátil správnou diagnózu u 45 případů. V souboru 15 případů genomů sekvenovaných dlouhými čteními určil v každém případě správný gen a ve 12 případech obě alely způsobující onemocnění. Tato hodnocení pomohla při vývoji promptu a ukázala, kde zůstává nezbytné odborné posouzení.

Skóre jistoty, která model sám vyhodnotil, v těchto dříve vyřešených případech odpovídala správným diagnózám: průměrné minimální skóre bylo 85,6 u konzistentně správných rozhodnutí a 42,1 u nesprávných nebo neznámých rozhodnutí. Skóre nebyla kalibrovanými pravděpodobnostmi a tým je nepoužíval jako náhradu důkazů ani klinického posouzení. Pomáhala však navést odborné hodnotitele na nejslibnější kandidátní diagnózy. 

Schéma pracovního postupu s názvem „Pracovní postup s AI řízený člověkem pro genomickou reanalýzu vzácných onemocnění“, které ukazuje tok deidentifikovaných dat pacientů přes lidská rozhodnutí, syntézu důkazů pomocí LLM, odborné posouzení, testování, klinické potvrzení a předání výsledků rodině.

Co výzkumníci zjistili

Tým poté pracovní postup použil na čtyři skupiny dříve nevyřešených případů: děti s neurovývojovými poruchami, lidi se vzácným neuromuskulárním onemocněním, děti a dospívající s časnou psychózou a případy syndromu náhlého úmrtí u dětí. Nešlo o nové případy čekající na první posouzení. Mnohé už prošly několika komerčními nebo institucionálními postupy a probíraly je multidisciplinární týmy.

Výsledky podle kohorty

Kohorta

Případy

Nalezené diagnózy

Výtěžnost

Neurovývojové poruchy

100

10

10,0 %

Neuromuskulární onemocnění

61

4

6,6 %

Syndrom náhlého úmrtí v pediatrii

200

2

1,0 %

Časná psychóza

15

2

13,3 %

Celkem

376

18

4,8 %

Kohorta časné psychózy byla malá, takže její procentuální hodnota má široký interval spolehlivosti. Výtěžnost také odráží, jak pravděpodobné bylo, že každá kohorta bude mít jednogenové vysvětlení.

Poté, co model předložil kandidáty a odborníci dokončili posouzení a klinické potvrzení, lékaři stanovili diagnózy u 4,8 % případů. Jde o nevelkou míru úspěšnosti, avšak v této populaci významnou, protože předchozí odborná posouzení případy nevyřešila. Podobné studie reanalýzy uvádějí u intenzivně posuzovaných případů jednociferné zisky; vyšší výtěžnost obvykle přinášejí studie zahrnující nové případy nebo dobře známé poruchy čekající na genetické potvrzení.

Z 18 diagnóz bylo 7 „znovuobjevených“: diagnózy byly stanoveny mimo místní výzkumný postup, ale chyběly v dokumentaci, kterou tým prověřoval. V několika případech byly varianty už uvedeny ve veřejných databázích jako patogenní nebo pravděpodobně patogenní, což poukazuje na provozní výzvu spočívající ve shromažďování informací z různých datových zdrojů.

Ukázka flexibility při identifikaci variant

V jednom případu časné psychózy model odvodil strukturální událost v genomu, která ve vstupních datech uvedena nebyla. Propojil sérii nekvalitních volání na chromozomu 22 se srdečními, imunitními, neurovývojovými a psychiatrickými projevy dítěte a poté vyslovil hypotézu delece 22q11.2 spojené s DiGeorgeovým syndromem. Tato předpokládaná varianta byla potvrzena následným sekvenováním genomu.

Ačkoli prompt žádal o nalezení jedné monogenní příčiny, model někdy upozornil na dva geny, které komplexní projevy vysvětlovaly lépe. Varianty v genech LAMA2 a FOXP1 společně pomohly v jednom případě vysvětlit svalové a neurovývojové projevy; jiný případ měl dříve neznámé digenní vysvětlení zahrnující TTN a SRPK3.

Vytvoření testovatelné, biologicky koherentní hypotézy

Kromě diagnóz model identifikoval také možné nové mechanistické vysvětlení poruchy jménem vitiligo. V jednom neurovývojovém případě model upozornil na deleci 11 aminokyselin v S1PR1 u osoby s vitiligem. S1PR1 kóduje receptor na povrchu buněk zapojený do signalizace, pohybu imunitních buněk a biologie tkání. Model integroval důkazy naznačující, že delece by mohla změnit strukturu a signalizaci receptoru způsoby, které snižují tvorbu pigmentu a zároveň pomáhají imunitním buňkám zůstávat v kůži.

Navržený vztah mezi S1PR1 a vitiligem vyžaduje další experimentální ověření, ale ilustruje významnou roli AI při převádění rozptýlených poznatků ze strukturní biologie, imunologie a klinické genetiky do konkrétních, testovatelných hypotéz.

Tým také v neuromuskulární kohortě zaznamenal možné rozšíření fenotypu. Poškozující varianty v HSPB8 a CDK13 neodpovídaly přesně nejznámějším poruchám spojeným s těmito geny, což naznačuje širší klinické spektrum, které bude nutné ověřit na více případech a laboratorní prací.

Případová studie: Kyřina diagnóza po téměř dvou desetiletích

Začalo to na hodině karate, když si Kyřina matka všimla, že její devítiletá dcera se při provádění postojů neohýbá tak hluboko jako dřív. Kyra také zpomalovala při fotbalovém tréninku a při chůzi i běhu chodila po špičkách. Její pediatr nedokázal určit příčinu svalové slabosti, a proto ji odeslal ke specialistovi. Následovala téměř dvacetiletá cesta plná testů, léčby a konzultací bez diagnózy.

Kyřin případ byl jednou ze čtyř diagnóz nalezených v neuromuskulární kohortě. Tým propojil její onemocnění s variantou posunu čtecího rámec v genu HSPB8 a diagnostikoval formu myofibrilární myopatie, při níž se ve svalových vláknech hromadí abnormální proteinové struktury a přispívají ke slabosti. Genetická poradkyně z Manton Center zatelefonovala Kyře asi týden před jejími 28. narozeninami.

Do té doby Kyra strávila velkou část života přizpůsobováním se nemoci. Ve 13 letech už potřebovala ventilátor a invalidní vozík, i když se od té doby její stav dále nezhoršuje. Ačkoli je Kyřina forma myofibrilární myopatie tak vzácná, že se o jejím dlouhodobém průběhu ví jen málo, diagnóza přinesla určitou úlevu.

Omezení

Tato studie ukazuje, že univerzální model s uvažováním může přispět k retrospektivní genomické reanalýze tím, že propojí fenotyp, dědičnost, anotace variant, vzorce kvality dat a vědeckou literaturu do hypotéz vhodných k posouzení. Ukazuje také, proč je pravidelná reanalýza důležitá: některé odpovědi se objeví až poté, co pokročí poznání nebo se propojí roztříštěné záznamy.

Tento výzkum není důkazem, že by pacienti, lékaři nebo zákazníci měli používat modely OpenAI k diagnostice onemocnění nebo k lékařským rozhodnutím. Nepopisuje ani nedoporučuje zamýšlené zákaznické použití OpenAI o3 Deep Research, ChatGPT ani žádného jiného produktu OpenAI pro diagnostiku. Model nediagnostikoval žádného účastníka; každou diagnózu stanovili lékaři a další kvalifikovaní kliničtí odborníci prostřednictvím zavedených postupů posouzení, testování a klinického potvrzení.

Studie byla retrospektivní, kohorty byly heterogenní a hodnotitelé nebyli zaslepeni vůči sebehodnocení jistoty modelu. Výzkumníci neměřili ušetřený čas, náklady, úsilí klinických odborníků, pracovní zátěž způsobenou falešně pozitivními nálezy, ani změny v péči. Systematicky nehodnotili ani jiné formy genetické variability, jako jsou strukturální varianty, expanze repetitivních sekvencí, hluboko intronové změny nebo mozaicismus.

Velké jazykové modely mohou špatně vyložit kontext nebo vytvořit věrohodná vysvětlení, která při bližším zkoumání neobstojí. Proto každý výsledek prošel lidským prověřením a klinickým potvrzením. Model rozšířil vyhledávání a nasměroval následnou analýzu vedenou člověkem; nerozhodoval, jaké informace nebo diagnóza mají být rodině sděleny.

Studie používala deidentifikované informace a mimo schválená prostředí nebyly využity ani přenášeny žádné chráněné zdravotní údaje. Širší klinické nasazení bude vyžadovat stejnou pozornost věnovanou soukromí, bezpečnosti, auditovatelnosti a místním předpisům, jaké platí pro veškerou lékařskou péči. Přístup k modelu nenahrazuje infrastrukturu pro sekvenování, genetické poradenství, potvrzovací testování ani úsudek specialistů.

Abstraktní modré gradientní pozadí s jemnými přechody mezi světle modrými, azurovými a sytě modrými tóny, vytvářející hladký rozostřený efekt.

„Kapacitním omezením je čas. Odborník může věnovat jednomu konkrétnímu člověku jen omezenou část svého dne.“

Dr. Catherine Brownstein, Manton Center for Orphan Disease Research při Boston Children’s Hospital

Abstraktní modré gradientní pozadí s jemnými přechody mezi světle modrými, azurovými a sytě modrými tóny, vytvářející hladký rozostřený efekt.

„Výzkumníci jako Catherine nebo já nemohou držet v hlavě 8 000 různých onemocnění. V tom je síla AI.“

Alan Beggs, ředitel Manton Center for Orphan Disease Research

Co bude dál

Prospektivní multicentrické studie by měly porovnat reanalýzu s podporou LLM se standardní praxí z hlediska diagnostické výtěžnosti, času nalezení kandidáta, úsilí pro klinické pracovníky, zátěže falešně pozitivních nálezů, nákladů a dopadů na péči. Verzované prompty, kontroly zdrojů, auditní záznamy a kalibrovaná nejistota budou důležité pro reprodukovatelnost a bezpečnost. Takové studie budou i nadále vyžadovat kvalifikované klinické pracovníky, kteří vyhodnotí důkazy, vyžádají si vhodné testy a učiní potřebná diagnostická nebo léčebná rozhodnutí.

Tato studie používala OpenAI o3 Deep Research. Novější univerzální modely dokáží vyhledávat a syntetizovat více vědeckých materiálů, zatímco účelově vytvořené systémy, jako je GPT‑Rosalind, jsou navrženy pro hlubší práci v biologických vědách, včetně účinků variant na strukturu a funkci proteinů. Tyto schopnosti zde testovány nebyly a budou vyžadovat vlastní hodnocení i kontrolu přístupu.

Tuto počáteční výzkumnou studii podpořila OpenAI, ale další fázi práce povede Manton Center díky grantu od OpenAI Foundation. Grant podpoří širší snahu centra vyvinout na platformě nezávislého a nízkonákladového genetického AI kopilota, který klinickým týmům pomůže analyzovat případy vzácných onemocnění rychleji a konzistentněji.

Dlouhodobější výzkumnou příležitostí je prozkoumat, zda reanalýza s pomocí AI vedená odborníky může pomoci vědeckému porozumění držet krok s objevy. Příslib nespočívá v tom, že AI nahradí lékařskou diagnózu, ale v tom, že pečlivě hodnocené výzkumné nástroje mohou specialistům pomoci najít důkazy, které stojí za prověření. Pro tisíce rodin nemusí dnešní nezodpovězené otázky zůstat nezodpovězené navždy.

  • 2026

Autor

OpenAI