18. juuni 2026

Rakenduslik AI

AI abil laste haruldaste geneetiliste haiguste diagnoosimine

NEJM AI uuringus kasutasid eksperdid OpenAI arutlusmudelit 376 varem lahendamata juhtumi reanalüüsiks ja leidsid juhtlõngu 18 diagnoosini.

Loe uuringu kokkuvõtet ajakirjas NEJM AI

Laadimine…

Isegi genoomisekveneerimise korral ei saa paljud haruldaste haigustega inimesed kunagi selget geneetilist diagnoosi. Ligikaudu pooled jäävad diagnoosita ka pärast ulatuslikke uuringuid ja eriarstide läbivaatust. Nende meditsiiniandmed võivad sisaldada vihjeid, kuid nende leidmine võib nõuda tuhandete kuni miljonite võimalike geneetiliste variantide, killustunud kliiniliste dokumentide ja kiiresti muutuva teaduskirjanduse läbitöötamist.

Uute geeni-haiguse seoste, haigusjuhtude kirjelduste ja klassifitseerimistõendite lisandudes võivad lahendamata juhtumid muutuda uuesti tõlgendatavaks.

Boston Children’s Hospitali Manton Center for Orphan Disease Researchi, Harvardi ülikooli ja OpenAI teadlased kasutasid OpenAI o3 süvauuringu arutlusmudelit, et analüüsida 376 varem analüüsitud, kuid lahendamata juhtumi pseudonüümitud kliinilist ja genoomiteavet. Mudel tõi teadlastele ja klinitsistidele hindamiseks esile tõenditega seotud kandidaatseletused. Pärast ekspertide ülevaatust, lisauuringuid ja kliinilist kinnitust panid arstid diagnoosi 18 juhul – see andis pärast varasemat spetsialistide analüüsi täiendava diagnostilise saagise 4,8%. Uuring avaldati 18. juunil 2026 ajakirjas NEJM AI ning näitab, kuidas AI toel toimiv uurimistöövoog võib aidata ekspertidel leida uusi juhtlõngu, kui nad vaatavad uuesti läbi osa kõige keerukamatest juhtumitest.

Paljud neist juhtumitest olid jäänud lahenduseta hoolimata aastatepikkusest ekspertanalüüsist. Selles uuringus aitas OpenAI o3 süvauuring teadlastel leida juhtlõngu, mida hiljem hinnati väljakujunenud kliiniliste protsesside kaudu, viidates sellele, et ekspertide juhitud perioodiline reanalüüs võib teadmiste arenedes muutuda paremini skaleeritavaks. Mudel ei diagnoosinud ühtegi patsienti ega teinud ühtegi kliinilist otsust. See koostas tõenditega seotud hüpoteese, mida spetsialistid said üle vaadata ning vajaduse korral lisatestidega uurida ja kliinilises laboris kinnitada.

Miks vana juhtum võib sisaldada uut vastust

Ebaselge geneetilise testi tulemus ei ole alati lõplik leid. Patsiendi fenotüübi kirjeldused, testitulemused ja perekonnaanamnees võivad paikneda eri andmebaasides, mis kasutavad erinevaid identifikaatoreid, vorminguid ja sõnastikke. Nende kirjete sidumine on keeruline, mistõttu võivad isegi spetsialistid diagnoosi märkamata jätta. Eksperdid võivad lapse genoomi sekveneerida ka enne, kui asjakohane geen või selle variandid on haigusega seostatud. Teaduse arenedes võivad samad andmed paljastada vastuseid, mida varem ei olnud võimalik leida.

Haruldaste haiguste reanalüüs on ühtaegu teaduslik ja hoolduslik probleem. Patsiendi genoom võib jääda samaks, kuid seda ümbritsevad tõendid muutuvad pidevalt: teadlased seostavad uusi geene ja variante haigustega, laborid klassifitseerivad vanu variante ümber ning juhtumite andmebaasidesse ja artiklitesse lisandub uusi tähelepanekuid. Iga uuendus võib muuta vana ebaselge juhtumi uuesti läbivaatamist väärivaks, nii et paljud asutused pärivad kasvava hulga genoome, mida tuleb hoida kooskõlas pidevalt muutuva teadmistebaasiga.

Selles uuringus kavandasid teadlased töövoo nii, et mudel toimis olemasolevate genoomikaprotsesside peal seletusele keskenduva arutluskihina. Selle asemel et tagastada ainult järjestatud geen, paluti sellel siduda kliinilised tunnused, pärandumismuster, varianditõendid ja teaduskirjandus põhjenduseks, mida inimhindaja saaks kriitiliselt uurida.

Kuidas reanalüüs toimis

Iga juhtumi kohta koostas töörühm pseudonüümitud paketi, mis sisaldas standardiseeritud Human Phenotype Ontology termineid patsiendi kliinilise pildi kirjeldamiseks, aeg-ajalt klinitsisti märkmeid ja võimalikku kirjeldavat kliinilist diagnoosi, metaandmeid nagu vanus ja sugu ning filtreeritud variantide tabelit. Tabel kajastas iga variandi haruldust, selle prognoositavat mõju kodeeritud valgule, ClinVari klassifikatsiooni ja signaali kvaliteeti kättesaadavate pereliikmete lõikes. Enamik juhtumeid sisaldas andmeid lapse ja mõlema bioloogilise vanema kohta.

Töörühm palus mudelil pakkuda kõige usutavama molekulaarse seletuse ja näidata oma arutluskäiku. Seejärel hindasid teadlased väljundeid sama ACMG/AMP raamistiku alusel, mida kliinilised laborid kasutavad geneetiliste variantide klassifitseerimiseks. Iga kandidaati vaatas üle vähemalt kaks töörühma liiget, erimeelsused lahendati konsensusega ning mudeli väljundit ei käsitatud kunagi diagnoosina. Leid loeti diagnoosiks alles pärast seda, kui kvalifitseeritud eksperdid olid tõendid läbi vaadanud, variant oli klassifitseeritud patogeenseks või tõenäoliselt patogeenseks, CLIA-sertifikaadiga labor oli selle kinnitanud ning kliiniline meeskond oli tulemuse perele edastanud.

Enne lahendamata juhtumite analüüsimist täiustas töörühm töövoogu juba kinnitatud diagnoosiga juhtumite abil. Kordusläbivaatustes leidis see õige geeni ja variandi 48 juhul 51-st, hõlmates mitmesuguseid haruldasi seisundeid. 57 neuromuskulaarse juhtumi kogumis andis töövoog kordusläbivaatustes õige diagnoosi 45 juhtumile. 15 juhtumist koosnevas pikkade lugemitega genoomikogumis nimetas see igas juhtumis õige geeni ja 12 juhtumis mõlemad haigust põhjustavad alleelid. Need hindamised aitasid viibu arendamisel ja näitasid, kus ekspertide ülevaatus jäi endiselt hädavajalikuks.

Mudelilt saadud enesekindlusskoorid seostusid nendes varem lahendatud juhtumites õigete diagnoosidega: keskmine miinimumskoor oli järjepidevalt õigete määrangute puhul 85,6 ning valede või teadmata määrangute puhul 42,1. Skoorid ei olnud kalibreeritud tõenäosused ning töörühm ei kasutanud neid tõendite ega kliinilise otsustamise asendajana. Küll aga aitasid need suunata eksperthindajaid keskenduma kõige paljutõotavamatele kandidaatdiagnoosidele.

Töövooskeem pealkirjaga „Inimese juhitud AI töövoog haruldaste haiguste genoomseks reanalüüsiks“, millel on näidatud, kuidas pseudonüümitud patsiendiandmed liiguvad läbi inimotsuste, LLM-i tõendisünteesi, ekspertülevaatuse, testimise, kliinilise kinnituse ja tulemuste perele tagastamise.

Mida teadlased leidsid

Seejärel rakendas töörühm töövoogu neljale varem lahendamata juhtumite rühmale: neuroarenguliste seisunditega lastele, haruldase neuromuskulaarse haigusega inimestele, varase psühhoosiga lastele ja noorukitele ning pediaatrilistele äkilise ootamatu surma juhtumitele. Need ei olnud uued juhtumid, mis ootasid esmast ülevaatust. Paljusid oli juba uuritud mitme kommerts- või asutusesisese töövooga ning arutatud multidistsiplinaarsetes meeskondades.

Tulemused kohortide kaupa

Kohort	Juhtumid	Esile toodud diagnoosid	Saagis
Neuroarenguline	100	10	10,0%
Neuromuskulaarne haigus	61	4	6,6%
Äkiline ootamatu surm pediaatrias	200	2	1,0%
Varane psühhoos	15	2	13,3%
Kokku	376	18	4,8%

Varase psühhoosi kohort oli väike, seega on selle protsendil lai usaldusvahemik. Saagis kajastab ka seda, kui tõenäoline oli igas kohordis ühe geeni põhine seletus.

Pärast seda, kui mudel oli kandidaadid esile toonud ning eksperdid olid ülevaatuse ja kliinilise kinnituse lõpule viinud, panid arstid diagnoosi 4,8% juhtudest. See määr on tagasihoidlik, kuid selles populatsioonis tähenduslik, sest varasemad ekspertülevaatused ei olnud juhtumeid lahendanud. Sarnased reanalüüsiuuringud teatavad põhjalikult läbi vaadatud juhtumites ühekohalistest lisavõitudest; suurem saagis tuleb tavaliselt uuringutest, mis sisaldavad uusi juhtumeid või hästi tuntud häireid, mis ootavad geneetilist kinnitust.

18 diagnoosist 7 olid taasleiud: diagnoosid, mis olid pandud väljaspool kohalikku uurimistöövoogu, kuid puudusid töörühma üle vaadatud kirjetest. Mitmel juhul olid variandid avalikes andmebaasides juba märgitud patogeenseks või tõenäoliselt patogeenseks, tuues esile eri andmeallikate teabe sünteesimise operatiivse väljakutse.

Paindlikkus variantide tuvastamisel

Ühes varase psühhoosi juhtumis järeldas mudel genoomis struktuurse sündmuse, mida sisendandmetes ei olnud loetletud. See seostas 22. kromosoomil esinenud madala kvaliteediga määrangute jada lapse südame-, immuun-, neuroarengu- ja psühhiaatriliste tunnustega ning püstitas seejärel hüpoteesi 22q11.2 deletsiooni kohta, mida seostatakse DiGeorge’i sündroomiga. See oletatav variant kinnitati järeltehtud genoomisekveneerimisega.

Kuigi viip palus leida ühe monogeense põhjuse, tõi mudel mõnikord esile kaks geeni, mis selgitasid keerukat haiguspilti paremini. Ühes juhtumis aitasid LAMA2 ja FOXP1 variandid koos selgitada lihas- ja neuroarengulisi tunnuseid; teises juhtumis leiti varem märkamata digeenne seletus, mis hõlmas TTN-i ja SRPK3-e.

Testitava ja bioloogiliselt sidusa hüpoteesi loomine

Lisaks diagnoosidele tuvastas mudel ka võimaliku uudse mehhanistliku seletuse seisundile nimega vitiliigo. Ühes neuroarengulises juhtumis tõi mudel vitiliigoga inimesel esile 11 aminohappe deletsiooni geenis S1PR1. S1PR1 kodeerib rakupinna retseptorit, mis osaleb signalisatsioonis, immuunrakkude liikumises ja kudede bioloogias. Mudel lõimis tõendeid, mis viitasid, et deletsioon võib muuta retseptori struktuuri ja signalisatsiooni viisil, mis vähendab pigmendi tootmist ning aitab samal ajal immuunrakkudel nahas püsida.

Pakutud S1PR1-vitiliigo seos vajab täiendavat eksperimentaalset kinnitamist, kuid see näitlikustab AI mõjuvat rolli struktuuribioloogia, immunoloogia ja kliinilise geneetika hajusate leidude tõlkimisel konkreetseteks, testitavateks hüpoteesideks.

Töörühm nägi neuromuskulaarses kohordis ka võimalikku fenotüübi laienemist. Kahjustavad variandid geenides HSPB8 ja CDK13 ei vastanud täielikult nende geenide tuntuimatele häiretele, viidates laiemale kliinilisele spektrile, mida tuleb kontrollida rohkemate juhtumite ja laboritööga.

Juhtumiuuring: Kyra diagnoos pärast peaaegu kaht aastakümmet

Kõik algas karatetunnis, kui Kyra ema märkas, et tema 9-aastane tütar ei lasku enam asendites nii madalale kui varem. Kyra muutus aeglasemaks ka jalgpallitrennis ning kõndides ja joostes püsis ta varvastel. Tema lastearst ei suutnud lihasnõrkuse põhjust tuvastada, mistõttu suunas ta Kyra eriarsti juurde. Järgnes peaaegu 20 aasta pikkune teekond läbi uuringute, ravide ja konsultatsioonide, kuid diagnoosita.

Kyra juhtum oli üks neljast diagnoosist, mis neuromuskulaarses kohordis esile toodi. Töörühm seostas tema seisundi raaminihkevariandiga geenis HSPB8 ning diagnoosis müofibrillaarse müopaatia vormi, mille korral kogunevad lihaskiududesse ebanormaalsed valgustruktuurid ja aitavad kaasa nõrkuse tekkele. Manton Centeri geneetikanõustaja helistas Kyrale umbes nädal enne tema 28. sünnipäeva.

Selleks ajaks oli Kyra veetnud suure osa oma elust haigusega kohanedes. 13. eluaastaks sõltus ta hingamisaparaadist ja liikus ratastoolis, kuigi tema seisund on sellest ajast saadik stabiliseerunud. Kuigi Kyra müofibrillaarse müopaatia vorm on nii haruldane, et selle pikaajalisest kulust teatakse vähe, on diagnoos toonud teatava selguse.

Piirangud

See uuring näitab, et üldotstarbeline arutlusmudel võib aidata retrospektiivses genoomses reanalüüsis, ühendades fenotüübi, pärandumise, variantide annotatsioonid, andmekvaliteedi mustrid ja teaduskirjanduse ülevaadatavateks hüpoteesideks. See näitab ka, miks perioodiline reanalüüs on oluline: mõned vastused ilmuvad alles siis, kui teadmised arenevad või killustunud kirjed kokku tuuakse.

See uurimus ei tõenda, et patsiendid, klinitsistid või kliendid peaksid kasutama OpenAI mudeleid haiguste diagnoosimiseks või meditsiiniliste otsuste tegemiseks. See ei kirjelda ega toeta OpenAI o3 süvauuringu, ChatGPT või mõne muu OpenAI toote kavandatud kliendikasutust diagnoosimiseks. Mudel ei diagnoosinud ühtegi osalejat; kõik diagnoosid panid arstid ja teised kvalifitseeritud kliinilised eksperdid väljakujunenud ülevaatuse, testimise ja kliinilise kinnitamise protsesside kaudu.

Uuring oli retrospektiivne, kohordid olid heterogeensed ning hindajad ei olnud mudeli enesekindlusskooride suhtes pimendatud. Teadlased ei mõõtnud säästetud aega, kulu, klinitsistide töömahtu, valepositiivsete töökoormust ega muutusi ravis. Samuti ei hinnanud nad süstemaatiliselt muid geneetilise varieeruvuse vorme, nagu struktuursed variandid, kordusjärjestuste laienemised, süvaintronilised muutused või mosaiiksus.

Suured keelemudelid võivad konteksti valesti mõista või luua usutavaid seletusi, mis lähemal kontrollimisel ei pea paika. Seetõttu läbis iga tulemus inimeste otsustamise ja kliinilise kinnituse. Mudel laiendas otsingut ja suunas sellele järgnenud inimjuhitud analüüsi; see ei otsustanud, milline teave või diagnoos perele tagastada.

Uuringus kasutati pseudonüümitud teavet; kaitstud terviseandmeid ei kasutatud ega edastatud väljapoole heakskiidetud keskkondi. Laiem kliiniline kasutuselevõtt nõuab samasugust tähelepanu privaatsusele, turvalisusele, auditeeritavusele ja kohalikele õigusnormidele nagu kogu arstiabi. Juurdepääs mudelile ei asenda sekveneerimistaristut, geneetilist nõustamist, kinnitavaid teste ega spetsialisti otsust.

Abstraktne sinine gradienttaust pehmete üleminekutega helesinise, tsüaani ja sügavsinise toonide vahel, luues sujuva häguse efekti.

„Pudelikael on aeg. Ekspert saab pühendada igale konkreetsele inimesele vaid piiratud osa oma päevast.“

Dr Catherine Brownstein, Bostoni lastehaigla Mantoni harvikhaiguste uurimiskeskus

„Sellised teadlased nagu Catherine ja mina ei suuda kuidagi hoida peas 8000 erinevat haigust. See ongi AI jõud.“

Alan Beggs, Manton Center for Orphan Disease Researchi direktor

Mis saab edasi

Prospektiivsed mitmekeskuselised uuringud peaksid võrdlema LLM-i toel tehtavat reanalüüsi tavapraktikaga diagnostilise saagise, kandidaadini jõudmise aja, klinitsisti töömahu, valepositiivsete koormuse, kulu ja ravi mõju osas. Reprodutseeritavuse ja ohutuse jaoks on olulised versioonitud viibad, viitekontrollid, auditeerimislogid ja kalibreeritud ebakindlus. Sellised uuringud nõuaksid endiselt kvalifitseeritud klinitsiste, kes hindavad tõendeid, tellivad asjakohased testid ning teevad diagnoosi- või raviotsused.

Selles uuringus kasutati OpenAI o3 süvauuringut. Uuemad üldotstarbelised mudelid suudavad otsida ja sünteesida rohkem teadusmaterjali, samas kui eriotstarbelised süsteemid, nagu GPT‑Rosalind, on loodud sügavamaks bioteaduslikuks tööks, sealhulgas variantide mõju hindamiseks valgu struktuurile ja funktsioonile. Neid võimekusi siin ei testitud ning need vajavad eraldi hindamisi ja juurdepääsukontrolle.

Kuigi OpenAI aitas seda esmast uurimust toetada, juhib töö järgmist etappi Manton Center OpenAI Foundationi grandi toel. Grant toetab keskuse laiemat pingutust arendada platvormiülest ja odavat geneetika-AI copiloti, mis aitab kliinilistel meeskondadel haruldaste haiguste juhtumeid kiiremini ja järjepidevamalt analüüsida.

Pikemas perspektiivis on uurimisvõimalus selgitada, kas ekspertide juhitud AI-toeline reanalüüs saab aidata teaduslikul arusaamal avastustega sammu pidada. Lubadus ei seisne selles, et AI asendab arsti diagnoosi, vaid selles, et hoolikalt hinnatud uurimisvahendid võivad aidata spetsialistidel leida tõendeid, mida tasub uurida. Tuhandete perede jaoks ei pea tänased vastuseta küsimused jääma vastuseta igavesti.

2026

Autor

OpenAI

Jätka lugemist

Vaata kõiki

A near-autonomous AI chemist improves a challenging reaction

Peaaegu autonoomne AI-keemik parandab keerulist reaktsiooni meditsiinilises keemias

Teadustöö17. juuni 2026

Tutvustame GPT-Rosalindi uusi võimalusi

Toode3. juuni 2026

GPT-5 vähendab rakuvaba valgusünteesi kulusid

Teadustöö5. veebr 2026