AI auttaa lääkäreitä diagnosoimaan lasten harvinaisia geneettisiä sairauksia
NEJM AI -tutkimuksessa asiantuntijat käyttivät OpenAI:n päättelymallia 376 aiemmin ratkaisemattoman tapauksen uudelleenanalyysiin ja löysivät johtolankoja 18 diagnoosiin.
Genomisekvensoinnista huolimatta moni harvinaissairautta sairastava ei koskaan saa selkeää geneettistä diagnoosia. Noin puolet jää ilman diagnoosia laajojen tutkimusten ja erikoislääkärien arvioiden jälkeenkin. Heidän lääketieteellisissä tiedoissaan voi olla vihjeitä, mutta niiden löytäminen voi vaatia tuhansien tai miljoonien mahdollisten geneettisten varianttien, hajanaisten potilasasiakirjojen ja nopeasti muuttuvan tieteellisen kirjallisuuden läpikäyntiä.
Kun uusia geeni–sairaus-yhteyksiä, tapausraportteja ja luokittelunäyttöä kertyy, aiemmin ratkaisemattomat tapaukset voivat muuttua tulkittaviksi.
Boston Children’s Hospitalin Manton Center for Orphan Disease Researchin, Harvardin yliopiston ja OpenAI:n tutkijat käyttivät OpenAI o3 -syvätutkimuksen päättelymallia analysoidakseen tunnisteettomia kliinisiä ja genomisia tietoja 376 aiemmin analysoidusta mutta ratkaisemattomaksi jääneestä tapauksesta. Malli nosti tutkijoiden ja kliinikoiden arvioitavaksi näyttöön kytkeytyviä ehdokasselityksiä. Asiantuntija-arvion, lisätestauksen ja kliinisen vahvistuksen jälkeen lääkärit tekivät diagnoosin 18 tapauksessa – aiempien erikoislääkärianalyysien jälkeen diagnostinen lisätuotto oli 4,8 %. Tutkimus julkaistiin 18. kesäkuuta 2026 NEJM AI -julkaisussa, ja se osoittaa, miten AI-avusteinen tutkimustyönkulku voi auttaa asiantuntijoita löytämään johtolankoja joidenkin vaikeimpien tapausten uudelleenarvioinnissa.
Monet näistä tapauksista olivat väistäneet asiantuntija-analyysiä vuosien ajan. Tässä tutkimuksessa OpenAI o3 -syvätutkimus auttoi tutkijoita tunnistamaan johtolankoja, joita arvioitiin myöhemmin vakiintuneissa kliinisissä prosesseissa. Tämä viittaa siihen, että asiantuntijavetoisesta säännöllisestä uudelleenanalyysistä voisi tulla skaalautuvampaa tiedon kehittyessä. Malli ei diagnosoinut yhtäkään potilasta eikä tehnyt kliinisiä päätöksiä. Se tuotti näyttöön perustuvia hypoteeseja asiantuntijoiden arvioitavaksi ja tarvittaessa lisätestauksella tutkittavaksi ja kliinisessä laboratoriossa vahvistettavaksi.
Epäselvä geneettinen testi ei aina ole pysyvä löydös. Potilaan fenotyyppikuvaukset, testitulokset ja sukuhistoria voivat olla hajallaan tietokannoissa, jotka käyttävät eri tunnisteita, muotoja ja sanastoja. Näiden tietojen yhdistäminen on vaikeaa, joten diagnoosi voi jäädä huomaamatta jopa asiantuntijoilta. Asiantuntijat voivat myös sekvensoida lapsen genomin ennen kuin asiaankuuluva geeni tai sen variantit on yhdistetty sairauteen. Tieteellisen tiedon edetessä samat tiedot voivat paljastaa vastauksia, joita aiemmin ei ollut mahdollista löytää.
Harvinaissairauksien uudelleenanalyysi on sekä tieteellinen että ylläpidollinen haaste. Potilaan genomi voi pysyä samana, mutta sitä ympäröivä näyttö muuttuu jatkuvasti: tutkijat yhdistävät uusia geenejä ja variantteja sairauksiin, laboratoriot luokittelevat vanhoja variantteja uudelleen, ja tapaustietokantoihin ja julkaisuihin kertyy uusia havaintoja. Jokainen päivitys voi tehdä vanhasta epäselvästä tapauksesta uudelleenarvioinnin arvoisen, joten monille laitoksille kertyy kasvava genomijono, joka on pidettävä ajan tasalla muuttuvan tietopohjan kanssa.
Tässä tutkimuksessa tutkijat suunnittelivat työnkulun niin, että malli toimi selityksiä ensin tuottavana päättelykerroksena olemassa olevien genomiputkien päällä. Sen sijaan, että se olisi palauttanut vain järjestetyn geenilistan, sitä pyydettiin yhdistämään kliiniset piirteet, periytymismalli, varianttinäyttö ja tieteellinen kirjallisuus perusteluksi, jota ihmistarkastaja voisi arvioida kriittisesti.
Kunkin tapauksen osalta tiimi kokosi tunnisteettoman aineistopaketin, joka sisälsi potilaan kliinisen oirekuvan kuvaamiseen standardoituja Human Phenotype Ontology -termejä, satunnaisia kliinikon muistiinpanoja ja mahdollisen kuvailevan kliinisen diagnoosin, metatietoja kuten iän ja sukupuolen sekä suodatetun varianttitaulukon. Taulukkoon koottiin kunkin variantin harvinaisuus, sen ennustettu vaikutus koodattuun proteiiniin, ClinVar-luokitus sekä signaalin laatu saatavilla olleiden perheenjäsenten tiedoissa. Useimmissa tapauksissa mukana oli tietoja lapsesta ja molemmista biologisista vanhemmista.
Tiimi pyysi mallia ehdottamaan uskottavinta molekyylitason selitystä ja näyttämään päättelynsä. Tutkijat arvioivat tuotoksia samalla ACMG/AMP-kehyksellä, jota kliiniset laboratoriot käyttävät geneettisten varianttien luokitteluun. Vähintään kaksi tiimin jäsentä arvioi jokaisen ehdokkaan, erimielisyydet ratkaistiin yhteisymmärryksessä, eikä mallin tuotosta koskaan käsitelty diagnoosina. Löydös laskettiin diagnoosiksi vasta, kun pätevät asiantuntijat olivat arvioineet näytön, variantti oli luokiteltu patogeeniseksi tai todennäköisesti patogeeniseksi, CLIA-sertifioitu laboratorio oli vahvistanut sen ja kliininen tiimi oli palauttanut tuloksen perheelle.
Ennen ratkaisemattomien tapausten analysointia tiimi hioi työnkulkua tapauksilla, joilla oli vakiintuneet diagnoosit. Se löysi oikean geenin ja variantin kahdessa rinnakkaisajossa 48 tapauksessa 51:stä, jotka kattoivat monenlaisia harvinaisia sairauksia. 57 hermolihastapauksen joukossa työnkulku palautti oikean diagnoosin kahdessa rinnakkaisajossa 45 tapauksessa. 15 pitkäluentaiseen genomiin perustuvassa tapauksessa se nimesi oikean geenin jokaisessa tapauksessa ja molemmat sairautta aiheuttavat alleelit 12 tapauksessa. Nämä arvioinnit auttoivat kehotteiden kehittämisessä ja osoittivat, missä asiantuntija-arvio oli edelleen välttämätön.
Mallin itse raportoimat luottamuspisteet seurasivat oikeita diagnooseja näissä aiemmin ratkaistuissa tapauksissa: keskimääräinen vähimmäispistemäärä oli 85,6 johdonmukaisesti oikeille kutsuille ja 42,1 virheellisille tai tuntemattomille kutsuille. Pisteet eivät olleet kalibroituja todennäköisyyksiä, eikä tiimi käyttänyt niitä näytön tai kliinisen arvioinnin korvikkeena. Niistä oli kuitenkin hyötyä, kun asiantuntija-arvioijia ohjattiin keskittymään lupaavimpiin diagnoosiehdokkaisiin.
Seuraavaksi tiimi sovelsi työnkulkua neljään aiemmin ratkaisemattomien tapausten ryhmään: lapsiin, joilla oli hermoston kehitykseen liittyviä sairauksia, harvinaista hermolihassairautta sairastaviin, varhaista psykoosia sairastaviin lapsiin ja nuoriin sekä lasten äkillisiin odottamattomiin kuolemantapauksiin. Nämä eivät olleet uusia tapauksia, jotka odottivat ensimmäistä arviota. Monia oli jo tutkittu useissa kaupallisissa tai laitosten omissa analyysiputkissa ja käsitelty moniammatillisissa tiimeissä.
Kohortti | Tapaukset | Diagnoosit nousivat esiin | Saanto |
Neurologinen kehitys | 100 | 10 | 10,0 % |
Neuromuskulaarinen sairaus | 61 | 4 | 6,6 % |
Äkillinen odottamaton kuolema lastenlääketieteessä | 200 | 2 | 1,0 % |
Varhainen psykoosi | 15 | 2 | 13,3 % |
Kokonais | 376 | 18 | 4,8 % |
Varhaisen psykoosin kohortti oli pieni, joten sen prosenttiosuudella on laaja luottamusväli. Löydösosuus kuvastaa myös sitä, kuinka todennäköisesti kullekin kohortille oli olemassa yhden geenin selitys.
Kun malli oli nostanut ehdokkaita esiin ja asiantuntijat olivat tehneet arvioinnin ja kliinisen vahvistuksen, lääkärit tekivät diagnoosin 4,8 %:ssa tapauksista. Osuus on maltillinen mutta tässä potilasjoukossa merkityksellinen, koska aiemmat asiantuntija-arviot eivät olleet ratkaisseet tapauksia. Samankaltaisissa uudelleenanalyysitutkimuksissa raportoidaan yksinumeroisia lisäyksiä perusteellisesti arvioiduissa tapauksissa; suuremmat löydösosuudet saadaan yleensä tutkimuksista, joissa on uusia tapauksia tai tunnettuja sairauksia, jotka odottavat geneettistä vahvistusta.
18 diagnoosista 7 oli uudelleenlöytöjä: diagnooseja, jotka oli tehty paikallisen tutkimustyönkulun ulkopuolella mutta jotka puuttuivat tiimin arvioimasta aineistosta. Useissa tapauksissa variantit oli jo merkitty julkisissa tietokannoissa patogeenisiksi tai todennäköisesti patogeenisiksi, mikä korostaa eri tietolähteiden tiedon yhdistämiseen liittyvää operatiivista haastetta.
Eräässä varhaisen psykoosin tapauksessa malli päätteli genomissa olevan rakenteellisen tapahtuman, jota ei ollut mainittu syötedatassa. Se yhdisti kromosomin 22 heikkolaatuisten kutsujen jakson lapsen sydän-, immuuni-, hermoston kehitys- ja psykiatrisiin piirteisiin ja esitti hypoteesin DiGeorgen oireyhtymään liittyvästä 22q11.2-deleetiosta. Tämä oletettu variantti vahvistettiin jatkogenomisekvensoinnilla.
Vaikka kehotteessa pyydettiin yhtä monogeenista syytä, malli nosti toisinaan esiin kaksi geeniä, jotka selittivät monimutkaista oirekuvaa paremmin. LAMA2- ja FOXP1-variantit yhdessä auttoivat selittämään lihas- ja hermoston kehityspiirteitä yhdessä tapauksessa; toisessa tapauksessa löytyi aiemmin tunnistamaton digeeninen selitys, johon liittyivät TTN ja SRPK3.
Diagnoosien lisäksi malli tunnisti myös mahdollisen uuden mekanistisen selityksen vitiligoksi kutsutulle sairaudelle. Eräässä hermoston kehitykseen liittyvässä tapauksessa malli nosti esiin 11 aminohapon deleetion S1PR1-geenissä henkilöllä, jolla oli vitiligo. S1PR1 koodaa solun pintareseptoria, joka osallistuu signalointiin, immuunisolujen liikkeeseen ja kudosbiologiaan. Malli yhdisti näyttöä, jonka mukaan deleetio voisi muuttaa reseptorin rakennetta ja signalointia tavoilla, jotka vähentävät pigmentin tuotantoa ja samalla auttavat immuunisoluja säilymään ihossa.
Ehdotettu S1PR1–vitiligo-yhteys vaatii lisää kokeellista validointia, mutta se havainnollistaa AI:n vahvaa roolia hajallaan olevien rakennebiologian, immunologian ja kliinisen genetiikan löydösten muuttamisessa konkreettisiksi, testattaviksi hypoteeseiksi.
Tiimi havaitsi myös mahdollista fenotyypin laajenemista hermolihaskohortissa. Vaurioittavat variantit HSPB8- ja CDK13-geeneissä eivät täysin vastanneet geenien parhaiten tunnettuja sairauksia, mikä viittaa laajempaan kliiniseen kirjoon, jonka testaamiseen tarvitaan lisää tapauksia ja laboratoriotyötä.
Tapaustutkimus: Kyran diagnoosi lähes kahden vuosikymmenen jälkeen
Kaikki alkoi karateharjoituksissa, kun Kyran äiti huomasi, ettei hänen 9-vuotias tyttärensä enää päässyt asennoissaan yhtä alas kuin ennen. Kyra hidastui myös jalkapalloharjoituksissa ja käveli ja juoksi päkiöillään. Hänen lastenlääkärinsä ei pystynyt tunnistamaan lihasheikkouden syytä, joten hän lähetti Kyran erikoislääkärille. Seurasi lähes 20 vuoden matka tutkimusten, hoitojen ja konsultaatioiden läpi ilman diagnoosia.
Kyran tapaus oli yksi neljästä hermolihaskohortissa esiin nousseesta diagnoosista. Tiimi yhdisti hänen sairautensa lukukehyksen siirtymän aiheuttavaan HSPB8-varianttiin ja diagnosoi myofibrillaarisen myopatian muodon, jossa poikkeavia proteiinirakenteita kertyy lihassyihin ja ne edistävät heikkoutta. Manton Centerin perinnöllisyysneuvoja soitti Kyralle noin viikko ennen hänen 28-vuotissyntymäpäiväänsä.
Siihen mennessä Kyra oli käyttänyt suuren osan elämästään sairauteen sopeutumiseen. Hän oli hengityskoneen varassa ja pyörätuolissa 13-vuotiaana, vaikka hänen tilansa on sittemmin tasaantunut. Vaikka Kyran myofibrillaarisen myopatian muoto on niin harvinainen, että sen pitkäaikaisesta kulusta tiedetään vain vähän, diagnoosi on tuonut jonkinlaisen päätöksen.
Tutkimus osoittaa, että yleiskäyttöinen päättelymalli voi edistää retrospektiivistä genomista uudelleenanalyysiä yhdistämällä fenotyypin, periytymisen, varianttiannotaatiot, datan laatukuviot ja tieteellisen kirjallisuuden arvioitaviksi hypoteeseiksi. Se osoittaa myös, miksi säännöllinen uudelleenanalyysi on tärkeää: osa vastauksista nousee esiin vasta, kun tieto kehittyy tai hajanaiset tiedot tuodaan yhteen.
Tämä tutkimus ei ole näyttöä siitä, että potilaiden, kliinikoiden tai asiakkaiden tulisi käyttää OpenAI:n malleja sairauksien diagnosointiin tai lääketieteellisten päätösten tekemiseen. Se ei kuvaa eikä suosittele OpenAI o3 -syvätutkimuksen, ChatGPT:n tai minkään muun OpenAI-tuotteen aiottua asiakaskäyttöä diagnostiikassa. Malli ei diagnosoinut yhtäkään osallistujaa; lääkärit ja muut pätevät kliiniset asiantuntijat tekivät kaikki diagnoosit vakiintuneiden arviointi-, testaus- ja kliinisen vahvistuksen prosessien kautta.
Tutkimus oli retrospektiivinen, kohortit olivat heterogeenisiä, eikä arvioijia sokkoutettu mallin luottamuspisteille. Tutkijat eivät mitanneet säästettyä aikaa, kustannuksia, kliinikon työmäärää, väärien positiivisten aiheuttamaa työkuormaa tai muutoksia hoidossa. He eivät myöskään arvioineet järjestelmällisesti muita geneettisen vaihtelun muotoja, kuten rakenteellisia variantteja, toistojaksojen laajentumia, syviä intronisia muutoksia tai mosaiikkisuutta.
Suuret kielimallit voivat tulkita kontekstin väärin tai tuottaa uskottavia selityksiä, jotka eivät kestä tarkempaa tarkastelua. Siksi jokainen tulos kulki ihmisen tekemän arvioinnin ja kliinisen vahvistuksen kautta. Malli laajensi hakua ja kohdisti sitä seuranneen ihmisten johtaman analyysin; se ei päättänyt, mitä tietoa tai mikä diagnoosi perheelle palautetaan.
Tutkimuksessa käytettiin tunnisteettomia tietoja, eikä suojattuja terveystietoja hyödynnetty tai siirretty hyväksyttyjen ympäristöjen ulkopuolelle. Laajempi kliininen käyttöönotto edellyttää samaa huomiota yksityisyyteen, tietoturvaan, auditoitavuuteen ja paikalliseen sääntelyyn kuin kaikki lääketieteellinen hoito. Mallin käyttömahdollisuus ei korvaa sekvensointi-infrastruktuuria, perinnöllisyysneuvontaa, varmistavia testejä eikä asiantuntijan harkintaa.

”Pullonkaula on aika. Asiantuntija voi omistaa päivästään vain tietyn määrän aikaa yhdelle ihmiselle.”
Tri Catherine Brownstein, Boston Children’s Hospitalin Manton Center for Orphan Disease Research

”Catherinen ja minun kaltaiseni tutkijat eivät mitenkään voi pitää mielessään 8 000:ta eri sairautta. Siinä on AI:n voima.”
Alan Beggs, Manton Center for Orphan Disease Researchin johtaja
Prospektiivisissa monikeskustutkimuksissa tulisi verrata suurten kielimallien avustamaa uudelleenanalyysiä tavanomaiseen käytäntöön diagnostisen löydösosuuden, ehdokkaaseen kuluvan ajan, kliinikon työmäärän, väärien positiivisten kuorman, kustannusten ja hoitovaikutusten osalta. Versioidut kehotteet, viitetarkistukset, auditointilokit ja kalibroitu epävarmuus ovat tärkeitä toistettavuuden ja turvallisuuden kannalta. Tällaiset tutkimukset edellyttäisivät edelleen päteviä kliinikoita arvioimaan näyttöä, tilaamaan asianmukaisia testejä ja tekemään mahdolliset diagnoosi- tai hoitopäätökset.
Tässä tutkimuksessa käytettiin OpenAI o3 -syvätutkimusta. Uudemmat yleiskäyttöiset mallit voivat hakea ja yhdistää enemmän tieteellistä aineistoa, kun taas GPT‑Rosalindin kaltaiset tarkoitukseen rakennetut järjestelmät on suunniteltu syvällisempään biotieteelliseen työhön, kuten varianttien proteiinirakenteeseen ja -toimintaan kohdistuvien vaikutusten arviointiin. Näitä kyvykkyyksiä ei testattu tässä, ja ne tarvitsevat omat arviointinsa ja pääsynhallintansa.
Vaikka OpenAI auttoi tukemaan tätä alkuvaiheen tutkimusta, Manton Center johtaa työn seuraavaa vaihetta OpenAI Foundationin apurahan avulla. Apuraha tukee Centerin laajempaa työtä alusta-agnostisen ja edullisen genetiikan AI-apurin kehittämiseksi. Se auttaa kliinisiä tiimejä analysoimaan harvinaissairauksien tapauksia nopeammin ja johdonmukaisemmin.
Pidemmän aikavälin tutkimusmahdollisuus on selvittää, voiko asiantuntijavetoinen AI-avusteinen uudelleenanalyysi auttaa tieteellistä ymmärrystä pysymään löytöjen tahdissa. Lupaus ei ole, että AI korvaisi lääkärin diagnoosin, vaan että huolellisesti arvioidut tutkimustyökalut voivat auttaa asiantuntijoita tunnistamaan näyttöä, jota kannattaa tutkia. Tuhansille perheille tämän päivän avoimien kysymysten ei tarvitse jäädä avoimiksi ikuisesti.
- 2026


