Preskočite na glavno vsebino
OpenAI

18. junij 2026

Uporabna AI

Uporaba AI za pomoč zdravnikom pri diagnosticiranju redkih genetskih bolezni pri otrocih

V študiji NEJM AI so strokovnjaki uporabili model sklepanja OpenAI za ponovno analizo 376 prej nerešenih primerov in odkrili sledi za 18 diagnoz.

Nalaganje …

Tudi ob genomskem sekvenciranju mnogi ljudje z redkimi boleznimi nikoli ne dobijo jasne genetske diagnoze. Približno polovica jih ostane brez diagnoze tudi po obsežnem testiranju in pregledu pri specialistih. Njihovi zdravstveni podatki lahko vsebujejo namige, vendar je za njihovo odkrivanje treba prečesati od tisoč do milijone možnih genetskih variant, razdrobljene klinične zapise in hitro spreminjajočo se znanstveno literaturo.

Ko se kopičijo nove povezave med geni in boleznimi, poročila o primerih ter dokazi za klasifikacijo, lahko nerešeni primeri postanejo na novo razložljivi.

Raziskovalci iz Manton Center for Orphan Disease Research pri Boston Children’s Hospital, Univerze Harvard in OpenAI so uporabili model sklepanja OpenAI o3 za poglobljeno raziskovanje, da bi analizirali deidentificirane klinične in genomske podatke iz 376 prej analiziranih primerov, ki so ostali nerešeni. Model je izpostavil z dokazi povezane možne razlage, ki so jih nato pregledali raziskovalci in kliniki. Po strokovnem pregledu, dodatnem testiranju in klinični potrditvi so zdravniki postavili diagnoze v 18 primerih, kar pomeni dodaten diagnostični izplen 4,8 % po predhodni analizi specialistov. Študija je bila objavljena 18. junija 2026 v reviji NEJM AI in kaže, kako lahko raziskovalni potek dela s pomočjo AI pomaga strokovnjakom ustvarjati sledi pri ponovnem pregledu nekaterih najtežjih primerov.

Mnogi od teh primerov so se več let izmikali strokovni analizi. V tej študiji je OpenAI o3 za poglobljeno raziskovanje raziskovalcem pomagal prepoznati sledi, ki so jih pozneje ocenili z uveljavljenimi kliničnimi postopki, kar nakazuje, da bi lahko redna ponovna analiza pod vodstvom strokovnjakov postala bolj razširljiva, ko se znanje razvija. Model ni diagnosticiral nobenega pacienta in ni sprejel nobene klinične odločitve. Ustvaril je z dokazi povezane hipoteze, ki so jih pregledali specialisti in jih, kjer je bilo primerno, raziskali z dodatnim testiranjem ter potrdili v kliničnem laboratoriju.

Zakaj lahko star primer vsebuje nov odgovor

Neodločen genetski test ni vedno trajna ugotovitev. Opisi pacientovega fenotipa, rezultati testov in družinska anamneza so lahko razpršeni po podatkovnih zbirkah, ki uporabljajo različne identifikatorje, formate in besedišča. Povezovanje teh zapisov je zahtevno, zato lahko diagnozo spregledajo tudi specialisti. Strokovnjaki lahko otrokov genom sekvencirajo tudi še preden je ustrezen gen ali njegove variante povezan z boleznijo. Z napredkom znanstvenega znanja lahko isti podatki razkrijejo odgovore, ki jih prej ni bilo mogoče odkriti.

Ponovna analiza redkih bolezni je hkrati znanstveni in vzdrževalni izziv. Pacientov genom lahko ostane enak, dokazi okoli njega pa se nenehno spreminjajo: raziskovalci z boleznimi povezujejo nove gene in variante, laboratoriji znova klasificirajo stare variante, podatkovne zbirke primerov in članki pa zbirajo nova opažanja. Vsaka posodobitev lahko pomeni, da je star, neodločen primer vreden ponovnega pregleda, zato se v številnih ustanovah kopiči vse več genomov, ki jih je treba usklajevati s premikajočo se bazo znanja.

V tej študiji so raziskovalci potek dela zasnovali tako, da je model deloval kot razlagalni sloj sklepanja nad obstoječimi genomskimi postopki. Namesto da bi vrnil le razvrščen gen, je moral klinične značilnosti, vzorec dedovanja, dokaze o varianti in znanstveno literaturo povezati v utemeljitev, ki jo je človeški pregledovalec lahko preverjal. 

Kako je potekala ponovna analiza

Ekipa je za vsak primer pripravila deidentificiran sveženj s standardiziranimi izrazi Human Phenotype Ontology za opis pacientove klinične slike, občasnimi zdravniškimi zapiski in morebitno opisno klinično diagnozo, metapodatki, kot sta starost in spol, ter filtrirano tabelo variant. Tabela je zajemala redkost posamezne variante, njen predvideni učinek na kodirano beljakovino, klasifikacijo ClinVar in kakovost signala pri razpoložljivih družinskih članih. Večina primerov je vključevala podatke otroka in obeh bioloških staršev.

Ekipa je model prosila, naj predlaga najverjetnejšo molekularno razlago in pokaže svoj postopek. Raziskovalci so nato rezultate pregledali z istim okvirom ACMG/AMP, ki ga klinični laboratoriji uporabljajo za klasifikacijo genetskih variant. Vsakega kandidata sta pregledala vsaj dva člana ekipe, nesoglasja so rešili s soglasjem, rezultat modela pa nikoli ni veljal za diagnozo. Ugotovitev je štela za diagnozo šele, ko so usposobljeni strokovnjaki pregledali dokaze, je bila varianta klasificirana kot patogena ali verjetno patogena, jo je potrdil laboratorij s certifikatom CLIA in je klinična ekipa rezultat vrnila družini.

Pred analizo nerešenih primerov je ekipa potek dela izpopolnila na primerih z že postavljenimi diagnozami. V podvojenih zagonih je pri 48 od 51 primerov z različnimi redkimi stanji znova našel pravilen gen in varianto. V naboru 57 živčno-mišičnih primerov je potek dela v podvojenih zagonih vrnil pravilno diagnozo pri 45 primerih. V naboru 15 genomov z dolgimi odčitki je v vsakem primeru navedel pravilen gen, v 12 primerih pa oba alela, ki povzročata bolezen. Te ocene so pomagale pri razvoju poziva in pokazale, kje strokovni pregled ostaja nujen.

Ocene zaupanja, ki jih je sporočil model sam, so se v teh prej rešenih primerih ujemale s pravilnimi diagnozami: povprečna najnižja ocena je bila 85,6 pri dosledno pravilnih določitvah in 42,1 pri nepravilnih ali neznanih določitvah. Ocene niso bile kalibrirane verjetnosti in ekipa jih ni uporabljala kot nadomestilo za dokaze ali klinično presojo. Vendar so bile koristne pri usmerjanju strokovnih pregledovalcev k najobetavnejšim možnim diagnozam. 

Diagram poteka dela z naslovom „Potek dela za genomsko ponovno analizo redkih bolezni z AI pod človeškim vodstvom“, ki prikazuje, kako deidentificirani podatki pacientov potujejo skozi človeške odločitve, sintezo dokazov z velikim jezikovnim modelom, strokovni pregled, testiranje, klinično potrditev in vrnitev rezultatov družini.

Kaj so ugotovili raziskovalci

Ekipa je nato potek dela uporabila pri štirih skupinah prej nerešenih primerov: otrocih z nevrorazvojnimi stanji, ljudeh z redko živčno-mišično boleznijo, otrocih in mladostnikih z zgodnjo psihozo ter primerih nenadne nepričakovane smrti pri otrocih. To niso bili sveži primeri, ki bi čakali na prvi pregled. Mnoge so že pregledali z več komercialnimi ali institucionalnimi postopki in jih obravnavale multidisciplinarne ekipe.

Rezultati po kohortah

Kohorta

Primeri

Odkrite diagnoze

Izplen

Nevrorazvojne

100

10

10,0 %

Živčno-mišična bolezen

61

4

6,6 %

Nenadna nepričakovana smrt pri otrocih

200

2

1,0 %

Zgodnja psihoza

15

2

13,3 %

Skupaj

376

18

4,8 %

Kohorta zgodnje psihoze je bila majhna, zato ima njen odstotek širok interval zaupanja. Izplen odraža tudi, kako verjetno je bilo, da ima posamezna kohorta enogensko razlago.

Ko je model izpostavil kandidate, strokovnjaki pa so dokončali pregled in klinično potrditev, so zdravniki postavili diagnoze v 4,8 % primerov. Ta delež je skromen, a pri tej populaciji pomemben, ker predhodni strokovni pregledi primerov niso razrešili. Podobne študije ponovne analize poročajo o enomestnih izboljšavah pri temeljito pregledanih primerih; večji izpleni običajno izhajajo iz študij z novimi primeri ali dobro znanimi motnjami, ki čakajo na genetsko potrditev.

Od 18 diagnoz jih je bilo 7 ponovnih odkritij: diagnoze, postavljene zunaj lokalnega raziskovalnega poteka dela, vendar odsotne iz zapisa, ki ga je pregledovala ekipa. V več primerih so bile variante v javnih podatkovnih zbirkah že navedene kot patogene ali verjetno patogene, kar poudarja operativni izziv združevanja informacij iz različnih podatkovnih virov.

Prilagodljivost pri prepoznavanju variant

V enem primeru zgodnje psihoze je model sklepal na strukturni dogodek v genomu, ki ni bil naveden v vhodnih podatkih. Niz nizkokakovostnih določitev na kromosomu 22 je povezal z otrokovimi srčnimi, imunskimi, nevrorazvojnimi in psihiatričnimi značilnostmi, nato pa predpostavil delecijo 22q11.2, povezano z DiGeorgeevim sindromom. To domnevno varianto so potrdili z nadaljnjim sekvenciranjem genoma.

Čeprav je poziv zahteval en monogenski vzrok, je model včasih izpostavil dva gena, ki sta bolje pojasnila zapleteno klinično sliko. Variante v LAMA2 in FOXP1 so skupaj pomagale pojasniti mišične in nevrorazvojne značilnosti v enem primeru; v drugem je šlo za prej neprepoznano digensko razlago, ki je vključevala TTN in SRPK3.

Oblikovanje preverljive, biološko skladne hipoteze

Poleg diagnoz je model prepoznal tudi možno novo mehanistično razlago za stanje, imenovano vitiligo. V enem nevrorazvojnem primeru je model izpostavil delecijo 11 aminokislin v S1PR1 pri osebi z vitiligom. S1PR1 kodira receptor na celični površini, ki sodeluje pri signaliziranju, gibanju imunskih celic in biologiji tkiv. Model je povezal dokaze, ki kažejo, da bi delecija lahko spremenila strukturo in signaliziranje receptorja tako, da bi zmanjšala tvorbo pigmenta, hkrati pa pomagala imunskim celicam vztrajati v koži.

Predlagana povezava med S1PR1 in vitiligom zahteva dodatno eksperimentalno potrditev, vendar ponazarja pomembno vlogo AI pri prevajanju razpršenih ugotovitev iz strukturne biologije, imunologije in klinične genetike v konkretne, preverljive hipoteze.

Ekipa je v živčno-mišični kohorti opazila tudi možno razširitev fenotipa. Škodljive variante v HSPB8 in CDK13 se niso popolnoma ujemale z najbolj znanimi motnjami, povezanimi s tema genoma, kar nakazuje širši klinični spekter, ki ga bo treba preveriti z več primeri in laboratorijskim delom.

Študija primera: Kyrina diagnoza po skoraj dveh desetletjih

Začelo se je pri karateju, ko je Kyrina mama opazila, da se njena 9-letna hči v položajih ne spušča več tako nizko kot nekoč. Kyra je začela zaostajati tudi na nogometnih treningih ter med hojo in tekom ostajati na prstih. Njen pediater ni mogel ugotoviti vzroka mišične oslabelosti, zato jo je napotil k specialistu. Sledilo je skoraj 20-letno potovanje skozi teste, zdravljenja in posvete brez diagnoze.

Kyrin primer je bil ena od štirih diagnoz, izpostavljenih v živčno-mišični kohorti. Ekipa je njeno stanje povezala z varianto s premikom bralnega okvirja v HSPB8 in diagnosticirala obliko miofibrilarne miopatije, pri kateri se v mišičnih vlaknih kopičijo nenormalne beljakovinske strukture in prispevajo k oslabelosti. Genetska svetovalka iz Manton Center je Kyro poklicala približno teden dni pred njenim 28. rojstnim dnevom.

Do takrat je Kyra velik del življenja preživela v prilagajanju bolezni. Do 13. leta je bila odvisna od ventilatorja in na invalidskem vozičku, čeprav se je njeno stanje od takrat ustalilo. Čeprav je Kyrina oblika miofibrilarne miopatije tako redka, da je o njenem dolgoročnem poteku znanega malo, je diagnoza prinesla nekaj zaključka.

Omejitve

Ta študija kaže, da lahko splošni model sklepanja prispeva k retrospektivni genomski ponovni analizi tako, da fenotip, dedovanje, opombe k variantam, vzorce kakovosti podatkov in znanstveno literaturo združi v hipoteze, primerne za pregled. Kaže tudi, zakaj je redna ponovna analiza pomembna: nekateri odgovori se pojavijo šele, ko znanje napreduje ali ko se razdrobljeni zapisi povežejo.

Ta raziskava ni dokaz, da bi morali pacienti, kliniki ali stranke uporabljati modele OpenAI za diagnosticiranje bolezni ali sprejemanje zdravstvenih odločitev. Ne opisuje niti ne podpira predvidene uporabe OpenAI o3 za poglobljeno raziskovanje, ChatGPT ali katerega koli drugega izdelka OpenAI za diagnostiko pri strankah. Model ni diagnosticiral nobenega udeleženca; vsako diagnozo so zdravniki in drugi usposobljeni klinični strokovnjaki postavili z uveljavljenimi postopki pregleda, testiranja in klinične potrditve.

Študija je bila retrospektivna, kohorte so bile heterogene, pregledovalci pa niso bili slepljeni za zaupanje modela. Raziskovalci niso merili prihranjenega časa, stroškov, truda klinikov, delovne obremenitve zaradi lažno pozitivnih rezultatov ali sprememb v oskrbi. Prav tako niso sistematično ocenjevali drugih oblik genetskih variacij, kot so strukturne variante, ekspanzije ponovitev, globoke intronske spremembe ali mozaicizem.

Veliki jezikovni modeli lahko napačno razumejo kontekst ali ustvarijo verjetne razlage, ki ob natančnejšem pregledu ne zdržijo. Zato je vsak rezultat šel skozi človeško presojo in klinično potrditev. Model je razširil iskanje in usmeril nadaljnjo analizo pod vodstvom ljudi; ni odločal, katere informacije ali diagnozo je treba vrniti družini.

Študija je uporabljala deidentificirane informacije; nobenih varovanih zdravstvenih podatkov niso uporabili ali posredovali zunaj odobrenih okolij. Širša klinična uvedba bo zahtevala enako pozornost zasebnosti, varnosti, revizijski sledljivosti in lokalni regulativi, kot velja za vso zdravstveno oskrbo. Dostop do modela ne nadomešča infrastrukture za sekvenciranje, genetskega svetovanja, potrditvenega testiranja ali specialistične presoje.

Abstraktno modro gradientno ozadje z mehkimi prehodi med svetlo modrimi, cian in temno modrimi toni, ki ustvarjajo gladek, zamegljen učinek.

„Ozko grlo je čas. Strokovnjak lahko posamezni osebi posveti le omejen del svojega dne.“

Dr. Catherine Brownstein, Manton Center for Orphan Disease Research pri Boston Children’s Hospital

Abstraktno modro gradientno ozadje z mehkimi prehodi med svetlo modrimi, cian in temno modrimi toni, ki ustvarjajo gladek, zamegljen učinek.

„Raziskovalci, kot sva Catherine in jaz, nikakor ne moremo imeti v glavi 8.000 različnih bolezni. V tem je moč AI.“

Alan Beggs, direktor Manton Center for Orphan Disease Research

Kaj sledi

Prospektivne, večcentrične študije bi morale primerjati ponovno analizo s pomočjo velikega jezikovnega modela s standardno prakso glede diagnostičnega izplena, časa do kandidata, truda klinikov, bremena lažno pozitivnih rezultatov, stroškov in učinkov na oskrbo. Različiceni pozivi, preverjanje referenc, revizijske sledi in kalibrirana negotovost bodo pomembni za ponovljivost in varnost. Tudi take študije bi še vedno zahtevale usposobljene klinike, ki ocenijo dokaze, naročijo ustrezne teste in sprejmejo vsako odločitev o diagnozi ali zdravljenju.

V tej študiji so uporabili OpenAI o3 za poglobljeno raziskovanje. Novejši splošnonamenski modeli lahko iščejo in sintetizirajo več znanstvenega gradiva, namensko razviti sistemi, kot je GPT‑Rosalind, pa so zasnovani za poglobljeno delo v vedah o življenju, vključno z učinki variant na strukturo in delovanje beljakovin. Teh zmožnosti tukaj niso preizkusili in bodo zahtevale lastne ocene ter nadzor dostopa.

Čeprav je OpenAI pomagal podpreti to začetno raziskovalno študijo, bo naslednjo fazo dela vodil Manton Center z nepovratnimi sredstvi OpenAI Foundation. Nepovratna sredstva bodo podprla širša prizadevanja Centra za razvoj platformno neodvisnega in nizkocenovnega genetskega kopilota z AI, ki kliničnim ekipam pomaga hitreje in dosledneje analizirati primere redkih bolezni.

Dolgoročnejša raziskovalna priložnost je raziskati, ali lahko ponovna analiza s pomočjo AI pod vodstvom strokovnjakov pomaga znanstvenemu razumevanju držati korak z odkritji. Obljuba ni v tem, da bi AI nadomestila zdravnikovo diagnozo, temveč da bi skrbno ocenjena raziskovalna orodja specialistom lahko pomagala prepoznati dokaze, vredne nadaljnje raziskave. Za tisoče družin današnja neodgovorjena vprašanja ne rabijo za vedno ostati brez odgovora.

  • 2026

Avtor

OpenAI