Pereiti prie pagrindinio turinio
OpenAI

2026 m. birželio 18 d.

Taikomasis AI

AI pagalba gydytojams diagnozuojant retas vaikų genetines ligas

NEJM AI tyrime ekspertai naudojo OpenAI protavimo modelį 376 neišspręstiems atvejams iš naujo analizuoti ir rado užuominų 18 diagnozių.

Įkeliama...

Net atlikus genomo sekoskaitą, daug žmonių, sergančių retomis ligomis, niekada negauna aiškios genetinės diagnozės. Maždaug pusei diagnozė nenustatoma net po išsamių tyrimų ir specialistų peržiūros. Jų medicininiuose duomenyse gali būti užuominų, tačiau norint jas rasti gali tekti peržiūrėti nuo tūkstančių iki milijonų galimų genetinių variantų, fragmentuotus klinikinius įrašus ir sparčiai kintančią mokslinę literatūrą.

Kaupiantis naujiems genų ir ligų ryšiams, atvejų aprašymams ir klasifikavimo įrodymams, neišspręsti atvejai gali tapti naujai interpretuojami.

Bostono vaikų ligoninės Manton našlaičių ligų tyrimų centro, Harvardo universiteto ir OpenAI tyrėjai naudojo OpenAI o3 giliojo tyrimo protavimo modelį, kad išanalizuotų nuasmenintą klinikinę ir genominę informaciją iš 376 anksčiau analizuotų, bet neišspręstų atvejų. Modelis pateikė įrodymais pagrįstus galimus paaiškinimus, kuriuos turėjo peržiūrėti tyrėjai ir gydytojai. Po ekspertų peržiūros, papildomų tyrimų ir klinikinio patvirtinimo gydytojai nustatė diagnozes 18 atvejų — tai papildoma 4,8 % diagnostinė išeiga po ankstesnės specialistų analizės. Šis tyrimas paskelbtas 2026 m. birželio 18 d. žurnale NEJM AI ir parodo, kaip AI padedama tyrimų eiga gali padėti ekspertams rasti užuominų iš naujo nagrinėjant kai kuriuos sudėtingiausius atvejus.

Daugelis šių atvejų metų metus liko neišaiškinti, nors juos analizavo ekspertai. Šiame tyrime OpenAI o3 gilusis tyrimas padėjo tyrėjams nustatyti užuominas, kurios vėliau buvo vertinamos taikant įprastus klinikinius procesus; tai rodo, kad ekspertų vadovaujama periodinė pakartotinė analizė, kintant žinioms, galėtų tapti lengviau plečiama. Modelis nediagnozavo nė vieno paciento ir nepriėmė jokių klinikinių sprendimų. Jis pateikė įrodymais pagrįstas hipotezes, kad specialistai jas peržiūrėtų ir, kai tinkama, ištirtų papildomais tyrimais bei patvirtintų klinikinėje laboratorijoje.

Kodėl sename atvejyje gali slypėti naujas atsakymas

Neaiškus genetinio tyrimo rezultatas ne visada yra galutinė išvada. Paciento fenotipo aprašymai, tyrimų rezultatai ir šeimos istorija gali būti išskaidyti po duomenų bazes, kuriose naudojami skirtingi identifikatoriai, formatai ir žodynai. Susieti tokius įrašus sunku, todėl diagnozės gali nepastebėti net specialistai. Ekspertai taip pat gali atlikti vaiko genomo sekoskaitą dar prieš tai, kai atitinkamas genas ar jo variantai susiejami su liga. Tobulėjant mokslinėms žinioms, tie patys duomenys gali atskleisti atsakymus, kurių anksčiau buvo neįmanoma rasti.

Retų ligų pakartotinė analizė yra ir mokslinė, ir priežiūros problema. Paciento genomas gali išlikti toks pats, tačiau jį supantys įrodymai nuolat kinta: tyrėjai susieja naujus genus ir variantus su ligomis, laboratorijos perklasifikuoja senus variantus, o atvejų duomenų bazėse ir straipsniuose kaupiasi nauji pastebėjimai. Kiekvienas atnaujinimas gali paversti seną neaiškų atvejį vertu naujos peržiūros, todėl daug institucijų paveldi augančią genomų sankaupą, kurią reikia derinti su nuolat judančia žinių baze.

Šiame tyrime tyrėjai sukūrė darbo eigą taip, kad modelis veiktų kaip į paaiškinimą orientuotas protavimo sluoksnis virš esamų genomikos procesų. Užuot pateikęs tik surikiuotą geną, jis turėjo susieti klinikinius požymius, paveldėjimo modelį, varianto įrodymus ir mokslinę literatūrą į pagrindimą, kurį galėtų nagrinėti žmogus vertintojas. 

Kaip vyko pakartotinė analizė

Kiekvienam atvejui komanda parengė nuasmenintą paketą, kuriame buvo standartizuoti Human Phenotype Ontology terminai paciento klinikiniam vaizdui apibūdinti, kartais — gydytojų pastabos ir bet kokia aprašomoji klinikinė diagnozė, metaduomenys, pavyzdžiui, amžius ir lytis, bei filtruota variantų lentelė. Lentelėje buvo fiksuojamas kiekvieno varianto retumas, numatomas poveikis koduojamam baltymui, ClinVar klasifikacija ir signalo kokybė tarp prieinamų šeimos narių. Daugumoje atvejų buvo įtraukti vaiko ir abiejų biologinių tėvų duomenys.

Komanda paprašė modelio pasiūlyti labiausiai tikėtiną molekulinį paaiškinimą ir parodyti, kaip jis prie jo priėjo. Tada tyrėjai peržiūrėjo išvestis naudodami tą pačią ACMG/AMP sistemą, kurią klinikinės laboratorijos taiko genetiniams variantams klasifikuoti. Kiekvieną kandidatą peržiūrėjo bent du komandos nariai, nesutarimai buvo sprendžiami bendru sutarimu, o modelio išvestis niekada nebuvo laikoma diagnoze. Radininys buvo laikomas diagnoze tik tada, kai kvalifikuoti ekspertai peržiūrėjo įrodymus, variantas buvo klasifikuotas kaip patogeninis arba tikėtinai patogeninis, CLIA sertifikuota laboratorija jį patvirtino, o klinikinė komanda pateikė rezultatą šeimai.

Prieš analizuodama neišspręstus atvejus, komanda patobulino darbo eigą naudodama atvejus su jau nustatytomis diagnozėmis. Pakartotiniuose paleidimuose ji atkūrė teisingą geną ir variantą 48 iš 51 atvejo, apėmusio įvairias retas būkles. 57 neuromuskulinių atvejų rinkinyje darbo eiga pakartotiniuose paleidimuose pateikė teisingą diagnozę 45 atvejais. 15 atvejų ilgųjų skaitymų genomų rinkinyje ji kiekvienu atveju nurodė teisingą geną, o 12 atvejų — abu ligą sukeliančius alelius. Šie vertinimai padėjo rengti užklausas ir parodė, kur ekspertų peržiūra išliko būtina.

Modelio pačių pateikti pasitikėjimo balai šiais anksčiau išspręstais atvejais atitiko teisingas diagnozes: vidutinis mažiausias balas buvo 85,6 nuosekliai teisingiems aptikimams ir 42,1 neteisingiems arba nežinomiems aptikimams. Balai nebuvo kalibruotos tikimybės, ir komanda jų nenaudojo kaip įrodymų ar klinikinio vertinimo pakaitalo. Tačiau jie padėjo ekspertams vertintojams sutelkti dėmesį į perspektyviausias kandidatines diagnozes. 

Darbo eigos diagrama pavadinimu „Žmogaus vadovaujama AI darbo eiga retų ligų genominei pakartotinei analizei“, kurioje rodoma, kaip nuasmeninti paciento duomenys pereina per žmogaus sprendimus, LLM įrodymų sintezę, ekspertų peržiūrą, tyrimus, klinikinį patvirtinimą ir rezultatų grąžinimą šeimai.

Ką tyrėjai nustatė

Tada komanda pritaikė darbo eigą keturioms anksčiau neišspręstų atvejų grupėms: vaikams, turintiems neurologinės raidos būklių, žmonėms, sergantiems reta neuromuskuline liga, vaikams ir paaugliams su ankstyvąja psichoze ir staigios netikėtos vaikų mirties atvejams. Tai nebuvo nauji atvejai, laukiantys pirmosios peržiūros. Daugelį jų jau buvo išnagrinėję keli komerciniai ar institucijų procesai, jie buvo aptarti daugiadalykėse komandose.

Rezultatai pagal kohortą

Kohorta

Atvejai

Iškeltos diagnozės

Išeiga

Neurologinės raidos

100

10

10,0 %

Neuromuskulinė liga

61

4

6,6 %

Staigi netikėta vaikų mirtis

200

2

1,0 %

Ankstyvoji psichozė

15

2

13,3 %

Iš viso

376

18

4,8 %

Ankstyvosios psichozės kohorta buvo maža, todėl jos procentinė dalis turi platų pasikliautinąjį intervalą. Išeiga taip pat atspindi, kiek tikėtina, kad kiekvienoje kohortoje buvo vieno geno paaiškinimas.

Modeliui pateikus kandidatus, o ekspertams užbaigus peržiūrą ir klinikinį patvirtinimą, gydytojai nustatė diagnozes 4,8 % atvejų. Šis rodiklis nedidelis, bet šioje populiacijoje reikšmingas, nes ankstesnės ekspertų peržiūros atvejų neišsprendė. Panašūs pakartotinės analizės tyrimai smarkiai peržiūrėtuose atvejuose praneša apie vienaženklius prieaugius; didesnė išeiga paprastai gaunama tyrimuose, kuriuose yra naujų atvejų arba gerai žinomų sutrikimų, laukiančių genetinio patvirtinimo.

Iš 18 diagnozių 7 buvo iš naujo atrastos: tai diagnozės, nustatytos už vietinės tyrimų darbo eigos ribų, bet nebuvusios įraše, kurį peržiūrėjo komanda. Keliais atvejais variantai viešose duomenų bazėse jau buvo nurodyti kaip patogeniniai arba tikėtinai patogeniniai, pabrėžiant operacinį iššūkį sintetinti informaciją iš skirtingų duomenų šaltinių.

Lankstumo demonstravimas nustatant variantus

Vienu ankstyvosios psichozės atveju modelis padarė išvadą apie struktūrinį įvykį genome, kuris nebuvo nurodytas įvesties duomenyse. Jis susiejo prastos kokybės aptikimų seką 22-oje chromosomoje su vaiko širdies, imuniniais, neurologinės raidos ir psichiatrijos požymiais, o tada iškėlė hipotezę apie 22q11.2 deleciją, siejamą su DiGeorge’o sindromu. Šis hipotetinis variantas buvo patvirtintas vėlesniu genomo sekoskaitos tyrimu.

Nors užklausoje buvo prašoma vienos monogeninės priežasties, modelis kartais iškeldavo du genus, kurie geriau paaiškindavo sudėtingą klinikinį vaizdą. Vienu atveju LAMA2 ir FOXP1 variantai kartu padėjo paaiškinti raumenų ir neurologinės raidos požymius; kitu atveju rastas anksčiau neatpažintas digeninis paaiškinimas, susijęs su TTN ir SRPK3.

Patikrinamos, biologiškai nuoseklios hipotezės kūrimas

Be diagnozių, modelis taip pat nustatė galimą naują mechanistinį paaiškinimą būklei, vadinamai vitiligu. Vienu neurologinės raidos atveju modelis atkreipė dėmesį į 11 aminorūgščių deleciją S1PR1 gene žmogui, sergančiam vitiligu. S1PR1 koduoja ląstelės paviršiaus receptorių, dalyvaujantį signalų perdavime, imuninių ląstelių judėjime ir audinių biologijoje. Modelis integravo įrodymus, rodančius, kad delecija galėtų pakeisti receptoriaus struktūrą ir signalų perdavimą taip, kad sumažėtų pigmento gamyba, o imuninės ląstelės lengviau išliktų odoje.

Siūlomam S1PR1 ir vitiligo ryšiui reikia papildomo eksperimentinio patvirtinimo, tačiau jis iliustruoja galingą AI vaidmenį paverčiant išsklaidytus struktūrinės biologijos, imunologijos ir klinikinės genetikos radinius konkrečiomis, patikrinamomis hipotezėmis.

Komanda neuromuskulinėje kohortoje taip pat pastebėjo galimą fenotipo išplėtimą. Žalingi HSPB8 ir CDK13 variantai nevisiškai atitiko geriausiai žinomus šių genų sutrikimus, todėl galima manyti, kad klinikinis spektras platesnis ir jį reikės patikrinti daugiau atvejų bei laboratoriniu darbu.

Atvejo analizė: Kyros diagnozė po beveik dviejų dešimtmečių

Viskas prasidėjo karatė pamokoje, kai Kyros mama pastebėjo, kad jos 9 metų dukra stovėsenose nebenusileidžia taip žemai kaip anksčiau. Kyra taip pat lėtėjo futbolo treniruotėse, o eidama ir bėgdama laikėsi pasistiebusi ant pirštų. Jos pediatras negalėjo nustatyti raumenų silpnumo priežasties, todėl nukreipė ją pas specialistą. Po to prasidėjo beveik 20 metų trukusi kelionė per tyrimus, gydymą ir konsultacijas be diagnozės.

Kyros atvejis buvo viena iš keturių neuromuskulinėje kohortoje iškeltų diagnozių. Komanda susiejo jos būklę su rėmelio poslinkio variantu HSPB8 gene ir diagnozavo miofibrilinės miopatijos formą, kai raumenų skaidulose kaupiasi nenormalios baltymų struktūros ir prisideda prie silpnumo. Manton centro genetinis konsultantas paskambino Kyrai likus maždaug savaitei iki jos 28-ojo gimtadienio.

Iki tol Kyra didžiąją gyvenimo dalį buvo praleidusi prisitaikydama prie ligos. Būdama 13-os ji jau buvo priklausoma nuo ventiliatoriaus ir judėjo neįgaliojo vežimėliu, nors nuo tada jos būklė stabilizavosi. Nors Kyros miofibrilinės miopatijos forma tokia reta, kad apie jos ilgalaikę eigą žinoma nedaug, diagnozė suteikė tam tikro aiškumo.

Apribojimai

Šis tyrimas rodo, kad bendrosios paskirties protavimo modelis gali prisidėti prie retrospektyvios genominės pakartotinės analizės, sujungdamas fenotipą, paveldimumą, variantų anotacijas, duomenų kokybės dėsningumus ir mokslinę literatūrą į peržiūrimas hipotezes. Jis taip pat parodo, kodėl periodinė pakartotinė analizė svarbi: kai kurie atsakymai išryškėja tik pažengus žinioms arba sujungus fragmentuotus įrašus.

Šis tyrimas nėra įrodymas, kad pacientai, gydytojai ar klientai turėtų naudoti OpenAI modelius ligoms diagnozuoti ar medicininiams sprendimams priimti. Jame neaprašomas ir nerekomenduojamas numatytas klientų naudojimas diagnostikai su OpenAI o3 giliuoju tyrimu, ChatGPT ar bet kuriuo kitu OpenAI produktu. Modelis nediagnozavo nė vieno dalyvio; kiekvieną diagnozę nustatė gydytojai ir kiti kvalifikuoti klinikiniai ekspertai, taikydami nusistovėjusius peržiūros, tyrimų ir klinikinio patvirtinimo procesus.

Tyrimas buvo retrospektyvus, kohortos buvo nevienalytės, o vertintojai žinojo modelio pasitikėjimo balus. Tyrėjai nematavo sutaupyto laiko, sąnaudų, gydytojų pastangų, klaidingai teigiamų rezultatų darbo krūvio ar priežiūros pokyčių. Jie taip pat sistemiškai nevertino kitų genetinės variacijos formų, tokių kaip struktūriniai variantai, pakartojimų išsiplėtimai, giliai introniniai pokyčiai ar mozaicizmas.

LLM gali neteisingai suprasti kontekstą arba pateikti įtikinamų paaiškinimų, kurie neišlaiko atidesnės patikros. Todėl kiekvienas rezultatas buvo peržiūrėtas žmogaus ir kliniškai patvirtintas. Modelis išplėtė paiešką ir nukreipė vėlesnę žmogaus vadovaujamą analizę; jis nenusprendė, kokia informacija ar diagnozė turėtų būti grąžinta šeimai.

Šiame tyrime naudota nuasmeninta informacija; saugoma sveikatos informacija nebuvo naudojama ar perduodama už patvirtintų aplinkų ribų. Platesniam klinikiniam diegimui reikės tokio pat dėmesio privatumui, saugumui, audituojamumui ir vietos reguliavimui, koks taikomas visai medicininei priežiūrai. Prieiga prie modelio nepakeičia sekoskaitos infrastruktūros, genetinio konsultavimo, patvirtinamųjų tyrimų ar specialisto sprendimo.

Abstraktus mėlynas gradiento fonas su švelniais perėjimais tarp šviesiai mėlynų, žydrų ir sodriai mėlynų tonų, sukuriantis glotnų, sulietą efektą.

„Siauroji vieta yra laikas. Ekspertas gali skirti tik ribotą savo dienos dalį vienam konkrečiam žmogui.“

Dr. Catherine Brownstein, Bostono vaikų ligoninės Manton našlaičių ligų tyrimų centras

Abstraktus mėlynas gradiento fonas su švelniais perėjimais tarp šviesiai mėlynų, žydrų ir sodriai mėlynų tonų, sukuriantis glotnų, sulietą efektą.

„Tokie tyrėjai kaip Catherine ir aš tiesiog negalime galvoje laikyti 8 000 skirtingų ligų. Štai kur AI galia.“

Alanas Beggsas, Manton našlaičių ligų tyrimų centro direktorius

Kas toliau

Perspektyviniai daugiacentriai tyrimai turėtų palyginti LLM padedamą pakartotinę analizę su įprasta praktika pagal diagnostinę išeigą, laiką iki kandidato nustatymo, gydytojo pastangas, klaidingai teigiamų rezultatų naštą, sąnaudas ir poveikį priežiūrai. Versijuojamos užklausos, nuorodų patikros, audito žurnalai ir kalibruotas neapibrėžtumas bus svarbūs atkuriamumui ir saugai. Tokiems tyrimams vis tiek reikėtų kvalifikuotų gydytojų, kurie vertintų įrodymus, skirtų tinkamus tyrimus ir priimtų bet kokius diagnozės ar gydymo sprendimus.

Šiame tyrime naudotas OpenAI o3 gilusis tyrimas. Naujesni bendrosios paskirties modeliai gali ieškoti ir sintetinti daugiau mokslinės medžiagos, o specialiai sukurti sistemos, pavyzdžiui, GPT‑Rosalind, skirtos gilesniam gyvybės mokslų darbui, įskaitant variantų poveikį baltymų struktūrai ir funkcijai. Šios galimybės čia nebuvo tikrintos ir reikalaus atskirų vertinimų bei prieigos kontrolės.

Nors OpenAI padėjo paremti šį pradinį tyrimą, kitam darbo etapui vadovaus Manton centras, gavęs OpenAI Foundation dotaciją. Dotacija parems platesnes centro pastangas sukurti nuo platformos nepriklausomą, nebrangų genetinio AI kopilotą, padedantį klinikinėms komandoms greičiau ir nuosekliau analizuoti retų ligų atvejus.

Ilgesnio laikotarpio tyrimų galimybė — ištirti, ar ekspertų vadovaujama AI padedama pakartotinė analizė gali padėti moksliniam supratimui neatsilikti nuo atradimų. Pažadas nėra tas, kad AI pakeis gydytojo diagnozę, o tai, kad kruopščiai įvertintos tyrimų priemonės gali padėti specialistams nustatyti įrodymus, vertus tolesnio tyrimo. Tūkstančiams šeimų šiandien neatsakyti klausimai neturi likti neatsakyti amžinai.

  • 2026 m.

Autorius

OpenAI