2026. gada 18. jūnijs

Lietišķais MI

MI izmantošana, lai palīdzētu ārstiem diagnosticēt retas bērnu ģenētiskās slimības

NEJM MI pētījumā eksperti izmantoja OpenAI spriestspējas modeli, lai atkārtoti analizētu 376 iepriekš neatrisinātus gadījumus un atrastu pavedienus 18 diagnozēm.

Lasīt pētījuma kopsavilkumu NEJM AI

Notiek ielāde…

Pat veicot genoma sekvencēšanu daudzi cilvēki ar retām slimībām nekad nesaņem skaidru ģenētisku diagnozi. Aptuveni puse nesaņem diagnozi arī pēc plašām pārbaudēm un speciālistu izvērtējuma. Viņu medicīniskajos datos var būt norādes, taču to atrašana var prasīt izsijāt no tūkstošiem līdz miljoniem iespējamu ģenētisko variantu, sadrumstalotus klīniskos ierakstus un strauji mainīgu zinātnisko literatūru.

Uzkrājoties jaunām gēnu un slimību saistībām, gadījumu aprakstiem un klasifikācijas pierādījumiem, neatrisinātus gadījumus var interpretēt no jauna.

Bostonas Bērnu slimnīcas Mantonas Bāreņu slimību pētniecības centra, Hārvardas Universitātes un OpenAI pētnieki izmantoja OpenAI o3 Deep Research spriešanas modeli, lai analizētu anonimizētu klīnisko un genomisko informāciju no 376 iepriekš analizētiem gadījumiem, kas palika neatrisināti. Modelis atklāja ar pierādījumiem saistītus kandidātu skaidrojumus, ko pētnieki un klīnicisti pārskatīja. Pēc ekspertu pārskatīšanas, papildu pārbaudēm un klīniskā apstiprinājuma ārsti noteica diagnozes 18 gadījumos, kas pēc speciālistu veiktas iepriekšējas analīzes palielināja diagnostisko ražu par 4,8%. Šis pētījums tika publicēts 2026. gada 18. jūnijā žurnālā NEJM AI un parāda, kā ar mākslīgo intelektu atbalstīta pētniecības darbplūsma var palīdzēt ekspertiem ģenerēt potenciālos klientus, atkārtoti izskatot dažus no vissarežģītākajiem gadījumiem..

Daudziem šiem gadījumiem vairākus gadus nebija veikta ekspertu analīze. Šajā pētījumā OpenAI o3 Deep Research palīdzēja pētniekiem identificēt pavedienus, kas vēlāk tika izvērtēti ar iedibinātiem klīniskajiem procesiem, liekot domāt, ka ekspertu vadīta periodiska atkārtota analīze, zināšanām attīstoties, varētu kļūt mērogojamāka. Modelis nevienam pacientam neuzstādīja diagnozi un nepieņēma nevienu klīnisku lēmumu. Tas sagatavoja ar pierādījumiem saistītas hipotēzes, ko speciālistiem pārskatīt un, ja nepieciešams, izmeklēt ar papildu testiem un apstiprināt klīniskā laboratorijā.

Kāpēc vecs gadījums var ietvert jaunu atbildi

Nepārliecinošs ģenētiskais tests ne vienmēr ir galīgs konstatējums. Pacienta fenotipa apraksti, testu rezultāti un ģimenes anamnēze var būt sadalīti pa datubāzēm, kas izmanto dažādus identifikatorus, formātus un vārdnīcas. Šos ierakstus sasaistīt ir grūti, tāpēc pat speciālisti var palaist garām diagnozi. Eksperti var arī sekvencēt bērna genomu, pirms attiecīgais gēns vai tā varianti ir sasaistīti ar slimību. Zinātniskajām zināšanām attīstoties, tie paši dati var atklāt atbildes, kuras iepriekš nebija iespējams atrast.

Retu slimību atkārtota analīze ir gan zinātniska, gan uzturēšanas problēma. Pacienta genoms var palikt nemainīgs, taču pierādījumi ap to nepārtraukti mainās: pētnieki sasaista jaunus gēnus un variantus ar slimībām, laboratorijas pārklasificē vecus variantus, bet gadījumu datubāzēs un publikācijās uzkrājas jauni novērojumi. Katrs atjauninājums var padarīt vecu, nepārliecinošu gadījumu atkārtotas pārskatīšanas vērtu, tāpēc daudzām iestādēm veidojas arvien lielāks genomu uzkrājums, kas jāuztur saskaņā ar mainīgu zināšanu bāzi.

Šajā pētījumā pētnieki izstrādāja darbplūsmu tā, lai modelis darbotos kā uz skaidrojumu vērsts spriestspējas slānis virs esošajām genomikas sistēmām. Tā vietā, lai atgrieztu tikai sarindotu gēnu, tam tika lūgts sasaistīt klīniskās pazīmes, pārmantošanas modeli, variantu pierādījumus un zinātnisko literatūru pamatojumā, ko cilvēks-recenzents varētu iztaujāt.

Kā notika atkārtotā analīze

Katram gadījumam komanda sagatavoja deidentificētu pakotni ar standartizētiem Human Phenotype Ontology terminiem pacienta klīniskās ainas aprakstīšanai, atsevišķām klīnicistu piezīmēm un jebkādu aprakstošu klīnisko diagnozi, metadatiem, piemēram, vecumu un dzimumu, kā arī filtrētu variantu tabulu. Tabulā tika ietverts katra varianta retums, tā prognozētā ietekme uz kodēto proteīnu, ClinVar klasifikācija un signāla kvalitāte pieejamo ģimenes locekļu datos. Lielākajā daļā gadījumu bija iekļauti dati par bērnu un abiem bioloģiskajiem vecākiem.

Komanda palūdza modelim ierosināt ticamāko molekulāro skaidrojumu un parādīt savu pamatojumu. Pēc tam pētnieki pārskatīja izvades, izmantojot to pašu ACMG/AMP satvaru, ko klīniskās laboratorijas izmanto ģenētisko variantu klasificēšanai. Katru kandidātu pārskatīja vismaz divi komandas locekļi, domstarpības tika atrisinātas vienprātīgi, un modeļa izvade nekad netika uzskatīta par diagnozi. Atrade tika ieskaitīta kā diagnoze tikai pēc tam, kad kvalificēti eksperti bija pārskatījuši pierādījumus, variants bija klasificēts kā patogēns vai, visticamāk, patogēns, CLIA sertificēta laboratorija to bija apstiprinājusi un klīniskā komanda rezultātu bija paziņojusi ģimenei.

Pirms neatrisināto gadījumu analīzes komanda pilnveidoja darbplūsmu ar gadījumiem, kuros diagnozes jau bija noteiktas. Tā atkārtotos palaidienos atrada pareizo gēnu un variantu 48 no 51 gadījumos, kas ietvēra dažādas retas saslimšanas. 57 neiromuskulāru gadījumu kopā darbplūsma atkārtotos palaidienos atgrieza pareizo diagnozi 45 gadījumos. 15 gadījumu garo nolasījumu genoma kopā tā nosauca pareizo gēnu katrā gadījumā un abas slimību izraisošās alēles 12 gadījumos. Šie izvērtējumi palīdzēja izstrādāt uzvednes un parādīja, kur ekspertu pārskats joprojām bija būtisks.

Modeļa pašziņotie pārliecības rādītāji šajos iepriekš atrisinātajos gadījumos korelēja ar pareizām diagnozēm: vidējais minimālais rādītājs bija 85,6 konsekventi pareiziem izsaukumiem un 42,1 nepareiziem vai nezināmiem izsaukumiem. Rādītāji nebija kalibrētas varbūtības, un komanda tos neizmantoja kā pierādījumu vai klīniskas izšķiršanas aizstājēju. Tomēr tie palīdzēja virzīt ekspertus-recenzentus koncentrēties uz daudzsološākajām kandidātu diagnozēm.

Darbplūsmas diagramma ar nosaukumu „Cilvēka vadīta MI darbplūsma retu slimību genomiskai atkārtotai analīzei”, kurā redzams, kā deidentificēti pacienta dati plūst caur cilvēka lēmumiem, LVM pierādījumu sintēzi, ekspertu pārskatu, testēšanu, klīnisku apstiprinājumu un rezultātu nodošanu ģimenei.

Ko pētnieki atklāja

Pēc tam komanda piemēroja darbplūsmu četrām iepriekš neatrisinātu gadījumu grupām: bērniem ar neiroattīstības traucējumiem, cilvēkiem ar retu neiromuskulāru slimību, bērniem un pusaudžiem ar sākotnēju psihozi un pediatriskiem pēkšņas negaidītas nāves gadījumiem. Tie nebija jauni gadījumi, kas gaidīja pirmo pārskatu. Daudzus jau bija izskatījušas vairākas komerciālas vai institucionālas sistēmas un apspriedušas daudzdisciplināras komandas.

Rezultāti pa kohortām

Kohorta	Gadījumi	Diagnozes atklājās	Ienesīgums
Neiroattīstības	100	10	10,0%
Neiromuskulāra slimība	61	4	6,6%
Pēkšņa negaidīta nāve pediatrijā	200	2	1,0%
Agrīna psihoze	15	2	13,3%
Kopā	376	18	4,8%

Sākotnējās psihozes kohorta bija neliela, tāpēc tās procentuālajam rādītājam ir plašs ticamības intervāls. Rezultativitāte atspoguļo arī to, cik iespējams katrai kohortai bija viena gēna skaidrojums.

Pēc tam, kad modelis izcēla kandidātus un eksperti pabeidza pārskatu un klīnisko apstiprinājumu, ārsti noteica diagnozes 4,8 % gadījumu. Šis rādītājs ir pieticīgs, bet šai populācijai nozīmīgs, jo iepriekšējie ekspertu pārskati gadījumus nebija atrisinājuši. Līdzīgi atkārtotas analīzes pētījumi ziņo par viencipara procentu pieaugumu rūpīgi pārskatītos gadījumos; augstāki rādītāji parasti ir pētījumos ar jauniem gadījumiem vai labi zināmiem traucējumiem, kuri gaida ģenētisku apstiprinājumu.

No 18 diagnozēm 7 bija atkārtoti atklājumi: diagnozes, kas noteiktas ārpus vietējās pētniecības darbplūsmas, bet nebija atrodamas ierakstā, ko komanda pārskatīja. Vairākos gadījumos varianti publiskajās datubāzēs jau bija norādīti kā patogēni vai, visticamāk, patogēni, uzsverot operacionālo izaicinājumu sintezēt informāciju no dažādiem datu avotiem.

Elastības demonstrēšana variantu identificēšanā

Vienā sākotnējā psihozes gadījumā modelis noteica strukturālu notikumu genomā, kas nebija norādīts ievaddatos. Tas sasaistīja zemas kvalitātes izsaukumu virkni 22. hromosomā ar bērna sirds, imūnsistēmas, neiroattīstības un psihiskajām pazīmēm un pēc tam izvirzīja hipotēzi par 22q11.2 delēciju, kas saistīta ar DiGeorge sindromu. Šis hipotētiskais variants tika apstiprināts ar turpmāku genoma sekvencēšanu.

Lai gan uzvednē tika palūgts noteikt vienu monogēnu cēloni, modelis dažreiz izcēla divus gēnus, kas labāk izskaidroja sarežģītu klīnisko ainu. Varianti LAMA2 un FOXP1 kopā palīdzēja izskaidrot muskuļu un neiroattīstības pazīmes vienā gadījumā; citā bija iepriekš neatpazīts digēns skaidrojums, kas ietvēra TTN un SRPK3.

Testējamas, bioloģiski saskanīgas hipotēzes izveide

Papildus diagnozēm modelis identificēja arī iespējamu jaunu mehānistisku skaidrojumu stāvoklim, ko sauc par vitiligo. Vienā neiroattīstības gadījumā modelis izcēla 11 aminoskābju delēciju S1PR1 gēnā cilvēkam ar vitiligo. S1PR1 kodē šūnas virsmas receptoru, kas iesaistīts signalizācijā, imūnšūnu kustībā un audu bioloģijā. Modelis integrēja pierādījumus, kas liecināja, ka delēcija varētu mainīt receptora struktūru un signalizāciju tā, ka samazinās pigmenta veidošanās, vienlaikus palīdzot imūnšūnām saglabāties ādā.

Ierosinātajai S1PR1 un vitiligo saistībai nepieciešama papildu eksperimentāla validācija, taču tā ilustrē MI spēcīgo lomu izkaisītu strukturālās bioloģijas, imunoloģijas un klīniskās ģenētikas atradņu pārvēršanā konkrētās, testējamās hipotēzēs.

Komanda neiromuskulārajā kohortā novēroja arī iespējamu fenotipa paplašināšanos. Kaitīgi varianti HSPB8 un CDK13 gēnos pilnībā neatbilda šo gēnu vislabāk zināmajiem traucējumiem, liekot domāt par plašāku klīnisko spektru, kas būs jāpārbauda ar vairāk gadījumiem un laboratorijas darbu.

Gadījuma pētījums: Kiras diagnoze pēc gandrīz divām desmitgadēm

Tas sākās karatē nodarbībā, kad Kirais māte pamanīja, ka viņas 9 gadus vecā meita vairs nespēj nostāties tik zemu kā agrāk. Kira arī kļuva lēnāka futbola treniņos un, ejot un skrienot, turējās uz pirkstgaliem. Viņas pediatrs nespēja noteikt muskuļu vājuma cēloni, tāpēc nosūtīja viņu pie speciālista. Tam sekoja gandrīz 20 gadus ilgs ceļš cauri testiem, ārstēšanai un konsultācijām bez diagnozes uzzināšanas.

Kiras gadījums bija viena no četrām diagnozēm, kas tika atklātas neiromuskulārajā kohortā. Komanda sasaistīja viņas stāvokli ar rāmja nobīdes variantu HSPB8 gēnā un diagnosticēja miofibrilārās miopātijas formu, kurā muskuļu šķiedrās uzkrājas patoloģiskas proteīnu struktūras un veicina vājumu. Aptuveni nedēļu pirms Kiras 28. dzimšanas dienas viņai piezvanīja ģenētikas konsultants no Manton centra.

Līdz tam Kira lielu daļu dzīves bija pavadījusi, pielāgojoties slimībai. Līdz 13 gadu vecumam viņa bija atkarīga no elpošanas ventilatora un pārvietojās ratiņkrēslā, lai gan kopš tā laika viņas stāvoklis ir stabilizējies. Lai gan Kira miofibrilārās miopātijas forma ir tik reta, ka par tās ilgtermiņa gaitu zināms maz, diagnoze ir devusi zināmu noslēguma sajūtu.

Ierobežojumi

Šis pētījums parāda, ka vispārīga lietojuma spriestspējas modelis var sniegt ieguldījumu retrospektīvā genomiskā atkārtotā analīzē, apvienojot fenotipu, pārmantošanu, variantu anotācijas, datu kvalitātes modeļus un zinātnisko literatūru pārskatāmās hipotēzēs. Tas arī parāda, kāpēc periodiska atkārtota analīze ir svarīga: dažas atbildes parādās tikai pēc zināšanu attīstības vai sadrumstalotu ierakstu apvienošanas.

Šis pētījums nav pierādījums tam, ka pacientiem, klīnicistiem vai klientiem būtu jāizmanto OpenAI modeļi slimību diagnosticēšanai vai medicīnisku lēmumu pieņemšanai. Tas neapraksta un neatbalsta OpenAI o3 Deep Research, ChatGPT vai jebkura cita OpenAI produkta paredzētu lietojumu diagnostikā klientu vajadzībām. Modelis nediagnosticēja nevienu dalībnieku; katru diagnozi ārsti un citi kvalificēti klīniskie eksperti noteica, izmantojot iedibinātus pārskata, testēšanas un klīniskā apstiprinājuma procesus.

Pētījums bija retrospektīvs, kohortas bija neviendabīgas, un recenzenti nebija akli attiecībā uz modeļa pārliecību. Pētnieki nemērīja ietaupīto laiku, izmaksas, klīnicistu ieguldījumu, viltus pozitīvo rezultātu darba slodzi vai izmaiņas aprūpē. Viņi arī sistemātiski neizvērtēja citas ģenētisko variāciju formas, piemēram, strukturālos variantus, atkārtojumu paplašinājumus, dziļi introniskas izmaiņas vai mozaīcismu.

Lielie valodu modeļi var nepareizi nolasīt kontekstu vai radīt ticamus skaidrojumus, kas neiztur rūpīgāku pārbaudi. Tāpēc katrs rezultāts izgāja cilvēka izvērtēšanu un klīnisku apstiprinājumu. Modelis paplašināja meklēšanu un fokusēja turpmāko cilvēku vadīto analīzi; tas neizlēma, kāda informācija vai diagnoze būtu jānodod ģimenei.

Šajā pētījumā tika izmantota deidentificēta informācija, un aizsargāta veselības informācija netika izmantota vai pārsūtīta ārpus apstiprinātām vidēm. Plašākai klīniskai ieviešanai būs nepieciešama tāda pati uzmanība privātumam, drošībai, auditējamībai un vietējam regulējumam, kāda attiecas uz visu medicīnisko aprūpi. Piekļuve modelim neaizstāj sekvencēšanas infrastruktūru, ģenētisko konsultēšanu, apstiprinošu testēšanu vai speciālista spriedumu.

Abstrakts zils gradienta fons ar maigām pārejām starp gaiši ziliem, ciāna un tumši ziliem toņiem, radot vienmērīgu, izplūdušu efektu.

„ Pudeles kakls vieta ir laiks. Eksperts jebkurai vienai konkrētai personai var veltīt tikai noteiktu daļu savas dienas.”

Dr. Catherine Brownstein, Boston Children’s Hospital Manton Orfāno slimību pētniecības centrs

„Tādi pētnieki kā Catherine un es nekādi nespējam paturēt prātā 8000 dažādu slimību. Tas ir MI spēks.”

Alan Beggs, Manton Bāreņu slimību pētniecības centra direktors

Kas būs tālāk

Prospektīvos vaiirāku centru pētījumos būtu jāsalīdzina ar LVM atbalstīta atkārtota analīze ar standarta praksi pēc diagnostiskās rezultativitātes, laika līdz kandidātam, klīnicistu ieguldījuma, viltus pozitīvo rezultātu sloga, izmaksām un ietekmes uz aprūpi. Reproducējamībai un drošībai svarīgas būs versijotas uzvednes, atsauču pārbaudes, audita žurnāli un kalibrēta nenoteiktība. Šādos pētījumos joprojām būtu vajadzīgi kvalificēti klīnicisti, kas izvērtē pierādījumus, pasūta atbilstošus testus un pieņem jebkādu diagnozes vai ārstēšanas lēmumu.

Šajā pētījumā tika izmantots OpenAI o3 Deep Research. Jaunāki vispārīga lietojuma modeļi var meklēt un sintezēt vairāk zinātnisku materiālu, savukārt īpaši veidotas sistēmas, piemēram, GPT‑Rosalind, ir paredzētas dziļākam darbam dzīvības zinātnēs, tostarp variantu ietekmes uz proteīnu struktūru un funkciju izpētei. Šīs funkcijafs šeit netika pārbaudītas, un tām būs vajadzīgi atsevišķi izvērtējumi un piekļuves kontroles.

Lai gan OpenAI palīdzēja atbalstīt šo sākotnējo pētniecības pētījumu, nākamo darba posmu Manton centrs vadīs ar OpenAI Foundation granta palīdzību. Grants atbalstīs centra plašākos centienus izstrādāt no platformas neatkarīgu, zemu izmaksu ģenētikas MI asistentu, kas palīdz klīniskajām komandām analizēt retu slimību gadījumus ātrāk un konsekventāk.

Ilgāka termiņa pētniecības iespēja ir izpētīt, vai ekspertu vadīta, ar MI atbalstīta atkārtota analīze var palīdzēt zinātniskajai izpratnei turēties līdzi atklājumiem. Solījums nav tas, ka MI aizstāj ārsta diagnozi, bet gan tas, ka rūpīgi izvērtēti pētniecības rīki var palīdzēt speciālistiem identificēt pierādījumus, kurus vērts izmeklēt. Tūkstošiem ģimeņu šodienas neatbildētajiem jautājumiem nav jāpaliek neatbildētiem uz visiem laikiem.

2026

Autors

OpenAI

Turpināt lasīt

Skatīt visu

A near-autonomous AI chemist improves a challenging reaction

Gandrīz autonoms AI ķīmiķis uzlabo izaicinošu reakciju medicīniskajā ķīmijā

Izpēte2026. g. 17. jūn.

Iepazīstinām ar jaunām GPT-Rosalind iespējām

Produkts2026. g. 3. jūn.

GPT-5 samazina bezšūnu proteīnu sintēzes izmaksas

Izpēte2026. g. 5. febr.