Ugrás a fő tartalomra
OpenAI

2026. június 18.

Alkalmazott AI

AI segíti az orvosokat gyermekeket érintő ritka genetikai betegségek diagnosztizálásában

Egy NEJM AI-tanulmányban szakértők OpenAI érvelési modellel elemeztek újra 376 korábban megoldatlan esetet, és 18 diagnózishoz találtak nyomokat.

Betöltés…

Még genomszekvenálás mellett is sok ritka betegségben érintett ember soha nem kap egyértelmű genetikai diagnózist. Nagyjából a felük kiterjedt vizsgálatok és szakorvosi áttekintés után is diagnózis nélkül marad. Orvosi adataik tartalmazhatnak nyomokat, de ezek megtalálása több ezertől akár több millió lehetséges genetikai variáns, töredezett klinikai dokumentáció és gyorsan változó tudományos szakirodalom átvizsgálását igényelheti.

Ahogy gyűlnek az új génbetegség-kapcsolatok, esettanulmányok és osztályozási bizonyítékok, a megoldatlan esetek újra értelmezhetővé válhatnak.

A Boston Children’s Hospital Manton Center for Orphan Disease Research központjának, a Harvard Universitynek és az OpenAI-nak a kutatói az OpenAI o3 mély kutatás érvelési modellt használták 376 korábban elemzett, de megoldatlan eset azonosításra alkalmatlanná tett klinikai és genomikai információinak elemzésére. A modell bizonyítékokhoz kapcsolt lehetséges magyarázatokat hozott felszínre, amelyeket a kutatók és a klinikusok áttekinthettek. Szakértői áttekintést, további vizsgálatokat és klinikai megerősítést követően az orvosok 18 esetben állítottak fel diagnózist – ez a szakértők korábbi elemzése után további 4,8%-os diagnosztikai találati arányt jelent. A tanulmány 2026. június 18-án jelent meg az NEJM AI folyóiratban, és azt mutatja be, hogyan segíthet egy AI-támogatott kutatási munkafolyamat a szakértőknek nyomokat találni a legnehezebb esetek némelyikének újbóli áttekintésekor.

Ezek közül sok eset évekig ellenállt a szakértői elemzésnek. Ebben a tanulmányban az OpenAI o3 mély kutatás segített a kutatóknak olyan nyomokat azonosítani, amelyeket később bevett klinikai folyamatokkal értékeltek, ami arra utal, hogy a szakértők által vezetett időszakos újraelemzés a tudás fejlődésével jobban skálázhatóvá válhat. A modell nem diagnosztizált egyetlen beteget sem, és nem hozott klinikai döntést. Bizonyítékokhoz kapcsolt hipotéziseket állított elő a szakemberek számára, hogy áttekintsék őket, és ahol indokolt, további vizsgálatokkal kivizsgálják, majd klinikai laboratóriumban megerősítsék.

Miért rejthet új választ egy régi eset?

Egy nem egyértelmű genetikai teszteredmény nem mindig végleges megállapítás. A beteg fenotípusleírásai, vizsgálati eredményei és családi anamnézise olyan adatbázisok között oszolhatnak meg, amelyek eltérő azonosítókat, formátumokat és szótárakat használnak. Ezeknek a rekordoknak az összekapcsolása nehéz, ezért még a szakemberek is elszalaszthatnak egy diagnózist. Előfordulhat az is, hogy a szakértők még azelőtt szekvenálják egy gyermek genomját, hogy egy releváns gént vagy annak variánsait betegséghez kapcsolták volna. A tudományos ismeretek fejlődésével ugyanazok az adatok olyan válaszokat tárhatnak fel, amelyeket korábban lehetetlen volt megtalálni.

A ritka betegségek újraelemzése egyszerre tudományos és fenntartási probléma. A beteg genomja változatlan maradhat, de a körülötte lévő bizonyítékok folyamatosan változnak: a kutatók új géneket és variánsokat kapcsolnak betegségekhez, a laborok újraosztályozzák a régi variánsokat, az esetadatbázisokban és a cikkekben pedig új megfigyelések gyűlnek. Minden frissítés indokolttá teheti egy régi, nem egyértelmű eset újbóli áttekintését, így sok intézménynél egyre nő azoknak a genomoknak a hátraléka, amelyeket összhangban kell tartani a mozgó tudásbázissal.

Ebben a tanulmányban a kutatók úgy tervezték meg a munkafolyamatot, hogy a modell magyarázatközpontú érvelési rétegként működjön a meglévő genomikai folyamatok felett. Ahelyett, hogy csak egy rangsorolt gént adott volna vissza, arra kérték, hogy a klinikai jellemzőket, az öröklődési mintázatot, a variánsbizonyítékokat és a tudományos szakirodalmat olyan indoklássá kapcsolja össze, amelyet egy emberi értékelő megvizsgálhat. 

Hogyan zajlott az újraelemzés?

A csapat minden esethez összeállított egy azonosításra alkalmatlanná tett csomagot, amely standardizált Human Phenotype Ontology kifejezéseket tartalmazott a beteg klinikai képének leírására, esetenként klinikusi jegyzeteket és leíró klinikai diagnózist, metaadatokat, például életkort és nemet, valamint egy szűrt variánstáblázatot. A táblázat rögzítette az egyes variánsok ritkaságát, a kódolt fehérjére gyakorolt előre jelzett hatását, a ClinVar-besorolást, valamint a rendelkezésre álló családtagoknál mért jelminőséget. A legtöbb esetben a gyermek és mindkét biológiai szülő adatai is szerepeltek.

A csapat arra kérte a modellt, hogy javasolja a legvalószínűbb molekuláris magyarázatot, és mutassa be az érvelését. A kutatók ezután ugyanazzal az ACMG/AMP keretrendszerrel tekintették át a kimeneteket, amelyet a klinikai laboratóriumok használnak a genetikai variánsok osztályozására. Minden jelöltet legalább két csapattag vizsgált meg, a nézeteltéréseket konszenzussal oldották fel, és a modell kimenetét soha nem kezelték diagnózisként. Egy megállapítás csak akkor számított diagnózisnak, ha képzett szakértők áttekintették a bizonyítékokat, a variánst patogénnek vagy valószínűleg patogénnek minősítették, egy CLIA-tanúsított laboratórium megerősítette, és a klinikai csapat visszajuttatta az eredményt a családnak.

A megoldatlan esetek elemzése előtt a csapat már felállított diagnózisú eseteken finomította a munkafolyamatot. A különféle ritka állapotokat tartalmazó 51 esetből 48-ban ismételt futtatások során megtalálta a helyes gént és variánst. Egy 57 neuromuszkuláris esetből álló halmazban a munkafolyamat 45 esetnél ismételt futtatásokban is a helyes diagnózist adta vissza. Egy 15 esetből álló, hosszú leolvasású genomokat tartalmazó halmazban minden esetben megnevezte a helyes gént, 12 esetben pedig mindkét betegséget okozó allélt. Ezek az értékelések segítették az utasítás fejlesztését, és megmutatták, hol marad nélkülözhetetlen a szakértői áttekintés.

A modell önmaga által jelentett konfidenciapontszámai együtt mozogtak a helyes diagnózisokkal ezekben a korábban megoldott esetekben: az átlagos minimumpontszám a következetesen helyes leleteknél 85,6, a helytelen vagy ismeretlen leleteknél 42,1 volt. A pontszámok nem kalibrált valószínűségek voltak, és a csapat nem használta őket a bizonyítékok vagy a klinikai elbírálás helyettesítésére. Ugyanakkor hasznosak voltak abban, hogy a szakértő értékelők a legígéretesebb diagnózisjelöltekre összpontosítsanak. 

„Ember által irányított AI-munkafolyamat ritka betegségek genomikai újraelemzéséhez” című munkafolyamat-ábra, amelyen az azonosításra alkalmatlanná tett betegadatok emberi döntéseken, LLM-alapú bizonyítékszintézisen, szakértői áttekintésen, tesztelésen, klinikai megerősítésen és az eredmények családhoz való visszajuttatásán haladnak keresztül.

Mit találtak a kutatók?

A csapat ezután négy, korábban megoldatlan esetekből álló csoportra alkalmazta a munkafolyamatot: idegfejlődési állapotú gyermekekre, ritka neuromuszkuláris betegségben érintett emberekre, korai pszichózissal élő gyermekekre és serdülőkre, valamint gyermekkorban bekövetkezett hirtelen váratlan halálesetekre. Ezek nem olyan friss esetek voltak, amelyek az első áttekintésre vártak. Sokukat már több kereskedelmi vagy intézményi folyamat is megvizsgálta, és multidiszciplináris csapatok is megvitatták.

Eredmények kohorsz szerint

Kohorsz

Esetek

Feltárultak a diagnózisok

Hozam

Neurológiai fejlődési

100

10

10,0%

Neuromuszkuláris betegség

61

4

6,6%

Hirtelen váratlan halál a gyermekgyógyászatban

200

2

1,0%

Korai pszichózis

15

2

13,3%

Teljes

376

18 éves

4,8%

A korai pszichózis kohorsz kicsi volt, ezért a százalékos értékhez széles konfidenciaintervallum tartozik. A találati arány azt is tükrözi, hogy az egyes kohorszokban mennyire volt valószínű az egygénes magyarázat.

Miután a modell felszínre hozta a jelölteket, a szakértők pedig elvégezték az áttekintést és a klinikai megerősítést, az orvosok az esetek 4,8%-ában állítottak fel diagnózist. Ez az arány szerény, de ebben a populációban jelentős, mert a korábbi szakértői áttekintések nem oldották meg az eseteket. Hasonló újraelemzési tanulmányok az alaposan áttekintett esetekben egyszámjegyű javulásról számolnak be; magasabb találati arányok általában olyan vizsgálatokban jelennek meg, amelyek új eseteket vagy genetikai megerősítésre váró, jól ismert rendellenességeket tartalmaznak.

A 18 diagnózisból 7 újrafelfedezés volt: olyan diagnózisok, amelyeket a helyi kutatási munkafolyamaton kívül állítottak fel, de hiányoztak a csapat által áttekintett dokumentációból. Több esetben a variánsok már patogénként vagy valószínűleg patogénként szerepeltek nyilvános adatbázisokban, ami rávilágít az adatforrások közötti információszintézis működtetési kihívására.

Rugalmasság demonstrálása a variánsok azonosításában

Egy korai pszichózissal kapcsolatos esetben a modell olyan strukturális eseményre következtetett a genomban, amely nem szerepelt a bemeneti adatok között. A 22-es kromoszómán talált, gyenge minőségű leletek sorozatát összekapcsolta a gyermek kardiális, immunológiai, idegfejlődési és pszichiátriai jellemzőivel, majd a DiGeorge-szindrómával összefüggő 22q11.2-deléciót feltételezett. Ezt a feltételezett variánst utólagos genomszekvenálással megerősítették.

Bár az utasítás egyetlen monogén okot kért, a modell időnként két olyan gént emelt ki, amelyek jobban magyarázták az összetett tünetegyüttest. Az LAMA2 és a FOXP1 variánsai együtt segítettek magyarázatot adni egy eset izom- és idegfejlődési jellemzőire; egy másik esetben pedig korábban fel nem ismert digénes magyarázat merült fel, amelyben a TTN és az SRPK3 érintett.

Tesztelhető, biológiailag koherens hipotézis létrehozása

A diagnózisokon túl a modell egy lehetséges új mechanisztikus magyarázatot is azonosított a vitiligó nevű állapotra. Egy idegfejlődési esetben a modell egy 11 aminosavas deléciót emelt ki az S1PR1 génben egy vitiligóban érintett személynél. Az S1PR1 egy sejtfelszíni receptort kódol, amely részt vesz a jelátvitelben, az immunsejtek mozgásában és a szövetbiológiában. A modell olyan bizonyítékokat integrált, amelyek arra utaltak, hogy a deléció megváltoztathatja a receptor szerkezetét és jelátvitelét oly módon, hogy csökkenti a pigmenttermelést, miközben segíti az immunsejtek bőrben való fennmaradását.

A javasolt S1PR1–vitiligó kapcsolat további kísérleti validálást igényel, de jól szemlélteti az AI erőteljes szerepét abban, hogy a strukturális biológia, az immunológia és a klinikai genetika elszórt eredményeit konkrét, tesztelhető hipotézisekké fordítsa.

A csapat a neuromuszkuláris kohorszban lehetséges fenotípusbővülést is látott. A HSPB8 és a CDK13 károsító variánsai nem illeszkedtek tökéletesen a gének legismertebb rendellenességeihez, ami szélesebb klinikai spektrumra utal; ezt további eseteknek és laboratóriumi munkának kell vizsgálnia.

Esettanulmány: Kyra diagnózisa közel két évtized után

Az egész karateórán kezdődött, amikor Kyra édesanyja észrevette, hogy 9 éves lánya már nem megy olyan mélyre az állásokban, mint korábban. Kyra a futballedzéseken is lassulni kezdett, járás és futás közben pedig lábujjhegyen maradt. Gyermekorvosa nem tudta azonosítani izomgyengeségének okát, ezért szakorvoshoz irányította. Ezt közel 20 éves út követte vizsgálatokon, kezeléseken és konzultációkon át, diagnózis nélkül.

Kyra esete egyike volt a neuromuszkuláris kohorszban felszínre hozott négy diagnózisnak. A csapat az állapotát a HSPB8 frameshift variánsához kapcsolta, és a miofibrilláris miopátia egy formáját diagnosztizálta nála, amelyben rendellenes fehérjestruktúrák halmozódnak fel az izomrostokban, és hozzájárulnak a gyengeséghez. A Manton Center egyik genetikai tanácsadója körülbelül egy héttel Kyra 28. születésnapja előtt hívta fel őt.

Addigra Kyra élete nagy részét a betegséghez való alkalmazkodással töltötte. 13 éves korára lélegeztetőgépre és kerekesszékre szorult, bár állapota azóta stabilizálódott. Bár Kyra miofibrilláris miopátiájának formája annyira ritka, hogy hosszú távú lefolyásáról keveset tudni, a diagnózis némi lezárást hozott számára.

Korlátok

Ez a tanulmány azt mutatja, hogy egy általános célú érvelési modell hozzájárulhat a retrospektív genomikai újraelemzéshez azáltal, hogy a fenotípust, az öröklődést, a variánsannotációkat, az adatminőségi mintázatokat és a tudományos szakirodalmat áttekinthető hipotézisekké kapcsolja össze. Azt is megmutatja, miért fontos az időszakos újraelemzés: egyes válaszok csak akkor kerülnek felszínre, amikor a tudás fejlődik, vagy a töredezett rekordokat összekapcsolják.

Ez a kutatás nem bizonyíték arra, hogy betegeknek, klinikusoknak vagy ügyfeleknek OpenAI modelleket kellene használniuk betegségek diagnosztizálására vagy orvosi döntések meghozatalára. Nem ír le és nem támogat diagnosztikai célú ügyfélhasználatot az OpenAI o3 mély kutatás, a ChatGPT vagy bármely más OpenAI-termék esetében. A modell egyetlen résztvevőt sem diagnosztizált; minden diagnózist orvosok és más képzett klinikai szakértők állítottak fel bevett áttekintési, vizsgálati és klinikai megerősítési folyamatokon keresztül.

A tanulmány retrospektív volt, a kohorszok heterogének voltak, és az értékelők nem voltak vakok a modell konfidenciájára. A kutatók nem mérték az időmegtakarítást, a költséget, a klinikusi ráfordítást, a téves pozitív találatokkal járó munkaterhet vagy az ellátásban bekövetkező változásokat. Más genetikai variációs formákat, például strukturális variánsokat, ismétlődés-expanziókat, mély intronikus változásokat vagy mozaicizmust sem értékeltek szisztematikusan.

A nagy nyelvi modellek félreérthetik a kontextust, vagy olyan hihető magyarázatokat állíthatnak elő, amelyek alaposabb vizsgálatkor nem állják meg a helyüket. Ezért minden eredmény emberi elbíráláson és klinikai megerősítésen ment keresztül. A modell kiszélesítette a keresést és fókuszálta a későbbi, ember vezette elemzést; nem döntötte el, milyen információt vagy diagnózist kell visszajuttatni egy családnak.

A tanulmány azonosításra alkalmatlanná tett információkat használt, és nem alkalmaztak, illetve nem továbbítottak védett egészségügyi információkat jóváhagyott környezeteken kívülre. A szélesebb körű klinikai bevezetéshez ugyanazt a figyelmet kell fordítani az adatvédelemre, a biztonságra, az auditálhatóságra és a helyi szabályozásra, mint minden orvosi ellátásban. A modellhez való hozzáférés nem helyettesíti a szekvenálási infrastruktúrát, a genetikai tanácsadást, a megerősítő vizsgálatokat vagy a szakorvosi megítélést.

Absztrakt kék gradiens háttér lágy átmenetekkel a világoskék, cián és mélykék tónusok között, sima, elmosódott hatást keltve.

„A szűk keresztmetszet az idő. Egy szakértő a napjából csak bizonyos mennyit tud egy adott emberre fordítani.”

Dr. Catherine Brownstein, a Boston Children’s Hospital Manton Center for Orphan Disease Research központja

Absztrakt kék gradiens háttér lágy átmenetekkel a világoskék, cián és mélykék tónusok között, sima, elmosódott hatást keltve.

„Az olyan kutatók, mint Catherine és én, képtelenek 8000 különböző betegséget fejben tartani. Ez az AI ereje.”

Alan Beggs, a Manton Center for Orphan Disease Research igazgatója

Mi következik?

Prospektív, többközpontú vizsgálatoknak kell összehasonlítaniuk az LLM-mel támogatott újraelemzést a standard gyakorlattal a diagnosztikai találati arány, a jelöltig eltelt idő, a klinikusi ráfordítás, a téves pozitív találatok terhe, a költség és az ellátásra gyakorolt hatások alapján. A verziózott utasítások, referencia-ellenőrzések, auditnaplók és kalibrált bizonytalanság fontosak lesznek a reprodukálhatóság és a biztonság szempontjából. Az ilyen vizsgálatokhoz továbbra is képzett klinikusokra lenne szükség a bizonyítékok értékeléséhez, a megfelelő vizsgálatok elrendeléséhez, valamint bármilyen diagnosztikai vagy kezelési döntés meghozatalához.

Ez a tanulmány az OpenAI o3 mély kutatást használta. Az újabb általános célú modellek több tudományos anyagot tudnak keresni és szintetizálni, míg az olyan célzott rendszereket, mint a GPT‑Rosalind, mélyebb élettudományi munkára tervezték, beleértve a variánsok fehérjeszerkezetre és -funkcióra gyakorolt hatásait. Ezeket a képességeket itt nem tesztelték, és saját értékelésekre, valamint hozzáférés-ellenőrzésekre lesz szükségük.

Bár az OpenAI segített támogatni ezt a kezdeti kutatási tanulmányt, a munka következő szakaszát a Manton Center vezeti majd az OpenAI Foundation támogatásával. A támogatás a Center szélesebb törekvését segíti: egy platformfüggetlen, alacsony költségű genetikai AI-kopilóta fejlesztését, amely segít a klinikai csapatoknak gyorsabban és következetesebben elemezni a ritka betegségek eseteit.

A hosszabb távú kutatási lehetőség annak feltárása, hogy a szakértők által vezetett, AI-támogatott újraelemzés segíthet-e a tudományos megértésnek lépést tartani a felfedezésekkel. Az ígéret nem az, hogy az AI kiváltja az orvosi diagnózist, hanem hogy a gondosan értékelt kutatási eszközök segíthetnek a szakembereknek azonosítani a vizsgálatra érdemes bizonyítékokat. Családok ezrei számára a ma megválaszolatlan kérdéseknek nem kell örökre megválaszolatlanul maradniuk.

  • 2026

Szerző

OpenAI