Folosirea AI pentru a ajuta medicii să diagnosticheze boli genetice rare la copii
Într-un studiu NEJM AI, experții au folosit un model de raţionament OpenAI pentru a reanaliza 376 de cazuri nerezolvate și a identifica piste pentru 18 diagnostice.
Chiar și cu secvențiere genomică, multe persoane cu boli rare nu primesc niciodată un diagnostic genetic clar. Aproximativ jumătate rămân nediagnosticate după testări ample și evaluări de specialitate. Datele lor medicale pot conține indicii, dar găsirea lor poate presupune filtrarea a mii sau milioane de variante genetice posibile, a dosarelor clinice fragmentate și a literaturii științifice aflate în schimbare rapidă.
Pe măsură ce se acumulează noi relații genă-boală, rapoarte de caz și dovezi de clasificare, cazurile nerezolvate pot deveni din nou interpretabile.
Cercetători de la Manton Center for Orphan Disease Research al Boston Children’s Hospital, Harvard University și OpenAI au folosit modelul de raţionament OpenAI o3 Cercetare aprofundată pentru a analiza informații clinice și genomice anonimizate din 376 de cazuri analizate anterior, dar rămase nerezolvate. Modelul a scos la iveală explicații candidate legate de dovezi, pentru a fi evaluate de cercetători și clinicieni. După evaluarea experților, testări suplimentare și confirmare clinică, medicii au stabilit diagnostice în 18 cazuri — un randament diagnostic suplimentar de 4,8% după analiza anterioară realizată de specialiști. Acest studiu a fost publicat pe 18 iunie 2026 în NEJM AI și arată cum un flux de cercetare asistat de AI poate ajuta experții să genereze piste atunci când reanalizează unele dintre cele mai dificile cazuri.
Multe dintre aceste cazuri scăpaseră ani la rând analizei experților. În acest studiu, OpenAI o3 Cercetare aprofundată a ajutat cercetătorii să identifice piste care au fost ulterior evaluate prin procese clinice consacrate, sugerând că reanaliza periodică, condusă de experți, ar putea deveni mai scalabilă pe măsură ce cunoașterea evoluează. Modelul nu a diagnosticat niciun pacient și nu a luat nicio decizie clinică. A produs ipoteze legate de dovezi pentru ca specialiștii să le evalueze și, după caz, să le investigheze prin testări suplimentare și să le confirme într-un laborator clinic.
Un test genetic neconcludent nu este întotdeauna o constatare definitivă. Descrierile fenotipului unui pacient, rezultatele testelor și istoricul familial pot fi împărțite între baze de date care folosesc identificatori, formate și vocabulare diferite. Corelarea acestor înregistrări este dificilă, astfel că până și specialiștii pot rata un diagnostic. Experții pot, de asemenea, să secvențieze genomul unui copil înainte ca o genă relevantă sau variantele ei să fi fost asociate cu boala. Pe măsură ce cunoașterea științifică avansează, aceleași date pot dezvălui răspunsuri care înainte erau imposibil de descoperit.
Reanaliza bolilor rare este atât o problemă științifică, cât și una de întreținere. Genomul pacientului poate rămâne același, dar dovezile din jurul lui continuă să se schimbe: cercetătorii leagă noi gene și variante de boală, laboratoarele reclasifică variante vechi, iar bazele de date de cazuri și articolele acumulează observații noi. Fiecare actualizare poate face ca un caz vechi neconcludent să merite reanalizat, astfel că multe instituții moștenesc un volum tot mai mare de genomuri care trebuie sincronizate cu o bază de cunoaștere în mișcare.
În acest studiu, cercetătorii au conceput fluxul de lucru astfel încât modelul să acționeze ca un strat de raţionament axat pe explicație, peste fluxurile de lucru genomice existente. În loc să returneze doar o genă ierarhizată, i s-a cerut să lege manifestările clinice, tiparul de moștenire, dovezile privind varianta și literatura științifică într-o justificare pe care un evaluator uman să o poată interoga.
Pentru fiecare caz, echipa a alcătuit un pachet anonimizat care conținea termeni standardizați din Human Phenotype Ontology pentru a descrie prezentarea clinică a pacientului, note ocazionale ale clinicianului și orice diagnostic clinic descriptiv, metadate precum vârsta și genul, precum și un tabel filtrat de variante. Tabelul includea raritatea fiecărei variante, efectul ei prezis asupra proteinei codificate, clasificarea ClinVar și calitatea semnalului la membrii disponibili ai familiei. Majoritatea cazurilor includeau date de la copil și de la ambii părinți biologici.
Echipa a cerut modelului să propună cea mai plauzibilă explicație moleculară și să-și arate raţionamentul. Cercetătorii au evaluat apoi rezultatele folosind același cadru ACMG/AMP pe care laboratoarele clinice îl folosesc pentru clasificarea variantelor genetice. Cel puțin doi membri ai echipei au evaluat fiecare candidat, dezacordurile au fost rezolvate prin consens, iar un rezultat al modelului nu a fost tratat niciodată ca diagnostic. O constatare a fost considerată diagnostic doar după ce experți calificați au evaluat dovezile, varianta a fost clasificată ca patogenă sau probabil patogenă, un laborator certificat CLIA a confirmat-o, iar echipa clinică a comunicat rezultatul familiei.
Înainte de a analiza cazurile nerezolvate, echipa a rafinat fluxul de lucru pe cazuri cu diagnostice stabilite. Acesta a recuperat gena și varianta corecte în rulări duplicate pentru 48 din 51 de cazuri care includeau o varietate de afecțiuni rare. Într-un set de 57 de cazuri neuromusculare, fluxul de lucru a returnat diagnosticul corect în rulări duplicate pentru 45 dintre cazuri. Într-un set de 15 cazuri cu genomuri secvențiate prin citiri lungi, a indicat gena corectă în fiecare caz și ambele alele cauzatoare de boală în 12 cazuri. Aceste evaluări au ajutat la dezvoltarea solicitării și au arătat unde evaluarea experților rămânea esențială.
Scorurile de încredere raportate de model au urmărit diagnosticele corecte în aceste cazuri rezolvate anterior: scorul minim mediu a fost 85,6 pentru apelurile constant corecte și 42,1 pentru apelurile incorecte sau necunoscute. Scorurile nu erau probabilități calibrate, iar echipa nu le-a folosit ca substitut pentru dovezi sau adjudecare clinică. Dar au fost utile pentru a-i ghida pe evaluatorii experți să se concentreze asupra celor mai promițătoare diagnostice candidate.
Echipa a aplicat apoi fluxul de lucru la patru grupuri de cazuri nerezolvate anterior: copii cu afecțiuni neurodezvoltative, persoane cu boală neuromusculară rară, copii și adolescenți cu psihoză precoce și cazuri de deces pediatric subit neașteptat. Acestea nu erau cazuri noi care așteptau o primă evaluare. Multe fuseseră deja examinate prin mai multe fluxuri de lucru comerciale sau instituționale și discutate de echipe multidisciplinare.
Cohortă | Cazuri | Diagnostice identificate | Randament |
Neurodezvoltativă | 100 | 10 | 10,0% |
Boală neuromusculară | 61 | 4 | 6,6% |
Deces pediatric subit neașteptat | 200 | 2 | 1,0% |
Psihoză precoce | 15 | 2 | 13,3% |
Total | 376 | 18 | 4,8% |
Cohorta de psihoză precoce a fost mică, astfel că procentul ei are un interval de încredere larg. Randamentul reflectă și probabilitatea ca fiecare cohortă să aibă o explicație monogenică.
După ce modelul a scos la iveală candidați, iar experții au finalizat evaluarea și confirmarea clinică, medicii au stabilit diagnostice în 4,8% dintre cazuri. Această rată este modestă, dar semnificativă în această populație, deoarece evaluările anterioare ale experților nu rezolvaseră cazurile. Studii similare de reanaliză raportează câștiguri de o singură cifră în cazuri intens evaluate; randamentele mai mari provin de obicei din studii care conțin cazuri noi sau tulburări bine cunoscute ce așteaptă confirmare genetică.
Dintre cele 18 diagnostice, 7 au fost redescoperiri: diagnostice stabilite în afara fluxului local de cercetare, dar absente din înregistrarea evaluată de echipă. În mai multe cazuri, variantele erau deja listate ca patogene sau probabil patogene în baze de date publice, evidențiind provocarea operațională de a sintetiza informații din surse de date diferite.
Într-un caz de psihoză precoce, modelul a dedus un eveniment structural în genom care nu era listat în datele de intrare. A corelat o serie de apeluri de calitate scăzută pe cromozomul 22 cu manifestările cardiace, imunitare, neurodezvoltative și psihiatrice ale copilului, apoi a formulat ipoteza unei pierderi de material genetic în regiunea 22q11.2 asociate cu sindromul DiGeorge. Această variantă ipotetică a fost confirmată prin secvențiere genomică ulterioară.
Deși solicitarea cerea o singură cauză monogenică, modelul a scos uneori la iveală două gene care explicau mai bine o prezentare complexă. Variantele din LAMA2 și FOXP1 au ajutat împreună la explicarea manifestărilor musculare și neurodezvoltative într-un caz; un altul avea o explicație digenică nerecunoscută anterior, implicând TTN și SRPK3.
Pe lângă diagnostice, modelul a identificat și o posibilă explicație mecanistică nouă pentru o afecțiune numită vitiligo. Într-un caz neurodezvoltativ, modelul a evidențiat o lipsa unei secvențe de 11 aminoacizi în S1PR1 la o persoană cu vitiligo. S1PR1 codifică un receptor de suprafață celulară implicat în semnalizare, mișcarea celulelor imune și biologia țesuturilor. Modelul a integrat dovezi care sugerau că această lipsă a secvenței ar putea modifica structura și semnalizarea receptorului în moduri care reduc producția de pigment, ajutând totodată celulele imune să persiste în piele.
Relația propusă S1PR1-vitiligo necesită validare experimentală suplimentară, dar ilustrează un rol puternic pentru AI în transformarea constatărilor disparate din biologia structurală, imunologie și genetica clinică în ipoteze concrete, testabile.
Echipa a observat și o posibilă extindere fenotipică în cohorta neuromusculară. Variantele dăunătoare din HSPB8 și CDK13 nu se potriveau perfect cu cele mai cunoscute tulburări asociate genelor, sugerând un spectru clinic mai larg pe care mai multe cazuri și lucrări de laborator vor trebui să îl testeze.
Studiu de caz: diagnosticul Kyrei după aproape două decenii
Totul a început la ora de karate, când mama Kyrei a observat că fiica ei de 9 ani nu mai cobora la fel de mult în poziții ca înainte. Kyra încetinise și la antrenamentele de fotbal și mergea sau alerga ridicată pe vârfuri. Pediatrul ei nu a putut identifica cauza slăbiciunii musculare, așa că a trimis-o la un specialist. A urmat o călătorie de aproape 20 de ani prin teste, tratamente și consultații, fără diagnostic.
Cazul Kyrei a fost unul dintre cele patru diagnostice identificate în cohorta neuromusculară. Echipa a legat afecțiunea ei de o variantă frameshift în HSPB8 și a diagnosticat o formă de miopatie miofibrilară, în care structuri proteice anormale se acumulează în fibrele musculare și contribuie la slăbiciune. Un consilier genetic de la Manton Center a sunat-o pe Kyra cu aproximativ o săptămână înainte de împlinirea vârstei de 28 de ani.
Până atunci, Kyra își petrecuse mare parte din viață adaptându-se la boală. Depindea de un ventilator și era în scaun cu rotile până la 13 ani, deși starea ei s-a plafonat de atunci. Deși forma de miopatie miofibrilară a Kyrei este atât de rară încât se cunosc puține despre evoluția ei pe termen lung, diagnosticul i-a adus o oarecare încheiere.
Acest studiu arată că un model de raţionament de uz general poate contribui la reanaliza genomică retrospectivă, combinând fenotipul, moștenirea, adnotările variantelor, tiparele de calitate a datelor și literatura științifică în ipoteze care pot fi evaluate. Arată și de ce contează reanaliza periodică: unele răspunsuri apar doar după ce cunoașterea avansează sau după ce înregistrările fragmentate sunt reunite.
Această cercetare nu este o dovadă că pacienții, clinicienii sau clienții ar trebui să folosească modelele OpenAI pentru a diagnostica boli sau a lua decizii medicale. Nu descrie și nu susține o utilizare destinată clienților a OpenAI o3 Cercetare aprofundată, ChatGPT sau a oricărui alt produs OpenAI pentru diagnostic. Modelul nu a diagnosticat niciun participant; medicii și alți experți clinici calificați au stabilit fiecare diagnostic prin procese consacrate de evaluare, testare și confirmare clinică.
Studiul a fost retrospectiv, cohortele au fost eterogene, iar evaluatorii nu au fost orbiți față de nivelul de încredere al modelului. Cercetătorii nu au măsurat timpul economisit, costurile, efortul clinicianului, volumul de muncă generat de rezultatele fals pozitive sau schimbările în îngrijire. De asemenea, nu au evaluat sistematic alte forme de variație genetică, precum variantele structurale, expansiunile de repetiții, modificările intronice profunde sau mozaicismul.
Modelele lingvistice mari pot interpreta greșit contextul sau pot produce explicații plauzibile care nu rezistă unei analize mai atente. Prin urmare, fiecare rezultat a trecut prin adjudecare umană și confirmare clinică. Modelul a lărgit căutarea și a orientat analiza ulterioară condusă de oameni; nu a decis ce informație sau diagnostic ar trebui comunicat unei familii.
Acest studiu a folosit informații anonimizate, fără ca informații medicale protejate să fie utilizate sau transmise în afara mediilor aprobate. Implementarea clinică mai largă va necesita aceeași atenție la confidențialitate, securitate, auditabilitate și reglementări locale care se aplică întregii îngrijiri medicale. Accesul la model nu înlocuiește infrastructura de secvențiere, consilierea genetică, testarea de confirmare sau judecata specialistului.

„Blocajul este timpul. Un expert poate dedica doar o anumită parte din zi unei singure persoane.”
Dr. Catherine Brownstein, Manton Center for Orphan Disease Research din cadrul Boston Children’s Hospital

„Cercetători ca mine și Catherine nu pot ține în minte 8.000 de boli diferite. Aceasta este puterea AI.”
Alan Beggs, director al Manton Center for Orphan Disease Research
Studiile prospective, multicentrice, ar trebui să compare reanaliza asistată de LLM cu practica standard în privința randamentului diagnostic, a timpului până la identificarea unui candidat, a efortului clinicianului, a poverii rezultatelor fals pozitive, a costurilor și a efectelor asupra îngrijirii. Solicitările versionate, verificările de referințe, jurnalele de audit și incertitudinea calibrată vor fi importante pentru reproductibilitate și siguranță. Astfel de studii ar necesita în continuare clinicieni calificați care să evalueze dovezile, să solicite testele adecvate și să ia orice decizie de diagnostic sau tratament.
Acest studiu a folosit OpenAI o3 Cercetare aprofundată. Modelele mai noi, de uz general, pot căuta și sintetiza mai mult material științific, în timp ce sisteme construite special, precum GPT‑Rosalind, sunt concepute pentru activități mai aprofundate în științele vieții, inclusiv efectele variantelor asupra structurii și funcției proteinelor. Aceste capabilități nu au fost testate aici și vor necesita propriile evaluări și controale de acces.
Deși OpenAI a ajutat la susținerea acestui studiu inițial de cercetare, Manton Center va conduce următoarea etapă a lucrării printr-un grant din partea OpenAI Foundation. Grantul va sprijini efortul mai amplu al centrului de a dezvolta un copilot AI pentru genetică, agnostic față de platformă și cu cost redus, care să ajute echipele clinice să analizeze cazurile de boli rare mai rapid și mai consecvent.
Oportunitatea de cercetare pe termen mai lung este de a explora dacă reanaliza condusă de experți și asistată de AI poate ajuta înțelegerea științifică să țină pasul cu descoperirile. Promisiunea nu este că AI înlocuiește diagnosticul unui medic, ci că instrumentele de cercetare atent evaluate îi pot ajuta pe specialiști să identifice dovezi care merită investigate. Pentru mii de familii, întrebările fără răspuns de astăzi nu trebuie să rămână fără răspuns pentru totdeauna.
- 2026


