Dùng AI giúp bác sĩ chẩn đoán bệnh di truyền hiếm ở trẻ em
Trong một nghiên cứu trên NEJM AI, các chuyên gia dùng mô hình suy luận của OpenAI để tái phân tích 376 ca trước đó chưa có lời giải và tìm manh mối cho 18 chẩn đoán.
Ngay cả khi đã giải trình tự bộ gen, nhiều người mắc bệnh hiếm vẫn không nhận được chẩn đoán di truyền rõ ràng. Khoảng một nửa vẫn chưa được chẩn đoán sau khi xét nghiệm rộng rãi và được chuyên gia xem xét. Dữ liệu y tế của họ có thể chứa manh mối, nhưng để tìm ra chúng có thể phải sàng lọc từ hàng nghìn đến hàng triệu biến thể di truyền khả dĩ, hồ sơ lâm sàng rời rạc và tài liệu khoa học thay đổi nhanh chóng.
Khi các mối liên hệ mới giữa gen và bệnh, báo cáo ca bệnh và bằng chứng phân loại tích lũy, những ca chưa có lời giải có thể trở nên diễn giải được.
Các nhà nghiên cứu từ Trung tâm Nghiên cứu Bệnh Hiếm Manton thuộc Bệnh viện Nhi Boston, Đại học Harvard và OpenAI đã sử dụng mô hình lập luận OpenAI o3 Deep Research để phân tích thông tin di truyền và lâm sàng đã được mã hóa xóa danh tính (de-identified) từ 376 ca bệnh từng được phân tích trước đó nhưng vẫn chưa tìm ra lời giải. Mô hình đưa ra các lời giải thích ứng viên có liên kết bằng chứng để nhà nghiên cứu và bác sĩ lâm sàng xem xét. Sau khi chuyên gia xem xét, xét nghiệm bổ sung và xác nhận lâm sàng, các bác sĩ đã thiết lập chẩn đoán trong 18 ca—tăng thêm 4,8% tỷ lệ chẩn đoán sau phân tích trước đó của các chuyên gia. Nghiên cứu này được công bố ngày 18 tháng 6 năm 2026 trên NEJM AI và cho thấy một quy trình nghiên cứu có AI hỗ trợ có thể giúp chuyên gia tạo manh mối khi xem xét lại một số ca khó nhất.
Nhiều ca trong số này đã vượt ngoài tầm phân tích của chuyên gia suốt nhiều năm. Trong nghiên cứu này, OpenAI o3 Nghiên cứu sâu giúp các nhà nghiên cứu xác định những manh mối sau đó được đánh giá qua các quy trình lâm sàng đã thiết lập, cho thấy việc tái phân tích định kỳ do chuyên gia dẫn dắt có thể mở rộng quy mô hơn khi tri thức phát triển. Mô hình không chẩn đoán cho bất kỳ bệnh nhân nào và không đưa ra quyết định lâm sàng nào. Mô hình tạo ra các giả thuyết có liên kết bằng chứng để chuyên gia xem xét và, khi phù hợp, điều tra bằng xét nghiệm bổ sung rồi xác nhận trong phòng xét nghiệm lâm sàng.
Một xét nghiệm di truyền chưa kết luận không phải lúc nào cũng là kết quả vĩnh viễn. Mô tả kiểu hình, kết quả xét nghiệm và tiền sử gia đình của bệnh nhân có thể nằm rải rác trong các cơ sở dữ liệu dùng những mã định danh, định dạng và từ vựng khác nhau. Việc liên kết các hồ sơ đó rất khó, nên ngay cả chuyên gia cũng có thể bỏ sót chẩn đoán. Các chuyên gia cũng có thể giải trình tự bộ gen của một trẻ trước khi gen liên quan hoặc các biến thể của gen đó được liên hệ với bệnh. Khi tri thức khoa học tiến bộ, cùng dữ liệu ấy có thể hé lộ những câu trả lời trước đây không thể tìm ra.
Tái phân tích bệnh hiếm vừa là một vấn đề khoa học, vừa là một vấn đề duy trì cập nhật. Bộ gen của bệnh nhân có thể không đổi, nhưng bằng chứng xung quanh nó liên tục thay đổi: các nhà nghiên cứu liên hệ gen và biến thể mới với bệnh, phòng xét nghiệm phân loại lại biến thể cũ, còn cơ sở dữ liệu ca bệnh và bài báo tích lũy thêm quan sát mới. Mỗi cập nhật có thể khiến một ca cũ chưa kết luận trở nên đáng xem xét lại, vì vậy nhiều tổ chức phải tiếp nhận một lượng bộ gen tồn đọng ngày càng lớn cần được đồng bộ với một nền tảng tri thức luôn dịch chuyển.
Trong nghiên cứu này, các nhà nghiên cứu thiết kế quy trình để mô hình đóng vai trò như một lớp suy luận ưu tiên giải thích, đặt trên các quy trình phân tích bộ gen hiện có. Thay vì chỉ trả về một gen được xếp hạng, mô hình được yêu cầu kết nối các đặc điểm lâm sàng, kiểu di truyền, bằng chứng biến thể và tài liệu khoa học thành một lập luận để người đánh giá có thể chất vấn.
Với mỗi ca, nhóm tập hợp một bộ dữ liệu đã khử định danh gồm các thuật ngữ Human Phenotype Ontology chuẩn hóa để mô tả biểu hiện lâm sàng của bệnh nhân, đôi khi có ghi chú của bác sĩ và bất kỳ chẩn đoán lâm sàng mô tả nào, siêu dữ liệu như tuổi và giới, cùng một bảng biến thể đã lọc. Bảng này ghi lại độ hiếm của từng biến thể, tác động dự đoán của nó lên protein được mã hóa, phân loại ClinVar và chất lượng tín hiệu ở các thành viên gia đình có dữ liệu. Hầu hết các ca đều có dữ liệu từ trẻ và cả cha lẫn mẹ ruột.
Nhóm yêu cầu mô hình đề xuất lời giải thích phân tử hợp lý nhất và trình bày cách lập luận. Sau đó, các nhà nghiên cứu xem xét đầu ra bằng cùng khung ACMG/AMP mà các phòng xét nghiệm lâm sàng dùng để phân loại biến thể di truyền. Ít nhất hai thành viên nhóm xem xét từng ứng viên, các bất đồng được giải quyết bằng đồng thuận, và đầu ra của mô hình không bao giờ được coi là chẩn đoán. Một phát hiện chỉ được tính là chẩn đoán sau khi các chuyên gia đủ năng lực xem xét bằng chứng, biến thể được phân loại là gây bệnh hoặc có khả năng gây bệnh, một phòng xét nghiệm được chứng nhận CLIA xác nhận, và nhóm lâm sàng trả kết quả cho gia đình.
Trước khi phân tích các ca chưa có lời giải, nhóm đã tinh chỉnh quy trình trên những ca có chẩn đoán đã được xác lập. Trong các lượt chạy lặp lại, quy trình tìm lại đúng gen và biến thể ở 48 trong 51 ca gồm nhiều bệnh hiếm khác nhau. Trong một tập 57 ca thần kinh cơ, quy trình trả về chẩn đoán đúng trong các lượt chạy lặp lại cho 45 ca. Trong một tập 15 ca dùng giải trình tự bộ gen đọc dài, quy trình nêu đúng gen ở mọi ca và cả hai alen gây bệnh trong 12 ca. Các đánh giá này hỗ trợ phát triển câu lệnh và cho thấy những điểm mà việc chuyên gia xem xét vẫn thiết yếu.
Điểm tự báo cáo về độ tin cậy của mô hình tương ứng với các chẩn đoán đúng trong những ca đã được giải trước đó: điểm tối thiểu trung bình là 85,6 đối với các kết quả gọi nhất quán đúng và 42,1 đối với các kết quả gọi sai hoặc chưa rõ. Các điểm này không phải xác suất đã hiệu chỉnh, và nhóm không dùng chúng thay cho bằng chứng hay thẩm định lâm sàng. Nhưng chúng hữu ích trong việc hướng dẫn các chuyên gia đánh giá tập trung vào những chẩn đoán ứng viên hứa hẹn nhất.
Sau đó, nhóm áp dụng quy trình cho bốn nhóm ca trước đây chưa có lời giải: trẻ mắc các tình trạng phát triển thần kinh, người mắc bệnh thần kinh cơ hiếm, trẻ em và thanh thiếu niên bị loạn thần sớm, và các ca đột tử bất ngờ ở trẻ em. Đây không phải là những ca mới đang chờ được xem xét lần đầu. Nhiều ca đã được nhiều quy trình phân tích thương mại hoặc của tổ chức kiểm tra và được các nhóm đa chuyên khoa thảo luận.
Nhóm | Số ca | Chẩn đoán được phát hiện | Tỷ lệ phát hiện |
Phát triển thần kinh | 100 | 10 | 10,0% |
Bệnh thần kinh cơ | 61 | 4 | 6,6% |
Đột tử bất ngờ ở trẻ em | 200 | 2 | 1,0% |
Loạn thần khởi phát | 15 | 2 | 13,3% |
Tổng cộng | 376 | 18 | 4,8% |
Nhóm loạn thần sớm có quy mô nhỏ, nên tỷ lệ phần trăm có khoảng tin cậy rộng. Tỷ lệ phát hiện cũng phản ánh khả năng mỗi nhóm có lời giải thích từ một gen đơn lẻ.
Sau khi mô hình nêu ra các ứng viên và chuyên gia hoàn tất xem xét cùng xác nhận lâm sàng, các bác sĩ đã thiết lập chẩn đoán trong 4,8% số ca. Tỷ lệ đó khiêm tốn nhưng có ý nghĩa trong quần thể này, vì các đợt xem xét trước của chuyên gia chưa giải quyết được các ca. Các nghiên cứu tái phân tích tương tự báo cáo mức tăng một chữ số ở những ca đã được xem xét kỹ; tỷ lệ phát hiện cao hơn thường đến từ các nghiên cứu có ca mới hoặc các rối loạn đã biết rõ đang chờ xác nhận di truyền.
Trong 18 chẩn đoán, 7 là các phát hiện lại: chẩn đoán được thiết lập ngoài quy trình nghiên cứu địa phương nhưng không có trong hồ sơ mà nhóm xem xét. Trong một số ca, các biến thể đã được liệt kê là gây bệnh hoặc có khả năng gây bệnh trong cơ sở dữ liệu công khai, nhấn mạnh thách thức vận hành khi tổng hợp thông tin từ nhiều nguồn dữ liệu.
Trong một ca loạn thần sớm, mô hình suy ra một sự kiện cấu trúc trong bộ gen không được liệt kê trong dữ liệu đầu vào. Mô hình liên hệ một chuỗi kết quả gọi biến thể chất lượng thấp trên nhiễm sắc thể 22 với các đặc điểm tim mạch, miễn dịch, phát triển thần kinh và tâm thần của trẻ, rồi giả thuyết có mất đoạn 22q11.2 liên quan đến hội chứng DiGeorge. Biến thể giả thuyết này đã được xác nhận bằng giải trình tự bộ gen tiếp theo.
Dù câu lệnh yêu cầu một nguyên nhân đơn gen, đôi khi mô hình nêu ra hai gen giải thích tốt hơn cho một biểu hiện phức tạp. Các biến thể ở LAMA2 và FOXP1 cùng giúp lý giải các đặc điểm về cơ và phát triển thần kinh trong một ca; một ca khác có lời giải thích hai gen liên quan đến TTN và SRPK3 mà trước đó chưa được nhận ra.
Ngoài các chẩn đoán, mô hình cũng xác định một lời giải thích cơ chế mới tiềm năng cho một tình trạng gọi là bạch biến. Trong một ca phát triển thần kinh, mô hình nêu bật một mất đoạn 11 axit amin ở S1PR1 trong một người mắc bạch biến. S1PR1 mã hóa một thụ thể trên bề mặt tế bào tham gia vào tín hiệu, sự di chuyển của tế bào miễn dịch và sinh học mô. Mô hình tích hợp bằng chứng cho thấy mất đoạn này có thể làm thay đổi cấu trúc và tín hiệu của thụ thể theo những cách làm giảm sản xuất sắc tố, đồng thời giúp tế bào miễn dịch tồn tại dai dẳng trong da.
Mối liên hệ được đề xuất giữa S1PR1 và bạch biến cần được xác thực thêm bằng thực nghiệm, nhưng nó minh họa một vai trò mạnh mẽ của AI trong việc chuyển các phát hiện rời rạc từ sinh học cấu trúc, miễn dịch học và di truyền học lâm sàng thành những giả thuyết cụ thể, có thể kiểm chứng.
Nhóm cũng thấy khả năng mở rộng kiểu hình trong nhóm thần kinh cơ. Các biến thể gây hại ở HSPB8 và CDK13 không khớp hoàn toàn với những rối loạn được biết rõ nhất của các gen này, gợi ý một phổ lâm sàng rộng hơn cần thêm ca bệnh và nghiên cứu phòng thí nghiệm để kiểm chứng.
Nghiên cứu ca bệnh: Chẩn đoán của Kyra sau gần hai thập kỷ
Mọi chuyện bắt đầu trong lớp karate, khi mẹ của Kyra nhận thấy cô con gái 9 tuổi của mình không thể hạ thấp trọng tâm khi xuống tấn như trước đây. Kyra cũng dần chậm lại trong các buổi tập bóng đá và thường xuyên nhón gót kiểng chân khi đi bộ và chạy. Bác sĩ nhi khoa không xác định được nguyên nhân gây yếu cơ của cô, nên đã giới thiệu cô đến bác sĩ chuyên khoa. Sau đó là hành trình gần 20 năm qua các xét nghiệm, điều trị và tư vấn mà vẫn không có chẩn đoán.
Trường hợp của Kyra là một trong bốn ca chẩn đoán được phát hiện trong nhóm bệnh nhân mắc bệnh cơ thần kinh (neuromuscular cohort). Nhóm nghiên cứu đã liên kết tình trạng của cô bé với một biến thể dịch khung (frameshift variant) ở gen HSPB8, từ đó chẩn đoán cô mắc một thể bệnh cơ tơ cơ (myofibrillar myopathy), là căn bệnh mà các cấu trúc protein bất thường tích tụ bên trong các sợi cơ và dẫn đến tình trạng suy nhược cơ. Một tư vấn viên di truyền từ Trung tâm Manton gọi cho Kyra khoảng một tuần trước sinh nhật lần thứ 28 của cô.
Đến chừng đó thì Kyra đã phải dành phần lớn cuộc đời để thích nghi với căn bệnh. Cô buộc bị phụ thuộc vào máy thở và ngồi xe lăn khi mới 13 tuổi, dù tình trạng từ đó đã ổn định. Dù thể bệnh cơ tơ cơ (myofibrillar myopathy) của Kyra hiếm đến mức người ta biết rất ít về diễn tiến dài hạn của nó, chẩn đoán này đã giúp cô phần nào khép lại hành trình tìm câu trả lời.
Nghiên cứu này cho thấy một mô hình suy luận đa năng có thể góp phần vào tái phân tích bộ gen hồi cứu bằng cách kết hợp kiểu hình, di truyền, chú giải biến thể, các mẫu chất lượng dữ liệu và tài liệu khoa học thành những giả thuyết có thể xem xét. Nghiên cứu cũng cho thấy vì sao tái phân tích định kỳ là quan trọng: một số câu trả lời chỉ xuất hiện sau khi tri thức tiến bộ hoặc các hồ sơ rời rạc được kết nối.
Nghiên cứu này không phải là bằng chứng cho thấy bệnh nhân, bác sĩ lâm sàng hoặc khách hàng nên dùng các mô hình OpenAI để chẩn đoán bệnh hoặc đưa ra quyết định y khoa. Nghiên cứu không mô tả hay ủng hộ bất kỳ mục đích sử dụng nào của khách hàng đối với OpenAI o3 Nghiên cứu sâu, ChatGPT hoặc bất kỳ sản phẩm OpenAI nào khác cho chẩn đoán. Mô hình không chẩn đoán cho bất kỳ người tham gia nào; bác sĩ và các chuyên gia lâm sàng đủ năng lực khác đưa ra mọi chẩn đoán thông qua các quy trình xem xét, xét nghiệm và xác nhận lâm sàng đã thiết lập.
Nghiên cứu có tính hồi cứu, các nhóm không đồng nhất, và người đánh giá không được làm mù với mức độ tin cậy của mô hình. Các nhà nghiên cứu không đo thời gian tiết kiệm được, chi phí, công sức của bác sĩ, khối lượng công việc do dương tính giả hoặc thay đổi trong chăm sóc. Họ cũng không đánh giá có hệ thống các dạng biến đổi di truyền khác như biến thể cấu trúc, mở rộng lặp lại, thay đổi sâu trong intron hoặc thể khảm.
Các mô hình ngôn ngữ lớn có thể đọc sai ngữ cảnh hoặc tạo ra những lời giải thích nghe hợp lý nhưng không đứng vững khi kiểm tra kỹ hơn. Vì vậy, mọi kết quả đều trải qua thẩm định của con người và xác nhận lâm sàng. Mô hình mở rộng phạm vi tìm kiếm và tập trung phân tích tiếp theo do con người dẫn dắt; nó không quyết định thông tin hay chẩn đoán nào nên được trả về cho gia đình.
Nghiên cứu này dùng thông tin đã mã hóa xóa danh tính, không sử dụng hoặc truyền thông tin sức khỏe được bảo vệ ra ngoài các môi trường đã được phê duyệt. Việc triển khai lâm sàng rộng hơn sẽ đòi hỏi cùng mức chú ý đến quyền riêng tư, bảo mật, khả năng kiểm toán và quy định địa phương như mọi hoạt động chăm sóc y tế. Quyền truy cập mô hình không thay thế hạ tầng giải trình tự, tư vấn di truyền, xét nghiệm xác nhận hoặc phán đoán của chuyên gia.

“Nút thắt nằm ở thời gian. Một chuyên gia chỉ có thể dành một phần hữu hạn trong ngày cho từng người cụ thể.”
Tiến sĩ Catherine Brownstein, Trung tâm Nghiên cứu Bệnh Hiếm Manton thuộc Bệnh viện Nhi Boston

“Những nhà nghiên cứu như Catherine và tôi không thể nào ghi nhớ 8.000 bệnh khác nhau trong đầu. Đó chính là sức mạnh của AI.”
Alan Beggs, giám đốc Trung tâm Nghiên cứu Bệnh Hiếm Manton
Các nghiên cứu tiến cứu, đa trung tâm nên so sánh tái phân tích có LLM hỗ trợ với thực hành tiêu chuẩn về tỷ lệ chẩn đoán, thời gian đến khi có ứng viên, công sức của bác sĩ, gánh nặng dương tính giả, chi phí và tác động lên chăm sóc. Câu lệnh được quản lý phiên bản, kiểm tra tham chiếu, nhật ký kiểm toán và độ bất định đã hiệu chỉnh sẽ quan trọng đối với khả năng tái lập và an toàn. Những nghiên cứu như vậy vẫn cần các bác sĩ đủ năng lực đánh giá bằng chứng, chỉ định xét nghiệm phù hợp và đưa ra mọi quyết định chẩn đoán hoặc điều trị.
Nghiên cứu này dùng OpenAI o3 Nghiên cứu sâu. Các mô hình đa năng mới hơn có thể tìm kiếm và tổng hợp nhiều tài liệu khoa học hơn, trong khi các hệ thống chuyên biệt như GPT‑Rosalind được thiết kế cho công việc khoa học sự sống chuyên sâu hơn, bao gồm tác động của biến thể lên cấu trúc và chức năng protein. Những năng lực đó chưa được kiểm thử ở đây và sẽ cần các đánh giá cũng như kiểm soát truy cập riêng.
Dù OpenAI đã hỗ trợ nghiên cứu ban đầu này, Trung tâm Manton sẽ dẫn dắt giai đoạn tiếp theo của công việc thông qua một khoản tài trợ từ Quỹ hỗ trợ OpenAI. Khoản tài trợ sẽ hỗ trợ nỗ lực rộng hơn của Trung tâm nhằm phát triển một trợ lý AI di truyền học chi phí thấp, không phụ thuộc nền tảng, giúp các nhóm lâm sàng phân tích ca bệnh hiếm nhanh hơn và nhất quán hơn.
Cơ hội nghiên cứu dài hạn là tìm hiểu liệu tái phân tích có AI hỗ trợ do chuyên gia dẫn dắt có thể giúp hiểu biết khoa học bắt kịp tốc độ khám phá hay không. Triển vọng không phải là AI thay thế chẩn đoán của bác sĩ, mà là các công cụ nghiên cứu được đánh giá cẩn trọng có thể giúp chuyên gia xác định bằng chứng đáng điều tra. Với hàng nghìn gia đình, những câu hỏi chưa có lời đáp hôm nay không nhất thiết phải mãi mãi không có lời đáp.
- 2026


