ข้ามไปยังเนื้อหาหลัก
OpenAI

18 มิถุนายน 2569

AI ประยุกต์

การใช้ AI เพื่อช่วยแพทย์วินิจฉัยโรคทางพันธุกรรมหายากที่ส่งผลกระทบต่อเด็ก

ในการศึกษาของ NEJM AI ผู้เชี่ยวชาญใช้โมเดลการให้เหตุผลของ OpenAI เพื่อวิเคราะห์เคสที่ก่อนหน้านี้ยังหาคำตอบไม่ได้จำนวน 376 เคสอีกครั้ง และค้นพบเบาะแสสำหรับการวินิจฉัย 18 รายการ

กำลังโหลด…

แม้จะมีการตรวจลำดับจีโนมแล้ว แต่ผู้ป่วยโรคหายากจำนวนมากยังคงไม่ได้รับการวินิจฉัยทางพันธุกรรมที่แน่ชัด ประมาณครึ่งหนึ่งของผู้ป่วยยังคงไม่ได้รับการวินิจฉัย แม้จะผ่านการตรวจอย่างละเอียดและได้รับการประเมินจากแพทย์ผู้เชี่ยวชาญแล้วก็ตาม ข้อมูลทางการแพทย์ของผู้ป่วยอาจมีเบาะแสสำคัญซ่อนอยู่ แต่การค้นหาเบาะแสเหล่านั้นอาจต้องพิจารณาความแปรผันทางพันธุกรรมที่เป็นไปได้ตั้งแต่หลักพันถึงหลักล้านรายการ เวชระเบียนที่กระจัดกระจาย และองค์ความรู้ทางวิทยาศาสตร์ที่เปลี่ยนแปลงอย่างรวดเร็ว

เมื่อมีการค้นพบความเชื่อมโยงใหม่ระหว่างยีนกับโรค รายงานผู้ป่วยเพิ่มเติม และหลักฐานสำหรับการจำแนกความผิดปกติทางพันธุกรรมเพิ่มขึ้นอย่างต่อเนื่อง เคสที่เคยหาคำอธิบายไม่ได้ก็อาจกลับมาตีความได้อีกครั้ง

นักวิจัยจากศูนย์ Manton Center for Orphan Disease Research แห่งโรงพยาบาล Boston Children’s Hospital ร่วมกับมหาวิทยาลัยฮาร์วาร์ด และ OpenAI ใช้โมเดลการให้เหตุผล o3 Deep Research ของ OpenAI เพื่อวิเคราะห์ข้อมูลทางคลินิกและข้อมูลจีโนมที่ไม่ระบุตัวตน จากกรณีศึกษาที่เคยวิเคราะห์ไปแล้วแต่ยังหาข้อสรุปไม่ได้จำนวน 376 เคส โมเดลนำเสนอข้อสันนิษฐานที่เชื่อมโยงกับหลักฐานเพื่อให้คณะนักวิจัยและแพทย์ผู้เชี่ยวชาญร่วมกันพิจารณา หลังจากผ่านการตรวจสอบโดยผู้เชี่ยวชาญ การทดสอบเพิ่มเติม และการยืนยันทางคลินิก แพทย์สามารถสรุปผลการวินิจฉัยได้ใน 18 เคส คิดเป็นอัตราความสำเร็จในการวินิจฉัยเพิ่มเติม 4.8% จากเคสที่เคยผ่านการวิเคราะห์โดยผู้เชี่ยวชาญมาแล้วก่อนหน้านี้ งานวิจัยชิ้นนี้ได้รับการตีพิมพ์เมื่อวันที่ 18 มิถุนายน พ.ศ. 2569 ในวารสาร NEJM AI ซึ่งแสดงให้เห็นว่ากระบวนการทำงานวิจัยโดยมี AI เป็นผู้ช่วยสามารถช่วยให้ผู้เชี่ยวชาญค้นพบเบาะแสสำคัญในขณะที่ทำการตรวจสอบเคสที่ซับซ้อนที่สุดอีกรอบ

เคสจำนวนมากเหล่านี้เคยผ่านการวิเคราะห์โดยผู้เชี่ยวชาญมานานหลายปี แต่ก็ยังไม่สามารถระบุสาเหตุได้ งานวิจัยนี้แสดงให้เห็นว่า OpenAI o3 Deep Research ช่วยให้นักวิจัยค้นพบแนวทางที่เป็นประโยชน์ ซึ่งได้รับการตรวจสอบในภายหลังด้วยกระบวนการทางการแพทย์ที่เป็นมาตรฐาน ซึ่งบ่งชี้ว่าการวิเคราะห์ซ้ำโดยผู้เชี่ยวชาญเป็นระยะอาจทำได้ในวงกว้างขึ้นเมื่อองค์ความรู้มีการพัฒนาไป โมเดลไม่ได้ทำการวินิจฉัยผู้ป่วยหรือตัดสินใจทางการแพทย์แต่อย่างใด โมเดลสร้างสมมติฐานที่เชื่อมโยงกับหลักฐานสนับสนุน เพื่อให้ผู้เชี่ยวชาญนำไปพิจารณา และหากเห็นว่าเหมาะสมก็สามารถตรวจสอบเพิ่มเติมและยืนยันผลในห้องปฏิบัติการทางคลินิกได้

เหตุใดเคสเก่าจึงอาจมีคำตอบใหม่

ผลการตรวจพันธุกรรมที่ยังระบุสาเหตุไม่ได้ อาจไม่ใช่ผลสรุปสุดท้ายเสมอไป ข้อมูลลักษณะอาการของผู้ป่วย ผลการตรวจ และประวัติครอบครัว อาจกระจัดกระจายอยู่ในฐานข้อมูลหลายแห่งซึ่งใช้รหัสอ้างอิง รูปแบบข้อมูล และคำศัพท์ที่แตกต่างกัน การเชื่อมโยงบันทึกเหล่านั้นเข้าด้วยกันทำได้ยาก ดังนั้นแม้แต่ผู้เชี่ยวชาญก็อาจพลาดการวินิจฉัยได้ ผู้เชี่ยวชาญอาจดำเนินการตรวจลำดับจีโนมของเด็กก่อนที่ยีนนั้นหรือตัวแปรของยีนดังกล่าวจะถูกค้นพบว่ามีความเกี่ยวข้องกับโรค เมื่อองค์ความรู้ทางวิทยาศาสตร์ก้าวหน้าขึ้น ข้อมูลชุดเดิมก็อาจเผยคำตอบที่ก่อนหน้านี้ไม่สามารถค้นพบได้

การวิเคราะห์ข้อมูลผู้ป่วยโรคหายากซ้ำเป็นทั้งปัญหาทางวิทยาศาสตร์และปัญหาด้านการดูแลรักษาระบบข้อมูล แม้จีโนมของผู้ป่วยจะยังคงเหมือนเดิม แต่หลักฐานรอบด้านกลับเปลี่ยนแปลงไปอยู่เสมอ ทั้งการที่นักวิจัยค้นพบความเชื่อมโยงใหม่ๆ ระหว่างยีนกับโรค การที่ห้องแล็บจัดหมวดหมู่ตัวแปรพันธุกรรมใหม่ รวมถึงการที่ฐานข้อมูลเคสผู้ป่วยและเอกสารงานวิจัยต่างๆ มีการบันทึกข้อมูลใหม่เพิ่มขึ้นตลอดเวลา ทุกครั้งที่มีองค์ความรู้ใหม่เพิ่มขึ้น เคสเก่าที่เคยยังหาข้อสรุปไม่ได้ก็อาจมีเหตุผลให้กลับมาทบทวนอีกครั้ง ส่งผลให้หลายสถาบันต้องรับมือกับจีโนมที่รอการวิเคราะห์ซ้ำสะสมเพิ่มขึ้นเรื่อยๆ เพื่อให้สอดคล้องกับฐานความรู้ที่เปลี่ยนแปลงอยู่ตลอดเวลา

ในงานวิจัยนี้คณะผู้วิจัยได้ออกแบบขั้นตอนการทำงานโดยให้โมเดลทำหน้าที่เป็นชั้นการใช้เหตุผลที่เน้นการอธิบายเป็นหลัก โดยทำงานอยู่บนกระบวนการวิเคราะห์จีโนมที่มีอยู่แล้ว แทนที่จะส่งกลับเพียงรายชื่อยีนที่ได้รับการจัดอันดับ โมเดลถูกกำหนดให้เชื่อมโยงลักษณะอาการทางคลินิก รูปแบบการถ่ายทอดทางพันธุกรรม หลักฐานเกี่ยวกับความแปรผันทางพันธุกรรม และงานวิจัยทางวิทยาศาสตร์เข้าด้วยกันเพื่อให้ผู้เชี่ยวชาญสามารถตรวจสอบและตั้งคำถามต่อได้

การวิเคราะห์ซ้ำทำงานอย่างไร

สำหรับแต่ละเคสทีมวิจัยได้จัดเตรียมชุดข้อมูลที่ลบข้อมูลระบุตัวตนแล้ว ซึ่งประกอบด้วยคำศัพท์มาตรฐานจาก Human Phenotype Ontology (HPO) สำหรับอธิบายลักษณะอาการทางของผู้ป่วย บันทึกของแพทย์ในบางโอกาส รวมถึงคำวินิจฉัยเชิงพรรณนาที่มีอยู่ ข้อมูลประกอบ เช่น อายุและเพศ ตลอดจนตารางความแปรผันทางพันธุกรรมที่ผ่านการคัดกรองแล้ว ตารางดังกล่าวบันทึกข้อมูลเกี่ยวกับความหายากของความแปรผันทางพันธุกรรมแต่ละรายการ ผลกระทบที่คาดว่าจะมีต่อโปรตีนที่ยีนนั้นสร้างขึ้น การจัดประเภทตามฐานข้อมูล ClinVar และคุณภาพสัญญาณที่ตรวจพบจากสมาชิกในครอบครัวที่มีข้อมูล เคสส่วนใหญ่ประกอบด้วยข้อมูลจากตัวเด็กและบิดามารดาทางสายเลือดทั้งสองฝ่าย

ทีมขอให้โมเดลเสนอคำอธิบายเชิงโมเลกุลที่เป็นไปได้มากที่สุด และแสดงขั้นตอนการให้เหตุผล จากนั้นนักวิจัยได้ทบทวนผลลัพธ์โดยใช้กรอบ ACMG/AMP เดียวกับที่ห้องปฏิบัติการทางแพทย์ใช้ในการจำแนกตัวแปรทางพันธุกรรม สมาชิกในทีมอย่างน้อยสองคนได้ร่วมกันตรวจสอบเคสแต่ละกรณี หากมีความเห็นไม่ตรงกันจะใช้การหารือจนได้ข้อสรุป และจะไม่นำผลลัพธ์จากโมเดลมาถือเป็นคำวินิจฉัยโดยเด็ดขาด ข้อมูลที่พบจะถือเป็นคำวินิจฉัยก็ต่อเมื่อผู้เชี่ยวชาญที่มีคุณสมบัติเหมาะสมได้ตรวจสอบหลักฐานแล้ว ตัวแปรพันธุกรรมถูกจำแนกประเภทว่าก่อให้เกิดโรคหรือมีแนวโน้มที่จะก่อให้เกิดโรค ห้องปฏิบัติการที่ได้รับการรับรองมาตรฐาน CLIA ยืนยันผล และทีมแพทย์ได้แจ้งผลดังกล่าวแก่ครอบครัวผู้ป่วยแล้วเท่านั้น

ก่อนที่จะดำเนินการวิเคราะห์เคสที่ยังหาข้อสรุปไม่ได้ ทีมงานได้ปรับปรุงขั้นตอนการทำงานโดยใช้เคสที่มีคำวินิจฉัยแน่ชัดแล้วเป็นตัวทดสอบ โมเดลสามารถระบุยีนและตัวแปรพันธุกรรมที่ถูกต้องได้สำเร็จในการทดสอบซ้ำสองครั้งสำหรับเคสจำนวน 48 จาก 51 เคสซึ่งครอบคลุมโรคหายากหลากหลายชนิด จากเคสโรคทางระบบประสาทและกล้ามเนื้อจำนวน 57 เคส กระบวนการทำงานนี้สามารถวิเคราะห์ผลวินิจฉัยที่ถูกต้องได้สำเร็จในการทดสอบซ้ำจำนวน 45 เคส ในชุดข้อมูลจีโนมแบบอ่านลำดับยาว (long-read genome) จำนวน 15 เคส โมเดลสามารถระบุยีนที่ถูกต้องได้ครบทุกเคส และสามารถระบุ Allele ก่อโรคทั้งสองชุดได้ใน 12 เคส การประเมินเหล่านี้ช่วยในการพัฒนาพรอมต์ และชี้ให้เห็นจุดที่การตรวจสอบโดยผู้เชี่ยวชาญยังเป็นส่วนสำคัญที่ขาดไม่ได้

คะแนนความเชื่อมั่นที่โมเดลรายงานด้วยตนเองมีความสอดคล้องกับความถูกต้องของการวินิจฉัยในเคสที่ทราบคำตอบอยู่แล้วเหล่านี้ โดยค่าเฉลี่ยของคะแนนต่ำสุดอยู่ที่ 85.6 สำหรับเคสที่ให้ผลถูกต้องอย่างสม่ำเสมอ และ 42.1 สำหรับเคสที่ให้ผลไม่ถูกต้องหรือไม่สามารถระบุคำตอบได้ คะแนนดังกล่าวไม่ใช่ค่าความน่าจะเป็นที่ผ่านการปรับเทียบ และทีมงานไม่ได้ใช้คะแนนเหล่านี้เป็นสิ่งที่ทดแทนการตรวจสอบหลักฐานหรือการพิจารณาตัดสินทางการแพทย์ อย่างไรก็ตามคะแนนเหล่านี้มีประโยชน์ในการช่วยให้ผู้เชี่ยวชาญที่ตรวจสอบสามารถมุ่งเน้นไปที่การวินิจฉัยที่เป็นไปได้มากที่สุด 

แผนภาพเวิร์กโฟลว์หัวข้อ “เวิร์กโฟลว์ AI ภายใต้การกำกับของมนุษย์สำหรับการวิเคราะห์จีโนมซ้ำในโรคหายาก” แสดงเส้นทางของข้อมูลผู้ป่วยแบบไม่ระบุตัวตน การสังเคราะห์หลักฐานโดย LLM การตรวจสอบโดยผู้เชี่ยวชาญ การทดสอบ การยืนยันผลทางการแพทย์ และการแจ้งผลกลับสู่ครอบครัว

สิ่งที่นักวิจัยค้นพบ

ทีมงานได้นำกระบวนการทำงานนี้ไปใช้กับกลุ่มเคสที่ยังหาข้อสรุปไม่ได้สี่กลุ่ม ได้แก่ เด็กที่มีภาวะพัฒนาการทางระบบประสาทผิดปกติ ผู้ป่วยโรคทางระบบประสาทและกล้ามเนื้อที่หายาก เด็กและวัยรุ่นที่มีอาการทางจิตในช่วงแรก และกรณีการเสียชีวิตอย่างกะทันหันโดยไม่ทราบสาเหตุในเด็ก เคสเหล่านี้ไม่ใช่เคสใหม่ที่กำลังรอการตรวจสอบเป็นครั้งแรก หลายเคสเคยผ่านการวิเคราะห์มาแล้วจากทั้งระบบของภาคเอกชนและสถาบันต่างๆ หลายระบบ และได้รับการพิจารณาโดยทีมผู้เชี่ยวชาญสหสาขาวิชาชีพ

ผลลัพธ์แบ่งตามกลุ่มผู้ป่วย

กลุ่มผู้ป่วย

เคส

การวินิจฉัยที่ปรากฏขึ้น

ผลลัพธ์

พัฒนาการทางระบบประสาท

100

10

10.0%

โรคระบบประสาทและกล้ามเนื้อ

61

4

6.6%

การเสียชีวิตอย่างกะทันหันโดยไม่คาดคิดในเด็ก

200

2

1.0%

ภาวะจิตเภทในระยะเริ่มต้น

15

2

13.3%

รวม

376

18

4.8%

เนื่องจากกลุ่มตัวอย่างผู้ป่วยโรคจิตระยะเริ่มต้นมีขนาดเล็ก ค่าร้อยละที่ได้จึงมีช่วงความเชื่อมั่นที่ค่อนข้างกว้าง อัตราผลลัพธ์ยังบ่งบอกถึงความเป็นไปได้ที่แต่ละกลุ่มผู้ป่วยมีแนวโน้มมากน้อยเพียงใดที่จะมีสาเหตุจากความผิดปกติของยีนเดี่ยว

หลังจากโมเดลระบุคำอธิบายที่เป็นไปได้ และผู้เชี่ยวชาญได้ตรวจทานพร้อมยืนยันผลทางคลินิกแล้ว แพทย์สามารถยืนยันการวินิจฉัยได้ใน 4.8% ของเคสทั้งหมด อัตราดังกล่าวอาจดูไม่สูงนักแต่มีความหมายอย่างยิ่งสำหรับกลุ่มผู้ป่วยนี้ เพราะเคสเหล่านี้เคยผ่านการทบทวนโดยผู้เชี่ยวชาญมาแล้วและยังไม่สามารถหาคำตอบได้ งานวิจัยด้านการวิเคราะห์ซ้ำในลักษณะเดียวกันมักรายงานอัตราการวินิจฉัยเพิ่มเติมในระดับเลขหลักเดียวสำหรับเคสที่ผ่านการตรวจสอบอย่างเข้มข้นมาแล้ว ขณะที่อัตราที่สูงกว่ามักพบในงานวิจัยที่มีเคสใหม่ หรือโรคที่เป็นที่รู้จักดีซึ่งกำลังรอการยืนยันทางพันธุกรรม

จากการวินิจฉัยทั้งหมด 18 รายการ มี 7 รายการที่เป็นการค้นพบซ้ำ กล่าวคือ เป็นการวินิจฉัยที่เคยได้รับการยืนยันจากที่อื่นนอกกระบวนการวิจัยนี้อยู่แล้ว แต่ข้อมูลดังกล่าวไม่ปรากฏอยู่ในเวชระเบียนที่ทีมวิจัยใช้ในการทบทวน ในหลายเคส ความแปรผันทางพันธุกรรมเหล่านั้นถูกระบุไว้แล้วว่าเป็นชนิดก่อโรคหรือมีแนวโน้มก่อโรคในฐานข้อมูลสาธารณะ ซึ่งสะท้อนให้เห็นความท้าทายด้านการปฏิบัติงานในการรวบรวมและเชื่อมโยงข้อมูลจากหลายแหล่งเข้าด้วยกัน

แสดงให้เห็นถึงความยืดหยุ่นในระหว่างขั้นตอนการระบุตัวแปร

ในกรณีศึกษาโรคจิตระยะเริ่มต้นกรณีหนึ่ง โมเดลสามารถเชื่อมโยงข้อมูลจนพบร่องรอยของความผิดปกติเชิงโครงสร้างในจีโนม แม้ว่ารายละเอียดดังกล่าวจะไม่ได้รวมอยู่ในข้อมูลที่ได้รับก็ตาม โมเดลเชื่อมโยงข้อมูลคุณภาพต่ำบนโครโมโซมคู่ที่ 22 เข้ากับลักษณะอาการทางหัวใจ ระบบภูมิคุ้มกัน พัฒนาการทางประสาทและอาการทางจิตเวชของเด็ก จากนั้นจึงตั้งข้อสันนิษฐานถึงความผิดปกติที่ตำแหน่ง 22q11.2 ซึ่งเป็นการขาดหายไปของชิ้นส่วนโครโมโซมที่เกี่ยวข้องกับกลุ่มอาการดิจอร์จ (DiGeorge syndrome) ตัวแปรที่ตั้งสมมติฐานไว้นี้ได้รับการยืนยันด้วยการจัดลำดับจีโนมเพิ่มเติม

แม้พรอมต์จะสั่งให้ระบุสาเหตุจากยีนเดี่ยวเพียงหนึ่งสาเหตุ แต่ในบางกรณีโมเดลสามารถระบุยีนสองตำแหน่งที่ช่วยอธิบายลักษณะอาการที่ซับซ้อนของผู้ป่วยได้ชัดเจนยิ่งขึ้น ความแปรผันในยีน LAMA2 และ FOXP1 ร่วมกันมีส่วนช่วยอธิบายลักษณะอาการทางกล้ามเนื้อและพัฒนาการทางประสาทของผู้ป่วยรายหนึ่ง ในขณะที่อีกรายพบคำอธิบายจากภาวะยีนสองตำแหน่งที่เกี่ยวข้องกับ TTN และ SRPK3 ซึ่งไม่เคยมีรายงานมาก่อน

การสร้างสมมติฐานที่สามารถทดสอบได้และมีความสอดคล้องกับหลักชีววิทยา

นอกจากจะช่วยในการวินิจฉัยโรคแล้ว โมเดลยังสามารถระบุคำอธิบายเชิงกลไกการเกิดโรคแบบใหม่ที่อาจเป็นไปได้สำหรับภาวะด่างขาว (vitiligo) อีกด้วย มีกรณีของผู้ป่วยโรคด่างขาวที่มีความผิดปกติของพัฒนาการทางระบบประสาท ซึ่งโมเดลได้ชี้ให้เห็นว่ามีการขาดหายไปของลำดับกรดอะมิโน 11 ตัวในยีน S1PR1 S1PR1 เป็นยีนที่ควบคุมการสร้างตัวรับบนพื้นผิวเซลล์ ซึ่งมีบทบาทสำคัญในกระบวนการส่งสัญญาณ การเคลื่อนที่ของเซลล์ในระบบภูมิคุ้มกัน และกระบวนการทางชีววิทยาของเนื้อเยื่อต่างๆ โมเดลได้ผสานหลักฐานที่บ่งชี้ว่าการขาดหายไปดังกล่าวอาจเปลี่ยนแปลงโครงสร้างและการส่งสัญญาณของตัวรับในลักษณะที่ลดการผลิตเม็ดสี ขณะเดียวกันก็ช่วยให้เซลล์ภูมิคุ้มกันคงอยู่ในผิวหนัง

ความสัมพันธ์ระหว่างยีน S1PR1 และโรคด่างขาวที่นำเสนอนี้ยังจำเป็นต้องมีการพิสูจน์เชิงทดลองเพิ่มเติม แต่ก็แสดงให้เห็นถึงบทบาทอันทรงพลังของ AI ในการเปลี่ยนผลลัพธ์ที่กระจัดกระจายจากสาขาชีววิทยาโครงสร้าง ภูมิคุ้มกันวิทยา และเวชพันธุศาสตร์ให้กลายเป็นสมมติฐานที่ชัดเจนและสามารถนำไปทดสอบได้จริง

นอกจากนี้ทีมวิจัยยังพบความเป็นไปได้ในการขยายขอบเขตของกลุ่มอาการในกลุ่มผู้ป่วยที่มีความผิดปกติทางระบบประสาทและกล้ามเนื้ออีกด้วย ความแปรผันที่ส่งผลเสียใน HSPB8 และ CDK13 แสดงลักษณะที่ไม่ตรงกับโรคต้นแบบที่มักเชื่อมโยงกับยีนทั้งสองอย่างครบถ้วน สะท้อนความเป็นไปได้ว่ากลุ่มอาการของยีนเหล่านี้อาจกว้างกว่าความเข้าใจในปัจจุบัน ซึ่งยังต้องได้รับการตรวจสอบจากผู้ป่วยรายอื่นและการทดลองเพิ่มเติม

กรณีศึกษา: การวินิจฉัยโรคของไคร่าหลังจากเวลาผ่านไปเกือบสองทศวรรษ

เรื่องเริ่มขึ้นในชั้นเรียนคาราเต้เมื่อแม่ของไคร่าสังเกตว่าลูกสาววัย 9 ขวบของเธอไม่ได้ย่อตัวลงในท่ายืนได้ต่ำเท่าที่เคย นอกจากนี้ไคร่ายังเริ่มเคลื่อนไหวช้าลงระหว่างการฝึกซ้อมฟุตบอล และมักเขย่งปลายเท้าเวลาเดินและวิ่ง กุมารแพทย์ของเธอไม่สามารถระบุสาเหตุของอาการกล้ามเนื้ออ่อนแรงของเธอได้ จึงส่งตัวเธอไปพบแพทย์เฉพาะทาง สิ่งที่ตามมาคือเส้นทางอันยาวนานเกือบ 20 ปีที่เต็มไปด้วยการตรวจ การรักษา และการปรึกษาแพทย์หลายครั้ง โดยยังไม่สามารถหาคำวินิจฉัยได้

เคสของไคร่าเป็นหนึ่งในสี่การวินิจฉัยที่พบในกลุ่มผู้ป่วยโรคประสาทและกล้ามเนื้อ ทีมวิจัยเชื่อมโยงภาวะอาการของเธอเข้ากับความแปรปรวนแบบเฟรมชิฟต์ในยีน HSPB8 และวินิจฉัยว่าเป็นโรคกล้ามเนื้อเสื่อมชนิดไมโอไฟบริลลาร์ ซึ่งมีการสะสมของโครงสร้างโปรตีนผิดปกติในเส้นใยกล้ามเนื้อจนส่งผลให้เกิดอาการกล้ามเนื้ออ่อนแรง นักให้คำปรึกษาทางพันธุกรรมจากศูนย์ Manton Center โทรหาไคร่าประมาณหนึ่งสัปดาห์ก่อนวันเกิดอายุครบ 28 ปีของเธอ

ในตอนนั้นไคร่าได้ใช้ชีวิตส่วนใหญ่ไปกับการปรับตัวให้เข้ากับโรคนี้แล้ว เธอต้องพึ่งเครื่องช่วยหายใจและต้องใช้รถเข็นเมื่ออายุ 13 ปี แม้อาการของเธอจะทรงตัวนับตั้งแต่นั้นมา แม้ว่าโรคกล้ามเนื้อไมโอไฟบริลลาร์ชนิดที่ไคราเป็นจะพบได้น้อยมากจนยังมีข้อมูลไม่มากนักเกี่ยวกับการดำเนินโรคในระยะยาว แต่การวินิจฉัยก็ช่วยให้คลายความค้างคาใจลงได้บ้าง

ข้อจำกัด

งานวิจัยนี้แสดงให้เห็นว่าโมเดลการใช้เหตุผลแบบอเนกประสงค์สามารถช่วยในการวิเคราะห์ข้อมูลจีโนมย้อนหลังได้ โดยการบูรณาการข้อมูลลักษณะทางคลินิก รูปแบบการถ่ายทอดทางพันธุกรรม คำอธิบายความแปรปรวน รูปแบบคุณภาพข้อมูล และวรรณกรรมทางวิทยาศาสตร์ เข้าเป็นสมมติฐานที่สามารถนำไปตรวจสอบได้ สิ่งนี้ยังแสดงให้เห็นว่าเหตุใดการวิเคราะห์ซ้ำเป็นระยะจึงสำคัญ เนื่องจากคำตอบบางอย่างจะปรากฏขึ้นก็ต่อเมื่อองค์ความรู้ก้าวหน้าไป หรือเมื่อบันทึกที่กระจัดกระจายอยู่ถูกนำมารวบรวมเข้าด้วยกัน

งานวิจัยนี้ไม่ได้เป็นข้อพิสูจน์ว่าผู้ป่วย แพทย์ หรือลูกค้าควรใช้โมเดลของ OpenAI เพื่อวินิจฉัยโรคหรือตัดสินใจเรื่องทางการแพทย์ งานวิจัยนี้ไม่ได้อธิบายหรือรับรองการใช้งาน OpenAI o3 Deep Research, ChatGPT หรือผลิตภัณฑ์อื่นใดของ OpenAI ในฐานะเครื่องมือสำหรับการวินิจฉัยโรคแต่อย่างใด โมเดลไม่ได้เป็นผู้วินิจฉัยผู้เข้าร่วมวิจัยรายใด การวินิจฉัยทุกกรณีดำเนินการโดยแพทย์และผู้เชี่ยวชาญทางการแพทย์ที่มีคุณสมบัติเหมาะสม โดยผ่านขั้นตอนการทบทวน การทดสอบ และการยืนยันผลทางการแพทย์ตามมาตรฐานที่กำหนดไว้

การศึกษานี้เป็นการศึกษาย้อนหลัง กลุ่มตัวอย่างมีความหลากหลาย และผู้ประเมินสามารถเห็นคะแนนความเชื่อมั่นของโมเดลได้ระหว่างการทบทวน นักวิจัยไม่ได้ประเมินว่ากระบวนการนี้ช่วยประหยัดเวลาได้มากเพียงใด ลดต้นทุนได้หรือไม่ ลดภาระงานของแพทย์ได้มากน้อยแค่ไหน เพิ่มภาระงานจากการวินิจฉัยที่ผิดพลาดหรือไม่ หรือส่งผลต่อการดูแลรักษาผู้ป่วยอย่างไร นอกจากนี้ผู้วิจัยยังไม่ได้ประเมินความแปรปรวนทางพันธุกรรมในรูปแบบอื่นอย่างเป็นระบบ เช่น ความแปรปรวนเชิงโครงสร้าง การขยายตัวของลำดับซ้ำ การเปลี่ยนแปลงในลึกของอินตรอน หรือภาวะโมเสก

โมเดลภาษาขนาดใหญ่สามารถตีความบริบทผิดพลาด หรือสร้างคำอธิบายที่ดูสมเหตุสมผลแต่กลับใช้ไม่ได้จริงเมื่อตรวจสอบอย่างละเอียด ด้วยเหตุนี้ ผลการวิเคราะห์ทุกประการจึงต้องผ่านการพิจารณาโดยมนุษย์และการตรวจสอบยืนยันผลทางการแพทย์ โมเดลทำหน้าที่เพียงขยายขอบเขตการค้นหาข้อมูลและกำหนดเป้าหมายสำหรับการวิเคราะห์ของมนุษย์ในขั้นต่อไป แต่ไม่ได้เป็นผู้ตัดสินว่าควรให้ข้อมูลหรือคำวินิจฉัยใดแก่ครอบครัวผู้ป่วย

งานวิจัยนี้อาศัยข้อมูลที่ไม่สามารถระบุตัวบุคคลได้ และไม่มีการนำข้อมูลสุขภาพที่ได้รับการคุ้มครองมาใช้หรือส่งออกนอกระบบที่ได้รับอนุญาต การนำเทคโนโลยีนี้ไปใช้ในทางคลินิกอย่างแพร่หลายจำเป็นต้องคำนึงถึงความเป็นส่วนตัว ความมั่นคงปลอดภัย ความสามารถในการตรวจสอบได้ และกฎระเบียบท้องถิ่น เช่นเดียวกับมาตรฐานที่ใช้กับบริการทางการแพทย์ทุกประเภท การเข้าถึงโมเดลไม่สามารถใช้แทนโครงสร้างพื้นฐานด้านการหาลำดับพันธุกรรม การให้คำปรึกษาทางพันธุกรรม การทดสอบเพื่อยืนยันผล หรือดุลยพินิจของผู้เชี่ยวชาญได้

พื้นหลังไล่ระดับสีน้ำเงินแบบนามธรรม พร้อมการเปลี่ยนผ่านอย่างนุ่มนวลระหว่างโทนสีฟ้าอ่อน สีฟ้าไซแอน และสีน้ำเงินเข้ม สร้างเอฟเฟกต์ที่เรียบเนียนและพร่ามัว

“อุปสรรคคือเวลา ผู้เชี่ยวชาญสามารถทุ่มเวลาให้กับผู้ป่วยแต่ละรายได้เพียงจำกัดในแต่ละวัน”

Dr. Catherine Brownstein จากสูนย์ Manton Center for Orphan Disease Research สังกัดโรงพยาบาลเด็กบอสตัน

พื้นหลังไล่ระดับสีน้ำเงินแบบนามธรรม พร้อมการเปลี่ยนผ่านอย่างนุ่มนวลระหว่างโทนสีฟ้าอ่อน สีฟ้าไซแอน และสีน้ำเงินเข้ม สร้างเอฟเฟกต์ที่เรียบเนียนและพร่ามัว

“นักวิจัยอย่างแคทเธอรีนกับฉันไม่มีทางจำโรคต่างๆ 8,000 โรคไว้ในหัวได้หมด นั่นคือพลังที่ AI ทำได้”

Alan Beggs ผู้อำนวยการประจำศูนย์ Manton Center for Orphan Disease Research

ก้าวต่อไปของเรา

โดยทั่วไปการศึกษาการวิเคราะห์ซ้ำในกลุ่มเคสที่ได้รับการตรวจสอบอย่างละเอียดมาแล้วมักให้ผลลัพธ์เพิ่มเติมเพียงไม่กี่เปอร์เซ็นต์ ส่วนอัตราที่สูงกว่ามักเกิดจากการศึกษาที่มีผู้ป่วยรายใหม่ หรือโรคที่ทราบลักษณะทางคลินิกอยู่แล้วและรอการยืนยันด้วยข้อมูลทางพันธุกรรม การใช้พรอมต์ที่มีการระบุเวอร์ชัน การตรวจสอบอ้างอิง บันทึกการตรวจสอบ และการปรับเทียบค่าความไม่แน่นอน ถือเป็นสิ่งจำเป็นต่อการเพิ่มความน่าเชื่อถือในการทำผลการทดลองซ้ำและความปลอดภัยของระบบ งานวิจัยเหล่านี้ยังคงต้องอาศัยแพทย์ผู้เชี่ยวชาญในการประเมินหลักฐาน สั่งการทดสอบที่เหมาะสม รวมถึงการตัดสินใจวินิจฉัยหรือวางแผนการรักษา

การศึกษานี้ใช้การค้นคว้าข้อมูลเชิงลึกของ OpenAI o3 โมเดลอเนกประสงค์รุ่นใหม่สามารถสืบค้นและสังเคราะห์เนื้อหาทางวิทยาศาสตร์ได้มากขึ้น ในขณะที่ระบบที่ถูกสร้างขึ้นเพื่อวัตถุประสงค์เฉพาะทาง เช่น GPT‑Rosalind นั้นได้รับการออกแบบมาเพื่องานด้านวิทยาศาสตร์ชีวภาพเชิงลึก ซึ่งรวมถึงการวิเคราะห์ผลกระทบของตัวแปรต่อโครงสร้างและหน้าที่ของโปรตีน ความสามารถเหล่านั้นไม่ได้รับการทดสอบในที่นี้ และจะต้องมีการประเมินและการควบคุมการเข้าถึงแยกต่างหาก

แม้ OpenAI จะมีส่วนสนับสนุนงานวิจัยระยะเริ่มต้นนี้ แต่ Manton Center จะเป็นผู้นำการดำเนินงานในระยะถัดไปโดยใช้ทุนสนับสนุนจาก OpenAI Foundation เงินทุนสนับสนุนนี้จะช่วยส่งเสริมความพยายามในวงกว้างของศูนย์ฯ ในการพัฒนาผู้ช่วย AI ด้านพันธุศาสตร์ที่ไม่ผูกติดกับแพลตฟอร์มใดแพลตฟอร์มหนึ่ง และมีต้นทุนต่ำ ซึ่งช่วยให้ทีมทางคลินิกวิเคราะห์กรณีโรคหายากได้รวดเร็วและสม่ำเสมอยิ่งขึ้น

โอกาสในการวิจัยระยะยาวคือการสำรวจว่าการวิเคราะห์ซ้ำที่นำโดยผู้เชี่ยวชาญและได้รับความช่วยเหลือจาก AI สามารถช่วยให้ความเข้าใจทางวิทยาศาสตร์ก้าวทันการค้นพบได้หรือไม่ ศักยภาพที่คาดหวังไม่ได้อยู่ที่ว่า AI จะมาแทนที่การวินิจฉัยของแพทย์ แต่อยู่ที่ว่าเครื่องมือวิจัยที่ผ่านการประเมินอย่างรอบคอบอาจช่วยให้ผู้เชี่ยวชาญระบุหลักฐานที่ควรค่าแก่การตรวจสอบเพิ่มเติมได้ สำหรับครอบครัวหลายพันครอบครัว คำถามที่ยังไม่มีคำตอบในวันนี้ไม่จำเป็นต้องไร้คำตอบตลอดไป

  • 2569

ผู้เขียน

OpenAI