การใช้ AI เพื่อช่วยแพทย์วินิจฉัยโรคทางพันธุกรรมหายากที่ส่งผลกระทบต่อเด็ก
ในการศึกษาของ NEJM AI ผู้เชี่ยวชาญใช้โมเดลการให้เหตุผลของ OpenAI เพื่อวิเคราะห์เคสที่ก่อนหน้านี้ยังหาคำตอบไม่ได้จำนวน 376 เคสอีกครั้ง และค้นพบเบาะแสสำหรับการวินิจฉัย 18 รายการ
แม้จะมีการตรวจลำดับจีโนมแล้ว แต่ผู้ป่วยโรคหายากจำนวนมากยังคงไม่ได้รับการวินิจฉัยทางพันธุกรรมที่แน่ชัด ประมาณครึ่งหนึ่งของผู้ป่วยยังคงไม่ได้รับการวินิจฉัย แม้จะผ่านการตรวจอย่างละเอียดและได้รับการประเมินจากแพทย์ผู้เชี่ยวชาญแล้วก็ตาม ข้อมูลทางการแพทย์ของผู้ป่วยอาจมีเบาะแสสำคัญซ่อนอยู่ แต่การค้นหาเบาะแสเหล่านั้นอาจต้องพิจารณาความแปรผันทางพันธุกรรมที่เป็นไปได้ตั้งแต่หลักพันถึงหลักล้านรายการ เวชระเบียนที่กระจัดกระจาย และองค์ความรู้ทางวิทยาศาสตร์ที่เปลี่ยนแปลงอย่างรวดเร็ว
เมื่อมีการค้นพบความเชื่อมโยงใหม่ระหว่างยีนกับโรค รายงานผู้ป่วยเพิ่มเติม และหลักฐานสำหรับการจำแนกความผิดปกติทางพันธุกรรมเพิ่มขึ้นอย่างต่อเนื่อง เคสที่เคยหาคำอธิบายไม่ได้ก็อาจกลับมาตีความได้อีกครั้ง
นักวิจัยจากศูนย์ Manton Center for Orphan Disease Research แห่งโรงพยาบาล Boston Children’s Hospital ร่วมกับมหาวิทยาลัยฮาร์วาร์ด และ OpenAI ใช้โมเดลการให้เหตุผล o3 Deep Research ของ OpenAI เพื่อวิเคราะห์ข้อมูลทางคลินิกและข้อมูลจีโนมที่ไม่ระบุตัวตน จากกรณีศึกษาที่เคยวิเคราะห์ไปแล้วแต่ยังหาข้อสรุปไม่ได้จำนวน 376 เคส โมเดลนำเสนอข้อสันนิษฐานที่เชื่อมโยงกับหลักฐานเพื่อให้คณะนักวิจัยและแพทย์ผู้เชี่ยวชาญร่วมกันพิจารณา หลังจากผ่านการตรวจสอบโดยผู้เชี่ยวชาญ การทดสอบเพิ่มเติม และการยืนยันทางคลินิก แพทย์สามารถสรุปผลการวินิจฉัยได้ใน 18 เคส คิดเป็นอัตราความสำเร็จในการวินิจฉัยเพิ่มเติม 4.8% จากเคสที่เคยผ่านการวิเคราะห์โดยผู้เชี่ยวชาญมาแล้วก่อนหน้านี้ งานวิจัยชิ้นนี้ได้รับการตีพิมพ์เมื่อวันที่ 18 มิถุนายน พ.ศ. 2569 ในวารสาร NEJM AI ซึ่งแสดงให้เห็นว่ากระบวนการทำงานวิจัยโดยมี AI เป็นผู้ช่วยสามารถช่วยให้ผู้เชี่ยวชาญค้นพบเบาะแสสำคัญในขณะที่ทำการตรวจสอบเคสที่ซับซ้อนที่สุดอีกรอบ
เคสจำนวนมากเหล่านี้เคยผ่านการวิเคราะห์โดยผู้เชี่ยวชาญมานานหลายปี แต่ก็ยังไม่สามารถระบุสาเหตุได้ งานวิจัยนี้แสดงให้เห็นว่า OpenAI o3 Deep Research ช่วยให้นักวิจัยค้นพบแนวทางที่เป็นประโยชน์ ซึ่งได้รับการตรวจสอบในภายหลังด้วยกระบวนการทางการแพทย์ที่เป็นมาตรฐาน ซึ่งบ่งชี้ว่าการวิเคราะห์ซ้ำโดยผู้เชี่ยวชาญเป็นระยะอาจทำได้ในวงกว้างขึ้นเมื่อองค์ความรู้มีการพัฒนาไป โมเดลไม่ได้ทำการวินิจฉัยผู้ป่วยหรือตัดสินใจทางการแพทย์แต่อย่างใด โมเดลสร้างสมมติฐานที่เชื่อมโยงกับหลักฐานสนับสนุน เพื่อให้ผู้เชี่ยวชาญนำไปพิจารณา และหากเห็นว่าเหมาะสมก็สามารถตรวจสอบเพิ่มเติมและยืนยันผลในห้องปฏิบัติการทางคลินิกได้
ผลการตรวจพันธุกรรมที่ยังระบุสาเหตุไม่ได้ อาจไม่ใช่ผลสรุปสุดท้ายเสมอไป ข้อมูลลักษณะอาการของผู้ป่วย ผลการตรวจ และประวัติครอบครัว อาจกระจัดกระจายอยู่ในฐานข้อมูลหลายแห่งซึ่งใช้รหัสอ้างอิง รูปแบบข้อมูล และคำศัพท์ที่แตกต่างกัน การเชื่อมโยงบันทึกเหล่านั้นเข้าด้วยกันทำได้ยาก ดังนั้นแม้แต่ผู้เชี่ยวชาญก็อาจพลาดการวินิจฉัยได้ ผู้เชี่ยวชาญอาจดำเนินการตรวจลำดับจีโนมของเด็กก่อนที่ยีนนั้นหรือตัวแปรของยีนดังกล่าวจะถูกค้นพบว่ามีความเกี่ยวข้องกับโรค เมื่อองค์ความรู้ทางวิทยาศาสตร์ก้าวหน้าขึ้น ข้อมูลชุดเดิมก็อาจเผยคำตอบที่ก่อนหน้านี้ไม่สามารถค้นพบได้
การวิเคราะห์ข้อมูลผู้ป่วยโรคหายากซ้ำเป็นทั้งปัญหาทางวิทยาศาสตร์และปัญหาด้านการดูแลรักษาระบบข้อมูล แม้จีโนมของผู้ป่วยจะยังคงเหมือนเดิม แต่หลักฐานรอบด้านกลับเปลี่ยนแปลงไปอยู่เสมอ ทั้งการที่นักวิจัยค้นพบความเชื่อมโยงใหม่ๆ ระหว่างยีนกับโรค การที่ห้องแล็บจัดหมวดหมู่ตัวแปรพันธุกรรมใหม่ รวมถึงการที่ฐานข้อมูลเคสผู้ป่วยและเอกสารงานวิจัยต่างๆ มีการบันทึกข้อมูลใหม่เพิ่มขึ้นตลอดเวลา ทุกครั้งที่มีองค์ความรู้ใหม่เพิ่มขึ้น เคสเก่าที่เคยยังหาข้อสรุปไม่ได้ก็อาจมีเหตุผลให้กลับมาทบทวนอีกครั้ง ส่งผลให้หลายสถาบันต้องรับมือกับจีโนมที่รอการวิเคราะห์ซ้ำสะสมเพิ่มขึ้นเรื่อยๆ เพื่อให้สอดคล้องกับฐานความรู้ที่เปลี่ยนแปลงอยู่ตลอดเวลา
ในงานวิจัยนี้คณะผู้วิจัยได้ออกแบบขั้นตอนการทำงานโดยให้โมเดลทำหน้าที่เป็นชั้นการใช้เหตุผลที่เน้นการอธิบายเป็นหลัก โดยทำงานอยู่บนกระบวนการวิเคราะห์จีโนมที่มีอยู่แล้ว แทนที่จะส่งกลับเพียงรายชื่อยีนที่ได้รับการจัดอันดับ โมเดลถูกกำหนดให้เชื่อมโยงลักษณะอาการทางคลินิก รูปแบบการถ่ายทอดทางพันธุกรรม หลักฐานเกี่ยวกับความแปรผันทางพันธุกรรม และงานวิจัยทางวิทยาศาสตร์เข้าด้วยกันเพื่อให้ผู้เชี่ยวชาญสามารถตรวจสอบและตั้งคำถามต่อได้
สำหรับแต่ละเคสทีมวิจัยได้จัดเตรียมชุดข้อมูลที่ลบข้อมูลระบุตัวตนแล้ว ซึ่งประกอบด้วยคำศัพท์มาตรฐานจาก Human Phenotype Ontology (HPO) สำหรับอธิบายลักษณะอาการทางของผู้ป่วย บันทึกของแพทย์ในบางโอกาส รวมถึงคำวินิจฉัยเชิงพรรณนาที่มีอยู่ ข้อมูลประกอบ เช่น อายุและเพศ ตลอดจนตารางความแปรผันทางพันธุกรรมที่ผ่านการคัดกรองแล้ว ตารางดังกล่าวบันทึกข้อมูลเกี่ยวกับความหายากของความแปรผันทางพันธุกรรมแต่ละรายการ ผลกระทบที่คาดว่าจะมีต่อโปรตีนที่ยีนนั้นสร้างขึ้น การจัดประเภทตามฐานข้อมูล ClinVar และคุณภาพสัญญาณที่ตรวจพบจากสมาชิกในครอบครัวที่มีข้อมูล เคสส่วนใหญ่ประกอบด้วยข้อมูลจากตัวเด็กและบิดามารดาทางสายเลือดทั้งสองฝ่าย
ทีมขอให้โมเดลเสนอคำอธิบายเชิงโมเลกุลที่เป็นไปได้มากที่สุด และแสดงขั้นตอนการให้เหตุผล จากนั้นนักวิจัยได้ทบทวนผลลัพธ์โดยใช้กรอบ ACMG/AMP เดียวกับที่ห้องปฏิบัติการทางแพทย์ใช้ในการจำแนกตัวแปรทางพันธุกรรม สมาชิกในทีมอย่างน้อยสองคนได้ร่วมกันตรวจสอบเคสแต่ละกรณี หากมีความเห็นไม่ตรงกันจะใช้การหารือจนได้ข้อสรุป และจะไม่นำผลลัพธ์จากโมเดลมาถือเป็นคำวินิจฉัยโดยเด็ดขาด ข้อมูลที่พบจะถือเป็นคำวินิจฉัยก็ต่อเมื่อผู้เชี่ยวชาญที่มีคุณสมบัติเหมาะสมได้ตรวจสอบหลักฐานแล้ว ตัวแปรพันธุกรรมถูกจำแนกประเภทว่าก่อให้เกิดโรคหรือมีแนวโน้มที่จะก่อให้เกิดโรค ห้องปฏิบัติการที่ได้รับการรับรองมาตรฐาน CLIA ยืนยันผล และทีมแพทย์ได้แจ้งผลดังกล่าวแก่ครอบครัวผู้ป่วยแล้วเท่านั้น
ก่อนที่จะดำเนินการวิเคราะห์เคสที่ยังหาข้อสรุปไม่ได้ ทีมงานได้ปรับปรุงขั้นตอนการทำงานโดยใช้เคสที่มีคำวินิจฉัยแน่ชัดแล้วเป็นตัวทดสอบ โมเดลสามารถระบุยีนและตัวแปรพันธุกรรมที่ถูกต้องได้สำเร็จในการทดสอบซ้ำสองครั้งสำหรับเคสจำนวน 48 จาก 51 เคสซึ่งครอบคลุมโรคหายากหลากหลายชนิด จากเคสโรคทางระบบประสาทและกล้ามเนื้อจำนวน 57 เคส กระบวนการทำงานนี้สามารถวิเคราะห์ผลวินิจฉัยที่ถูกต้องได้สำเร็จในการทดสอบซ้ำจำนวน 45 เคส ในชุดข้อมูลจีโนมแบบอ่านลำดับยาว (long-read genome) จำนวน 15 เคส โมเดลสามารถระบุยีนที่ถูกต้องได้ครบทุกเคส และสามารถระบุ Allele ก่อโรคทั้งสองชุดได้ใน 12 เคส การประเมินเหล่านี้ช่วยในการพัฒนาพรอมต์ และชี้ให้เห็นจุดที่การตรวจสอบโดยผู้เชี่ยวชาญยังเป็นส่วนสำคัญที่ขาดไม่ได้
คะแนนความเชื่อมั่นที่โมเดลรายงานด้วยตนเองมีความสอดคล้องกับความถูกต้องของการวินิจฉัยในเคสที่ทราบคำตอบอยู่แล้วเหล่านี้ โดยค่าเฉลี่ยของคะแนนต่ำสุดอยู่ที่ 85.6 สำหรับเคสที่ให้ผลถูกต้องอย่างสม่ำเสมอ และ 42.1 สำหรับเคสที่ให้ผลไม่ถูกต้องหรือไม่สามารถระบุคำตอบได้ คะแนนดังกล่าวไม่ใช่ค่าความน่าจะเป็นที่ผ่านการปรับเทียบ และทีมงานไม่ได้ใช้คะแนนเหล่านี้เป็นสิ่งที่ทดแทนการตรวจสอบหลักฐานหรือการพิจารณาตัดสินทางการแพทย์ อย่างไรก็ตามคะแนนเหล่านี้มีประโยชน์ในการช่วยให้ผู้เชี่ยวชาญที่ตรวจสอบสามารถมุ่งเน้นไปที่การวินิจฉัยที่เป็นไปได้มากที่สุด
ทีมงานได้นำกระบวนการทำงานนี้ไปใช้กับกลุ่มเคสที่ยังหาข้อสรุปไม่ได้สี่กลุ่ม ได้แก่ เด็กที่มีภาวะพัฒนาการทางระบบประสาทผิดปกติ ผู้ป่วยโรคทางระบบประสาทและกล้ามเนื้อที่หายาก เด็กและวัยรุ่นที่มีอาการทางจิตในช่วงแรก และกรณีการเสียชีวิตอย่างกะทันหันโดยไม่ทราบสาเหตุในเด็ก เคสเหล่านี้ไม่ใช่เคสใหม่ที่กำลังรอการตรวจสอบเป็นครั้งแรก หลายเคสเคยผ่านการวิเคราะห์มาแล้วจากทั้งระบบของภาคเอกชนและสถาบันต่างๆ หลายระบบ และได้รับการพิจารณาโดยทีมผู้เชี่ยวชาญสหสาขาวิชาชีพ
กลุ่มผู้ป่วย | เคส | การวินิจฉัยที่ปรากฏขึ้น | ผลลัพธ์ |
พัฒนาการทางระบบประสาท | 100 | 10 | 10.0% |
โรคระบบประสาทและกล้ามเนื้อ | 61 | 4 | 6.6% |
การเสียชีวิตอย่างกะทันหันโดยไม่คาดคิดในเด็ก | 200 | 2 | 1.0% |
ภาวะจิตเภทในระยะเริ่มต้น | 15 | 2 | 13.3% |
รวม | 376 | 18 | 4.8% |
เนื่องจากกลุ่มตัวอย่างผู้ป่วยโรคจิตระยะเริ่มต้นมีขนาดเล็ก ค่าร้อยละที่ได้จึงมีช่วงความเชื่อมั่นที่ค่อนข้างกว้าง อัตราผลลัพธ์ยังบ่งบอกถึงความเป็นไปได้ที่แต่ละกลุ่มผู้ป่วยมีแนวโน้มมากน้อยเพียงใดที่จะมีสาเหตุจากความผิดปกติของยีนเดี่ยว
หลังจากโมเดลระบุคำอธิบายที่เป็นไปได้ และผู้เชี่ยวชาญได้ตรวจทานพร้อมยืนยันผลทางคลินิกแล้ว แพทย์สามารถยืนยันการวินิจฉัยได้ใน 4.8% ของเคสทั้งหมด อัตราดังกล่าวอาจดูไม่สูงนักแต่มีความหมายอย่างยิ่งสำหรับกลุ่มผู้ป่วยนี้ เพราะเคสเหล่านี้เคยผ่านการทบทวนโดยผู้เชี่ยวชาญมาแล้วและยังไม่สามารถหาคำตอบได้ งานวิจัยด้านการวิเคราะห์ซ้ำในลักษณะเดียวกันมักรายงานอัตราการวินิจฉัยเพิ่มเติมในระดับเลขหลักเดียวสำหรับเคสที่ผ่านการตรวจสอบอย่างเข้มข้นมาแล้ว ขณะที่อัตราที่สูงกว่ามักพบในงานวิจัยที่มีเคสใหม่ หรือโรคที่เป็นที่รู้จักดีซึ่งกำลังรอการยืนยันทางพันธุกรรม
จากการวินิจฉัยทั้งหมด 18 รายการ มี 7 รายการที่เป็นการค้นพบซ้ำ กล่าวคือ เป็นการวินิจฉัยที่เคยได้รับการยืนยันจากที่อื่นนอกกระบวนการวิจัยนี้อยู่แล้ว แต่ข้อมูลดังกล่าวไม่ปรากฏอยู่ในเวชระเบียนที่ทีมวิจัยใช้ในการทบทวน ในหลายเคส ความแปรผันทางพันธุกรรมเหล่านั้นถูกระบุไว้แล้วว่าเป็นชนิดก่อโรคหรือมีแนวโน้มก่อโรคในฐานข้อมูลสาธารณะ ซึ่งสะท้อนให้เห็นความท้าทายด้านการปฏิบัติงานในการรวบรวมและเชื่อมโยงข้อมูลจากหลายแหล่งเข้าด้วยกัน
ในกรณีศึกษาโรคจิตระยะเริ่มต้นกรณีหนึ่ง โมเดลสามารถเชื่อมโยงข้อมูลจนพบร่องรอยของความผิดปกติเชิงโครงสร้างในจีโนม แม้ว่ารายละเอียดดังกล่าวจะไม่ได้รวมอยู่ในข้อมูลที่ได้รับก็ตาม โมเดลเชื่อมโยงข้อมูลคุณภาพต่ำบนโครโมโซมคู่ที่ 22 เข้ากับลักษณะอาการทางหัวใจ ระบบภูมิคุ้มกัน พัฒนาการทางประสาทและอาการทางจิตเวชของเด็ก จากนั้นจึงตั้งข้อสันนิษฐานถึงความผิดปกติที่ตำแหน่ง 22q11.2 ซึ่งเป็นการขาดหายไปของชิ้นส่วนโครโมโซมที่เกี่ยวข้องกับกลุ่มอาการดิจอร์จ (DiGeorge syndrome) ตัวแปรที่ตั้งสมมติฐานไว้นี้ได้รับการยืนยันด้วยการจัดลำดับจีโนมเพิ่มเติม
แม้พรอมต์จะสั่งให้ระบุสาเหตุจากยีนเดี่ยวเพียงหนึ่งสาเหตุ แต่ในบางกรณีโมเดลสามารถระบุยีนสองตำแหน่งที่ช่วยอธิบายลักษณะอาการที่ซับซ้อนของผู้ป่วยได้ชัดเจนยิ่งขึ้น ความแปรผันในยีน LAMA2 และ FOXP1 ร่วมกันมีส่วนช่วยอธิบายลักษณะอาการทางกล้ามเนื้อและพัฒนาการทางประสาทของผู้ป่วยรายหนึ่ง ในขณะที่อีกรายพบคำอธิบายจากภาวะยีนสองตำแหน่งที่เกี่ยวข้องกับ TTN และ SRPK3 ซึ่งไม่เคยมีรายงานมาก่อน
นอกจากจะช่วยในการวินิจฉัยโรคแล้ว โมเดลยังสามารถระบุคำอธิบายเชิงกลไกการเกิดโรคแบบใหม่ที่อาจเป็นไปได้สำหรับภาวะด่างขาว (vitiligo) อีกด้วย มีกรณีของผู้ป่วยโรคด่างขาวที่มีความผิดปกติของพัฒนาการทางระบบประสาท ซึ่งโมเดลได้ชี้ให้เห็นว่ามีการขาดหายไปของลำดับกรดอะมิโน 11 ตัวในยีน S1PR1 S1PR1 เป็นยีนที่ควบคุมการสร้างตัวรับบนพื้นผิวเซลล์ ซึ่งมีบทบาทสำคัญในกระบวนการส่งสัญญาณ การเคลื่อนที่ของเซลล์ในระบบภูมิคุ้มกัน และกระบวนการทางชีววิทยาของเนื้อเยื่อต่างๆ โมเดลได้ผสานหลักฐานที่บ่งชี้ว่าการขาดหายไปดังกล่าวอาจเปลี่ยนแปลงโครงสร้างและการส่งสัญญาณของตัวรับในลักษณะที่ลดการผลิตเม็ดสี ขณะเดียวกันก็ช่วยให้เซลล์ภูมิคุ้มกันคงอยู่ในผิวหนัง
ความสัมพันธ์ระหว่างยีน S1PR1 และโรคด่างขาวที่นำเสนอนี้ยังจำเป็นต้องมีการพิสูจน์เชิงทดลองเพิ่มเติม แต่ก็แสดงให้เห็นถึงบทบาทอันทรงพลังของ AI ในการเปลี่ยนผลลัพธ์ที่กระจัดกระจายจากสาขาชีววิทยาโครงสร้าง ภูมิคุ้มกันวิทยา และเวชพันธุศาสตร์ให้กลายเป็นสมมติฐานที่ชัดเจนและสามารถนำไปทดสอบได้จริง
นอกจากนี้ทีมวิจัยยังพบความเป็นไปได้ในการขยายขอบเขตของกลุ่มอาการในกลุ่มผู้ป่วยที่มีความผิดปกติทางระบบประสาทและกล้ามเนื้ออีกด้วย ความแปรผันที่ส่งผลเสียใน HSPB8 และ CDK13 แสดงลักษณะที่ไม่ตรงกับโรคต้นแบบที่มักเชื่อมโยงกับยีนทั้งสองอย่างครบถ้วน สะท้อนความเป็นไปได้ว่ากลุ่มอาการของยีนเหล่านี้อาจกว้างกว่าความเข้าใจในปัจจุบัน ซึ่งยังต้องได้รับการตรวจสอบจากผู้ป่วยรายอื่นและการทดลองเพิ่มเติม
กรณีศึกษา: การวินิจฉัยโรคของไคร่าหลังจากเวลาผ่านไปเกือบสองทศวรรษ
เรื่องเริ่มขึ้นในชั้นเรียนคาราเต้เมื่อแม่ของไคร่าสังเกตว่าลูกสาววัย 9 ขวบของเธอไม่ได้ย่อตัวลงในท่ายืนได้ต่ำเท่าที่เคย นอกจากนี้ไคร่ายังเริ่มเคลื่อนไหวช้าลงระหว่างการฝึกซ้อมฟุตบอล และมักเขย่งปลายเท้าเวลาเดินและวิ่ง กุมารแพทย์ของเธอไม่สามารถระบุสาเหตุของอาการกล้ามเนื้ออ่อนแรงของเธอได้ จึงส่งตัวเธอไปพบแพทย์เฉพาะทาง สิ่งที่ตามมาคือเส้นทางอันยาวนานเกือบ 20 ปีที่เต็มไปด้วยการตรวจ การรักษา และการปรึกษาแพทย์หลายครั้ง โดยยังไม่สามารถหาคำวินิจฉัยได้
เคสของไคร่าเป็นหนึ่งในสี่การวินิจฉัยที่พบในกลุ่มผู้ป่วยโรคประสาทและกล้ามเนื้อ ทีมวิจัยเชื่อมโยงภาวะอาการของเธอเข้ากับความแปรปรวนแบบเฟรมชิฟต์ในยีน HSPB8 และวินิจฉัยว่าเป็นโรคกล้ามเนื้อเสื่อมชนิดไมโอไฟบริลลาร์ ซึ่งมีการสะสมของโครงสร้างโปรตีนผิดปกติในเส้นใยกล้ามเนื้อจนส่งผลให้เกิดอาการกล้ามเนื้ออ่อนแรง นักให้คำปรึกษาทางพันธุกรรมจากศูนย์ Manton Center โทรหาไคร่าประมาณหนึ่งสัปดาห์ก่อนวันเกิดอายุครบ 28 ปีของเธอ
ในตอนนั้นไคร่าได้ใช้ชีวิตส่วนใหญ่ไปกับการปรับตัวให้เข้ากับโรคนี้แล้ว เธอต้องพึ่งเครื่องช่วยหายใจและต้องใช้รถเข็นเมื่ออายุ 13 ปี แม้อาการของเธอจะทรงตัวนับตั้งแต่นั้นมา แม้ว่าโรคกล้ามเนื้อไมโอไฟบริลลาร์ชนิดที่ไคราเป็นจะพบได้น้อยมากจนยังมีข้อมูลไม่มากนักเกี่ยวกับการดำเนินโรคในระยะยาว แต่การวินิจฉัยก็ช่วยให้คลายความค้างคาใจลงได้บ้าง
งานวิจัยนี้แสดงให้เห็นว่าโมเดลการใช้เหตุผลแบบอเนกประสงค์สามารถช่วยในการวิเคราะห์ข้อมูลจีโนมย้อนหลังได้ โดยการบูรณาการข้อมูลลักษณะทางคลินิก รูปแบบการถ่ายทอดทางพันธุกรรม คำอธิบายความแปรปรวน รูปแบบคุณภาพข้อมูล และวรรณกรรมทางวิทยาศาสตร์ เข้าเป็นสมมติฐานที่สามารถนำไปตรวจสอบได้ สิ่งนี้ยังแสดงให้เห็นว่าเหตุใดการวิเคราะห์ซ้ำเป็นระยะจึงสำคัญ เนื่องจากคำตอบบางอย่างจะปรากฏขึ้นก็ต่อเมื่อองค์ความรู้ก้าวหน้าไป หรือเมื่อบันทึกที่กระจัดกระจายอยู่ถูกนำมารวบรวมเข้าด้วยกัน
งานวิจัยนี้ไม่ได้เป็นข้อพิสูจน์ว่าผู้ป่วย แพทย์ หรือลูกค้าควรใช้โมเดลของ OpenAI เพื่อวินิจฉัยโรคหรือตัดสินใจเรื่องทางการแพทย์ งานวิจัยนี้ไม่ได้อธิบายหรือรับรองการใช้งาน OpenAI o3 Deep Research, ChatGPT หรือผลิตภัณฑ์อื่นใดของ OpenAI ในฐานะเครื่องมือสำหรับการวินิจฉัยโรคแต่อย่างใด โมเดลไม่ได้เป็นผู้วินิจฉัยผู้เข้าร่วมวิจัยรายใด การวินิจฉัยทุกกรณีดำเนินการโดยแพทย์และผู้เชี่ยวชาญทางการแพทย์ที่มีคุณสมบัติเหมาะสม โดยผ่านขั้นตอนการทบทวน การทดสอบ และการยืนยันผลทางการแพทย์ตามมาตรฐานที่กำหนดไว้
การศึกษานี้เป็นการศึกษาย้อนหลัง กลุ่มตัวอย่างมีความหลากหลาย และผู้ประเมินสามารถเห็นคะแนนความเชื่อมั่นของโมเดลได้ระหว่างการทบทวน นักวิจัยไม่ได้ประเมินว่ากระบวนการนี้ช่วยประหยัดเวลาได้มากเพียงใด ลดต้นทุนได้หรือไม่ ลดภาระงานของแพทย์ได้มากน้อยแค่ไหน เพิ่มภาระงานจากการวินิจฉัยที่ผิดพลาดหรือไม่ หรือส่งผลต่อการดูแลรักษาผู้ป่วยอย่างไร นอกจากนี้ผู้วิจัยยังไม่ได้ประเมินความแปรปรวนทางพันธุกรรมในรูปแบบอื่นอย่างเป็นระบบ เช่น ความแปรปรวนเชิงโครงสร้าง การขยายตัวของลำดับซ้ำ การเปลี่ยนแปลงในลึกของอินตรอน หรือภาวะโมเสก
โมเดลภาษาขนาดใหญ่สามารถตีความบริบทผิดพลาด หรือสร้างคำอธิบายที่ดูสมเหตุสมผลแต่กลับใช้ไม่ได้จริงเมื่อตรวจสอบอย่างละเอียด ด้วยเหตุนี้ ผลการวิเคราะห์ทุกประการจึงต้องผ่านการพิจารณาโดยมนุษย์และการตรวจสอบยืนยันผลทางการแพทย์ โมเดลทำหน้าที่เพียงขยายขอบเขตการค้นหาข้อมูลและกำหนดเป้าหมายสำหรับการวิเคราะห์ของมนุษย์ในขั้นต่อไป แต่ไม่ได้เป็นผู้ตัดสินว่าควรให้ข้อมูลหรือคำวินิจฉัยใดแก่ครอบครัวผู้ป่วย
งานวิจัยนี้อาศัยข้อมูลที่ไม่สามารถระบุตัวบุคคลได้ และไม่มีการนำข้อมูลสุขภาพที่ได้รับการคุ้มครองมาใช้หรือส่งออกนอกระบบที่ได้รับอนุญาต การนำเทคโนโลยีนี้ไปใช้ในทางคลินิกอย่างแพร่หลายจำเป็นต้องคำนึงถึงความเป็นส่วนตัว ความมั่นคงปลอดภัย ความสามารถในการตรวจสอบได้ และกฎระเบียบท้องถิ่น เช่นเดียวกับมาตรฐานที่ใช้กับบริการทางการแพทย์ทุกประเภท การเข้าถึงโมเดลไม่สามารถใช้แทนโครงสร้างพื้นฐานด้านการหาลำดับพันธุกรรม การให้คำปรึกษาทางพันธุกรรม การทดสอบเพื่อยืนยันผล หรือดุลยพินิจของผู้เชี่ยวชาญได้

“อุปสรรคคือเวลา ผู้เชี่ยวชาญสามารถทุ่มเวลาให้กับผู้ป่วยแต่ละรายได้เพียงจำกัดในแต่ละวัน”
Dr. Catherine Brownstein จากสูนย์ Manton Center for Orphan Disease Research สังกัดโรงพยาบาลเด็กบอสตัน

“นักวิจัยอย่างแคทเธอรีนกับฉันไม่มีทางจำโรคต่างๆ 8,000 โรคไว้ในหัวได้หมด นั่นคือพลังที่ AI ทำได้”
Alan Beggs ผู้อำนวยการประจำศูนย์ Manton Center for Orphan Disease Research
โดยทั่วไปการศึกษาการวิเคราะห์ซ้ำในกลุ่มเคสที่ได้รับการตรวจสอบอย่างละเอียดมาแล้วมักให้ผลลัพธ์เพิ่มเติมเพียงไม่กี่เปอร์เซ็นต์ ส่วนอัตราที่สูงกว่ามักเกิดจากการศึกษาที่มีผู้ป่วยรายใหม่ หรือโรคที่ทราบลักษณะทางคลินิกอยู่แล้วและรอการยืนยันด้วยข้อมูลทางพันธุกรรม การใช้พรอมต์ที่มีการระบุเวอร์ชัน การตรวจสอบอ้างอิง บันทึกการตรวจสอบ และการปรับเทียบค่าความไม่แน่นอน ถือเป็นสิ่งจำเป็นต่อการเพิ่มความน่าเชื่อถือในการทำผลการทดลองซ้ำและความปลอดภัยของระบบ งานวิจัยเหล่านี้ยังคงต้องอาศัยแพทย์ผู้เชี่ยวชาญในการประเมินหลักฐาน สั่งการทดสอบที่เหมาะสม รวมถึงการตัดสินใจวินิจฉัยหรือวางแผนการรักษา
การศึกษานี้ใช้การค้นคว้าข้อมูลเชิงลึกของ OpenAI o3 โมเดลอเนกประสงค์รุ่นใหม่สามารถสืบค้นและสังเคราะห์เนื้อหาทางวิทยาศาสตร์ได้มากขึ้น ในขณะที่ระบบที่ถูกสร้างขึ้นเพื่อวัตถุประสงค์เฉพาะทาง เช่น GPT‑Rosalind นั้นได้รับการออกแบบมาเพื่องานด้านวิทยาศาสตร์ชีวภาพเชิงลึก ซึ่งรวมถึงการวิเคราะห์ผลกระทบของตัวแปรต่อโครงสร้างและหน้าที่ของโปรตีน ความสามารถเหล่านั้นไม่ได้รับการทดสอบในที่นี้ และจะต้องมีการประเมินและการควบคุมการเข้าถึงแยกต่างหาก
แม้ OpenAI จะมีส่วนสนับสนุนงานวิจัยระยะเริ่มต้นนี้ แต่ Manton Center จะเป็นผู้นำการดำเนินงานในระยะถัดไปโดยใช้ทุนสนับสนุนจาก OpenAI Foundation เงินทุนสนับสนุนนี้จะช่วยส่งเสริมความพยายามในวงกว้างของศูนย์ฯ ในการพัฒนาผู้ช่วย AI ด้านพันธุศาสตร์ที่ไม่ผูกติดกับแพลตฟอร์มใดแพลตฟอร์มหนึ่ง และมีต้นทุนต่ำ ซึ่งช่วยให้ทีมทางคลินิกวิเคราะห์กรณีโรคหายากได้รวดเร็วและสม่ำเสมอยิ่งขึ้น
โอกาสในการวิจัยระยะยาวคือการสำรวจว่าการวิเคราะห์ซ้ำที่นำโดยผู้เชี่ยวชาญและได้รับความช่วยเหลือจาก AI สามารถช่วยให้ความเข้าใจทางวิทยาศาสตร์ก้าวทันการค้นพบได้หรือไม่ ศักยภาพที่คาดหวังไม่ได้อยู่ที่ว่า AI จะมาแทนที่การวินิจฉัยของแพทย์ แต่อยู่ที่ว่าเครื่องมือวิจัยที่ผ่านการประเมินอย่างรอบคอบอาจช่วยให้ผู้เชี่ยวชาญระบุหลักฐานที่ควรค่าแก่การตรวจสอบเพิ่มเติมได้ สำหรับครอบครัวหลายพันครอบครัว คำถามที่ยังไม่มีคำตอบในวันนี้ไม่จำเป็นต้องไร้คำตอบตลอดไป
- 2569


