
การเร่งรัดความก้าวหน้าทางวิทยาศาสตร์ถือเป็นวิธีทรงคุณค่าที่สุดประการหนึ่งที่ AI สามารถสร้างประโยชน์ต่อมนุษยชาติได้ GPT‑5 แสดงให้เห็นสัญญาณเริ่มต้นของศักยภาพนี้ ซึ่งไม่เพียงแต่ช่วยให้นักวิจัยสามารถสืบค้นข้อมูลทางวิทยาศาสตร์ได้รวดเร็วยิ่งขึ้นเท่านั้น แต่ยังสนับสนุนการใช้เหตุผลทางวิทยาศาสตร์ในรูปแบบใหม่ๆ เช่น การค้นพบความเชื่อมโยงที่ไม่คาดคิด หรือการเสนอสมมติฐานเกี่ยวกับกลไกที่เป็นไปได้ เพื่อให้ผู้เชี่ยวชาญนำไปประเมินและทดสอบต่อไป
จนถึงตอนนี้เราจะเห็นความก้าวหน้าได้ชัดที่สุดในด้านคณิตศาสตร์และทฤษฎีต่างๆ ทั้งทางฟิสิกส์และคอมพิวเตอร์ เพราะในด้านเหล่านี้เราสามารถตรวจสอบแนวคิดได้อย่างแม่นยำด้วยเหตุผลและตัวเลข โดยไม่จำเป็นต้องทำการทดลองจริง ด้านชีววิทยานั้นมีความแตกต่างออกไป เนื่องจากความก้าวหน้าส่วนใหญ่จำเป็นต้องอาศัยการดำเนินการทดลอง การทำซ้ำ และการตรวจสอบความถูกต้องด้วยข้อมูลเชิงประจักษ์จากห้องแล็บ
เราได้ทำงานร่วมกับ Red Queen Bio สตาร์ทอัพด้านความปลอดภัยทางชีวภาพ เพื่อสร้างกรอบการประเมินสำหรับทำความเข้าใจว่าโมเดลระดับแนวหน้าทำงานอย่างไร โดยทดสอบการเสนอ การวิเคราะห์ และการพัฒนาแนวคิดซ้ำๆ ในบริบทของห้องปฏิบัติการเปียก เราได้สร้างระบบการทดลองทางชีววิทยาโมเลกุลที่เรียบง่าย และใช้ GPT‑5 ในการเพิ่มประสิทธิภาพของขั้นตอนการโคลนโมเลกุล
หลังจากการทดลองหลายรอบ GPT‑5 ได้เสนอวิธีการใหม่ที่ช่วยเพิ่มประสิทธิภาพการโคลนโมเลกุลได้ถึง 79 เท่า การโคลนนิ่งเป็นเครื่องมือพื้นฐานที่สำคัญยิ่งในทางชีววิทยาระดับโมเลกุล ประสิทธิภาพของวิธีการโคลนนิ่งมีความสำคัญอย่างยิ่งต่อการสร้างคลังข้อมูลทางพันธุกรรมที่มีขนาดใหญ่และซับซ้อน ซึ่งเป็นหัวใจสำคัญของ วิศวกรรมโปรตีน(เปิดในหน้าต่างใหม่) การคัดกรองทางพันธุกรรม(เปิดในหน้าต่างใหม่) และ วิศวกรรมสายพันธุ์ของสิ่งมีชีวิต(เปิดในหน้าต่างใหม่) โครงการนี้เผยให้เห็นว่า AI สามารถทำงานเคียงข้างนักชีววิทยา เพื่อเร่งการค้นพบทางวิทยาศาสตร์ได้จริง การพัฒนาวิธีการทดลองให้ดียิ่งขึ้น จะช่วยให้นักวิจัยสามารถทำงานได้รวดเร็วขึ้น ลดค่าใช้จ่าย และสามารถนำการค้นพบต่างๆ ไปต่อยอดให้เกิดผลลัพธ์ที่จับต้องได้จริง
เนื่องจากความก้าวหน้าในการใช้เหตุผลทางชีวภาพมีผลกระทบต่อความปลอดภัยทางชีวภาพ เราจึงดำเนินงานนี้ในสภาพแวดล้อมที่มีการควบคุมอย่างเข้มงวด โดยใช้ระบบทดลองที่ไม่เป็นอันตราย จำกัดขอบเขตของงาน และประเมินพฤติกรรมของโมเดลเพื่อแจ้งการประเมินความเสี่ยงด้านความปลอดภัยทางชีวภาพของเราและการพัฒนามาตรการป้องกันในระดับโมเดลและระบบ ตามที่ระบุไว้ใน กรอบการเตรียมความพร้อม(เปิดในหน้าต่างใหม่)ของเรา
ในระบบการทดลองนี้ GPT‑5 สามารถวิเคราะห์ขั้นตอนการโคลนอย่างอิสระ เสนอการปรับแก้ และบูรณาการข้อมูลจากการทดลองใหม่เพื่อแนะนำแนวทางการปรับปรุงเพิ่มเติม มนุษย์มีบทบาทเพียงแค่ดำเนินการตามขั้นตอนที่ปรับปรุงแล้ว และอัปโหลดข้อมูลการทดลอง
ในการทดลองหลายรอบ GPT‑5 ได้ปรับปรุงขั้นตอนการโคลนให้มีประสิทธิภาพสูงขึ้นกว่า 79 เท่า ซึ่งหมายความว่า เมื่อใช้ปริมาณ DNA ตั้งต้นในจำนวนที่เท่ากัน เราได้โคลนที่ตรวจสอบความถูกต้องของลำดับพันธุกรรมแล้วมากกว่าวิธีการแบบเดิมถึง 79 เท่า สิ่งที่น่าทึ่งคือ GPT‑5 ได้แนะนำเอนไซม์ 2 ชนิดที่ทำงานร่วมกันเป็นกลไกใหม่ ได้แก่ RecA จากเชื้อ E. coli และโปรตีน gp32 (โปรตีนจับ DNA สายเดี่ยว) จาก Phage T4 ซึ่งเป็นวิธีที่แปลกใหม่และได้ผลลัพธ์ที่ยอดเยี่ยม เมื่อทำงานร่วมกัน gp32 จะช่วยจัดเรียงและคลายปลาย DNA ที่หลวม และ RecA จะนำแต่ละสายไปจับคู่กับสายที่ถูกต้อง
จากการคัดกรองเบื้องต้นและการทดลองในรอบถัดมา พบว่าระบบ HiFi Assembly ที่เสริมประสิทธิภาพด้วย RecA (RecA-Assisted Pair-and-Finish หรือ RAPF) และ การเปลี่ยนแปลงรูปแบบที่ 7 (T7) เป็นโปรโตคอลเอนไซม์และโปรโตคอลการเปลี่ยนแปลงที่ดีที่สุดตามลำดับ ทั้งการประกอบ DNA แบบ RAPF และกระบวนการเปลี่ยนแปลงแบบ T7 ต่างสามารถเพิ่มประสิทธิภาพการโคลนนิ่งได้ด้วยตัวเองเมื่อเทียบกับโปรโตคอล HiFi มาตรฐาน โดยเพิ่มขึ้น 2.6 เท่า และ 36 เท่าตามลำดับ และเมื่อนำทั้งสองส่วนมาใช้ร่วมกัน จะให้ผลลัพธ์เชิงบวกที่ส่งเสริมกันจนเพิ่มประสิทธิภาพการทำงานได้สูงถึง 79 เท่า โคลนทั้งหมดได้รับการตรวจสอบและยืนยันความถูกต้องผ่านการวิเคราะห์ลำดับเบส (แถบค่าความคลาดเคลื่อน: ค่าเบี่ยงเบนมาตรฐาน (SD) จากการทดลองเพื่อตรวจสอบความถูกต้องที่เป็นอิสระต่อกันจำนวน 3 ครั้ง)
แม้จะยังอยู่ในระยะเริ่มต้น แต่ผลลัพธ์เหล่านี้เป็นที่น่าพอใจและมีทิศทางที่น่าสนใจ การปรับปรุงเหล่านี้ใช้ได้เฉพาะกับการตั้งค่าการโคลนที่ใช้ในระบบต้นแบบของเรา และยังคงต้องอาศัยนักวิทยาศาสตร์ในการจัดเตรียมและดำเนินการตามขั้นตอน แม้จะเป็นเพียงก้าวแรก แต่การทดลองนี้พิสูจน์ให้เห็นว่า AI สามารถช่วยงานในแล็บได้จริง และมีศักยภาพที่จะช่วยให้นักวิทยาศาสตร์ทำงานได้รวดเร็วขึ้นอย่างมากในอนาคต
วงจรการทำงานร่วมกันระหว่าง AI และห้องปฏิบัติการนี้ ดำเนินการโดยใช้ชุดคำสั่งที่กำหนดไว้ล่วงหน้าโดยไม่มีการแทรกแซงจากมนุษย์ การจัดวางโครงสร้างนี้ช่วยให้เห็นศักยภาพของโมเดลในการเสนอการปรับเปลี่ยนโปรโตคอลที่แท้จริงโดยไม่ต้องอาศัยการชี้นำจากมนุษย์ แต่ก็ทำให้ระบบติดอยู่กับการลองสิ่งใหม่ๆ และลดทอนความสามารถในการเพิ่มประสิทธิภาพของแนวคิดใหม่ที่ค้นพบ หากสามารถปรับสมดุลระหว่างการค้นหาวิธีใหม่กับการพัฒนาต่อยอดสิ่งที่ค้นพบได้ดีกว่านี้ เราน่าจะได้เห็นความก้าวหน้าที่ยิ่งใหญ่กว่าเดิม เพราะทั้งส่วนของกลไกเอนไซม์และกระบวนการส่งถ่ายสารพันธุกรรมยังสามารถพัฒนาให้มีประสิทธิภาพสูงขึ้นได้ เราคาดการณ์ว่าความก้าวหน้าในด้านการวางแผน และการใช้เหตุผลในงานที่มีระยะเวลายาวนาน จะช่วยเพิ่มขีดความสามารถของชุดคำสั่งแบบคงที่ ให้สามารถรองรับได้ทั้งการค้นพบสิ่งใหม่ๆ และการเพิ่มประสิทธิภาพในขั้นตอนต่อๆ ไปให้ดียิ่งขึ้น
ตั้งแต่การคิดค้นในปี 2009 ปฏิกิริยา Gibson Assembly(เปิดในหน้าต่างใหม่) ได้กลายเป็นวิธีการโคลนที่สำคัญ และถูกนำมาใช้อย่างกว้างขวางในงานชีววิทยาโมเลกุล Gibson Assembly ช่วยให้นักชีววิทยาระดับโมเลกุลสามารถ "เชื่อม" ชิ้นส่วนของ DNA เข้าด้วยกันได้ โดยการละลายปลายของ DNA ชั่วคราวเพื่อให้ลำดับที่ตรงกันสามารถผนึกเข้าด้วยกันเป็นโมเลกุลเดียว จุดเด่นที่สำคัญของ Gibson Assembly อยู่ที่ความง่ายในการใช้งาน เพราะทุกขั้นตอนสามารถดำเนินการเสร็จสิ้นได้ในหลอดเดียว โดยใช้อุณหภูมิเพียงค่าเดียวตลอดกระบวนการ ข้อจำกัดเหล่านี้คือโอกาสสำคัญในการยกระดับประสิทธิภาพให้ดีกว่าที่เป็นอยู่ ยิ่งไปกว่านั้น คุณสมบัติเหล่านี้ทำให้ระบบมีความเหมาะสมต่อการใช้ประเมินศักยภาพของโมเดล AI ในการยกระดับเทคนิคการทำงานในห้องปฏิบัติการเปียก
- ระบบนี้มีความชัดเจนและสามารถควบคุมส่วนประกอบทุกอย่างได้ ต่างจากระบบในเซลล์ที่มีความซับซ้อนและควบคุมได้ยากกว่า
- มีฟังก์ชันการเพิ่มประสิทธิภาพที่ชัดเจน โดยมุ่งเน้นการสร้าง DNA แบบวงกลมที่สามารถแปลงได้จาก DNA สายตรงตั้งต้นในปริมาณที่กำหนดไว้
- มีรอบการทดลองที่ค่อนข้างรวดเร็ว (1-2 วัน)
- พื้นที่การออกแบบมีความซับซ้อนและมีมิติสูง จำเป็นต้องอาศัยการให้เหตุผลเชิงกลไกเพื่อพัฒนาผลลัพธ์ เนื่องจากปัจจัยด้านบัฟเฟอร์ สารเคมี และอุณหภูมิที่เหมาะสมที่สุดต่างมีความเกี่ยวพันและส่งผลกระทบซึ่งกันและกัน
เราเลือกใช้ชุดเอนไซม์ HiFi assembly(เปิดในหน้าต่างใหม่) ซึ่งเป็นระบบเอนไซม์ที่พัฒนาโดย New England Biolabs และอิงจาก Gibson Assembly เป็นจุดเริ่มต้นในการเพิ่มประสิทธิภาพ เราได้ทำการศึกษาเพื่อดูว่า AI สามารถสร้างนวัตกรรมและเรียนรู้จากข้อมูลป้อนกลับเชิงทดลองได้หรือไม่ เมื่อไม่มีข้อจำกัดของการทำงานแบบขั้นตอนเดียวและอุณหภูมิคงที่ ซึ่งอาจนำไปสู่การระบุการปรับปรุงโปรโตคอลในบริบทนี้
สำหรับการทดสอบนี้ เราเลือกใช้ระบบการโคลนนิ่งแบบสองส่วนที่ประกอบด้วยยีนโปรตีนเรืองแสงสีเขียว (GFP) และ พลาสมิด pUC19 ซึ่งเปรียบเสมือนพาหะ DNA มาตรฐานที่ช่วยนำส่งยีนเข้าสู่แบคทีเรียเพื่อใช้ในการคัดลอกและเพิ่มปริมาณยีนเหล่านั้น เป้าหมายหลักคือการเพิ่มจำนวนโคโลนีที่ได้รับยีนเป้าหมายให้สูงขึ้น
เราได้เพิ่มประสิทธิภาพของปฏิกิริยาการโคลนนิ่งโดยการนำกรอบแนวคิดเชิงวิวัฒนาการมาใช้ในการปรับปรุงข้อเสนอการทดลองซ้ำๆ ซึ่งช่วยให้โมเดลสามารถเรียนรู้แบบ "ออนไลน์" จากประสบการณ์ที่ได้รับจากการทดลองในรอบก่อนหน้า ในแต่ละรอบ GPT‑5 เสนอชุดปฏิกิริยาที่แตกต่างกัน 8-10 แบบ โดยปฏิกิริยาที่ต้องใช้สารเคมีเฉพาะที่ห้องปฏิบัติการไม่มีพร้อมจะถูกเลื่อนไปยังรอบถัดไป จากนั้นนักวิทยาศาสตร์ได้ดำเนินการทดสอบปฏิกิริยาและวัดปริมาณโคโลนีที่ได้ เปรียบเทียบกับค่ามาตรฐานของระบบ HiFi Gibson Assembly ในการคัดกรองเบื้องต้น ข้อมูลที่มีประสิทธิภาพสูงสุดจากรอบก่อนหน้านี้ถูกนำไปใช้ในรอบถัดไป ที่สำคัญคือเราควบคุมกระบวนการป้อนคำสั่งให้เป็นมาตรฐาน โดยไม่มีการให้ข้อมูลจากมนุษย์เพิ่มเติมยกเว้นเพียงการตอบคำถามสั้นๆ เพื่อความเข้าใจที่ตรงกัน มั่นใจได้ว่านวัตกรรมและการวิเคราะห์เชิงกลไกที่เกิดขึ้นนั้นมาจากศักยภาพของ AI โดยตรงแทนที่จะเป็นคำแนะนำจากมนุษย์
เราทดสอบปฏิกิริยาท็อป 8 จากชุดการเพิ่มประสิทธิภาพทั้งหมดอีกครั้ง โดยใช้ช่วงการเจือจาง DNA ที่กว้างขึ้น ผลการทดสอบพบว่าหลายปฏิกิริยาให้ผลลดลงเมื่อเทียบกับการคัดกรองครั้งแรก ท้ายที่สุดเราพบว่าปฏิกิริยาจากรอบที่ 5 คือตัวเลือกที่ผ่านการตรวจสอบแล้วว่าแข็งแกร่งที่สุด โดยสามารถให้ผลลัพธ์ได้ดีเท่ากับประสิทธิภาพเดิมที่เคยทำไว้ ปฏิกิริยาที่มีประสิทธิภาพสูงจำนวนมากจัดอยู่ในกลุ่ม Ligase-Polish ซึ่งมีความไวต่อความแปรผันเล็กน้อยของสภาวะเซลล์ที่มีความสามารถในการรับ DNA และ หรือการจัดการ DNA หลังปฏิกิริยา เนื่องจากปฏิกิริยาเหล่านี้ใช้ขั้นตอน HiFi ที่สั้น เราจึงตั้งสมมติฐานว่าผลิตภัณฑ์ส่วนใหญ่น่าจะเข้าสู่เซลล์ E. coli ดยมีเพียงจุดเชื่อมหนึ่งที่ถูกปิดผนึก และอีกจุดหนึ่งถูกยึดด้วยการจับคู่เบส ทำให้การซ่อมแซมต่อเนื่องต้องอาศัยกลไกการซ่อมแซมของเซลล์ สิ่งนี้ทำให้เกิดความแปรปรวนสูงเหมือนการลุ้น 'แจ็กพอต' กล่าวคือ แม้สายพันธุ์ส่วนใหญ่ของปฏิกิริยาจะไม่แสดงผลเหนือกว่า แต่หากมีผลลัพธ์ที่ยอดเยี่ยมเพียงหนึ่งเดียว ก็เพียงพอที่จะส่งให้กลุ่มปฏิกิริยานี้ผ่านเข้าสู่การทดลองในรอบถัดไปได้
แม้ว่าเรามุ่งเน้นการปรับแต่งปฏิกิริยาโคลนในหลายรอบเนื่องจากความซับซ้อนเชิงกลไก แต่ในขณะเดียวกันเราก็ได้ทำการปรับปรุงขั้นตอนการส่งถ่ายสารพันธุกรรมควบคู่กันไปในรูปแบบ "รอบเดียว" โดยให้โมเดลเสนอการเปลี่ยนแปลงหลายแบบ และเลือกปฏิกิริยาที่ให้ผลดีที่สุด
การคัดกรองการปรับปรุงขั้นต้นของเวิร์กโฟลว์การโคลนสองขั้นตอน ประกอบด้วยการประกอบเอนไซม์และขั้นตอนการเปลี่ยนแปลง (ซ้าย) การปรับปรุงแบบวนรอบของการประกอบเอนไซม์ในห้ารอบ (รวมทั้งหมด 44 ปฏิกิริยา) การทดลองเริ่มต้นจากการใช้วิธี HiFi เป็นเกณฑ์มาตรฐาน โดยในแต่ละรอบ GPT‑5 จะออกแบบการทดลองที่แตกต่างกัน 8-10 รูปแบบ ข้อมูลของผลลัพธ์ที่มีประสิทธิภาพสูงสุดถูกนำไปใช้ในคำสั่งถัดไป ในการทดลองแต่ละรอบรอบ เราจะทำการแสดงกราฟของปฏิกิริยาที่มีผลการทำงานดีที่สุด โดยรวมถึงข้อมูลจากรอบที่ผ่านมา (ขวา) การปรับปรุงประสิทธิภาพแบบรอบเดียวสำหรับการทดสอบเงื่อนไขการเปลี่ยนแปลงโดยใช้โปรโตคอล 13 แบบที่แตกต่างกัน ในการสกรีนรอบแรก เราทดสอบแต่ละสภาวะเพียงรอบเดียวก่อน (n=1) เพื่อความรวดเร็วในการหาตัวแปรที่น่าสนใจ จากนั้นจึงนำเฉพาะตัวเลือกที่ดีที่สุดมาทำการทดลองซ้ำอย่างละเอียดเพื่อยืนยันผลลัพธ์อีกครั้ง
จากการใช้คำสั่งมาตรฐานโดยไม่มีการแทรกแซงจากมนุษย์ GPT‑5 สามารถเพิ่มประสิทธิภาพของการโคลนนิ่งแบบครบวงจรได้ถึง 79 เท่า ซึ่งได้รับการยืนยันผ่านการทดสอบซ้ำในการทดลองหลายครั้ง
โมเดลได้คิดค้นเทคนิคการใช้เอนไซม์แบบใหม่ขึ้นมาเองในชื่อ RAPF-HiFi (RecA-Assisted Pair-and-Finish HiFi Assembly) ซึ่งความพิเศษอยู่ที่การเติมโปรตีนเสริมเข้าไป 2 ตัว คือ RecA จากเชื้อ E. coli และ gp32 ซึ่งเป็นโปรตีนช่วยจับสาย DNA จาก Phage T4 เพื่อช่วยยกระดับการทำงานของระบบ HiFi เดิม นอกจากนี้ โมเดลยังได้ปรับเปลี่ยนอุณหภูมิและระยะเวลาในการบ่ม (Incubation) รวมถึงลำดับเวลาในการเติมเอนไซม์อย่างตั้งใจ โดยเสนอให้เติม RecA และ gp32 หลังจากปฏิกิริยา HiFi เริ่มต้นที่อุณหภูมิ 50°C ผ่านไปแล้ว เพื่อให้โปรตีนเหล่านี้ทำงานที่อุณหภูมิ 37°C ก่อนจะปรับอุณหภูมิกลับไปที่ 50°C อีกครั้งเพื่อทำให้กระบวนการประกอบ DNA เสร็จสมบูรณ์ การปรับปรุงใหม่เหล่านี้ช่วยเพิ่มประสิทธิภาพมากกว่า 2.5 เท่า นี่เป็นเพียงแค่ประสิทธิภาพตั้งต้นเท่านั้น โดยไม่ได้ผ่านการปรับแต่งเงื่อนไขและระยะเวลาของปฏิกิริยาแบบวนซ้ำ
ในด้านการส่งถ่ายสารพันธุกรรมนั้น การปรับเปลี่ยนที่มีประสิทธิภาพสูงสุดกลับเรียบง่ายอย่างคาดไม่ถึง นั่นคือการการปั่นเซลล์ให้ตกตะกอน จากนั้นจึงดูดสารละลายออกครึ่งหนึ่งของปริมาตรเดิม และทำการแขวนลอยตะกอนเซลล์ใหม่ก่อนที่จะเติม DNAโดยทุกขั้นตอนดำเนินการที่อุณหภูมิ 4°C แม้ว่าเซลล์ที่มีประสิทธิภาพสูงทางเคมีมักจะถูกมองว่าเปราะบาง แต่เซลล์เหล่านี้ทนต่อความเข้มข้นได้ดี และการชนกันของโมเลกุลที่เพิ่มขึ้นช่วยเพิ่มประสิทธิภาพการเปลี่ยนแปลงได้อย่างมาก (>30 เท่าในการตรวจสอบขั้นสุดท้าย)

เอนไซม์ T5 เอ็กโซนิวคลีเอสจะสร้างส่วนปลายสายเดี่ยว 3′ ซึ่งจะถูกทำให้เสถียรโดยโปรตีน gp32 ด้วยการยับยั้งการเกิดโครงสร้างทุติยภูมิ จากนั้น RecA จะเข้าจู่โจมสาย DNA โดยเริ่มจากปลาย 3′ พร้อมเข้าแทนที่ gp32 เพื่อกระตุ้นให้เกิดการค้นหาลำดับที่เหมือนกัน รวมถึงการเชื่อมสาย การให้ความร้อนถึง 50 °C จะลบโปรตีนทั้งสองชนิดออก ทำให้สามารถเติมช่องว่างด้วยโพลีเมอเรสและทำการเชื่อมต่อได้
กระบวนการ Gibson assembly ทำงานโดยการจัดให้ชิ้นส่วน DNA มีปลายที่เข้าคู่กันเพื่อให้สามารถจับคู่และเชื่อมต่อกันได้ ปฏิกิริยานี้ใช้เอนไซม์สองชนิดที่แตกต่างกัน (โพลีเมอเรสและไลเกส) เพื่อปิดผนึกชิ้นส่วนที่เชื่อมต่อกัน ใน RAPF-HiFi ได้มีการแนะนำโปรตีนสองชนิดเพื่อปรับปรุงขั้นตอนการจับคู่ให้มีประสิทธิภาพมากขึ้น ตัวแรก gp32 ทำหน้าที่เหมือนหวีที่ช่วยให้ปลาย DNA ที่หลวมเรียบและคลี่คลาย RecA ตัวที่สองทำหน้าที่เหมือนเป็นไกด์ที่ค้นหาคู่ที่ถูกต้องสำหรับแต่ละสายและดึงชิ้นส่วนที่ตรงกันเข้าด้วยกัน อุณหภูมิที่สูงขึ้นทำให้ตัวช่วยทั้งสองหลุดออกจาก DNA ทำให้เอนไซม์ Gibson ปกติสามารถทำให้ปฏิกิริยาเสร็จสมบูรณ์
โดยสรุป เราตั้งสมมติฐานว่าประสิทธิภาพที่เพิ่มสูงขึ้นนั้นถูกขับเคลื่อนผ่านกลไกดังต่อไปนี้
- โปรตีน gp32 ทำหน้าที่เคลือบปลาย DNA สายเดี่ยว (ssDNA) ที่ยังไม่เกิดการจับคู่ เพื่อกำจัดโครงสร้างทุติยภูมิออกไป
- RecA ซึ่งโดยปกติถูกยับยั้งโดยโครงสร้าง จะเริ่มแทรกตัวเข้าหาปลาย 3’ และเข้ายึดพื้นที่แทนที่โปรตีน gp32 ที่เกาะอยู่เดิม
- RecA เป็นตัวกลางในการ ค้นหาความเหมือนกันของ ssDNA:ssDNA(เปิดในหน้าต่างใหม่) ซึ่งส่งเสริมการเชื่อมต่อ
- เมื่ออุณหภูมิกลับไปที่ 50°C ทั้งเส้นใย recA และ gp32 จะถูกแทนที่ ทำให้โพลีเมอเรสและไลเกสสามารถดำเนินการประกอบสาย DNA ให้สมบูรณ์ได้
เพื่อทดสอบว่าเอนไซม์ใหม่ทำงานได้หรือไม่ และเพื่อยืนยันว่าการปรับปรุงประสิทธิภาพไม่ได้เกิดจากการเปลี่ยนแปลงเฉพาะในขั้นตอนความร้อนหรือบัฟเฟอร์ เราได้ทดสอบประสิทธิภาพของ RAPF-HiFi โดยไม่มี RecA และไม่มีทั้ง RecA และ gp32 ประสิทธิภาพของทั้งสองปฏิกิริยาลดลงเมื่อเทียบกับ RAPF-HiFi ซึ่งบ่งชี้ว่าทั้งสองโปรตีนมีความจำเป็นต่อกลไกการกระทำของ RAPF-HiFi
ในการพิสูจน์ว่ากลไกนี้ทำงานอย่างไร เราได้แยกเอนไซม์สองตัวที่เพิ่มเข้ามาใหม่ออกจากกัน นั่นก็คือ RecA และ gp32 เราพบว่าหากใช้เอนไซม์ตัวใดตัวหนึ่งเพียงลำพัง จะส่งผลให้ประสิทธิภาพลดลงเมื่อเทียบกับค่าพื้นฐานของ HiFi มาตรฐาน เมื่อทำงานร่วมกัน เอนไซม์ทั้งสองชนิดสามารถทำประสิทธิภาพได้เหนือกว่าค่าพื้นฐาน โดยมีประสิทธิภาพเพิ่มขึ้นถึง 2.6 เท่า (แถบค่าความคลาดเคลื่อน: ค่าเบี่ยงเบนมาตรฐาน (SD) จากการทดลองอิสระจำนวน 3 ครั้ง)
การพัฒนา RAPF-HiFi ชี้ให้เห็นว่า GPT‑5 มีความสามารถในการใช้เหตุผลที่ซับซ้อนและหลายมิติได้:
- RecA ถูกยับยั้งโดยโครงสร้างของ DNA(เปิดในหน้าต่างใหม่) และเป็นที่น่าสังเกตว่าโมเดลได้แนะนำการปรับเปลี่ยนที่เสริมกันสองอย่างพร้อมกันคือการเพิ่ม RecA และเสริมด้วย gp32 เพื่อลบโครงสร้างทุติยภูมิของ DNA
- คู่ธรรมชาติของโปรตีน RecA ใน E. coli คือโปรตีนจับ DNA สายเดี่ยว (SSB) ของ E. coli โปรตีน SSB มีบทบาทคล้ายกับ gp32 ในกระบวนการจำลองจีโนม การเกิดการรวมตัวใหม่ และการซ่อมแซม DNA อย่างไรก็ตาม E. coli SSB ไม่ได้หลุดออกจาก DNA รวดเร็วพอสำหรับการเติบโตของเส้นใย RecA โดยที่ RecFOR Complex ส่งเสริมการเกิด RecA ที่เส้นใย SSB ในสิ่งมีชีวิต(เปิดในหน้าต่างใหม่) SSB จับตัวเป็น Tetrame ที่เสถียร โดยมีอัตราการหลุดออกที่ช้ามาก(เปิดในหน้าต่างใหม่) ในทางตรงกันข้าม เส้นใย gp32 มีความ ไดนามิกมากขึ้น(เปิดในหน้าต่างใหม่) ทำให้สามารถแทนที่ RecA ได้
เท่าที่เราทราบ RecA และ gp32 ยังไม่ได้ถูกใช้ร่วมกันในวิธีการทางชีววิทยาโมเลกุล เช่นเดียวกับนวัตกรรมทางชีววิทยาโมเลกุลหลายอย่าง กลไกทางชีวเคมีที่อยู่เบื้องหลังไม่ใช่เรื่องใหม่และมีการศึกษากันมานานแล้ว แต่จุดเปลี่ยนที่สำคัญคือการรู้จักนำกลไกเหล่านั้นมาหลอมรวมจนกลายเป็นวิธีการที่ใช้งานได้จริง
ตัวอย่างเช่น ปฏิสัมพันธ์ระหว่าง RecA และ gp32 เคยได้รับการศึกษามาแล้วผ่านการทดสอบเชืงกลไหในหลอดทดลอง โดยในการศึกษาการเกิดโครงสร้าง D-loop พบว่า gp32(เปิดในหน้าต่างใหม่) มีความสามารถในการเสริมฤทธิ์การทำงานของ RecA ได้ ในเทคนิค RPA (Recombinase Polymerase Amplification)(เปิดในหน้าต่างใหม่) มีการนำ gp32 มาใช้งานร่วมกับคู่ธรรมชาติของมันอย่าง UvsX และ uvsY ซึ่งเป็นโปรตีนช่วยบรรจุ เพื่อให้ระบบการเพิ่มจำนวน DNA ทำงานได้สมบูรณ์ แม้ว่าข้อกำหนดในสิทธิบัตรของ RPA(เปิดในหน้าต่างใหม่) จะมีการระบุว่า ปฏิกิริยา RPA ที่มีประสิทธิภาพสามารถเกิดขึ้นได้โดยใช้ RecA จาก E. coli ในระบบข้ามสายพันธุ์ร่วมกับโปรตีน gp32 ที่ผ่านการดัดแปลงทางวิศวกรรม (ไม่ใช่สายพันธุ์ธรรมชาติ) แต่ข้อกล่าวอ้างนี้ปรากฏเป็นเพียงการกล่าวถึงโดยสังเขปในเอกสารสิทธิบัตรบางฉบับเท่านั้น และเท่าที่เราทราบ ยังไม่เคยมีข้อมูลที่ตีพิมพ์รองรับหรือมีการนำมาใช้เป็นระบบ RPA บนพื้นฐานของ RecA ที่มีประสิทธิภาพสูงแต่อย่างใด เทคนิค SLiCE (เปิดในหน้าต่างใหม่)คือตัวอย่างหนึ่งของการโคลนนิ่งที่ใช้สารสกัดจากเซลล์ทั้งหมดของ E. coli ที่ประกอบด้วยการดึงเอาระบบ λ Red มาใช้งาน โดยที่โปรตีน Red Beta อาจทำหน้าที่ควบคู่กันเป็นทั้งโปรตีนจับ DNA และเอนไซม์รีคอมบิเนส (อย่างไรก็ตาม เราได้สั่งห้ามการใช้สารสกัดจากเซลล์อย่างชัดเจนในคำสั่งที่ป้อนให้แก่โมเดล) นอกจากนี้ยังมีงานของ Ferrin และ Camerini-Otero(เปิดในหน้าต่างใหม่) ที่ดึงเอาความสามารถของ RecA มาใช้ตัวเดียวล้วนๆ ในการทำหน้าที่เป็น ตัวจับโมเลกุล DNA เฉพาะตำแหน่ง โดยใช้คุณสมบัติของเอนไซม์ในการจดจำลำดับเบสที่เข้าคู่กันได้อย่างแม่นยำ นอกจากนี้ gp32 ได้ถูกใช้เป็นสารเติมแต่ง(เปิดในหน้าต่างใหม่) ในกระบวนการขยาย DNA ที่เรียกว่า PCR เพื่อลดโครงสร้างทุติยภูมิ การขยาย NABSA ได้แสดง(เปิดในหน้าต่างใหม่)ให้เห็นว่าได้รับการเพิ่มประสิทธิภาพจาก RecA และ gp32 แม้ว่าทั้งสองจะสามารถเพิ่มประสิทธิภาพของปฏิกิริยาได้แยกกัน และไม่มีการพบการทำงานร่วมกัน ในภาพรวมแล้วข้อเสนอแนะในการปรับปรุงปฏิกิริยาการประกอบ DNA พื้นฐานแบบ Gibson นั้นมีปรากฏอยู่น้อยมาก โดยตัวอย่างที่โดดเด่นที่สุดคือการใช้โปรตีนจับ DNA ชนิดทนความร้อน (ET SSB) ซึ่งช่วยเพิ่มประสิทธิภาพในการประกอบ DNA ได้เพียงประมาณ 2 เท่า(เปิดในหน้าต่างใหม่)
ในแง่การใช้งานทั่วไป เราไม่ได้มองว่า RAPF-HiFi จะมาแทนที่การโคลนนิ่งแบบ HiFi/Gibson ที่มีจุดเด่นเรื่องขั้นตอนที่ง่ายและให้ผลลัพธ์ที่คงเส้นคงวาอยู่แล้ว ทว่าสิ่งที่น่าทึ่งคือการค้นพบกลไกการเชื่อมต่อ DNA ในรูปแบบใหม่ที่ไม่ซ้ำใคร โดย GPT‑5 ได้สร้างทางออกที่ใช้การผสมผสานเอนไซม์แปลกใหม่ร่วมกับการบริหารจัดการปฏิกิริยาที่แตกต่างไปจากตำราเดิมๆ อย่างสิ้นเชิง กลไกที่อยู่เบื้องหลังนี้อาจถูกพัฒนาให้เป็นแบบแยกส่วนได้ ซึ่งจะช่วยให้เราสามารถดึงเอาบางส่วนของระบบไปปรับใช้หรือผสมผสานร่วมกับขั้นตอนการทำงานทางชีววิทยาโมเลกุลรูปแบบอื่นในอนาคต เรายังคงมุ่งเน้นการวิจัยและพัฒนาการปรับปรุง RAPF-HiFi อย่างต่อเนื่อง อุณหภูมิปฏิกิริยาและระยะเวลาของแต่ละขั้นตอนสามารถปรับได้เพื่อสร้างสมดุลระหว่างกิจกรรมของ RecA และ gp32 กับการย่อย DNA เกินพอดีโดยเอ็กโซนิวคลีเอส (Exonuclease) และปริมาณของโปรตีนทั้งสองยังคงต้องได้รับการปรับให้เหมาะสม GPT‑5 ได้แนะนำ RecA ที่มีความสามารถเพิ่มขึ้นสูง ซึ่งเรากำลังทำการแยกและทำให้บริสุทธิ์อยู่ในขณะนี้
สำหรับโปรโตคอลการแปลงเซลล์ เงื่อนไขการเพิ่มประสิทธิภาพที่ประสบความสำเร็จครอบคลุมสารเติมแต่งและการเปลี่ยนแปลงความร้อนที่หลากหลาย ซึ่งมีจุดประสงค์เพื่อเพิ่มประสิทธิภาพการทนต่อความร้อนของเซลล์ 10-Beta(เปิดในหน้าต่างใหม่) ในเชิงพาณิชย์ จากการทดสอบการเปลี่ยนแปลงแบบรอบเดียวที่สร้างโดย AI ทั้ง 13 แบบ การปรับเปลี่ยนที่มีประสิทธิภาพมากที่สุดคือ การเปลี่ยนแปลงที่ 7 (T7) ซึ่งใช้กระบวนการตกตะกอนเซลล์ แล้วดูดสารละลายส่วนเกินออกครึ่งหนึ่ง จากนั้นจึงทำการแขวนลอยเซลล์ใหม่ก่อนที่จะเติม DNA โดยทุกขั้นตอนดำเนินการที่อุณหภูมิ 4°C เซลล์ที่มีความสามารถสูงในการรับ DNA ทางเคมีมักถูกมองว่าเปราะบาง และโดยทั่วไปจะหลีกเลี่ยงขั้นตอนการจัดการเช่นนี้ ถึงแม้จะมีการทำให้เข้มข้น แต่ก็ยังคงแข็งแรงและทนทานต่อกระบวนการได้ดี เมื่อ DNA ต่อเซลล์มากขึ้นและบัฟเฟอร์ยับยั้งน้อยลง ทำให้ให้เกิดการช็อกความร้อน (Heat-shock) ที่รุนแรงและชัดเจนขึ้น ส่งผลให้ประสิทธิภาพการเปลี่ยนแปลงเพิ่มขึ้นอย่างมาก (มากกว่า 30 เท่า)
โปรโตคอลการเปลี่ยนแปลงนี้เป็นวิธีการที่ไม่เคยมีมาก่อน แม้ว่าจะมีการรายงานเกี่ยวกับ แนวทางที่คล้ายกัน(เปิดในหน้าต่างใหม่) ซึ่งเน้นการเพิ่มความเข้มข้นของเซลล์ตั้งแต่ขั้นตอนก่อนหน้า สิ่งที่น่าสังเกตคือ วิธีการที่พัฒนาขึ้นโดย GPT‑5 นี้สามารถใช้ร่วมกับเซลล์คอมพีเทนต์ทางเคมีที่มีจำหน่ายทั่วไปได้ โดยไม่จำเป็นต้องเตรียมเซลล์เองในห้องปฏิบัติการ และยังให้ประสิทธิภาพที่สูงกว่าวิธีการคล้ายกันที่มีรายงานไว้ในสายพันธุ์เซลล์ที่ใกล้เคียงกัน
เพื่อเพิ่มขีดความสามารถในการทดลองของระบบต้นแบบนี้ Robot on Rails และ Red Queen Bio ได้ร่วมมือกันสร้างระบบหุ่นยนต์ที่สามารถรับโปรโตคอลการโคลนนิ่งในรูปแบบภาษาธรรมชาติ และนำไปปฏิบัติจริงในห้องปฏิบัติการเปียกได้
โครงสร้างของระบบนี้ถูกขับเคลื่อนด้วย 3 กลไกหลัก คือ 1) โมเดลภาษาขนาดใหญ่ (LLM) ที่ทำหน้าที่เปลี่ยนภาษาอังกฤษให้เป็นคำสั่งการทำงานของหุ่นยนต์ 2) ระบบการมองเห็นที่ระบุตำแหน่งและจำแนกอุปกรณ์ห้องแล็บได้แบบเรียลไทม์ และ 3) ระบบวางแผนเส้นทางหุ่นยนต์ที่ออกแบบมาเพื่อให้การดำเนินการแต่ละขั้นตอนมีความปลอดภัยและแม่นยำ ผลลัพธ์ที่ได้คือหุ่นยนต์ห้องปฏิบัติการที่มีความยืดหยุ่นและสามารถใช้งานได้ในหลายบริบท โดยได้รับการปรับแต่งเพิ่มเติมเพื่อรองรับตัวแปรต่างๆ ของโปรโตคอลการโคลนนิ่งแบบ Gibson
เราได้ทำการทดสอบความสามารถของหุ่นยนต์อัตโนมัติในการดำเนินการทดลองโคลนนิ่งแบบครบวงจร โดยใช้โปรโตคอลสองแบบพร้อมกัน ได้แก่ วิธีมาตรฐาน HiFi และ R8 ซึ่งเป็นโปรโตคอลที่ได้รับการปรับแต่งโดย AI และมีผลการทำงานดีที่สุดจากการปรับแต่งครั้งแรก
เราเปรียบเทียบงานของหุ่นยนต์กับการทดลองโดยมนุษย์ทีละขั้นตอน หุ่นยนต์สามารถดำเนินการในกระบวนการการเปลี่ยนแปลงได้สำเร็จ ซึ่งต้องอาศัยการปฏิบัติการทางกายภาพที่หลากหลาย ได้แก่ การเคลื่อนย้ายและผสมของเหลว การย้ายหลอดตัวอย่าง การคุมอุณหภูมิความร้อนที่ส่งผ่านไปยังเซลล์ และการเกลี่ยเซลล์ลงบนจานเพาะเชื้อ ผลการเปรียบเทียบระหว่างหุ่นยนต์และมนุษย์แสดงให้เห็นว่า หุ่นยนต์สามารถสร้างข้อมูลที่มีคุณภาพใกล้เคียงกัน และให้ผลการพัฒนาประสิทธิภาพที่เท่าเทียมกันเมื่อเทียบกับค่าพื้นฐาน ซึ่งแสดงให้เห็นถึงศักยภาพเบื้องต้นในการใช้ระบบอัตโนมัติเข้ามาช่วยขับเคลื่อนและเร่งความเร็วในการปรับปรุงการทดลองทางชีววิทยาให้ก้าวหน้ายิ่งขึ้น
แม้ว่าค่าการเปลี่ยนแปลงเชิงสัดส่วนระหว่างการทดลองด้วยหุ่นยนต์และมนุษย์จะมีความใกล้เคียงกัน แต่จำนวนโคโลนีสัมบูรณ์ที่ได้จากหุ่นยนต์นั้นต่ำกว่าการปฏิบัติด้วยมือประมาณสิบเท่า ซึ่งชี้ให้เห็นถึงประเด็นที่ต้องปรับปรุง เช่น ความแม่นยำในการจัดการของเหลว การปรับเทียบการควบคุมอุณหภูมิ และการเลียนแบบความละเอียดอ่อนของเทคนิคการจัดการเซลล์โดยมนุษย์
ในการทดสอบนี้ ทั้งมนุษย์และหุ่นยนต์ได้ทำการทดลองโดยใช้ทั้งวิธีแบบ HiFi มาตรฐานและแบบ R8 เหมือนกัน โดยเราใช้ประสิทธิภาพของวิธี HiFi มาเป็นเกณฑ์อ้างอิงเริ่มต้นที่ 1.0 เพื่อให้สามารถเปรียบเทียบสัดส่วนความเก่งของแต่ละวิธีได้อย่างชัดเจน การทดลอง R8 โดยมนุษย์แสดงให้เห็นถึงประสิทธิภาพที่เพิ่มขึ้น 2.39 เท่า ส่วนการทดลอง R8 โดยหุ่นยนต์สามารถทำได้ดีขึ้น 2.13 เท่า (คิดเป็น 89% ของประสิทธิภาพที่มนุษย์ทำได้) ซึ่งพิสูจน์ให้เห็นว่าลำดับประสิทธิภาพของโปรโตคอลนั้นมีความสอดคล้องกัน แม้ว่าจำนวนผลผลิตสัมบูรณ์จากหุ่นยนต์จะต่ำกว่าก็ตาม
เรามีเชื่อว่าการทดลองเหล่านี้แสดงให้เห็นภาพรวมของอนาคตของวิทยาศาสตร์ที่เร่งการขับเคลื่อนด้วย AI ซึ่งประกอบด้วยโมเดลที่เรียนรู้อย่างต่อเนื่องและสามารถโต้ตอบกับโลกแห่งความเป็นจริงได้ แม้ว่าการทดลองของเราจะตัดการแทรกแซงจากมนุษย์ออกไป เพื่อวัดขีดความสามารถของโมเดลอย่างแท้จริง แต่สิ่งที่เรารอคอยมากที่สุดคือการที่เราจะได้เห็น AI เข้ามามีบทบาทในการช่วยนักวิทยาศาสตร์ออกแบบการทดลอง และร่วมเป็นส่วนหนึ่งในการสร้างสรรค์ผลงานวิจัยที่ก้าวหน้าอย่างก้าวกระโดด
ในขณะที่เรามุ่งมั่นเร่งความก้าวหน้าทางวิทยาศาสตร์อย่างปลอดภัยและมีความรับผิดชอบ เรายังให้ความสำคัญกับการประเมินและลดความเสี่ยงต่างๆ โดยเฉพาะอย่างยิ่งความเสี่ยงที่เกี่ยวข้องกับความมั่นคงทางชีวภาพ ผลการประเมินเหล่านี้แสดงให้เห็นว่าโมเดลสามารถให้เหตุผลในห้องปฏิบัติการเปียกเพื่อปรับปรุงโปรโตคอล และอาจมีผลกระทบต่อความมั่นคงทางชีวภาพตามที่อธิบายไว้ใน กรอบการเตรียมความพร้อม(เปิดในหน้าต่างใหม่)ของเรา เรามุ่งมั่นที่จะสร้าง มาตรการป้องกัน ที่จำเป็นและละเอียดอ่อนทั้งในระดับโมเดลและระดับระบบเพื่อลดความเสี่ยงเหล่านี้ พร้อมทั้งพัฒนาการประเมินผลเพื่อติดตามระดับความสามารถของเทคโนโลยีในปัจจุบันอย่างใกล้ชิด


