16 tháng 12, 2025

Đánh giá khả năng của AI để đẩy nhanh nghiên cứu sinh học trong phòng thí nghiệm ẩm ướt

GPT‑5 đã tạo ra những cải tiến mới về giao thức phòng thí nghiệm ướt, tối ưu hóa hiệu quả của giao thức nhân bản phân tử lên 79x.

Đồ họa kiểu ảnh ghép với các gradient màu xanh lam - cam mềm, sơ đồ nối DNA và văn bản in đậm có nội dung “Nghiên cứu sinh học”, được gắn nhãn trong “OpenAI for Science.”

Đang tải…

Đẩy nhanh tiến bộ khoa học là một trong những cách có giá trị nhất mà AI có thể mang lại lợi ích cho nhân loại. Với GPT‑5, chúng ta bắt đầu thấy những dấu hiệu⁠ ban đầu của điều này - không chỉ giúp các nhà nghiên cứu di chuyển nhanh hơn trong các tài liệu khoa học, mà còn hỗ trợ các hình thức lý luận khoa học mới, chẳng hạn như xuất hiện các mối liên hệ bất ngờ, đề xuất các chiến lược chứng minh hoặc đề xuất các cơ chế hợp lý mà các chuyên gia có thể đánh giá và kiểm tra.

Tiến bộ cho đến nay đã được nhìn thấy rõ nhất trong các lĩnh vực như toán học, vật lý lý thuyết và khoa học máy tính lý thuyết, nơi các ý tưởng có thể được kiểm tra nghiêm ngặt mà không cần các thí nghiệm vật lý. Sinh học là khác nhau: hầu hết các tiến bộ phụ thuộc vào việc thực hiện thí nghiệm, lặp lại và xác nhận thực nghiệm trong phòng thí nghiệm.

Để giúp hiểu cách các mô hình biên giới hoạt động trong các cài đặt này, chúng tôi đã làm việc với Red Queen Bio, một công ty khởi nghiệp về an toàn sinh học, để xây dựng một khung đánh giá kiểm tra cách một mô hình đề xuất, phân tích và lặp lại các ý tưởng trong phòng thí nghiệm ướt. Chúng tôi thiết lập một hệ thống thí nghiệm sinh học phân tử đơn giản và nhờ GPT‑5 tối ưu hóa giao thức nhân bản phân tử để đạt hiệu quả.

Qua nhiều vòng thử nghiệm, GPT‑5 đã giới thiệu một cơ chế mới giúp cải thiện hiệu quả nhân bản lên 79 lần. Nhân bản là một công cụ sinh học phân tử cơ bản. Hiệu quả của các phương pháp nhân bản là rất quan trọng để tạo ra các thư viện lớn, phức tạp là trung tâm của kỹ thuật protein⁠(mở trong cửa sổ mới), sàng lọc di truyền⁠(mở trong cửa sổ mới) và kỹ thuật chủng sinh vật⁠(mở trong cửa sổ mới). Dự án này cung cấp một cái nhìn thoáng qua về cách AI có thể hoạt động song song với các nhà sinh vật học để tăng tốc độ nghiên cứu. Cải thiện các phương pháp thử nghiệm sẽ giúp các nhà nghiên cứu con người di chuyển nhanh hơn, giảm chi phí và biến những khám phá thành tác động trong thế giới thực.

Vì những tiến bộ trong lý luận sinh học có những tác động đến an ninh sinh học, chúng tôi đã thực hiện công việc này trong một môi trường được kiểm soát chặt chẽ—sử dụng một hệ thống thí nghiệm vô hại, giới hạn phạm vi của nhiệm vụ, và đánh giá hành vi của mô hình để cung cấp thông tin cho các đánh giá rủi ro an ninh sinh học của chúng tôi và phát triển các biện pháp bảo vệ ở cấp độ mô hình và hệ thống, như được nêu trong Preparedness Framework (Khuôn khổ chuẩn bị)⁠(mở trong cửa sổ mới) của chúng tôi.

Kết quả thí nghiệm

Trong thiết lập này, GPT‑5 tự động lý luận về giao thức nhân bản, đề xuất sửa đổi và kết hợp dữ liệu từ các thí nghiệm mới để đề xuất nhiều cải tiến hơn. Sự can thiệp duy nhất của con người là yêu cầu các nhà khoa học thực hiện giao thức sửa đổi và tải lên dữ liệu thực nghiệm.

Trong quá trình nhiều vòng, GPT‑5 đã tối ưu hóa quy trình nhân bản để cải thiện hiệu quả hơn 79x — có nghĩa là đối với một lượng DNA đầu vào cố định, chúng tôi đã thu hồi được nhiều bản sao đã xác minh trình tự nhiều hơn 79 lần so với giao thức cơ bản. Đáng chú ý nhất, nó đã giới thiệu hai enzym tạo thành một cơ chế mới: tái tổ hợp RecA từ E. coli và gen T4 thể 32 protein liên kết DNA sợi đơn (gp32). Hoạt động song song, gp32 làm mịn và tách các đầu DNA lỏng lẻo, và RecA sau đó hướng dẫn từng sợi đến sự khớp chính xác của nó.

Các thí nghiệm sàng lọc ban đầu và thứ cấp đã xác định Phương pháp nối HiFi ghép nối và kết thúc (RAPF) và Biến đổi 7 (T7) được hỗ trợ bởi RecA lần lượt là các giao thức enzym và biến đổi hàng đầu. Cả phương pháp nối RAPF và chuyển đổi T7 đều cải thiện hiệu quả nhân bản một cách độc lập so với giao thức nhân bản phản ứng HiFi cơ sở, lần lượt là 2,6 lần và 36 lần; và kết hợp để cung cấp sự cải thiện cộng thêm về hiệu suất 79 lần. Tất cả các dòng vô tính đã được xác nhận bằng cách giải trình tự. (Thanh lỗi: SD của n = 3 thí nghiệm xác thực độc lập).

Mặc dù còn sớm, nhưng những kết quả này rất đáng khích lệ. Những cải tiến dành riêng cho thiết lập nhân bản cụ thể của chúng tôi được sử dụng trong hệ thống mô hình của chúng tôi và vẫn yêu cầu các nhà khoa học con người thiết lập và chạy các giao thức. Mặc dù vậy, những thí nghiệm này cho thấy rằng các hệ thống AI có thể hỗ trợ một cách có ý nghĩa cho công việc thực tế trong phòng thí nghiệm và có thể thúc đẩy các nhà khoa học con người trong tương lai.

Đáng chú ý, vòng lặp AI-lab được chạy với lời nhắc cố định và không có sự can thiệp của con người. Giàn giáo này đã giúp tiết lộ khả năng của mô hình trong việc đề xuất các thay đổi giao thức thực sự mới độc lập với sự hướng dẫn của con người, nhưng nó cũng khóa hệ thống vào việc khám phá và hạn chế khả năng tối đa hóa hiệu suất của các ý tưởng mới được phát hiện. Một sự cân bằng năng động tốt hơn giữa thăm dò và khai thác có thể sẽ mang lại lợi ích lớn hơn, vì cả cải tiến về enzym và biến đổi đều có chỗ đáng kể để tinh chỉnh. Chúng tôi hy vọng những tiến bộ trong lập kế hoạch và lý luận về chân trời nhiệm vụ sẽ cải thiện khả năng của các lời nhắc cố định đơn giản để hỗ trợ cả khám phá và tối ưu hóa tiếp theo.

Một khuôn khổ tiến hóa để tối ưu hóa các giao thức trong thế giới thực

Phản ứng nối Gibson⁠(mở trong cửa sổ mới) đã trở thành phương pháp nhân bản chính kể từ khi được phát minh vào năm 2009, với sự áp dụng rộng rãi trong sinh học phân tử. Phương pháp nối của Gibson cho phép các nhà sinh học phân tử "dán" các đoạn DNA lại với nhau bằng cách làm nóng chảy tạm thời các đầu của chúng để các trình tự khớp nhau có thể được gắn kết thành một phân tử duy nhất. Một điểm hấp dẫn chính của phương pháp nối Gibson là sự đơn giản của nó: mọi thứ xảy ra trong một ống duy nhất ở một nhiệt độ. Những hạn chế đó tự nhiên để lại chỗ cho sự cải thiện. Ngoài ra, các thuộc tính sau làm cho nó rất phù hợp để đánh giá khả năng của các mô hình AI để cải thiện các kỹ thuật phòng thí nghiệm ướt:

Được xác định rõ ràng với các thành phần được kiểm soát, không giống như hệ thống dựa trên tế bào
Có chức năng tối ưu hóa rõ ràng: DNA tuần hoàn có thể biến đổi được tạo ra từ một lượng cố định đầu vào DNA tuyến tính
Chu kỳ thử nghiệm tương đối nhanh (1-2 ngày)
Không gian thiết kế có chiều cao đòi hỏi lý luận cơ học để cải thiện: bộ đệm, thuốc thử và nhiệt độ tối ưu đều phụ thuộc lẫn nhau

Chúng tôi đã sử dụng phương pháp nối HiFi⁠(mở trong cửa sổ mới), một hệ thống enzyme độc quyền được phát triển bởi New England Biolabs và dựa trên phương pháp nối Gibson, làm điểm khởi đầu tối ưu hóa. Chúng tôi đã khám phá xem liệu AI có thể đổi mới và học hỏi từ phản hồi thử nghiệm sau khi các ràng buộc đơn bước và đẳng nhiệt được loại bỏ hay không, và do đó xác định các cải tiến giao thức trong kịch bản này.

Cụ thể, chúng tôi đã thực hiện phản ứng nhân bản hai mảnh bằng cách sử dụng gen cho protein huỳnh quang xanh lá cây (GFP) và plasmid pUC19 được sử dụng rộng rãi, một “phương tiện” DNA tiêu chuẩn được sử dụng để mang gen vào vi khuẩn để chúng có thể được sao chép. Mục tiêu là tăng số lượng các nhóm thành công.

Chúng tôi đã tối ưu hóa phản ứng nhân bản bằng cách giới thiệu một khuôn khổ tiến hóa để lặp lại các đề xuất, cho phép mô hình học hỏi “trực tuyến” từ các thí nghiệm trước đây của nó. Trong mỗi vòng, GPT‑5 đề xuất một loạt 8-10 phản ứng khác nhau, với các phản ứng được đẩy sang các vòng sau nếu chúng yêu cầu thuốc thử tùy chỉnh mà phòng thí nghiệm không có sẵn. Các nhà khoa học về con người sau đó đã thực hiện các phản ứng và đo số lượng khuẩn lạc so với cụm HiFi Gibson cơ bản trong màn hình ban đầu. Dữ liệu hoạt động tốt nhất từ vòng trước sau đó được đưa vào vòng tiếp theo. Điều quan trọng là, lời nhắc đã được tiêu chuẩn hóa mà không có ý kiến đầu vào của con người ngoài việc làm rõ các câu hỏi, cho phép chúng tôi gán những hiểu biết cơ học mới trực tiếp cho AI hơn là sự hướng dẫn của con người.

Chúng tôi đã kiểm tra lại tám phản ứng hàng đầu từ chuỗi tối ưu hóa đầy đủ bằng cách sử dụng phạm vi pha loãng DNA rộng hơn và nhận thấy rằng nhiều phản ứng cho thấy hiệu ứng nhỏ hơn trong màn hình ban đầu; cuối cùng, ứng cử viên được xác nhận mạnh nhất là phản ứng từ vòng 5 tái tạo hiệu suất ban đầu của nó. Nhiều người có hiệu suất cao thuộc họ ligase-polish, có vẻ đặc biệt nhạy cảm với các biến thể nhỏ trong trạng thái tế bào năng lực và/hoặc xử lý DNA sau phản ứng. Vì các phản ứng này sử dụng một bước HiFi ngắn, chúng tôi đưa ra giả thuyết rằng nhiều sản phẩm có thể xâm nhập vào E. coli với chỉ một điểm nối được niêm phong và điểm nối còn lại được giữ bằng cách ủ, để lại sự cứu hộ ở hạ nguồn cho các con đường sửa chữa tế bào. Điều này tạo ra sự biến động cao và một động lực "trúng số độc đắc": ngay cả khi hầu hết các biến thể theo thời gian của phản ứng này không vượt trội, một trường hợp ngoại lệ mạnh mẽ duy nhất có thể đưa cả nhóm vào các vòng tiếp theo.

Trong khi chúng tôi tập trung vào việc tối ưu hóa phản ứng nhân bản qua nhiều vòng do sự phức tạp về cơ chế của nó, chúng tôi đồng thời tối ưu hóa quy trình chuyển đổi bằng cách sử dụng một vòng "một lần" duy nhất, nơi mô hình đề xuất nhiều thay đổi độc lập, và chúng tôi đã chọn phản ứng có hiệu suất cao nhất.

Các màn hình tối ưu hóa ban đầu của quy trình nhân bản hai bước: nối và biến đổi enzym. (Trái) Tối ưu hóa lặp đi lặp lại quá trình nối enzym trong năm vòng (tổng cộng 44 phản ứng). Bắt đầu từ cơ sở nối HiFi, GPT‑5 đề xuất 8-10 biến thể giao thức nối mỗi vòng; dữ liệu về kết quả hoạt động tốt nhất đã được đưa vào các lời nhắc tiếp theo. Ở mỗi vòng, chúng tôi vẽ ra phản ứng hoạt động tốt nhất cho đến nay (bao gồm cả các vòng trước). (Đúng) Tối ưu hóa một lần các điều kiện chuyển đổi khi thử nghiệm 13 giao thức khác nhau. Đối với cả hai màn hình tối ưu hóa, dữ liệu đại diện cho các phép đo đơn lẻ (n = 1) cho mỗi điều kiện; xác thực nhân rộng được thực hiện riêng cho các ứng cử viên hàng đầu.

Sử dụng các lời nhắc tiêu chuẩn hóa mà không có đầu vào của con người, GPT5 đã cải thiện hiệu quả nhân bản đầu cuối 79 lần, được xác nhận trên các bản sao thử nghiệm.

Đáng chú ý, mô hình đã đề xuất một quy trình enzym mới, mà mô hình được gọi là RecA Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), bổ sung hai protein mới vào phản ứng: tái tổ hợp RecA từ E. coli và gen phage T4 32 protein liên kết DNA sợi đơn (gp32). Hơn nữa, mô hình đã thực hiện các sửa đổi có chủ ý đối với nhiệt độ và thời gian ủ, cũng như thời gian bổ sung enzym: nó đề xuất thêm RecA và gp32 sau phản ứng HiFi 50° C ban đầu, để các protein này hoạt động ở 37° C, và sau đó quay trở lại 50° C để hoàn thành quá trình nối. Cùng với nhau, những sửa đổi mới này đã tăng hiệu quả hơn 2,5 lần. Cần lưu ý rằng điều này thể hiện hiệu suất ban đầu mà không cần tối ưu hóa lặp đi lặp lại các điều kiện và thời gian phản ứng.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

Về mặt biến đổi, sự sửa đổi hiệu quả nhất tỏ ra đơn giản đến bất ngờ: tạo viên các tế bào (quay chúng xuống trong máy ly tâm để chúng thu thập ở đáy ống), loại bỏ một nửa thể tích được cung cấp và tái tạo tế bào trước khi thêm DNA, tất cả ở 4° C. Trong khi các tế bào có năng lực hóa học hiệu quả cao thường được coi là dễ vỡ, các tế bào chịu được nồng độ tốt và sự va chạm phân tử tăng lên đã làm tăng hiệu quả biến đổi đáng kể (> 30 lần khi xác nhận cuối cùng).

Một cải tiến mới đối với nhân bản dựa trên sự tương đồng

Sơ đồ thể hiện các bước của quá trình nối DNA HiFi ghép nối và hoàn thiện được RecA hỗ trợ, với các giai đoạn được đánh dấu cho T5 exonuclease, GP32, RecA, polymerase và ligase hoạt động tuần tự trên các sợi DNA.

Exonuclease T5 tạo ra các phần nhô 3′ mà gp32 ổn định bằng cách ức chế cấu trúc bậc hai. RecA sau đó xâm nhập từ các đầu 3′, thay thế gp32 và thúc đẩy tìm kiếm đồng dạng và gắn kết. Gia nhiệt đến 50 °C loại bỏ cả hai loại protein, cho phép lấp đầy khoảng trống polymerase và liên kết.

Phương pháp nối Gibson hoạt động bằng cách cho các đoạn DNA khớp với các đầu “dính” để chúng có thể tìm thấy nhau và nối với nhau. Phản ứng sử dụng hai enzym khác nhau (polymerase và ligase) để bịt kín các mảnh liên kết. Trong RAPF-HiFi, hai protein đã được đưa vào để cải thiện bước khớp nối. Đầu tiên, gp32, hoạt động giống như một chiếc lược làm mịn và gỡ rối các đầu DNA lỏng lẻo. Thứ hai, RecA, hoạt động giống như một hướng dẫn tìm kiếm đối tác chính xác cho mỗi sợi và kéo các mảnh phù hợp lại với nhau. Nhiệt độ cao hơn khiến cả hai chất trợ giúp rơi ra khỏi DNA, cho phép các enzym Gibson bình thường hoàn thành phản ứng.

Tóm tắt, chúng tôi giả định rằng hiệu suất được cải thiện thông qua cơ chế sau:

Gp32 phủ các đuôi DNA sợi đơn (ssDNA) không ủ, loại bỏ cấu trúc thứ cấp
RecA, thường bị ức chế bởi cấu trúc, xâm nhập từ 3' và thay thế sợi gp32
RecA làm trung gian cho tìm kiếm tương đồng ssDNA:ssDNA⁠(mở trong cửa sổ mới), thúc đẩy quá trình ủ
Sự trở lại 50°C sẽ thay thế cả sợi RecA và gp32, cho phép polymerase và ligase hoàn thành phản ứng.

Để kiểm tra xem các enzym mới có hoạt động hay không và để loại trừ rằng việc cải thiện hiệu suất chỉ được thúc đẩy bởi những thay đổi trong các bước nhiệt hoặc bộ đệm, chúng tôi đã thử nghiệm hiệu suất của RapF-HiFi mà không có RecA và không có cả RecA và gp32. Hiệu suất của cả hai phản ứng đã giảm so với Rapf-HiFi, cho thấy rằng cả hai protein đều cần thiết cho cơ chế hoạt động của RapF-HiFi.

Để kiểm tra cơ chế cơ bản, chúng tôi tách ra hai enzym mới trong phản ứng: RecA và gp32. Chúng tôi chỉ ra rằng chỉ riêng một trong hai điều này làm giảm hiệu quả so với cơ sở HiFi. Cùng với nhau, chúng hoạt động vượt trội so với mức tăng hiệu suất 2,6 lần. (Thanh lỗi: SD của n = 3 thí nghiệm độc lập)

Sự phát triển Rapf-HiFi gợi ý rằng GPT‑5 có khả năng lý luận phức tạp, đa chiều:

RecA bị ức chế bởi cấu trúc DNA⁠(mở trong cửa sổ mới) và điều đáng chú ý là mô hình đã giới thiệu hai sửa đổi hiệp đồng cùng một lúc: thêm RecA và bổ sung nó với gp32 để loại bỏ cấu trúc thứ cấp DNA.
Đối tác tự nhiên của E. coli RecA là protein liên kết sợi đơn E. coli (SSB). SSB đóng vai trò tương tự như gp32 trong quá trình sao chép, tái tổ hợp và sửa chữa bộ gen. Tuy nhiên, E. coli SSB không tự nhiên rơi ra khỏi DNA đủ nhanh để phát triển sợi RecA, với phức hợp RecFor thúc đẩy quá trình tạo nhân RecA tại sợi SSB in vivo⁠(mở trong cửa sổ mới). SSB liên kết như một tetramer ổn định với tốc độ tắt cực kỳ chậm⁠(mở trong cửa sổ mới). Ngược lại, sợi gp32 năng động hơn⁠(mở trong cửa sổ mới), cho phép dịch chuyển RecA.

Theo hiểu biết của chúng tôi, RecA và gp32 chưa được đồng sử dụng về mặt chức năng trong các phương pháp sinh học phân tử. Như với nhiều kỹ thuật sinh học phân tử mới, các hoạt động sinh hóa cơ bản đã được nghiên cứu, nhưng việc sử dụng chúng như một phương pháp thực tế, khái quát hóa tạo nên sự tiến bộ.

Ví dụ như sự tương tác của RecA và gp32 đã được nghiên cứu trong các xét nghiệm tái tạo cơ học trong ống nghiệm: trong các nghiên cứu về sự hình thành vòng lặp D, gp32 được chứng minh⁠(mở trong cửa sổ mới) là có khả năng tăng cường hoạt động của RecA. Gp32 đã được sử dụng cùng với đối tác tái tổ hợp tự nhiên T4 UvsX và yếu tố tải tái tổ hợp uvsY trong khuếch đại polymerase tái tổ hợp (RPA⁠(mở trong cửa sổ mới)). Mặc dù bản mô tả bằng sáng chế RPA nêu rõ⁠(mở trong cửa sổ mới) rằng các phản ứng RPA hiệu quả đã được chứng minh bằng cách sử dụng RecA của E. coli trong một hệ thống dị loại với protein gp32 bị biến đổi (tức là được thiết kế, không phải dạng hoang dã), nhưng khẳng định này chỉ xuất hiện như một phần phụ trong một số bản công bố bằng sáng chế và theo kiến thức của chúng tôi, chưa được hỗ trợ bởi dữ liệu đã công bố hoặc được áp dụng như một hệ thống RPA dựa trên RecA mạnh mẽ. Một phương pháp nhân bản được gọi là SLICE⁠(mở trong cửa sổ mới) sử dụng chiết xuất toàn bộ tế bào từ E. coli có chứa hệ thống tái tổ hợp λ Red, trong đó Red beta có thể thực hiện vai trò kép như cả protein liên kết DNA và tái tổ hợp (mặc dù chúng tôi rõ ràng cấm sử dụng chiết xuất tế bào trong lời nhắc của chúng tôi). Trong một ứng dụng khác, Ferrin & Camerini-Otero⁠(mở trong cửa sổ mới) chỉ sử dụng RecA để bắt chọn lọc các phân tử DNA dựa trên các trình tự phù hợp. Một cách riêng biệt, gp32 đã được sử dụng như một chất phụ gia⁠(mở trong cửa sổ mới) trong quá trình khuếch đại DNA được gọi là PCR để giảm cấu trúc thứ cấp. Sự khuếch đại NABSA đã được chứng minh⁠(mở trong cửa sổ mới) là được tăng cường bởi cả RecA và gp32, mặc dù mỗi loại có thể tăng cường phản ứng riêng biệt và không có sức mạnh tổng hợp nào được xác định. Nói chung, các báo cáo về cải tiến đối với các phản ứng nối DNA kiểu Gibson cơ bản rất hiếm, với ví dụ đáng chú ý nhất là một protein liên kết DNA chịu nhiệt (ET SSB) cải thiện hiệu suất nối khoảng 2,5 lần⁠(mở trong cửa sổ mới).

Đối với hầu hết các ứng dụng, chúng tôi không mong đợi Rapf-HiFi cạnh tranh với sự đơn giản và mạnh mẽ của nhân bản HiFi/Gibson. Tuy nhiên, sự xuất hiện của một con đường nối khác biệt về mặt cơ học là đáng chú ý: GPT‑5 đã đi đến một giải pháp kết hợp một sự kết hợp không quen thuộc của các protein tái tổ hợp và động lực phản ứng. Cơ chế cơ bản có thể được chứng minh là mô-đun, cung cấp các thành phần có thể được tái sử dụng hoặc tái tổ hợp trong các quy trình công việc phân tử khác. Chúng tôi cũng đang tiếp tục khám phá những cải tiến cho Rapf-HiFi. Nhiệt độ phản ứng và thời lượng bước có thể được điều chỉnh để cân bằng hoạt động của RecA và gp32 chống lại quá trình tiêu hóa exonuclease và lượng của cả hai protein vẫn phải được tối ưu hóa. GPT‑5 cũng đã đề xuất một biến thể RecA hiếu động, mà chúng tôi hiện đang thanh lọc.

Về quy trình chuyển đổi, các điều kiện tối ưu hóa thành công bao gồm một loạt các chất phụ gia và biến đổi nhiệt nhằm mục đích tăng cường hiệu quả sốc nhiệt của các tế bào 10-beta⁠(mở trong cửa sổ mới) thương mại. Trong số 13 biến đổi một lần do AI tạo ra được thử nghiệm, biến đổi hiệu quả nhất, Biến đổi 7 (T7), đã tạo viên các tế bào, loại bỏ một nửa thể tích được cung cấp và tái tạo tế bào trước khi thêm DNA, tất cả ở 4°C. Các tế bào có năng lực hóa học hiệu quả cao thường được coi là dễ vỡ và các bước xử lý như vậy thường tránh được. Tuy nhiên, các tế bào dung nạp nồng độ tốt. Các tác động kết hợp của việc tăng phơi nhiễm DNA trên mỗi tế bào và bộ đệm ức chế ít hơn dẫn đến sốc nhiệt mạnh hơn đã làm tăng đáng kể hiệu quả biến đổi (> 30 lần).

Giao thức biến đổi này là mới lạ, mặc dù một cách tiếp cận tương tự⁠(mở trong cửa sổ mới) về mặt khái niệm trong đó các tế bào được tập trung ở bước trước đó đã được báo cáo. Đáng chú ý là phương pháp được GPT‑5 phát triển ở đây tương thích với các tế bào có thẩm quyền hóa học sẵn có, loại bỏ nhu cầu chuẩn bị tế bào trong nhà, đồng thời vượt quá mức tăng hiệu quả được báo cáo của phương pháp tương tự đối với các chủng tế bào tương đương.

Hệ thống rô-bốt

Để tăng thông lượng của hệ thống thử nghiệm mô hình này, Robot on Rails và Red Queen Bio đã hợp tác để xây dựng một hệ thống robot có giao thức nhân bản ngôn ngữ tự nhiên và thực thi nó trong phòng thí nghiệm ướt.

Hệ thống kết hợp ba thành phần: 1) LLM từ người sang robot chuyển đổi tiếng Anh đơn giản thành hành động của robot; 2) hệ thống thị giác xác định và bản địa hóa phần mềm phòng thí nghiệm trong thời gian thực; và 3) lập kế hoạch đường dẫn robot xác định cách thực hiện từng hành động một cách an toàn và chính xác. Kết quả là một robot phòng thí nghiệm linh hoạt, tổng quát được tối ưu hóa hơn nữa cho các biến thể của giao thức nhân bản Gibson.

Chúng tôi đã kiểm tra xem robot tự trị có thể thực hiện thử nghiệm nhân bản hoàn chỉnh bằng cách chạy đồng thời hai giao thức: phương pháp HiFi tiêu chuẩn và R8, giao thức sửa đổi AI hiệu suất cao nhất từ vòng tối ưu hóa đầu tiên.

Chúng tôi so sánh công việc của robot với các thí nghiệm do con người thực hiện ở mỗi bước. Robot đã xử lý thành công quá trình biến đổi, đòi hỏi các hoạt động vật lý đa dạng: chuyển và trộn chất lỏng, di chuyển ống mẫu, áp dụng nhiệt có kiểm soát cho tế bào và lan truyền tế bào lên các tấm tăng trưởng. Khi so sánh trực tiếp với các biến đổi do con người thực hiện, robot đã tạo ra dữ liệu chất lượng tương tự với những cải tiến tương đương so với cơ sở, cho thấy tiềm năng ban đầu để tự động hóa và tăng tốc tối ưu hóa thí nghiệm sinh học.

Mặc dù các thay đổi gấp đôi giữa các thí nghiệm của robot và con người là tương tự nhau, số lượng khuẩn lạc tuyệt đối từ robot thấp hơn khoảng mười lần so với thực hiện thủ công, chỉ ra các lĩnh vực cần cải thiện như độ chính xác xử lý chất lỏng, hiệu chuẩn kiểm soát nhiệt độ và tái tạo các sắc thái của kỹ thuật xử lý tế bào thủ công.

Cả phương pháp HiFi tiêu chuẩn (cơ sở) và phương pháp R8 cải tiến đều được thực hiện bởi các nhà nghiên cứu con người và robot tự trị, với hiệu quả chuyển đổi được chuẩn hóa cho các điều khiển cơ sở HiFi tương ứng (được đặt thành 1.0). R8 do con người thực hiện cho thấy cải thiện gấp 2,39 lần; R8 được thực hiện bởi robot đạt được cải thiện 2,13 lần (89% hiệu suất của con người), thể hiện xếp hạng giao thức tương đương mặc dù sản lượng tuyệt đối thấp hơn.

Tương lai

Chúng tôi tin rằng những thí nghiệm này cung cấp một bức ảnh chụp nhanh về khoa học tăng tốc AI trong tương lai sẽ như thế nào: các mô hình liên tục học hỏi và tương tác với thế giới thực. Mặc dù các thí nghiệm của chúng tôi đã loại trừ sự can thiệp của con người để đo lường hoàn toàn khả năng của mô hình, chúng tôi đặc biệt hào hứng về việc AI giúp các nhà khoa học⁠ thiết kế các thí nghiệm và đóng góp vào những đột phá nghiên cứu.

Khi chúng tôi làm việc để đẩy nhanh tiến bộ khoa học một cách an toàn và có trách nhiệm, chúng tôi cũng tìm cách đánh giá và giảm thiểu rủi ro, đặc biệt là những rủi ro liên quan đến an toàn sinh học. Những kết quả đánh giá này cho thấy rằng các mô hình có thể lý luận trong phòng thí nghiệm ướt để cải thiện các quy trình và có thể có ý nghĩa đối với an toàn sinh học như được mô tả trong Khung chuẩn bị⁠(mở trong cửa sổ mới) của chúng tôi. Chúng tôi cam kết xây dựng⁠ các biện pháp bảo vệ cần thiết và có nhiều sắc thái ở cấp mô hình và hệ thống để giảm thiểu những rủi ro này, cũng như phát triển các đánh giá để theo dõi các mức hiện tại.

Tác giả

Hãy tiếp tục xem

Xem tất cả

Scientific computing agentic AI card image (1x1)

Scientific computing in the age of agentic AI

Ấn phẩm28 thg 7, 2026

GPT-Red: Mở khóa tự cải thiện để tăng độ vững chắc

An toàn15 thg 7, 2026

"Tách biệt tín hiệu khỏi nhiễu trong các bài đánh giá lập trình

Nghiên cứu8 thg 7, 2026