Bỏ qua nội dung chính
OpenAI

17 tháng 6, 2026

Nghiên cứuẤn phẩm

Nhà hóa học AI gần như tự chủ cải tiến một phản ứng khó khăn trong hóa dược

Với Maria của Molecule.one, GPT‑5.4 đã tìm thấy một phụ gia bất ngờ giúp tăng hiệu suất phản ứng ghép Chan-Lam cho hơn 80% số chất nền được thử nghiệm.

Hoạt động của OpenAI trong lĩnh vực khoa học được thúc đẩy bởi một niềm tin đơn giản: AI tiên tiến có thể trở thành một đối tác mạnh mẽ của các nhà khoa học, giúp họ khám phá thêm nhiều ý tưởng, kết nối những khái niệm xa rời nhau, thiết kế các thí nghiệm tốt hơn và đẩy nhanh những khám phá mang lại lợi ích cho nhân loại. Chúng tôi đã chia sẻ những ví dụ ban đầu về việc các mô hình góp phần tạo ra những kết quả mới trong toán học, bao gồm nghiên cứu về bài toán khoảng cách đơn vị, trong vật lý lý thuyết, thông qua một kết quả mới về biên độ gluon, và trong sinh học, nơi GPT‑5 đã giúp giảm chi phí tổng hợp protein không tế bào trong một phòng thí nghiệm tự động. Chúng tôi cũng đã giới thiệu GPT‑Rosalind, một mô hình chuyên dụng để hỗ trợ nghiên cứu khoa học đời sống và các quy trình khám phá thuốc. 

Dự án này mở rộng hướng phát triển đó sang lĩnh vực hóa dược, nơi không đo lường được tiến bộ chỉ bằng suy luận. Một giả thuyết phải được kiểm nghiệm có hiệu quả trong phòng thí nghiệm với các phân tử thực, thiết bị và tình trạng nhiễu thực nghiệm. Hợp tác với Molecule.one(mở trong cửa sổ mới), Chúng tôi đã kết nối GPT‑5.4 với Maria—một AI hóa học dạng tác nhân được tích hợp với phòng thí nghiệm thông lượng cao để phục vụ nghiên cứu tự chủ—và giao cho nó một mục tiêu mở: cải thiện một trong số nhiều lớp phản ứng quan trọng. Hệ thống đã tạo ra các đề xuất nghiên cứu, thiết kế và tiến hành thí nghiệm, phân tích dữ liệu thí nghiệm và đề xuất các thí nghiệm tiếp theo. Con người vẫn tham gia vào quy trình bằng cách thiết kế các câu lệnh điều hướng và chấm điểm, cũng như lựa chọn các đề xuất để thử nghiệm. Họ cũng thực hiện một số chỉnh sửa hạn chế đối với các kế hoạch thí nghiệm, hỗ trợ các thao tác cơ bản trong phòng thí nghiệm và độc lập kiểm chứng kết quả cuối cùng.

Đề xuất triển vọng nhất, OAI-M1-03, tập trung vào một phiên bản khó thực hiện nhưng hữu ích của phản ứng ghép cặp Chan–Lam, một phản ứng mà các nhà hóa học sử dụng để hình thành liên kết cacbon–nitơ. Xuất phát từ mục tiêu mở là cải thiện phản ứng ghép cặp Chan–Lam cho hóa học quy trình, GPT‑5.4 đã độc lập xác định sulfonamide sơ cấp là một nhóm chất nền khó nhưng có giá trị cao, đồng thời đề xuất rằng các chất oxy hóa nhẹ, bao gồm TEMPO, có thể cải thiện phản ứng này. 

Qua hai chu kỳ thử nghiệm tại Maria Lab, ý tưởng đó đã mang lại cải thiện đáng kể. Trong các điều kiện đã được tối ưu hóa, hiệu suất đo được đã cải thiện đối với 88% số axit boronic và 83% số sulfonamide được thử nghiệm. Hiệu suất trung bình tăng từ 16,6% lên 25,2%, và tỷ lệ các phản ứng có hiệu suất trên 30% tăng từ 15,6% lên 37,5%. Sau đó, các nhà hóa học đã lặp lại các phản ứng đại diện ở quy mô bàn thí nghiệm. Những thí nghiệm đó đã xác nhận các kết quả ở quy mô microlít, cho thấy hiệu suất cao hơn đối với 11 trong số 14 cặp chất nền, với mức tăng hơn hai lần trong hầu hết các trường hợp. Điều đó quan trọng vì các nhà hóa dược cần những phản ứng không chỉ hiệu quả trong các thí nghiệm sàng lọc ở quy mô microlít, mà còn trong các quy trình phòng thí nghiệm thực tế được dùng trong quá trình phát hiện thuốc.

Những cải tiến trong lĩnh vực hóa dược này đặc biệt đáng chú ý vì tổng hợp thường là một nút thắt lớn trong quá trình khám phá thuốc: các nhà khoa học chỉ có thể thử nghiệm những phân tử mà họ có thể tạo ra hoặc có được bằng cách khác. Nhóm sulfonamide xuất hiện trong các loại thuốc thuộc nhiều lĩnh vực điều trị khác nhau, bao gồm thuốc chống ung thư, thuốc kháng vi sinh vật và thuốc lợi tiểu, tuy nhiên phản ứng ghép cặp Chan–Lam giữa các sulfonamide bậc một với axit boronic trước đây thường cho hiệu suất thấp. Việc làm cho phản ứng này trở nên đáng tin cậy hơn có thể mang lại cho các nhà hóa học dược phẩm một phương pháp rộng rãi và thiết thực hơn để sản xuất và khám phá các phân tử có tiềm năng hữu ích.

Mặc dù đây vẫn là một kết quả ban đầu, nó cung cấp thêm một ví dụ cụ thể về định hướng rộng hơn mà chúng tôi đang hướng tới: các hệ thống AI có thể trở thành những đối tác có giá trị đối với các nhà khoa học trong phần lớn chu trình nghiên cứu. Mô hình đã rà soát các tài liệu nghiên cứu, đề xuất một ý tưởng bất ngờ, hỗ trợ thiết kế và phân tích các thí nghiệm, và đi đến một phát hiện khoa học mà các nhà hóa học có thể đánh giá.

Maria Lab: Phòng thí nghiệm chuyên biệt có thông lượng cao của Molecule.one đã thực hiện 10.080 phản ứng trong dự án OAI-M1-03

Tại sao vấn đề hóa học này lại quan trọng

Hóa học hữu cơ là nền tảng cho mọi loại thuốc phân tử nhỏ, cũng như các sản phẩm trong nông nghiệp, điện tử và khoa học vật liệu. Một phản ứng đặc biệt hữu ích khi nó có thể tạo ra cùng một loại liên kết hóa học một cách đáng tin cậy trên nhiều chất ban đầu khác nhau. Khi các phản ứng cho hiệu suất thấp hoặc tạo ra quá nhiều sản phẩm phụ không mong muốn, các nhà hóa học có thể phải từ bỏ những phân tử vốn đầy hứa hẹn hoặc dành nhiều thời gian để phát triển một lộ trình tổng hợp khác. Điều này khiến quá trình tổng hợp trở thành một nút thắt lớn trong khám phá thuốc: nhìn chung, các nhà khoa học chỉ có thể thử nghiệm những phân tử mà họ có thể tạo ra hoặc có được bằng cách khác.

Phản ứng ghép cặp Chan–Lam hữu ích trong hóa dược vì nó tạo ra các liên kết carbon–nitơ, vốn phổ biến trong thuốc. Tuy nhiên, phản ứng này không diễn ra hiệu quả như nhau đối với mọi lớp phân tử. Đặc biệt, phản ứng ghép cặp các sulfonamide bậc một với axit boronic trước đây thường cho hiệu suất thấp. Các sulfonamid là một họ phân tử quan trọng, có mặt trong các loại thuốc dùng trong điều trị ung thư và bệnh truyền nhiễm. Việc làm cho phản ứng này đáng tin cậy hơn có thể mang lại cho các nhà hóa dược một phương pháp có phạm vi ứng dụng rộng hơn và thực tiễn hơn để tạo ra và khảo sát những phân tử có tiềm năng hữu ích.

Kết nối GPT‑5.4 với Maria AI và Lab

Hệ thống kết hợp đã liên kết các năng lực bổ sung. Các câu lệnh do các nhà khoa học làm việc với Maria AI viết đã được sử dụng với GPT‑5.4 trong một môi trường thử nghiệm để tạo và xếp hạng hàng nghìn đề xuất nghiên cứu khả thi. Các nhà hóa học đã xem xét một tập hợp con nhỏ gồm các đề xuất được hệ thống xếp hạng cao nhất và chọn bốn đề xuất để thử nghiệm trong phòng thí nghiệm. Sau đó, Maria AI đã chuyển các kế hoạch cấp cao được chọn thành hướng dẫn phòng thí nghiệm chi tiết, tiến hành hàng nghìn thí nghiệm thông lượng cao, phân tích dữ liệu thô và trả về kết quả có cấu trúc cho GPT‑5.4. 

Một trong bốn đề xuất được chọn, OAI-M1-03, đề nghị sử dụng các chất oxy hóa nhẹ như TEMPO để cải thiện hiệu suất của phản ứng Chan-Lam trong quá trình tổng hợp sulfonamide. Các nhà hóa học nhận thấy đề xuất này vừa đáng ngạc nhiên vừa thú vị. Chúng tôi chia sẻ những phát hiện chi tiết từ OAI-M1-03 trong bài đăng blog này và trong bài báo(mở trong cửa sổ mới).

Sau đó, bản đề xuất nghiên cứu cuối cùng đã được Maria sử dụng để tạo các lưới thí nghiệm, với một số chỉnh sửa nhỏ do con người thực hiện. Sự chỉnh sửa lớn nhất của con người là tránh dùng dimetyl sulfoxit, hay DMSO, làm dung môi vì các nhà hóa học lo ngại rằng chất này có thể phản ứng với các chất oxy hóa mạnh hơn được dùng để so sánh.

Toàn bộ quy trình kéo dài ba tháng, từ câu lệnh đầu tiên vào ngày 4 tháng 3 đến khi chia sẻ kết quả OAI-M1-03 với các chuyên gia độc lập vào ngày 4 tháng 6.

Chúng tôi mô tả quy trình làm việc này là gần như tự động, chứ không hoàn toàn tự động, vì các nhà hóa học vẫn đưa ra những quyết định quan trọng trong suốt quá trình. Mô hình đã đề xuất các ý tưởng nghiên cứu then chốt, trong khi các nhà hóa học cung cấp định hướng cấp cao và đánh giá chuyên môn, chỉnh sửa các chi tiết thí nghiệm, hỗ trợ chuẩn bị vật tư tiêu hao và thuốc thử trong phòng thí nghiệm, đồng thời tự tay lặp lại các thí nghiệm then chốt.

Những phát hiện của chúng tôi

OAI-M1-03 đã xác định TEMPO là một chất phụ gia hữu ích cho phản ứng ghép cặp Chan-Lam với sulfonamide bậc một được nghiên cứu ở đây. Trong các điều kiện được tối ưu hóa, phản ứng được cải thiện theo hai cách: hiệu suất trung bình tăng lên và có nhiều tổ hợp chất nền hơn đạt được mức hiệu suất hữu ích trên thực tế.

Trong hai chu kỳ, Maria đã thực hiện tổng cộng 10.080 phản ứng – nhiều hơn số phản ứng mà một nhà hóa học thực hiện ba phản ứng mỗi ngày có thể thực hiện trong cả một thập kỷ. Quy mô đó có ý nghĩa quan trọng vì các kết quả trong hóa học có thể gây hiểu lầm khi chúng chỉ được kiểm nghiệm trên một vài ví dụ. Một phản ứng có thể trông có vẻ đầy hứa hẹn trên một cặp chất ban đầu, nhưng lại thất bại trên một tập hợp phân tử rộng hơn. Hàng nghìn phản ứng đã giúp xác định TEMPO trong số mười chất oxi hóa được thử nghiệm, quan sát thấy hiệu ứng này lặp lại trên nhiều tổ hợp đa dạng, và tìm ra các giới hạn của nó.


Sau khi phân tích vòng dữ liệu đầu tiên, hệ thống đã đề xuất một vòng thí nghiệm thứ hai có trọng tâm hơn để kiểm chứng các giả thuyết tiếp theo. Một phát hiện tiếp theo hữu ích là TEMPO có thể được thay thế bằng một chất tương tự rẻ hơn nhiều, 4-hydroxy-TEMPO, mà hiệu suất chỉ giảm rất ít.

Biểu đồ so sánh hiệu suất của TEMPO, 4-hydroxy-TEMPO, 4-oxo-TEMPO và PMP, kèm theo cấu trúc hóa học.

Kết quả vẫn được duy trì ngoài định dạng sàng lọc ở quy mô microlít của Maria Lab. Các nhà hóa học đã tái tạo thủ công các phản ứng đại diện ở quy mô phòng thí nghiệm và quan sát thấy hiệu suất tăng đối với 11 trong số 14 cặp chất nền; đối với 8 cặp, mức tăng lớn hơn gấp đôi. Việc tái lập đó rất quan trọng vì các thí nghiệm ở quy mô rất nhỏ đôi khi có thể tạo ra các vật thể giả, vốn sẽ biến mất ở quy mô lớn hơn. Việc kiểm chứng ở quy mô phòng thí nghiệm cũng là thông lệ trước khi nghiên cứu được công bố trên một tạp chí khoa học.

Các lọ phản ứng bằng thủy tinh có dán nhãn từ các thí nghiệm xác thực ở quy mô phòng thí nghiệm của Molecule.one.

Các lọ phản ứng từ quy trình thẩm định thủ công ở quy mô bàn thí nghiệm.

TEMPO cải thiện sự hình thành sản phẩm ở quy mô phòng thí nghiệm

Bốn chuyên gia hóa học bên ngoài đã đánh giá bản thảo tiền công bố mô tả OAI-M1-03. Các đánh giá của họ củng cố quan điểm của chúng tôi rằng kết quả này có tính mới và đáng được chia sẻ với cộng đồng khoa học. Phép kiểm chứng khắt khe hơn sẽ đến tiếp theo: liệu các phòng thí nghiệm độc lập có thể tái lập kết quả hay không, và liệu các nhà hóa học có thấy nó hữu ích trên phạm vi phân tử rộng hơn hay không.

Sự kết hợp giữa thử nghiệm thông lượng cao và AI hiện đại đại diện cho một lĩnh vực tiên phong mới trong khám phá khoa học. Phản ứng mới này là một minh chứng mạnh mẽ, trong đó các điều kiện rất nhẹ và một chất oxi hóa thực tiễn cho phép đạt được phạm vi chất nền rộng và có tính tổng quát cao cho một trong những phản ứng phổ biến hơn trong tổng hợp thuốc.
—Tim Cernak, Phó giáo sư Hóa dược, Đại học Michigan

Trong số ba đề xuất còn lại do GPT‑5.4 tạo ra và được Maria thử nghiệm trong khoảng thời gian ba tháng, OAI-M1-02 và OAI-M1-04 đã được chứng minh bằng thực nghiệm tại Maria Lab, trong khi OAI-M1-01 bị bác bỏ. Việc phân tích các kết quả này đang được tiến hành.

Hạn chế

Công trình này cho thấy rằng một mô hình có thể đóng góp hữu ích trong lĩnh vực hóa học hữu cơ. Nó không chỉ tóm tắt các tài liệu nghiên cứu hoặc đề xuất một thí nghiệm đơn lẻ: nó đã đề xuất một giả thuyết cụ thể và đáng ngạc nhiên, đưa ra để con người xem xét, thiết kế các thí nghiệm, diễn giải dữ liệu thực nghiệm và thiết kế các thí nghiệm tiếp theo.

Điều đó không cho thấy rằng AI có thể độc lập triển khai một chương trình nghiên cứu hóa học từ đầu đến cuối. Khả năng phán đoán của con người vẫn là thiết yếu, và quy trình làm việc phụ thuộc vào hạ tầng chuyên biệt có thông lượng cao. Điều này cũng không chứng minh rằng phương pháp đó sẽ có thể áp dụng rộng rãi cho các phản ứng ghép cặp khác, các lớp chất nền khác hoặc các điều kiện sản xuất.

Các ước tính hiệu suất đến từ một nền tảng thông lượng cao và quá trình xác thực ở quy mô phòng thí nghiệm bao quát 14 cặp chất nền đại diện. Cần có thêm nghiên cứu để đặc trưng hóa cơ chế phản ứng, xác định phạm vi chất nền, đo lường hiệu quả trong các điều kiện phòng thí nghiệm khác nhau và tái lập kết quả một cách độc lập.

Khả năng chuẩn bị sẵn sàng

Các năng lực về hóa học cần được xử lý một cách thận trọng vì chính những công cụ có thể hỗ trợ y học và khoa học vật liệu cũng có thể bị lạm dụng. Chúng tôi đã chủ ý giới hạn phạm vi công việc này ở một vấn đề hóa dược chính đáng: cải thiện một phản ứng ghép cặp đã biết, được dùng để tạo ra các phân tử giống thuốc. Các thí nghiệm không liên quan đến độc tố, vũ khí hóa học hoặc các yêu cầu thiết kế các hợp chất gây hại. Những kết quả này không nên được diễn giải là bằng chứng cho thấy hệ thống có thể hỗ trợ các ứng dụng có hại đó. Dự án đã không kiểm thử hoặc chứng minh điều đó.

Chúng tôi đánh giá và giảm thiểu các rủi ro mới phát sinh từ những năng lực của mô hình tiên tiến thông qua Khung chuẩn bị của chúng tôi, bao gồm cả các rủi ro liên quan đến các lĩnh vực hóa học và sinh học. Mô hình được sử dụng trong công trình này trước đó đã trải qua các đánh giá liên quan với Viện An ninh AI Vương quốc Anh, và hệ thống được thiết kế để từ chối các yêu cầu tập trung vào những ứng dụng gây hại. Quy trình thực nghiệm đã bổ sung thêm một lớp kiểm soát: các nhà hóa học là con người lựa chọn những đề xuất nào được đưa vào phòng thí nghiệm, xem xét các kế hoạch thực nghiệm và vẫn nắm quyền kiểm soát đối với cơ sở hạ tầng vật lý.

Chúng tôi cho rằng đây là cách tiếp cận có trách nhiệm để nghiên cứu tiềm năng của AI trong hóa học thực nghiệm: chọn một không gian vấn đề có giá trị khoa học rõ ràng, kết hợp các biện pháp bảo vệ ở cấp độ mô hình với sự giám sát của chuyên gia, và đánh giá hệ thống thông qua các thí nghiệm thực tế có ràng buộc. Khi các khả năng này được cải thiện, chúng tôi sẽ tiếp tục đánh giá các rủi ro mới phát sinh, tăng cường các biện pháp bảo vệ và nêu rõ kết quả có ý nghĩa gì và không có ý nghĩa gì.

Kế hoạch tiếp theo là gì

Các bước tiếp theo trước mắt mang tính khoa học: thử nghiệm với phạm vi vật liệu ban đầu rộng hơn, điều tra lý do vì sao các chất phụ gia cải thiện phản ứng, xác định phạm vi mà hiệu ứng này phát huy tác dụng hoặc không, và hỗ trợ việc tái lập độc lập. Kết hợp lại, các nghiên cứu này sẽ xác định phương pháp này có thể được áp dụng rộng rãi đến mức nào và hữu ích ra sao trong các quy trình làm việc thực tiễn trong hóa dược.

Mục tiêu dài hạn hơn của chúng tôi là biến các hệ thống AI thành những đối tác khoa học đáng tin cậy, giúp các nhà nghiên cứu tạo ra giả thuyết, thiết kế thí nghiệm, diễn giải kết quả và quyết định điều gì cần kiểm thử tiếp theo, đồng thời vẫn dựa vững chắc trên phán đoán của chuyên gia, phép đo đáng tin cậy và các biện pháp bảo vệ mạnh mẽ. Hóa học hữu cơ là một lĩnh vực có tác động đòn bẩy đặc biệt lớn vì tiến bộ trong khám phá và sản xuất phân tử nhỏ phụ thuộc vào khả năng tạo ra các phân tử một cách đáng tin cậy. Các nhà khoa học chỉ có thể thử nghiệm những phân tử mà họ có thể tạo ra, và các phương pháp tổng hợp tốt hơn có thể mở rộng phạm vi ý tưởng mà họ có thể khám phá trong y học, nông nghiệp, điện tử, năng lượng và khoa học vật liệu. Kết quả này là một ví dụ ban đầu cho định hướng rộng lớn hơn đó: một mô hình tiên phong, các tác nhân chuyên biệt, một phòng thí nghiệm tự động và các nhà hóa học cùng làm việc để đẩy nhanh tiến trình trong vòng lặp nghiên cứu và tạo ra những phát hiện mà cộng đồng khoa học có thể đánh giá, tái lập và phát triển tiếp.

Chúng tôi xin cảm ơn đội ngũ Molecule.one và các nhà hóa học độc lập đã đánh giá công trình này.

Tác giả

OpenAI

Tác giả