Các thí nghiệm ban đầu về thúc đẩy tiến bộ khoa học với GPT‑5
Những gì chúng tôi đang học hỏi nhờ sự hợp tác với các nhà khoa học

Khoa học định hình mọi thứ từ sức khỏe con người đến sản xuất năng lượng, từ an ninh quốc gia đến sự hiểu biết của chúng ta về vũ trụ. Nếu AI có thể thúc đẩy tiến bộ khoa học—rút ngắn thời gian để tạo ra ý tưởng mới hoặc chuyển từ ý tưởng sang kết quả đã được kiểm chứng—thì lợi ích sẽ được nhân lên trong toàn xã hội.
Nhưng nhịp độ đổi mới vẫn là một hạn chế. Ngay cả khi có ý tưởng đúng, việc biến nó thành một sản phẩm hoặc một phương pháp điều trị có thể mất nhiều năm. Trong một cuộc khảo sát gần đây(mở trong cửa sổ mới), 60 phần trăm người dân Hoa Kỳ cho biết những đột phá về khoa học và y tế đến với họ quá chậm; 73 phần trăm cho biết chúng ta cần những cách tốt hơn để đẩy nhanh quá trình khám phá; và 69 phần trăm xác định vai trò lãnh đạo khoa học là ưu tiên hàng đầu quốc gia.
Hôm nay, chúng tôi phát hành bài viết “Các thí nghiệm thúc đẩy tiến bộ khoa học ban đầu với GPT‑5(mở trong cửa sổ mới),” một bài báo được đồng tác giả với các cộng tác viên tại các trường đại học và phòng thí nghiệm quốc gia bao gồm Vanderbilt, UC Berkeley, Columbia, Oxford, Cambridge, Phòng thí nghiệm Quốc gia Lawrence Livermore và Phòng thí nghiệm Jackson. Bài báo này tổng hợp các nghiên cứu điển hình ban đầu trong các lĩnh vực toán học, vật lý, sinh học, khoa học máy tính, thiên văn học và khoa học vật liệu, trong đó GPT‑5 đã hỗ trợ các nhà nghiên cứu tổng hợp các kết quả đã biết theo cách mới, thực hiện đánh giá tài liệu mạnh mẽ, tăng tốc các phép tính khó và thậm chí tạo ra các chứng minh mới cho các mệnh đề chưa được giải quyết. Bài báo cũng ghi lại những hạn chế. Mục tiêu của chúng tôi là cung cấp cho cộng đồng một cái nhìn rõ ràng về những gì các hệ thống này có thể và không thể làm trong bối cảnh nghiên cứu hiện nay.
Các nghiên cứu điển hình này cho thấy cách GPT‑5, dưới sự điều khiển của các chuyên gia, đang tăng tốc quá trình khám phá khoa học và lý do tại sao sự tăng tốc đó lại quan trọng:
- Sinh học: Trong một nghiên cứu do Bác sĩ Derya Unutmaz dẫn đầu, các nhà khoa học đã dành nhiều tháng để cố gắng giải thích một sự thay đổi khó hiểu trong các tế bào miễn dịch của con người. GPT‑5 xác định cơ chế có khả năng xảy ra trong vòng vài phút từ một biểu đồ chưa được công bố và đề xuất một thí nghiệm chứng minh điều đó. Loại tốc độ này có thể giúp các nhà nghiên cứu hiểu rõ về bệnh tật nhanh hơn và lập ra các phương pháp điều trị tốt hơn.
- Toán học: Trong một trường hợp khác, các nhà nghiên cứu Mehtaab Sawhney và Mark Sellke đang giải quyết một bài toán mở đã tồn tại hàng thập kỷ, ban đầu được đề xuất bởi Paul Erdős. Họ đã bị mắc kẹt ở bước cuối cùng, và GPT‑5 đã đóng góp một ý tưởng mới về cách một số lẻ phá vỡ mô hình, điều này đã giúp họ hoàn thành phần chứng minh. Những tiến bộ như thế này giúp củng cố nền tảng toán học mà nhiều thuật toán và kỹ thuật bảo mật cuối cùng dựa vào.
- Thuật toán & tối ưu hóa: Các nhà nghiên cứu Sébastien Bubeck và Christian Coester đang kiểm tra xem liệu một phương pháp ra quyết định phổ biến được sử dụng trong robot và định tuyến có đáng tin cậy như mọi người vẫn nghĩ hay không. GPT‑5 đã tìm thấy một ví dụ mới, rõ ràng cho thấy phương pháp này có thể thất bại và cũng cải thiện một kết quả cổ điển trong tối ưu hóa, toán học được sử dụng để tìm ra cách tốt nhất để giải quyết vấn đề. Loại tiến bộ này giúp các kỹ sư hiểu rõ hơn về các hệ thống ra quyết định được sử dụng trong robot, định tuyến và các ứng dụng thực tế khác.
Sứ mệnh của OpenAI for Science là tăng tốc khám phá khoa học: hỗ trợ các nhà nghiên cứu khám phá nhiều ý tưởng hơn, kiểm tra giả thuyết nhanh hơn và tìm ra những hiểu biết sâu sắc mà nếu không sẽ mất nhiều thời gian đáng kể. Chúng tôi thực hiện điều này bằng cách kết hợp các mô hình tiên tiến với các công cụ, quy trình làm việc và hợp tác phù hợp.
Chúng tôi làm việc chặt chẽ với các nhà nghiên cứu trong các học viện, ngành công nghiệp và các phòng thí nghiệm quốc gia. Những mối hợp tác này giúp chúng tôi hiểu được các mô hình hữu ích nằm ở đâu, chúng thất bại ở chỗ nào và làm thế nào để tích hợp chúng vào quy trình khoa học—từ việc xem xét tài liệu và tạo lời giải đến mô hình hóa, mô phỏng và thiết kế thử nghiệm.
Cách tiếp cận của chúng tôi kết hợp hai niềm tin bổ trợ cho nhau. Các công cụ khoa học chuyên dụng, chẳng hạn như công cụ mô phỏng, cơ sở dữ liệu protein và hệ thống đại số máy tính, rất cần thiết cho hiệu quả và độ chính xác. Đồng thời, việc mở rộng các mô hình nền tảng tiếp tục mở ra những khả năng suy luận mới: kết nối ý tưởng giữa các lĩnh vực, phác thảo chứng minh, đề xuất cơ chế và điều hướng các tài liệu lớn theo khái niệm thay vì theo từ khóa. Khi có các công cụ chuyên dụng, chúng tôi muốn sử dụng chúng; khi cần suy luận chung, chúng tôi xây dựng các mô hình được thiết kế để xử lý điều đó. Cả hai con đường đều củng cố lẫn nhau.
Bước tiến có ý nghĩa nhất đến từ các nhóm con người–AI. Các nhà khoa học đặt ra chương trình nghị sự: họ xác định câu hỏi, chọn phương pháp, phê bình ý tưởng và xác nhận kết quả. GPT‑5 đóng góp sự đa dạng, tốc độ và khả năng khám phá nhiều hướng đi song song.
Sử dụng GPT‑5 hiệu quả là một kỹ năng. Các nhà nghiên cứu học cách đặt câu hỏi, khi nào nên phản biện, làm thế nào để chia nhỏ vấn đề thành các bước, và những gì cần xác nhận một cách độc lập. Công việc hiệu quả thường giống như một cuộc đối thoại—nhà nghiên cứu và mô hình lặp đi lặp lại cho đến khi một hướng đi đầy hứa hẹn xuất hiện hoặc ý tưởng bị loại bỏ.
Trong các nghiên cứu ban đầu này, GPT‑5 dường như có khả năng rút ngắn một số phần của quy trình nghiên cứu khi được các chuyên gia sử dụng. Nó không tự động thực hiện các dự án hoặc giải quyết các vấn đề khoa học một cách độc lập, nhưng nó có thể mở rộng phạm vi khám phá và giúp các nhà nghiên cứu tiến nhanh hơn đến kết quả chính xác.
- Một khả năng mới nổi là tìm kiếm tài liệu nghiên cứu mang tính khái niệm. GPT‑5 thường có thể xác định mối quan hệ sâu sắc hơn giữa các ý tưởng và truy xuất tài liệu có liên quan trên nhiều ngôn ngữ và các nguồn khó tiếp cận hơn. Các nhà nghiên cứu báo cáo rằng họ đã tìm thấy các tài liệu tham khảo, mối liên hệ và luận đề mà trước đây họ chưa từng biết đến.
- Trong toán học và khoa học máy tính lý thuyết, nơi cấu trúc rõ ràng và các vòng phản hồi diễn ra nhanh chóng, GPT‑5 đặc biệt hữu ích. Các nhà toán học đã sử dụng GPT‑5 để phác thảo lời giải khả thi chỉ trong vài phút, biến đổi công việc mà nếu không thì có thể mất nhiều ngày hoặc nhiều tuần. Trong các miền vật lý và tính toán, mô hình có thể đề xuất các phép biến đổi đơn giản hóa hoặc chỉ ra các cấu trúc tương tự trong các miền khác.
- Trong sinh học và các ngành khoa học thực nghiệm khác, mô hình có thể đề xuất các cơ chế và thiết kế thí nghiệm để kiểm chứng các giả thuyết này trong phòng thí nghiệm ướt.
Chúng ta đã vượt qua giai đoạn mà các mô hình chỉ tóm tắt kiến thức hiện có. Hiện nay, những đóng góp ban đầu từ GPT‑5 có thể hỗ trợ đáng kể cho các nhà nghiên cứu dưới sự giám sát của chuyên gia. Tốc độ cải thiện cho thấy tiềm năng tăng tốc mạnh mẽ hơn khi năng lực và công cụ phát triển.
Những nghiên cứu trường hợp này là các minh họa được chọn lọc về nơi GPT‑5 đã tỏ ra hữu ích; chúng không phải là mẫu hệ thống và không nắm bắt được toàn bộ các chế độ thất bại. Sự giám sát của chuyên gia vẫn là điều cần thiết. GPT‑5 đôi khi có thể tạo ra các trích dẫn, cơ chế hoặc bằng chứng có vẻ hợp lý; nó có thể nhạy cảm với các vấn đề liên quan đến cấu trúc hỗ trợ và khởi động; đôi khi nó bỏ qua các chi tiết đặc thù của miền; và nó có thể theo đuổi các hướng suy luận không hiệu quả nếu không được điều chỉnh. Đây là những lĩnh vực nghiên cứu đang được chú trọng, và chúng tôi đang hợp tác với các cộng tác viên để đo lường và giảm thiểu những thất bại này khi chúng tôi hoàn thiện các hệ thống trong tương lai.
Nhìn chung, những nghiên cứu ban đầu này cho thấy GPT‑5 đang bắt đầu hỗ trợ cho các loại công việc khoa học mới. Mô hình này không tự động, nhưng khi vào tay chuyên gia, nó có thể giúp chứng minh các định lý, khám phá lại và mở rộng các cấu trúc, làm nổi bật các kết nối liên ngành và tạo ra các cơ chế và thí nghiệm để các nhà khoa học xác nhận.
Chúng tôi cũng thấy một xu hướng mà các hệ thống này cải thiện theo thời gian và khả năng tính toán. Nếu GPT‑5 có thể hỗ trợ một cách có ý nghĩa cho một số câu hỏi nghiên cứu trong 20 phút, chúng tôi kỳ vọng sẽ có kết quả sâu sắc hơn khi các mô hình có thể dành hàng giờ hoặc thậm chí hàng ngày để suy luận về một vấn đề. Kết hợp với các nhà khoa học đẳng cấp thế giới, điều này chỉ ra khả năng có một bước đột phá trong năng suất khoa học theo thời gian.


