20 tháng 11, 2025

Các thí nghiệm ban đầu về thúc đẩy tiến bộ khoa học với GPT‑5

Những gì chúng tôi đang học hỏi nhờ sự hợp tác với các nhà khoa học

Hình họa theo phong cách ảnh ghép, có các hình dạng trừu tượng và màu sắc. Phía trên bên trái hiển thị một khối màu cam nhạt với một phần văn bản bị che khuất. Phía trên bên phải có một sơ đồ phân nhánh với các mũi tên đen mỏng phân kỳ từ một chấm đen trung tâm, cùng với các vòng tròn màu cam nhỏ đánh dấu các điểm khác nhau. Phía dưới bên trái hiển thị nét pha trộn nhẹ nhàng của các sắc độ cam, hồng và tím. Góc dưới bên phải có số “5” màu đen lớn trên nền xanh lam nhạt.

Đang tải…

Khoa học định hình mọi thứ từ sức khỏe con người đến sản xuất năng lượng, từ an ninh quốc gia đến sự hiểu biết của chúng ta về vũ trụ. Nếu AI có thể thúc đẩy tiến bộ khoa học—rút ngắn thời gian để tạo ra ý tưởng mới hoặc chuyển từ ý tưởng sang kết quả đã được kiểm chứng—thì lợi ích sẽ được nhân lên trong toàn xã hội.

Nhưng nhịp độ đổi mới vẫn là một hạn chế. Ngay cả khi có ý tưởng đúng, việc biến nó thành một sản phẩm hoặc một phương pháp điều trị có thể mất nhiều năm. Trong một cuộc khảo sát gần đây⁠(mở trong cửa sổ mới), 60 phần trăm người dân Hoa Kỳ cho biết những đột phá về khoa học và y tế đến với họ quá chậm; 73 phần trăm cho biết chúng ta cần những cách tốt hơn để đẩy nhanh quá trình khám phá; và 69 phần trăm xác định vai trò lãnh đạo khoa học là ưu tiên hàng đầu quốc gia.

Hôm nay, chúng tôi phát hành bài viết “Các thí nghiệm thúc đẩy tiến bộ khoa học ban đầu với GPT‑5⁠(mở trong cửa sổ mới),” một bài báo được đồng tác giả với các cộng tác viên tại các trường đại học và phòng thí nghiệm quốc gia bao gồm Vanderbilt, UC Berkeley, Columbia, Oxford, Cambridge, Phòng thí nghiệm Quốc gia Lawrence Livermore và Phòng thí nghiệm Jackson. Bài báo này tổng hợp các nghiên cứu điển hình ban đầu trong các lĩnh vực toán học, vật lý, sinh học, khoa học máy tính, thiên văn học và khoa học vật liệu, trong đó GPT‑5 đã hỗ trợ các nhà nghiên cứu tổng hợp các kết quả đã biết theo cách mới, thực hiện đánh giá tài liệu mạnh mẽ, tăng tốc các phép tính khó và thậm chí tạo ra các chứng minh mới cho các mệnh đề chưa được giải quyết. Bài báo cũng ghi lại những hạn chế. Mục tiêu của chúng tôi là cung cấp cho cộng đồng một cái nhìn rõ ràng về những gì các hệ thống này có thể và không thể làm trong bối cảnh nghiên cứu hiện nay.

Các nghiên cứu điển hình này cho thấy cách GPT‑5, dưới sự điều khiển của các chuyên gia, đang tăng tốc quá trình khám phá khoa học và lý do tại sao sự tăng tốc đó lại quan trọng:

Sinh học: Trong một nghiên cứu do Bác sĩ Derya Unutmaz dẫn đầu, các nhà khoa học đã dành nhiều tháng để cố gắng giải thích một sự thay đổi khó hiểu trong các tế bào miễn dịch của con người. GPT‑5 xác định cơ chế có khả năng xảy ra trong vòng vài phút từ một biểu đồ chưa được công bố và đề xuất một thí nghiệm chứng minh điều đó. Loại tốc độ này có thể giúp các nhà nghiên cứu hiểu rõ về bệnh tật nhanh hơn và lập ra các phương pháp điều trị tốt hơn.
Toán học: Trong một trường hợp khác, các nhà nghiên cứu Mehtaab Sawhney và Mark Sellke đang giải quyết một bài toán mở đã tồn tại hàng thập kỷ, ban đầu được đề xuất bởi Paul Erdős. Họ đã bị mắc kẹt ở bước cuối cùng, và GPT‑5 đã đóng góp một ý tưởng mới về cách một số lẻ phá vỡ mô hình, điều này đã giúp họ hoàn thành phần chứng minh. Những tiến bộ như thế này giúp củng cố nền tảng toán học mà nhiều thuật toán và kỹ thuật bảo mật cuối cùng dựa vào.
Thuật toán & tối ưu hóa: Các nhà nghiên cứu Sébastien Bubeck và Christian Coester đang kiểm tra xem liệu một phương pháp ra quyết định phổ biến được sử dụng trong robot và định tuyến có đáng tin cậy như mọi người vẫn nghĩ hay không. GPT‑5 đã tìm thấy một ví dụ mới, rõ ràng cho thấy phương pháp này có thể thất bại và cũng cải thiện một kết quả cổ điển trong tối ưu hóa, toán học được sử dụng để tìm ra cách tốt nhất để giải quyết vấn đề. Loại tiến bộ này giúp các kỹ sư hiểu rõ hơn về các hệ thống ra quyết định được sử dụng trong robot, định tuyến và các ứng dụng thực tế khác.

OpenAI for Science là gì?

Sứ mệnh của OpenAI for Science là tăng tốc khám phá khoa học: hỗ trợ các nhà nghiên cứu khám phá nhiều ý tưởng hơn, kiểm tra giả thuyết nhanh hơn và tìm ra những hiểu biết sâu sắc mà nếu không sẽ mất nhiều thời gian đáng kể. Chúng tôi thực hiện điều này bằng cách kết hợp các mô hình tiên tiến với các công cụ, quy trình làm việc và hợp tác phù hợp.

Chúng tôi làm việc chặt chẽ với các nhà nghiên cứu trong các học viện, ngành công nghiệp và các phòng thí nghiệm quốc gia. Những mối hợp tác này giúp chúng tôi hiểu được các mô hình hữu ích nằm ở đâu, chúng thất bại ở chỗ nào và làm thế nào để tích hợp chúng vào quy trình khoa học—từ việc xem xét tài liệu và tạo lời giải đến mô hình hóa, mô phỏng và thiết kế thử nghiệm.

Cách tiếp cận của chúng tôi kết hợp hai niềm tin bổ trợ cho nhau. Các công cụ khoa học chuyên dụng, chẳng hạn như công cụ mô phỏng, cơ sở dữ liệu protein và hệ thống đại số máy tính, rất cần thiết cho hiệu quả và độ chính xác. Đồng thời, việc mở rộng các mô hình nền tảng tiếp tục mở ra những khả năng suy luận mới: kết nối ý tưởng giữa các lĩnh vực, phác thảo chứng minh, đề xuất cơ chế và điều hướng các tài liệu lớn theo khái niệm thay vì theo từ khóa. Khi có các công cụ chuyên dụng, chúng tôi muốn sử dụng chúng; khi cần suy luận chung, chúng tôi xây dựng các mô hình được thiết kế để xử lý điều đó. Cả hai con đường đều củng cố lẫn nhau.

Các nhà khoa học đang làm việc với GPT‑5 như thế nào ngày nay

Bước tiến có ý nghĩa nhất đến từ các nhóm con người–AI. Các nhà khoa học đặt ra chương trình nghị sự: họ xác định câu hỏi, chọn phương pháp, phê bình ý tưởng và xác nhận kết quả. GPT‑5 đóng góp sự đa dạng, tốc độ và khả năng khám phá nhiều hướng đi song song.

Sử dụng GPT‑5 hiệu quả là một kỹ năng. Các nhà nghiên cứu học cách đặt câu hỏi, khi nào nên phản biện, làm thế nào để chia nhỏ vấn đề thành các bước, và những gì cần xác nhận một cách độc lập. Công việc hiệu quả thường giống như một cuộc đối thoại—nhà nghiên cứu và mô hình lặp đi lặp lại cho đến khi một hướng đi đầy hứa hẹn xuất hiện hoặc ý tưởng bị loại bỏ.

Tình trạng hiện tại của GPT‑5 trong công việc khoa học

Trong các nghiên cứu ban đầu này, GPT‑5 dường như có khả năng rút ngắn một số phần của quy trình nghiên cứu khi được các chuyên gia sử dụng. Nó không tự động thực hiện các dự án hoặc giải quyết các vấn đề khoa học một cách độc lập, nhưng nó có thể mở rộng phạm vi khám phá và giúp các nhà nghiên cứu tiến nhanh hơn đến kết quả chính xác.

Một khả năng mới nổi là tìm kiếm tài liệu nghiên cứu mang tính khái niệm. GPT‑5 thường có thể xác định mối quan hệ sâu sắc hơn giữa các ý tưởng và truy xuất tài liệu có liên quan trên nhiều ngôn ngữ và các nguồn khó tiếp cận hơn. Các nhà nghiên cứu báo cáo rằng họ đã tìm thấy các tài liệu tham khảo, mối liên hệ và luận đề mà trước đây họ chưa từng biết đến.
Trong toán học và khoa học máy tính lý thuyết, nơi cấu trúc rõ ràng và các vòng phản hồi diễn ra nhanh chóng, GPT‑5 đặc biệt hữu ích. Các nhà toán học đã sử dụng GPT‑5 để phác thảo lời giải khả thi chỉ trong vài phút, biến đổi công việc mà nếu không thì có thể mất nhiều ngày hoặc nhiều tuần. Trong các miền vật lý và tính toán, mô hình có thể đề xuất các phép biến đổi đơn giản hóa hoặc chỉ ra các cấu trúc tương tự trong các miền khác.
Trong sinh học và các ngành khoa học thực nghiệm khác, mô hình có thể đề xuất các cơ chế và thiết kế thí nghiệm để kiểm chứng các giả thuyết này trong phòng thí nghiệm ướt.

Chúng ta đã vượt qua giai đoạn mà các mô hình chỉ tóm tắt kiến thức hiện có. Hiện nay, những đóng góp ban đầu từ GPT‑5 có thể hỗ trợ đáng kể cho các nhà nghiên cứu dưới sự giám sát của chuyên gia. Tốc độ cải thiện cho thấy tiềm năng tăng tốc mạnh mẽ hơn khi năng lực và công cụ phát triển.

Điều này diễn ra như thế nào trong thực tế: một số nghiên cứu điển hình

Tái khám phá độc lập các kết quả đã biết tại ranh giới khoa học

Thắt chặt một định lý trong tối ưu hóa lồi

Tối ưu hóa là toán học của việc tìm ra tùy chọn “tốt nhất”—như mức tổn thất huấn luyện thấp nhất hoặc tuyến đường ngắn nhất trong một mạng lưới. Thuật toán hạ dốc là một phương pháp tối ưu hóa cơ bản, thực hiện các bước nhỏ lặp đi lặp lại theo hướng dốc xuống trên một hàm số. Một định lý⁠(mở trong cửa sổ mới) gần đây của Guy Barzilai, Ohad Shamir và Moslem Zamani đã đặt câu hỏi khi nào chuỗi giá trị mà thuật toán hạ dốc đi qua sẽ tạo thành một đường cong lồi theo thời gian (một đường cong không có chỗ lõm), giúp cho hành vi của thuật toán dễ phân tích và kiểm soát hơn. Phiên bản đầu tiên của bài báo chỉ cho thấy điều này đối với các bước có kích thước rất nhỏ và thận trọng.

Sébastien Bubeck đã cung cấp cho GPT‑5 phiên bản yếu hơn của kết quả và hỏi liệu điều kiện có thể được cải thiện hay không, và mô hình đã đề xuất một giới hạn kích thước bước sắc nét hơn và một bằng chứng tiêu chuẩn hơn, sạch hơn mà sau đó ông đã kiểm tra cẩn thận bằng tay; Với nhiều thời gian suy nghĩ hơn, một lần chạy nội bộ của mô hình thậm chí đã rút ra giới hạn tối ưu từ đầu.

Đóng góp của GPT‑5: GPT‑5 đã giúp Sébastien Bubeck khám phá một điều kiện kích thước bước sắc nét hơn và đề xuất một bằng chứng rõ ràng hơn cho một định lý tối ưu hóa lồi gần đây, mà ông đã tự mình xác minh.

Đọc thêm ở trang 3(mở trong cửa sổ mới)

Khôi phục cấu trúc đối xứng ẩn xung quanh hố đen

Trong thuyết tương đối rộng, các lỗ đen quay được mô tả bằng nghiệm Kerr, và các sóng chuyển động xung quanh chúng thỏa mãn một phương trình vi phân phức tạp. Các nhà vật lý tìm kiếm tính đối xứng của các phương trình như vậy—các phép biến đổi giữ nguyên chúng—vì tính đối xứng dẫn đến các đại lượng bảo toàn và cấu trúc đơn giản. Nghiên cứu gần đây của Alex Lupsasca cho thấy phương trình sóng Kerr có cấu trúc đối xứng ẩn tạo thành đại số SL(2,ℝ), giúp giải thích tại sao một số phản ứng thủy triều biến mất.

Khi chúng tôi hỏi trực tiếp GPT‑5 Pro về toàn bộ vấn đề Kerr, ban đầu nó không thành công và không báo cáo được cấu trúc đối xứng thú vị nào. Sau khi Lupsasca đưa ra một phiên bản “khởi động” đơn giản hơn của cùng một cấu trúc trong không gian phẳng, chúng tôi quay lại trường hợp Kerr; lần này, sau khoảng 18 phút suy luận nội bộ, mô hình đã tạo ra bộ máy phát đối xứng đầy đủ đóng vào SL(2,ℝ), khớp với kết quả của con người.

Đóng góp của GPT‑5: GPT‑5 Pro đã tái tạo lại đại số đối xứng SL(2,ℝ) ẩn của phương trình sóng lỗ đen Kerr sau khi được cung cấp một bài toán khởi động thích hợp, và Lupsasca đã xác nhận kết quả.

Hiểu biết cơ chế trong miễn dịch học

Một câu hỏi quan trọng trong liệu pháp miễn dịch hiện đại, đặc biệt là trong các phương pháp điều trị ung thư CAR-T dựa vào tế bào T được thiết kế, là làm thế nào để duy trì các tế bào T có lợi hoạt động và bền vững mà không đẩy chúng vào trạng thái kiệt sức và rối loạn chức năng. Các tài liệu đã được thiết lập đã chỉ ra rằng việc hạn chế tạm thời quá trình chuyển hóa glucose có thể lập trình lại tế bào T một cách lâu dài để chúng trở nên gây viêm nhiều hơn. Trong một nghiên cứu trước đó, Derya Unutmaz và các đồng nghiệp đã xử lý ngắn gọn tế bào T CD4+ của con người (một loại tế bào miễn dịch quan trọng) bằng 2-deoxyglucose (2DG), một hợp chất can thiệp vào quá trình chuyển hóa glucose. Sau khi loại bỏ 2DG và sau đó kích hoạt các tế bào T CD4+ bằng IL-2 (một phân tử tín hiệu cho tế bào T biết để tăng sinh), họ đã quan sát thấy một sự chuyển đổi lâu dài sang trạng thái giống Th17 gây viêm - một loại tế bào T liên quan đến cả bảo vệ và bệnh tự miễn dịch - và đã dành nhiều tháng thực hiện thí nghiệm và đọc tài liệu để đưa ra một cơ chế hợp lý giải thích cho hiệu ứng này.

Nhiều năm sau, ông đã cung cấp cho GPT‑5 Pro một hình ảnh chưa công bố về biểu đồ phân tán tế bào dòng chảy cho thấy các phân nhóm tế bào T khác nhau sau khi điều trị với các mức glucose và 2DG khác nhau—và hỏi điều gì có thể giải thích dữ liệu và những thí nghiệm nào cần thực hiện tiếp theo. Trong khoảng một chục phút trao đổi qua lại, mô hình đã chỉ ra rằng sự gián đoạn trong quá trình glycosyl hóa liên kết N (cách các tế bào gắn chuỗi đường vào protein) trong giai đoạn mồi là yếu tố thúc đẩy, và dự đoán rằng các tế bào T trí nhớ (thay vì tế bào T ngây thơ) là nguyên nhân. GPT‑5 sau đó đã đề xuất các thí nghiệm tiếp theo cụ thể, bao gồm một thí nghiệm cứu mannose tinh tế giúp khôi phục N-glycosyl hóa mà không khôi phục quá trình đường phân. Phòng thí nghiệm đã tiến hành thí nghiệm cứu mannose trước đó, và kết quả hoàn toàn khớp với dự đoán của mô hình.

GPT‑5 Pro sau đó đã có thể phân tích dữ liệu chưa được công bố của các tế bào T CD8+ được xung với 2DG, và dự đoán rằng việc tiếp xúc thoáng qua với 2DG trong quá trình tạo CAR-T sẽ dẫn đến hiệu quả tiêu diệt được nâng cao đối với các dòng tế bào ung thư mục tiêu. Dự đoán của GPT‑5 Pro khớp với dữ liệu thí nghiệm chưa được công bố của phòng thí nghiệm.

Đóng góp của GPT‑5: GPT‑5 đã phân tích dữ liệu chưa công bố để đưa ra các giả thuyết cơ chế không hiển nhiên và có giá trị, xác định nhóm tế bào T hoạt động, và đề xuất các thí nghiệm tiếp theo, mà phòng thí nghiệm của Unutmaz sau đó đã thử nghiệm và xác nhận.

Đọc thêm ở trang 11(mở trong cửa sổ mới)

Tìm kiếm tài liệu chuyên sâu

Liên kết một kết quả hình học mới với các lĩnh vực khác

Nikita Zhivotovskiy và các cộng sự của ông đã chứng minh một định lý mới trong hình học lồi—nghiên cứu về các hình dạng "được định hình tốt" nơi bất kỳ đường thẳng nào nối hai điểm đều nằm bên trong hình dạng đó. Hình học lồi là nền tảng của nhiều mô hình trong học máy và thống kê. Khi định lý đã được chứng minh, câu hỏi tự nhiên tiếp theo là: kết quả này có thể hữu ích ở đâu nữa?

Thay vì đoán các cụm từ tìm kiếm và quét tài liệu bằng tay, Zhivotovskiy đã đưa cho GPT‑5 tuyên bố chính thức về định lý và hỏi nó có thể kết nối với những lĩnh vực nào. Mô hình đã chỉ ra công việc trong ước lượng mật độ, lý thuyết học và tối ưu hóa đa mục tiêu, đồng thời đưa ra các tài liệu tham khảo cụ thể, bao gồm một số tài liệu mà ông chưa thấy và một số bằng các ngôn ngữ khác.

Đóng góp của GPT‑5: GPT‑5 đã giúp Nikita Zhivotovskiy xác định các kết nối và tài liệu tham khảo cụ thể trong một số lĩnh vực, bao gồm cả những tài liệu mà ông chưa từng gặp.

Dọn dẹp—và đóng góp vào—cơ sở dữ liệu vấn đề Erdős

Paul Erdős đã đặt ra hơn một nghìn vấn đề, nhiều trong số đó được theo dõi trên một trang web công cộng. Một số vấn đề vẫn được liệt kê là “chưa giải quyết” mặc dù đã có giải pháp trong các tạp chí ít người biết đến hoặc các bài báo không phải tiếng Anh. Mehtaab Sawhney và Mark Sellke đã sử dụng GPT‑5 như một trợ lý tìm kiếm tài liệu trên cơ sở dữ liệu này: đối với mỗi vấn đề được cho là còn bỏ ngỏ, họ yêu cầu nó tìm kiếm giải pháp hoặc tiến triển lớn.

GPT‑5 đã tìm ra giải pháp đầy đủ cho một số bài toán vẫn còn bỏ ngỏ, xác định được kết quả một phần đáng kể cho các bài toán khác và phát hiện lỗi in trong một câu lệnh của bài toán. Đối với Vấn đề Erdős số 848, các bình luận của con người trên trang web đã phác thảo phần lớn cấu trúc; GPT‑5 đã đề xuất một ước tính mật độ quan trọng, và Sawhney cùng Sellke đã sửa chữa và hoàn thiện nó thành một bằng chứng hoàn chỉnh để giải quyết vấn đề.

Đóng góp của GPT‑5: GPT‑5 đã hỗ trợ trong việc xác định các giải pháp bị bỏ sót và đề xuất một ước tính mật độ mà Sawhney và Sellke đã tinh chỉnh thành một chứng minh hoàn chỉnh cho Vấn đề Erdős số 848.

Mã tránh clique: một câu chuyện cảnh báo

Mã sửa lỗi thêm dư thừa vào dữ liệu để bạn có thể khôi phục thông tin ngay cả khi các bit bị hỏng. Dự án này đã nghiên cứu một loại mã nhị phân đặc biệt, trong đó mỗi vị trí tương ứng với một cạnh trong đồ thị, và mục tiêu là loại bỏ bất kỳ từ mã nào trông giống như một “clique” (một tập hợp các nút được kết nối đầy đủ). Thách thức là xác định cần có bao nhiêu kiểm tra chẵn lẻ về cơ bản để ngăn chặn các lỗi có cấu trúc này. GPT‑5 đã định khung lại câu hỏi bằng cách sử dụng phương trình bậc hai trên một trường hữu hạn và làm nổi bật một kết quả cổ điển, định lý Chevalley–Warning, ngay lập tức chỉ ra giới hạn dưới chính xác—cho thấy rằng chỉ cần khoảng một nửa số ràng buộc như đã nghĩ trước đây.

Một bước ngoặt bất ngờ đã xuất hiện sau đó: cùng một ràng buộc chính xác và về cơ bản là cùng một bằng chứng đã xuất hiện nhiều năm trước trong một bài nghiên cứu ngắn. GPT‑5 đã sao chép lại lập luận mà không trích dẫn nguồn, chỉ xác định tác phẩm trước đó khi được hỏi lại trong một phiên mới. Điều này nhấn mạnh một bài học quan trọng cho toán học được hỗ trợ bởi AI: các mô hình có thể tạo ra lý luận chính xác và tinh tế, nhưng chúng có thể không đáng tin cậy trong việc xác định nguồn gốc ban đầu của những ý tưởng đó. Việc xác minh cẩn thận và chú ý đến việc ghi nguồn vẫn là điều cần thiết.

Đóng góp của GPT‑5: GPT‑5 đã cung cấp sự cải tiến quan trọng và định lý cổ điển dẫn đến giới hạn dưới tối ưu. Tuy nhiên, mô hình không nhận diện được ấn phẩm trước đó cho đến khi được yêu cầu một cách rõ ràng, điều này nhấn mạnh sự cần thiết của việc kiểm tra cẩn thận của con người đối với việc xác định nguồn gốc.

Đọc thêm ở trang 28(mở trong cửa sổ mới)

Làm việc song hành với AI

Sử dụng GPT-5 như một đối tác nghiên cứu trong lĩnh vực tổ hợp

Tim Gowers, một nhà toán học tổ hợp đoạt giải Fields, đã thực hiện một loạt thí nghiệm coi GPT‑5 như một “đối tác nghiên cứu” thay vì một công cụ cho các vấn đề kiểu bài tập về nhà. Ông đã đưa cho mô hình những câu hỏi tổ hợp khó mà ông đang tích cực suy nghĩ và yêu cầu nó đề xuất các cấu trúc, tìm phản ví dụ hoặc phê bình các lập luận một phần.

Trong nhiều trường hợp, GPT‑5 nhanh chóng phát hiện ra các lỗi hoặc trường hợp bị thiếu trong các cấu trúc ứng viên và đề xuất các giải pháp thay thế đơn giản hơn hoặc phản ví dụ; trong những trường hợp khác, nó bị đình trệ hoặc không tiến triển. Kết luận chung của Gowers là mô hình này đã hữu ích như một nhà phê bình rất nhanh và hiểu biết sâu sắc, có thể kiểm tra sức chịu đựng của các ý tưởng và lưu thời gian, mặc dù nó vẫn chưa đáp ứng được tiêu chuẩn của ông về việc đồng tác giả đầy đủ.

Đóng góp của GPT‑5: GPT‑5 đã đóng vai trò như một nhà phê bình nhanh chóng cho Tim Gowers, phát hiện ra những sai sót, trường hợp bị thiếu và các giải pháp thay thế đơn giản hơn trong công việc nghiên cứu tổ hợp khám phá.

Đọc thêm ở trang 31(mở trong cửa sổ mới)

Diễn giải các mô hình vũ trụ học

Vũ trụ học sử dụng các mô hình đơn giản hóa để mô tả hành vi quy mô lớn của vũ trụ, bao gồm năng lượng tối và lịch sử giãn nở. Những mô hình này thường tồn tại ở nhiều dạng toán học tương đương nhau, và những sai sót nhỏ về mặt đại số có thể làm trật hướng một phép tính. Robert Scherrer đã sử dụng GPT‑5 để kiểm tra tính hợp lý của các phép suy luận, khám phá các phiên bản thử nghiệm của các mô hình vũ trụ học và chuyển đổi giữa các tham số hóa khác nhau của năng lượng tối.

GPT‑5 đặc biệt hữu ích trong việc phát hiện các lỗi đại số, đề xuất các công thức tương đương của cùng một ý tưởng vật lý và chỉ cho Scherrer các kết quả hiện có trong tài liệu phù hợp với các mô hình mà ông tự mình suy ra. Điều này làm giảm sự ma sát giữa việc đưa ý tưởng lên giấy và việc chuyển nó thành dạng có thể so sánh với dữ liệu.

Đóng góp của GPT‑5: GPT‑5 đã hỗ trợ Robert Scherrer bằng cách kiểm tra các dẫn xuất, đề xuất các công thức tương đương và chỉ ra các kết quả phù hợp trong tài liệu.

Đọc thêm ở trang 37(mở trong cửa sổ mới)

Hỗ trợ vật lý nhiệt hạch và plasma

Vật lý nhiệt hạch và plasma liên quan đến việc mô hình hóa các plasma nóng, dày đặc, trong đó những thay đổi nhỏ trong điều kiện ban đầu có thể dẫn đến hành vi rất khác nhau. Việc chạy và diễn giải các mô phỏng này rất tốn kém và mất thời gian. Công trình này đã sử dụng GPT‑5 để hỗ trợ xây dựng và phân tích một mô hình phản ứng-khuếch tán đơn giản hóa cho sự lan truyền của quá trình đốt cháy nhiệt hạch, diễn giải các đầu ra phức tạp và khám phá cách các hồ sơ mật độ khác nhau ảnh hưởng đến hiệu suất đốt cháy. Mô hình đã hỗ trợ thực hiện quét tham số và xác định một dãy hồ sơ tối ưu nơi các mặt trận cháy di chuyển nhanh nhất.

GPT‑5 cũng hỗ trợ trong việc đề xuất một lời giải thích lý thuyết cho các mẫu số này, sử dụng các lập luận cân bằng công suất để giải thích tại sao một số hồ sơ hoạt động tốt hơn và đề xuất các quy tắc kỹ thuật đơn giản để hướng dẫn thiết kế trong tương lai. Mặc dù mô hình đôi khi tạo ra các mô phỏng không ổn định hoặc kết luận quá tự tin, sự giám sát của chuyên gia đã cho phép điều chỉnh nhanh chóng, giúp chuyển từ "có điều gì đó kỳ lạ đang xảy ra trong chế độ này" sang "đây là một lời giải thích hợp lý và một thử nghiệm cụ thể" nhanh hơn nhiều.

Đóng góp của GPT‑5: GPT‑5 đã giúp xây dựng mô hình vật lý giản lược, khám phá không gian tham số và đề xuất các giải thích vật lý.

Đọc thêm ở trang 40(mở trong cửa sổ mới)

Những kết quả khoa học mới được thu thập bằng AI

Giải bài toán lý thuyết số Erdős

Paul Erdős đã đặt ra một bài toán về việc tìm tập hợp số nguyên dương lớn nhất với một quy tắc đáng ngạc nhiên: đối với bất kỳ hai số nào trong tập hợp, tích của hai số đó cộng với một phải luôn chia hết cho một thừa số nguyên tố là bình phương hoàn hảo. Erdős đã đoán tập số lớn nhất như vậy sẽ trông ra sao, nhưng vấn đề này vẫn còn bỏ ngỏ trong nhiều thập kỷ.

Sawhney và Sellke đã khám phá cấu trúc của vấn đề và sau đó yêu cầu GPT‑5 giúp phân tích cách một số 'không đúng chỗ' duy nhất sẽ ảnh hưởng đến toàn bộ tập số. GPT‑5 đã gợi ý một cách rõ ràng hơn để chỉ ra rằng nếu ngay cả một con số không phù hợp với một mẫu cụ thể, nó sẽ gây ra mâu thuẫn ở hầu hết các con số khác. Ý tưởng đó hóa ra là bước còn thiếu. Với điều đó, các nhà nghiên cứu đã hoàn thành một chứng minh đầy đủ cho thấy phỏng đoán ban đầu của Erdős là chính xác.

Đóng góp của GPT‑5: GPT‑5 đã đưa ra cái nhìn sâu sắc quan trọng về cách một con số ràng buộc tất cả các con số khác, cho phép các tác giả hoàn thành chứng minh cho Vấn đề 848 của Erdős.

Giới hạn dưới mới cho các thuật toán trực tuyến

Các thuật toán trực tuyến đưa ra quyết định từng bước mà không biết trước tương lai—ví dụ, quyết định cách di chuyển một hệ thống khi các ràng buộc được tiết lộ theo thời gian. Trong bài toán đuổi theo vật thể lồi, thuật toán phải duy trì ở bên trong một vùng lồi đang di chuyển mà vẫn giữ được tổng chuyển động nhỏ. Một câu hỏi cốt lõi là tỷ lệ cạnh tranh tốt nhất có thể: một thuật toán trực tuyến có thể tệ hơn bao nhiêu, trong trường hợp xấu nhất, so với một thuật toán ngoại tuyến lý tưởng có thể nhìn thấy toàn bộ chuỗi từ trước.

Christian Coester đã sử dụng GPT‑5 để động não về các trường hợp khó và các cấu trúc có thể buộc bất kỳ thuật toán trực tuyến nào hoạt động kém. Mô hình đã làm nổi bật một cấu trúc hình học cụ thể mà, sau khi được Coester tinh chỉnh và kiểm tra, đã dẫn đến một giới hạn dưới rõ ràng và mạnh mẽ hơn về tỷ lệ cạnh tranh so với những gì đã biết trước đây.

Đóng góp của GPT‑5: GPT‑5 đã đề xuất một cấu trúc hình học mà Christian Coester đã tinh chỉnh thành một giới hạn dưới mạnh hơn cho một vấn đề thuật toán trực tuyến.

Đọc thêm tại trang 61(mở trong cửa sổ mới)

Chứng minh các bất đẳng thức mới trong lý thuyết đồ thị

Team đã nghiên cứu một bài toán lý thuyết đồ thị về việc đếm các mẫu nhỏ—đường đi, ngôi sao và "wyes"—bên trong cây (đồ thị không có chu kỳ). Các công trình trước đây đã chứng minh một bất đẳng thức liên quan đến các số đếm này và đưa ra một giả thuyết thứ hai, vẫn chưa được chứng minh. Sử dụng một khung toán học tùy chỉnh xung quanh GPT‑5, trước tiên các tác giả yêu cầu mô hình chứng minh lại bất đẳng thức đã biết, sau đó tấn công bất đẳng thức được phỏng đoán.

GPT‑5 đã tạo ra các chứng minh ngắn gọn, độc lập cho cả hai bất đẳng thức, dựa trên một lập luận khác biệt và tinh tế hơn so với chứng minh ban đầu của con người; Bubeck, Sellke và Yin sau đó đã kiểm tra và chấp nhận lập luận của mô hình trong bài viết của họ.

Đóng góp của GPT‑5: GPT‑5 đã tạo ra các lời giải ngắn gọn cho hai bất đẳng thức trong cây, bao gồm một bất đẳng thức được phỏng đoán, và các tác giả đã độc lập kiểm tra và chấp nhận lập luận này.

Đọc thêm ở trang 69(mở trong cửa sổ mới)

Xác định các tham số ẩn trong mạng lưới đang phát triển

Các nhà nghiên cứu đã nghiên cứu một mô hình đơn giản của một mạng lưới đang phát triển, trong đó mỗi nút mới kết nối với các nút trước đó với xác suất bị ảnh hưởng bởi một tham số ẩn www. Thách thức là khi mạng lưới phát triển, bạn chỉ nhìn thấy cây cuối cùng chưa có nhãn—không phải nhãn ẩn hay quy tắc đính kèm tạo ra nó. Câu hỏi mở là liệu www có thể được khôi phục hoàn toàn từ cấu trúc cuối cùng này hay không.

Nhóm đã yêu cầu GPT‑5 Suy luận về các mẫu toàn cầu trong cây cuối cùng có thể phản ánh đáng tin cậy giá trị của www. Mô hình đề xuất tập trung vào một chỉ số thống kê đáng ngạc nhiên: tỷ lệ dài hạn của các nút kết thúc là lá. GPT‑5 đã phác thảo cách phần lá này hội tụ thành một hàm số đơn giản, tăng đơn điệu của www, có nghĩa là www có thể được đọc trực tiếp từ hình dạng của cây. Với hướng dẫn này, các tác giả đã tạo ra một chứng minh hoàn chỉnh cho thấy rằng thông số thực sự có thể được xác định.

Đóng góp của GPT‑5: GPT‑5 đã làm nổi bật yếu tố quan sát quan trọng—phần lá—mở ra một phương pháp rõ ràng, có thể chứng minh được để khôi phục tham số ẩn www từ một ảnh chụp nhanh duy nhất của mạng cuối cùng.

Đọc thêm ở trang 75(mở trong cửa sổ mới)

Hạn chế

Những nghiên cứu trường hợp này là các minh họa được chọn lọc về nơi GPT‑5 đã tỏ ra hữu ích; chúng không phải là mẫu hệ thống và không nắm bắt được toàn bộ các chế độ thất bại. Sự giám sát của chuyên gia vẫn là điều cần thiết. GPT‑5 đôi khi có thể tạo ra các trích dẫn, cơ chế hoặc bằng chứng có vẻ hợp lý; nó có thể nhạy cảm với các vấn đề liên quan đến cấu trúc hỗ trợ và khởi động; đôi khi nó bỏ qua các chi tiết đặc thù của miền; và nó có thể theo đuổi các hướng suy luận không hiệu quả nếu không được điều chỉnh. Đây là những lĩnh vực nghiên cứu đang được chú trọng, và chúng tôi đang hợp tác với các cộng tác viên để đo lường và giảm thiểu những thất bại này khi chúng tôi hoàn thiện các hệ thống trong tương lai.

Tiếp theo là gì

Nhìn chung, những nghiên cứu ban đầu này cho thấy GPT‑5 đang bắt đầu hỗ trợ cho các loại công việc khoa học mới. Mô hình này không tự động, nhưng khi vào tay chuyên gia, nó có thể giúp chứng minh các định lý, khám phá lại và mở rộng các cấu trúc, làm nổi bật các kết nối liên ngành và tạo ra các cơ chế và thí nghiệm để các nhà khoa học xác nhận.

Chúng tôi cũng thấy một xu hướng mà các hệ thống này cải thiện theo thời gian và khả năng tính toán. Nếu GPT‑5 có thể hỗ trợ một cách có ý nghĩa cho một số câu hỏi nghiên cứu trong 20 phút, chúng tôi kỳ vọng sẽ có kết quả sâu sắc hơn khi các mô hình có thể dành hàng giờ hoặc thậm chí hàng ngày để suy luận về một vấn đề. Kết hợp với các nhà khoa học đẳng cấp thế giới, điều này chỉ ra khả năng có một bước đột phá trong năng suất khoa học theo thời gian.

2025

Tác giả

Kevin Weil

Hãy tiếp tục xem

Xem tất cả

"Tách biệt tín hiệu khỏi nhiễu trong các bài đánh giá lập trình

Nghiên cứu8 thg 7, 2026

Giới thiệu GeneBench-Pro

Nghiên cứu30 thg 6, 2026

A near-autonomous AI chemist improves a challenging reaction

Nhà hóa học AI gần như tự chủ cải tiến một phản ứng khó khăn trong hóa dược

Nghiên cứu17 thg 6, 2026