Giới thiệu GPT‑Rosalind dành cho nghiên cứu trong lĩnh vực khoa học đời sống
Một mô hình chuyên dụng mới để đẩy nhanh nghiên cứu khoa học và khám phá thuốc.
Hôm nay, chúng tôi giới thiệu GPT‑Rosalind, mô hình suy luận tiên phong của chúng tôi, được xây dựng để hỗ trợ nghiên cứu trong các lĩnh vực sinh học, khám phá thuốc và y học chuyển dịch. Dòng mô hình khoa học sự sống được tối ưu hóa cho các quy trình làm việc khoa học, kết hợp khả năng sử dụng công cụ được cải thiện với sự hiểu biết sâu sắc hơn về hóa học, kỹ thuật protein và hệ gen học.
Trung bình, phải mất khoảng 10 đến 15 năm để đi từ việc phát hiện mục tiêu đến phê duyệt theo quy định cho một loại thuốc mới tại Hoa Kỳ. Những tiến bộ đạt được ở các giai đoạn khám phá sớm nhất sẽ tạo ra tác động cộng dồn về sau, giúp lựa chọn mục tiêu tốt hơn, xây dựng các giả thuyết sinh học vững chắc hơn và thực hiện các thí nghiệm chất lượng cao hơn. Tiến bộ trong lĩnh vực khoa học đời sống bị hạn chế không chỉ bởi độ khó của nền tảng khoa học cơ bản, mà còn bởi sự phức tạp của chính các quy trình nghiên cứu. Các nhà khoa học phải làm việc với khối lượng lớn tài liệu, cơ sở dữ liệu chuyên biệt, dữ liệu thực nghiệm và các giả thuyết liên tục phát triển để tạo ra và đánh giá các ý tưởng mới. Các quy trình làm việc này thường tốn nhiều thời gian, rời rạc và khó mở rộng quy mô.
Chúng tôi tin rằng các hệ thống AI tiên tiến có thể giúp các nhà nghiên cứu tiến nhanh hơn trong các quy trình làm việc này—không chỉ bằng cách làm cho công việc hiện có hiệu quả hơn, mà còn bằng cách giúp các nhà khoa học khám phá nhiều khả năng hơn, làm nổi bật các mối liên hệ mà nếu không có thể bị bỏ lỡ, và đưa ra các giả thuyết tốt hơn sớm hơn. Bằng cách hỗ trợ tổng hợp bằng chứng, xây dựng giả thuyết, lập kế hoạch thử nghiệm và các nhiệm vụ nghiên cứu nhiều bước khác, mô hình này được thiết kế để giúp các nhà nghiên cứu đẩy nhanh các giai đoạn đầu của quá trình khám phá. Theo thời gian, những hệ thống này có thể giúp các tổ chức trong lĩnh vực khoa học đời sống khám phá những đột phá vốn nếu không thì sẽ không thể đạt được, với tỷ lệ thành công cao hơn nhiều.
GPT‑Rosalind hiện đã có sẵn dưới dạng bản xem trước nghiên cứu trên ChatGPT, Codex và API dành cho các khách hàng đủ điều kiện thông qua chương trình truy cập đáng tin cậy của chúng tôi. Chúng tôi cũng giới thiệu một plugin nghiên cứu Khoa học Sự sống miễn phí dành cho Codex, giúp các nhà khoa học kết nối các mô hình với hơn 50 công cụ khoa học và nguồn dữ liệu. Chúng tôi đang hợp tác với các khách hàng như Amgen, Moderna, Viện Allen, Thermo Fisher Scientific và nhiều khách hàng khác để ứng dụng GPT‑Rosalind vào các quy trình làm việc nhằm đẩy nhanh quá trình nghiên cứu và khám phá.
Mô hình được đặt theo tên Rosalind Franklin, người có nghiên cứu nghiêm ngặt đã giúp làm sáng tỏ cấu trúc của DNA và đặt nền móng cho sinh học phân tử hiện đại.
Từ dữ liệu thô đến các quyết định khám phá có cơ sở, hãy xem cách mô hình được thiết kế đặc biệt của chúng tôi tăng tốc quy trình nghiên cứu.
Dòng mô hình khoa học đời sống GPT‑Rosalind được xây dựng cho công việc khoa học hiện đại trên các lĩnh vực bằng chứng đã công bố, dữ liệu, công cụ và thí nghiệm. Trong các đánh giá của chúng tôi, mô hình này mang lại hiệu suất tốt nhất đối với các tác vụ đòi hỏi khả năng suy luận về phân tử, protein, gen, con đường sinh học và sinh học liên quan đến bệnh, đồng thời hiệu quả hơn trong việc sử dụng các công cụ và cơ sở dữ liệu khoa học trong các quy trình làm việc nhiều bước như tổng quan tài liệu, diễn giải mối liên hệ giữa trình tự và chức năng, lập kế hoạch thí nghiệm và phân tích dữ liệu.
Đây là bản phát hành đầu tiên trong dòng mô hình khoa học sự sống GPT‑Rosalind của chúng tôi, và chúng tôi sẽ tiếp tục mở rộng các tiên phong về khả năng suy luận sinh hóa của mô hình trong các quy trình làm việc khoa học dài hạn và sử dụng nhiều công cụ. Hạ tầng điện toán của OpenAI cho phép chúng tôi tiếp tục huấn luyện, đánh giá và cải thiện các mô hình theo lĩnh vực ngày càng tiên tiến hơn trên các tác vụ khoa học thực tế—giúp các hệ thống này trở nên hữu ích hơn khi các quy trình làm việc ngày càng phức tạp.
Từ những thông tin chuyên sâu về khám phá dựa trên bằng chứng đến các thử nghiệm có tác động lớn, hãy xem cách bộ giải pháp của chúng tôi mang lại những cải thiện có thể đo lường được trong quy trình nghiên cứu của bạn.
Chúng tôi đang hợp tác với các khách hàng hàng đầu trong lĩnh vực dược phẩm, công nghệ sinh học và nghiên cứu, cũng như các tổ chức công nghệ khoa học đời sống để ứng dụng GPT‑Rosalind vào các quy trình làm việc thúc đẩy khám phá.
“Lĩnh vực khoa học sự sống đòi hỏi sự chính xác ở mọi bước.” Các câu hỏi vô cùng phức tạp, dữ liệu rất độc đáo và rủi ro cực kỳ cao. Sự hợp tác độc đáo của chúng tôi với OpenAI cho phép chúng tôi áp dụng các khả năng và công cụ tiên tiến nhất của họ theo những cách thức mới và sáng tạo, với tiềm năng đẩy nhanh quá trình cung cấp thuốc đến tay bệnh nhân.”
Chúng tôi đã đánh giá GPT‑Rosalind trên nhiều khả năng cơ bản đối với khám phá khoa học và nghiên cứu công nghiệp. Các bài đánh giá này đo lường khả năng suy luận cốt lõi trên các phân ngành khoa học, bao gồm cơ chế phản ứng hóa học; cấu trúc protein, tác động của đột biến và các tương tác; và diễn giải phát sinh chủng loài của các trình tự DNA. Họ cũng đánh giá liệu các mô hình có thể hỗ trợ các quy trình làm việc nghiên cứu thực tế hay không bằng cách diễn giải các đầu ra thực nghiệm, xác định các mô hình liên quan đến chuyên gia và tổng hợp thông tin bên ngoài để thiết kế các thí nghiệm tiếp theo. Cuối cùng, họ kiểm tra xem các mô hình có thể lựa chọn và sử dụng đúng các công cụ tính toán, cơ sở dữ liệu và các năng lực dành riêng cho miền để bổ trợ cho quá trình suy luận của chúng hay không. Nhìn chung, những đánh giá này cho thấy có tiến bộ trên toàn bộ quy trình đầu-cuối của nghiên cứu khoa học và cho thấy năng lực hỗ trợ các nhà nghiên cứu xử lý các nhiệm vụ khám phá đầy thách thức đã được cải thiện hơn.
Chúng tôi đã đánh giá GPT‑Rosalind trên một loạt các bộ tiêu chuẩn công khai. Trên BixBench, một bộ tiêu chuẩn được thiết kế xoay quanh tin sinh học và phân tích dữ liệu trong thế giới thực, GPT‑Rosalind đạt hiệu suất hàng đầu trong số các mô hình có điểm số được công bố.
Trên LABBench2, một điểm chuẩn đo lường hiệu suất trên nhiều tác vụ nghiên cứu như truy xuất tài liệu, truy cập cơ sở dữ liệu, thao tác trình tự và thiết kế giao thức, GPT‑Rosalind vượt trội hơn GPT‑5.4 ở 6 trên 11 tác vụ. Cải thiện đáng chú ý nhất đến từ CloningQA, tác vụ đòi hỏi thiết kế toàn diện các thuốc thử DNA và enzym cho các giao thức nhân bản phân tử.
Chúng tôi cũng hợp tác với Dyno Therapeutics, một công ty tiên phong trong lĩnh vực liệu pháp gen được thiết kế bằng trí tuệ nhân tạo, để đánh giá mô hình trên nhiệm vụ dự đoán và tạo ra chức năng của trình tự RNA bằng cách sử dụng các trình tự chưa được công bố và chưa bị nhiễm bẩn. Hiệu suất được so sánh với 57 điểm số trước đây của các chuyên gia con người trong lĩnh vực AI-sinh học. Khi được đánh giá trực tiếp trong ứng dụng Codex, các bài nộp của mô hình tốt nhất trong mười lần thử được xếp hạng cao hơn phân vị thứ 95 của các chuyên gia là con người trong tác vụ dự đoán và ở mức xấp xỉ phân vị thứ 84 của các chuyên gia là con người trong tác vụ tạo chuỗi.
Những đánh giá này cung cấp một tín hiệu có ý nghĩa về hiệu suất trên các loại quy trình làm việc mà các nhà khoa học dựa vào mỗi ngày để tạo ra bằng chứng, phân tích dữ liệu phức tạp và tiến tới các kết luận sinh học có thể bảo vệ được.
Các nhà khoa học có thể sử dụng plugin nghiên cứu Khoa học đời sống(mở trong cửa sổ mới) mới của chúng tôi cho Codex, hiện đã có trên GitHub từ hôm nay. Gói này bao gồm một bộ kỹ năng mô-đun toàn diện cho hầu hết các quy trình nghiên cứu phổ biến, được thiết kế để giúp người dùng làm việc trên nhiều lĩnh vực như di truyền học người, hệ gen học chức năng, cấu trúc protein, hóa sinh, bằng chứng lâm sàng và khám phá các nghiên cứu công khai.

Những kỹ năng này đóng vai trò là một lớp điều phối, giúp các nhà khoa học xử lý các câu hỏi rộng, mơ hồ và nhiều bước hiệu quả hơn. Chúng cung cấp quyền truy cập vào hơn 50 cơ sở dữ liệu đa omics công khai, nguồn tài liệu và công cụ sinh học, đồng thời mang đến một điểm khởi đầu linh hoạt cho các quy trình công việc lặp lại phổ biến như tra cứu cấu trúc protein, tìm kiếm trình tự, tổng quan tài liệu và khám phá bộ dữ liệu công khai.
Người dùng Enterprise đủ điều kiện có thể tận dụng plugin này trong các quy trình nghiên cứu với GPT‑Rosalind để thực hiện suy luận sinh học chuyên sâu hơn, trong khi tất cả người dùng đều có thể sử dụng gói plugin với các mô hình dòng chính của chúng tôi.
Chúng tôi muốn cung cấp những khả năng này cho các nhà khoa học và tổ chức nghiên cứu có vị thế tốt nhất để thúc đẩy sức khỏe con người, đồng thời duy trì các biện pháp bảo vệ mạnh mẽ chống lại việc lạm dụng sinh học. Mô hình Khoa học Sự sống đang được triển khai thông qua cấu trúc quản lý truy cập đáng tin cậy dành cho các khách hàng doanh nghiệp đủ điều kiện tại Hoa Kỳ, với các biện pháp kiểm soát về điều kiện đủ tư cách, quản lý truy cập và quản trị tổ chức. Đồng thời, chúng tôi đang cung cấp rộng rãi hơn bộ kết nối và Plugin Nghiên cứu Khoa học Sự sống, để các nhà nghiên cứu có thể sử dụng các mô hình chính của chúng tôi hiệu quả hơn cho các nhiệm vụ nghiên cứu khoa học sự sống.
Mô hình Khoa học Sự sống được phát triển với các biện pháp kiểm soát an ninh cấp doanh nghiệp nâng cao và quản lý truy cập được tăng cường, cho phép sử dụng khoa học chuyên nghiệp trong môi trường nghiên cứu được quản lý chặt chẽ. Chúng tôi đánh giá quyền truy cập dựa trên ba nguyên tắc cốt lõi: mục đích sử dụng mang lại lợi ích, cơ chế quản trị chặt chẽ và giám sát an toàn, cùng quyền truy cập được kiểm soát với bảo mật cấp doanh nghiệp. Trên thực tế, điều này có nghĩa là các tổ chức tham gia phải đang tiến hành nghiên cứu khoa học chính đáng với lợi ích công cộng rõ ràng; duy trì cơ chế quản trị, tuân thủ và các biện pháp kiểm soát nhằm ngăn ngừa việc lạm dụng một cách phù hợp; đồng thời giới hạn quyền truy cập cho những người dùng đã được phê duyệt trong các môi trường an toàn, được quản lý chặt chẽ. Các tổ chức cũng phải đồng ý với các điều khoản bản xem trước về nghiên cứu khoa học sự sống và tuân thủ các chính sách sử dụng của OpenAI, đồng thời chúng tôi có thể yêu cầu thêm thông tin trong quá trình tiếp nhận ban đầu hoặc trong quá trình tham gia liên tục.
Các tổ chức có thể yêu cầu quyền truy cập thông qua quy trình đánh giá về năng lực và an toàn của chúng tôi.
Trong giai đoạn xem trước nghiên cứu, việc sử dụng mô hình này sẽ không tiêu tốn số credit hoặc token hiện có — tùy thuộc vào các quy định bảo vệ tránh lạm dụng. Chúng tôi sẽ chia sẻ thêm thông tin chi tiết về giá cả và phạm vi cung cấp khi chương trình được mở rộng.
Mô hình Khoa học sự sống được xây dựng để giúp các tổ chức khoa học thực hiện công việc với chất lượng cao hơn, nhanh hơn, trong những môi trường đòi hỏi cả năng lực kỹ thuật lẫn quyền kiểm soát vận hành. Đội ngũ Khoa học đời sống chuyên trách của chúng tôi—cùng với các đối tác tư vấn bao gồm McKinsey & Company, Boston Consulting Group (BCG) và Bain & Company—giúp các tổ chức xác định các trường hợp sử dụng có tác động cao, tích hợp mô hình vào môi trường doanh nghiệp và thúc đẩy các kết quả có thể đo lường. Nếu bạn muốn khám phá những cách OpenAI dành cho lĩnh vực Khoa học đời sống có thể hỗ trợ công việc của mình, bạn có thể liên hệ với đội ngũ Khoa học đời sống của chúng tôi.
Đây là bản phát hành đầu tiên trong dòng mô hình Khoa học Sự sống của chúng tôi, và chúng tôi xem đây là khởi đầu cho một cam kết dài hạn nhằm xây dựng AI có thể thúc đẩy khám phá khoa học trong những lĩnh vực có ý nghĩa sâu sắc đối với xã hội, từ sức khỏe con người đến nghiên cứu sinh học rộng hơn. Chúng tôi sẽ tiếp tục cải thiện khả năng suy luận sinh học của mô hình, mở rộng hỗ trợ cho các quy trình nghiên cứu dài hạn và đòi hỏi nhiều công cụ, đồng thời hợp tác chặt chẽ với các tổ chức khoa học hàng đầu để đánh giá tác động thực tiễn. Điều đó bao gồm các mối quan hệ đối tác đang diễn ra với các phòng thí nghiệm quốc gia như Phòng thí nghiệm Quốc gia Los Alamos, nơi chúng tôi đang khám phá việc thiết kế protein và chất xúc tác có sự hướng dẫn của AI, bao gồm cả khả năng của các hệ thống AI trong việc sửa đổi các cấu trúc sinh học đồng thời duy trì hoặc cải thiện các đặc tính chức năng then chốt.
Theo thời gian, chúng tôi kỳ vọng những hệ thống này sẽ trở thành các đối tác ngày càng hiệu quả hơn trong quá trình khám phá — hỗ trợ các nhà khoa học tiến nhanh hơn từ câu hỏi đến bằng chứng, từ bằng chứng đến hiểu biết, và từ hiểu biết đến các phương pháp điều trị mới cho bệnh nhân.


