跳到主要內容
OpenAI

2026年4月16日

研究發佈

面向生命科學研究的 GPT‑Rosalind 登場

一個專為加快科研和藥物研發而設的新模型。

今日,我們推出全新前沿推理模型 GPT‑Rosalind,旨在支援生物學、藥物研發和轉化醫學領域的研究。生命科學模型系列針對科研工作流程作出優化,結合更佳的工具使用能力,以及在化學、蛋白質工程和基因組學方面更深入的理解。

平均而言,在美國,從發現藥物靶點到新藥獲監管批准,大約需時 10 至 15 年。在研發最初階段取得的進展,會在後續流程中逐步累積,帶來更理想的靶點選擇、更扎實的生物學假設,以及更高質素的實驗。在研發最初階段取得的進展,會在後續流程中逐步累積,帶來更理想的靶點選擇、更扎實的生物學假設,以及更高質素的實驗。科研人員必須處理大量文獻、專門數據庫、實驗數據,以及不斷演變的假設,才能提出並評估新想法。這些工作流程往往非常花時間、零散,而且難以擴展。

我們相信,先進 AI 系統可以協助研究人員更快推進這些工作流程。這不單能提升現有工作的效率,亦可幫助科研人員探索更多可能性、找出原本可能被忽略的關聯,並更早提出更好的假設。這個模型可以支援證據整合、假設生成、實驗規劃,以及其他多步驟研究任務,旨在協助研究人員加快研發初期階段的工作。長遠而言,這些系統有望協助生命科學機構實現原本未必可能達成的突破,並以更高成功率推進科研發現。

GPT‑Rosalind 現已透過我們的可信存取計劃,以研究預覽形式在 ChatGPT、Codex 及 API 中向合資格客戶提供。我們亦推出可免費使用的 Codex 生命科學研究外掛程式,協助科研人員將模型連接至超過 50 個科研工具和數據來源。我們正與 Amgen、Moderna、Allen Institute、Thermo Fisher Scientific 等客戶合作,將 GPT‑Rosalind 應用於可加快研究與科研突破的工作流程。

這個模型以 Rosalind Franklin 命名。她嚴謹的研究協助揭示 DNA 的結構,並為現代分子生物學奠下基礎。

由原始數據到有根有據的科研決策,看看我們專門打造的模型如何加快研究工作流程。

專為科研工作流程而設

GPT‑Rosalind 生命科學模型系列專為現代科研工作而設,可處理已發表證據、數據、工具及實驗。在我們的評估中,模型在需要對分子、蛋白質、基因、通路及與疾病相關的生物學進行推理的任務上表現最佳;在文獻回顧、序列至功能解讀、實驗規劃和數據分析等多步驟工作流程中,亦能更有效運用科研工具及數據庫。

這是我們 GPT‑Rosalind 生命科學模型系列的首個版本,我們會繼續推進模型在長期、重度依賴工具的科研工作流程中的生化推理能力。OpenAI 的運算基礎架構讓我們能持續就真實科研任務訓練、評估和改進能力越來越強的領域模型,讓這些系統能隨著工作流程日趨複雜而變得更實用。

由以證據為本的科研分析見解,到具高影響力的實驗,看看我們一系列解決方案如何在你的研究工作流程中帶來可衡量的改進。

客戶與生態系統

我們正與領先的製藥、生物科技及研究客戶,以及生命科學技術機構合作,將 GPT‑Rosalind 應用於推動科研突破的工作流程。

「生命科學領域要求每一步都準確無誤。相關問題極其複雜,數據極其獨特,而每一項決定都關係重大。我們與 OpenAI 的獨特合作,讓我們能以嶄新方式運用最先進的能力與工具,並有望加快我們將藥物帶給病人的速度。」
—Amgen 人工智能與數據資深副總裁 Sean Bruich

表現與評估

我們針對一系列對科研突破及業界研究十分重要的能力,評估 GPT‑Rosalind 的表現。這些評估主要衡量模型在不同科研子領域的核心推理能力,包括化學反應機理、蛋白質結構、突變效應和相互作用,以及 DNA 序列的系統發育解讀。評估亦會檢視模型是否能支援真實研究工作流程,例如解讀實驗輸出、識別與專家判斷相關的模式,以及整合外部資訊來設計後續實驗。最後,評估亦測試模型是否能選取並運用合適的計算工具、數據庫和領域專屬能力,進一步提升推理表現。整體而言,這些評估顯示模型在科研端到端流程上有所進展,亦反映模型更有能力協助研究人員處理具挑戰性的科研發現任務。

提示詞

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

業界評估

我們在一系列公開基準測試中評估 GPT‑Rosalind。在 BixBench 這個根據真實生物資訊學和數據分析工作設計的基準測試中,GPT‑Rosalind 在已公佈分數的模型之中表現領先。

LABBench2 評估包括文獻擷取、數據庫存取、序列操作及研究方案設計等多種研究任務表現,在這項基準測試中,GPT‑Rosalind 在 11 項任務中有 6 項表現比 GPT‑5.4 優勝。其中最顯著的提升來自 CloningQA。這項測試要求模型為分子克隆研究方案端到端設計 DNA 及酶試劑。

我們亦與致力開發由 AI 設計基因療法的 Dyno Therapeutics 合作,使用未公開、未受污染的序列,評估模型在 RNA 序列至功能預測和生成任務上的表現。模型表現與 AI 生物學領域人類專家過往 57 個歷史分數作比較。在 Codex 應用程式中直接評估時,模型最佳十次提交在預測任務上的表現高於 95 百分位的人類專家,而在序列生成任務上的表現則約為 84 百分位的人類專家。

這些評估為科研人員日常依賴的工作流程提供了有意義的表現參考,包括生成證據、分析複雜數據,以及邁向具充分理據的生物學結論。


連接科研人員使用的工具

科研人員現可使用我們全新推出、適用於 Codex 的生命科學研究外掛程式(在新視窗中開啟),今日起已在 GitHub 提供。這個套件包含一系列廣泛而模組化的技能,涵蓋最常見的科研工作流程,旨在協助用戶處理人類遺傳學、功能基因組學、蛋白質結構、生物化學、臨床證據及公開研究探索等工作。

生命科學外掛程式示範靜態圖片

這些技能充當一個編排層,協助科研人員更有效處理廣泛、模糊而多步驟的問題。它們可連接超過 50 個公開多組學數據庫、文獻來源和生物學工具,並為常見且可重複的工作流程提供靈活起點,例如蛋白質結構查找、序列搜尋、文獻回顧及公開數據集探索。

合資格的 Enterprise 用戶可在研究工作流程中配合 GPT‑Rosalind 使用此外掛程式,以進行更深入的生物學推理;而所有用戶都可把此外掛套件與我們的主線模型一併使用。

可信存取

我們希望讓最有條件推動人類健康進步的科研人員和研究機構可以取用和掌握這些能力,同時維持針對生物濫用的強力保障。生命科學模型將首先透過可信存取部署架構,向美國合資格 Enterprise 客戶推出,並在資格審核、存取管理和機構管治方面設有相應控制。同時,我們亦會更廣泛提供一系列連接器和生命科學研究外掛程式,讓研究人員可以更有效使用我們的主線模型處理生命科學研究任務。

生命科學模型在開發過程中採用了更高級別的企業安全控制和更嚴格的存取管理,以支援受管治研究環境中的專業科研使用。我們會根據三項核心原則評估存取資格:用途具實際效益、具備完善的管治與安全監督,以及在企業級安全保障下實施受控存取。實際上,這代表參與機構必須從事正當而有明確公共利益的科研工作;維持適當的管治、合規及防止濫用措施;並只容許獲批准用戶在安全且管理完善的環境中存取。機構亦必須同意生命科學研究預覽條款,並遵守 OpenAI 的使用政策;在加入計劃或持續參與期間,我們亦可能要求提供額外資料。

開始使用

機構可以透過我們的資格審核及安全審查程序申請存取權限

在研究預覽期間,使用此模型不會消耗現有積分或 Token,但須受濫用防護措施的約束。隨著計劃擴展,我們將分享更多有關收費方式和可用性的詳情。

生命科學模型旨在協助科研機構在同時要求技術能力和營運控制的環境中,以更快速度完成更高質素的工作。我們專責的生命科學團隊,以及 McKinsey & Company、Boston Consulting Group (BCG) 和 Bain & Company 等顧問合作夥伴,會協助機構識別高影響力用例,將模型整合至企業環境,並推動可衡量的成果。如果你想進一步了解 OpenAI 生命科學如何支援你的工作,歡迎聯絡我們的生命科學團隊

展望將來

這是我們生命科學模型系列的首個版本,我們視之為一項長期承諾的起點,致力打造可加快科研突破的 AI,關注對社會深切重要的領域,推動從人類健康到更廣泛的生物學研究。我們將繼續提升模型的生物學推理能力,擴展對重度依賴工具和長期研究工作流程的支援,並與領先科研機構緊密合作,評估其真實世界影響。這包括與 Los Alamos National Laboratory 等國家實驗室保持合作,在當中探索 AI 引導的蛋白質及催化劑設計,包括 AI 系統在保留或提升關鍵功能特性的同時修改生物結構的能力。

長遠而言,我們預期這些系統會成為科研突破中越趨強大的合作夥伴,協助科研人員更快由問題走向證據、從證據得出深入見解,並將分析見解轉化為可協助病人的新療法。