今天,我們推出前沿推理模型 GPT‑Rosalind,支援生物學、藥物開發與轉譯醫學領域的研究。這個生命科學模型系列專為科學工作流程設計,結合更強的工具運用能力與更深入的理解,涵蓋化學、蛋白質工程與基因體學。
平均而言,在美國,一款新藥從標的發現到取得主管機關核准,大約需要 10 至 15 年。在研究早期取得的進展,會在後續階段持續放大,帶來更好的標的選擇、更扎實的生物學假說,以及更高品質的實驗。生命科學的進展不僅受限於科學本身的難度,也深受研究工作流程複雜性的影響。科學家必須同時處理大量文獻、專業資料庫、實驗數據,以及持續演變的假設,才能提出並驗證新想法。這些工作流程通常耗時、零散,而且難以擴展規模。
我們相信,先進的 AI 系統能幫助研究人員更快推進這些工作流程。不只提升既有工作的效率,也能協助科學家探索更多可能性、找出原本可能被忽略的關聯,並更早提出更好的假設。此模型支援證據整合、假設生成、實驗規劃及其他多步驟研究任務,目的在於協助研究人員加速探索早期的發現階段。長遠來說,這些系統有望協助生命科學機構實現原本難以達成的突破,並顯著提高成功率。
GPT‑Rosalind 現已在 ChatGPT、Codex 和 API 中以研究預覽形式提供,符合資格的客戶可透過受信任存取計畫使用。我們也推出適用於 Codex 的免費生命科學研究外掛程式,協助科學家將模型連接至超過 50 種科學工具與資料來源。我們正與 Amgen、Moderna、Allen Institute、Thermo Fisher Scientific 等客戶合作,將 GPT‑Rosalind 應用於加速研究與發現的各項工作流程。
此模型以 Rosalind Franklin 命名。她嚴謹的研究揭示了 DNA 的結構,為現代分子生物學奠定基礎。
從原始資料到有憑有據的發現決策,了解我們專為研究打造的模型如何加速研究工作流程。
GPT‑Rosalind 生命科學模型系列專為現代科學工作打造,支援整合已發表的證據、資料、工具與實驗。在我們的評估中,對於需要針對分子、蛋白質、基因、途徑及與疾病相關的生物學進行推理的任務,模型表現領先;在文獻回顧、序列到功能的解讀、實驗規劃與資料分析等多步驟工作流程中,也更擅長運用科學工具與資料庫。
這是 GPT‑Rosalind 生命科學模型系列的首個版本。我們將持續拓展模型在長時程且高度依賴工具的科學工作流程中的生化推理能力,並進一步提升其前沿能力。OpenAI 的運算基礎設施讓我們能持續針對真實科學任務訓練、評估並改進能力日益提升的領域模型,讓系統在工作流程變得更複雜時,仍能保持實用性。
從以實證為基礎的探索洞察到高影響力的實驗,了解我們的一系列解決方案如何轉化為研究工作流程中可衡量的改善。
我們正與頂尖製藥、生物科技與研究客戶,以及生命科學技術機構合作,將 GPT‑Rosalind 應用於推動科研發現的各項工作流程。
「生命科學領域在每一步都要求精準。問題極為複雜,資料高度獨特,而且影響層面極高。我們與 OpenAI 的合作,讓我們能以嶄新方式運用其最先進的能力與工具,並有機會加快將藥物送達患者手中的速度。」
我們評估了 GPT‑Rosalind 在一系列對科學探索與產業研究至關重要的能力上的表現。這些評估衡量跨科學子領域的核心推理能力,包括化學反應機制、蛋白質結構、突變效應與交互作用,以及 DNA 序列的系統發育判讀。評估也會檢視模型是否能支援真實研究工作流程,例如解讀實驗輸出、識別與專家相關的模式,以及整合外部資訊以設計後續實驗。最後,評估會測試模型是否能選擇並運用合適的運算工具、資料庫及特定領域能力,藉此增強推理能力。整體而言,這些評估顯示模型在科學研究的端對端流程中已有進展,也展現出更強的能力,能協助研究人員處理具挑戰性的探索任務。
我們在多項公開基準測試中評估 GPT‑Rosalind 的表現。在 BixBench 這項以真實生物資訊學與資料分析為核心設計的基準測試中,GPT‑Rosalind 在已公布分數的模型中表現領先。
在 LABBench2 這項涵蓋文獻檢索、資料庫存取、序列操作與實驗流程設計等多種研究任務的基準測試中,GPT‑Rosalind 在 11 項任務中有 6 項表現優於 GPT‑5.4。最顯著的提升來自 CloningQA。這項任務要求為分子克隆流程端到端設計 DNA 與酵素試劑。
我們也與 Dyno Therapeutics 合作。該公司率先開發 AI 設計的基因療法。我們使用未發表且未受污染的序列,在 RNA 序列到功能的預測與生成任務中評估此模型。我們將模型表現與 AI 生物領域人類專家的 57 筆歷史分數進行比較。在 Codex 應用程式中直接評估時,十次取樣中的最佳結果,在預測任務上高於人類專家的第 95 百分位,在序列生成任務上則約落在第 84 百分位。
這些評估提供具參考價值的效能指標,反映模型在科學家日常仰賴的工作流程中的表現,包括產出證據、分析複雜資料,以及推導出具充分依據的生物學結論。
科學家現在可在 GitHub 上使用我們全新推出、適用於 Codex 的生命科學研究外掛程式(在新視窗中開啟)。此套件提供一系列模組化能力,涵蓋大多數常見研究工作流程,支援人類遺傳學、功能基因體學、蛋白質結構、生物化學、臨床證據與公開研究探索等領域。

這些能力可作為協調層,協助科學家更有效率地處理範圍廣泛、定義模糊且涉及多步驟的問題。它們可連接超過 50 個公開多體學資料庫、文獻來源與生物學工具,並為常見且可重複的工作流程提供靈活的起點,例如蛋白質結構查詢、序列搜尋、文獻回顧與公開資料集探索。
符合資格的企業用戶可在研究工作流程中搭配 GPT‑Rosalind 使用此外掛程式,進行更深入的生物學推理;所有使用者也可將此套件與我們的主線模型一併使用。
我們希望讓這些能力提供給最有條件推動人類健康進展的科學家與研究機構,同時維持嚴格的防護措施,防範生物領域的濫用。生命科學模型將率先透過受信任存取的部署架構推出,初期開放給美國符合資格的 Enterprise 客戶,並針對資格審核、存取管理與組織治理設有控管機制。同時,我們也將擴大提供一組連接器與生命科學研究外掛程式,讓研究人員能更有效運用我們的主線模型處理生命科學研究任務。
生命科學模型在開發時導入更嚴密的企業級安全控管與強化的存取管理,支援在具備治理機制的研究環境中進行專業科學應用。我們依據三項核心原則評估存取資格:有益用途、健全治理與安全監督,以及具備企業級安全性的受控存取。實務上,參與的機構必須從事具備明確公共利益的正當科學研究,維持適當的治理、合規與防止濫用的控管機制,並將存取權限限制於安全且管理完善環境中的經核准使用者。此外,機構也必須同意生命科學研究預覽條款並遵守 OpenAI 的使用政策。我們也可能在註冊或持續參與過程中要求提供補充資訊。
機構可透過我們的資格與安全審查流程申請存取權限。
在研究預覽期間,使用此模型不會消耗現有的積分或 Token,仍須遵循防濫用規則。隨著此計畫逐步擴展,我們會分享更多有關定價與供應情況的資訊。
生命科學模型旨在協助科學機構在同時要求技術能力與營運控制的環境中,以更快的速度完成更高品質的工作。我們的生命科學專責團隊,以及包括 McKinsey & Company、Boston Consulting Group(BCG)和 Bain & Company 在內的顧問合作夥伴,會協助機構找出高影響力的使用情境、將模型整合至企業環境,並推動可量化的成果。如果想進一步了解 OpenAI 生命科學解決方案如何支援你的工作,可以聯絡我們的生命科學團隊。
這是我們生命科學模型系列的首個版本。我們將此視為一項長期承諾的起點,致力打造能加速科學發現的 AI,推動對社會具有深遠影響的領域發展,從人類健康到更廣泛的生物研究。我們將持續提升模型的生物推理能力,擴展對高度仰賴工具且長時程研究工作流程的支援,並與頂尖科學機構密切合作,評估實際應用中的影響。這也包括與洛斯阿拉莫斯國家實驗室等機構建立長期合作關係。我們正與這些機構探索 AI 引導的蛋白質與催化劑設計,包括在保留或提升關鍵功能特性的同時,調整生物結構的能力。
我們預期這些系統將逐漸成為探索過程中能力持續提升的合作夥伴,協助科學家更快從問題走向證據、從證據走向洞察,並從洞察發展出新的治療方式。


