跳至主要內容
OpenAI

2026年6月3日

產品研究發布

為 GPT‑Rosalind 推出新能力

為生命科學產業帶來植基於真實科學工作流程的更高智慧。

GPT‑Rosalind 系列我專為企業規模生命科學研究打造,我們正為其推出模型更新。GPT‑Rosalind 結合 GPT‑5.5 的智慧體式程式碼編寫與工具使用能力,以及在藥物化學和基因體學等核心藥物探索領域更強的模型智慧,同時提升更廣泛生命科學分析、設計和實驗工作流程的效能。

生命科學的進展取決於跨尺度與跨模態整合資料和證據:分子、基因、路徑與生命系統。在我們的評估中,更新後的 GPT‑Rosalind 在生物學專家提出的研究任務、複雜藥物化學查詢、定量生物學,以及濕實驗室疑難排解方面都展現廣泛的效能提升。

GPT‑Rosalind 現已透過我們的可信存取部署架構,以研究預覽形式向全球符合資格的機構提供。

提升在具科學價值任務上的效能

為了衡量並持續改善 GPT‑Rosalind 的真實世界影響,我們設計了 LifeSciBench,這是一項由外部專家評審、聚焦於生命科學研究基礎面向的基準測試。不同於既有基準測試只孤立評估模型效能或生物領域的單一組成部分,LifeSciBench 以端到端視角看待具科學價值的工作,從生命科學研究核心的六個工作流程領域取樣任務:證據處理、分析、設計與最佳化、科學推理、驗證與營運,以及轉譯與溝通。我們使用這項基準測試,讓進展與生命科學研究的需求和現實對齊。

GPT‑Rosalind 在產業與學術專家識別的具科學價值任務中效能領先。

從論文、圖表、表格與實驗紀錄中擷取、調和並稽核科學證據。

新範例

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

候選回應

結論:就目前呈現而言,此套件不足以支持以微肌萎縮蛋白表現作為合理可能預測臨床效益的替代端點來加速核准。持懷疑態度的 FDA 審查員可能會認為生物標誌物、功能、持久性、安全性與可概化性證據實質上支持不足。

套件項目

關鍵失敗模式

需要什麼

Western blot 定量

MANEX1A 結合內源性全長肌萎縮蛋白與微肌萎縮蛋白轉基因共有的 N 端表位,因此檢測無法清楚區分轉基因與殘留/返祖肌萎縮蛋白。以健康全長肌萎縮蛋白標準品來定量 138 kDa 微肌萎縮蛋白也是無效的。

使用重組微肌萎縮蛋白標準品,以及可區分轉基因與內源性肌萎縮蛋白的正交方法,例如靶向質譜或轉基因特異性/表位特異性檢測。

免疫螢光

C 端多株抗體並不適合,因為 138 kDa 構築體缺少 C 端結構域。許多 DMD 患者有返祖纖維,而返祖肌萎縮蛋白可保留 C 端表位。返祖纖維可能隨年齡克隆性擴增,使 IF 訊號產生偏差,尤其是在較年長男孩中。

使用針對存在於轉基因、但不存在於返祖肌萎縮蛋白之表位的抗體重複 IF。將轉基因陽性纖維與返祖纖維分開定量。

替代端點有效性

此套件混淆了蛋白質量與臨床功能。「健康對照蛋白質質量的 38%」不代表正常肌萎縮蛋白功能的 38%,因為微肌萎縮蛋白在結構上被截短。

在將表現量視為替代端點前,需實證驗證微肌萎縮蛋白質量百分比、肌膜定位、下游功能恢復與臨床效益之間的關係。

活檢設計

治療前後對側股外側肌活檢會引入左右差異與肌內空間變異。疾病進展與纖維脂肪替代也可能改變以總蛋白標準化的訊號。

使用一致解剖標誌標準化活檢部位,以肌肉特異性蛋白標準化,並同步測量纖維脂肪組成。

NSAA 比較組/統計

外部自然史隊列不是隨機同步對照。試驗資格、支持性照護、參與效應、基線 NSAA、類固醇療程、年齡與外顯子類別都可能使比較產生偏差。未配對 t 檢定並不足夠。此外,+1.4 NSAA 變化位於此年齡層的重測變異範圍內。

進行隨機同步安慰劑對照研究,或至少使用校正分析,納入基線 NSAA、年齡、類固醇療程、外顯子類別與其他混雜因子。

年齡窗口混雜

4–7 歲男孩處於發育窗口,未治療的可行走 DMD 患者可能在衰退主導前獲得運動功能。48 週 NSAA 變化混合了發育增益、疾病進展與可能的治療效果。

使用按年齡分層的同步隨機對照,以將發育軌跡與治療效果分開。

先前臨床先例

開放標籤微肌萎縮蛋白功能訊號並未可靠預測確證性效益;已發表先例包括微肌萎縮蛋白基因治療確證性試驗未能重現開放標籤 NSAA 改善。

不要依賴開放標籤 NSAA 變化作為決定性支持。需有受控功能證據。

構築體的結構限制

138 kDa 構築體刪除了含 nNOS 結合位點的 spectrin repeats R16/17。nNOS 招募喪失可能損害運動期間局部抑制交感神經性血管收縮的能力與缺血保護作用,形成與表現量無關的機制性救援上限。

增加機制研究,顯示此特定構築體是否恢復相關肌萎縮蛋白相關複合體功能、nNOS 定位、運動生理與肌肉保護。

AAV 持久性

12 週時的載體基因組不能證明表現持久。AAV9 基因組多為非整合型游離體,可能隨時間下降。載體基因組持續存在不等於蛋白質持續表現。

測量超過 12 週的縱向轉基因蛋白表現與功能生物標誌物持久性。

免疫/安全性概況

12 名患者中 8 名出現轉氨酶升高,與對 AAV 轉導細胞的免疫反應一致,但機制尚未確立。考量 AAV9 的心臟趨向性,一例心肌炎令人擔憂。

提供更深入的免疫監測、肝臟/心臟安全性表徵,以及強化心臟追蹤。

患者選擇/可概化性

排除抗 AAV9 中和抗體陽性患者會限制可概化性。排除外顯子 44 缺失會限制對該 DMD 亞群的適用性。n=12 太小,無法表徵更廣泛 DMD 族群中的安全性與療效。

在可能情況下擴大納入資格,或在使用結果支持廣泛核准前,預先指定按抗體狀態、基因型/外顯子類別、年齡與基線功能分層的分析。

法規結論:此套件可能顯示生物活性,但尚未確立測得的微肌萎縮蛋白表現是合理可能預測臨床效益的可靠替代指標。主要缺口包括檢測特異性、無效的定量標準、可能的返祖纖維混雜、缺乏隨機對照、年齡相關 NSAA 混雜、不確定持久性,以及未解決的安全性/可概化性問題。

為縮小缺口,該計畫需要受控、按年齡分層的臨床設計,搭配轉基因特異性表現檢測、正交蛋白定量、組織組成控制、縱向持久性資料、截短構築體的機制性功能檢測,以及更強安全性監測,尤其是肝臟與心臟。

評分標準與等級

評分標準
分數
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

更強的科學推理

藥物化學

GPT‑Rosalind 在藥物化學方面達到業界領先效能;藥物化學是一門專注於將分子轉化為有用藥物的領域。我們設計 MedChemBench 以反映真實的藥物化學工作流程,評估多模態化學結構理解、結構-活性關係(SAR)、藥物效力、毒性,以及吸收、分布、代謝、排泄(ADME)預測、多參數先導化合物最佳化決策,以及逆合成。在 MedChemBench 上,GPT‑Rosalind 以 27.5% 對 25.1% 優於 GPT‑5.5,同時少用 7.2% 的 Token。

GPT‑Rosalind 在藥物化學領域展現更強的多模態資訊整合能力與機制推理能力。

基因體學與定量生物學

在 GeneBench(我們針對基因體學與定量生物學中長時間跨度、端到端分析的智慧體評估),GPT‑Rosalind 比 GPT‑5.5 少用 31% Token,同時將準確率提升至 21.6%,高於 GPT‑5.5 的 20.4%。GeneBench 評估長時間跨度定量任務中的智慧體效能:基於真實科學資料,智慧體能否規劃有效的分析、QC、建模與校正,得出與決策相關的答案?納入的問題涵蓋多種領域,包括功能基因體學、空間轉錄體學、蛋白質體學、表觀基因體學與應用遺傳學。

GPT‑Rosalind 比 GPT‑5.5 少用 31% 的 Token,且準確率有所提升。

協助真實世界的實驗室工作

我們推出一項新評估,用以測試 GPT‑Rosalind 協助科學家在真實世界進行實驗室工作的能力。LabWorkBench 測試模型在科學家使用的真實濕實驗室流程中,將擾動連結到實驗結果的能力,目的涵蓋疑難排解到最佳化。LabWorkBench 使用的資料屬於專有資料,因此未受污染。GPT‑Rosalind 得分為 63.2%,高於 GPT‑5.5 的 55.8%,同時少用 5.3% 的 Token。

在真實濕實驗室流程協助方面,GPT‑Rosalind 較 GPT‑5.5 顯著提升,同時改善 Token 效率。

從推理到執行工作流程

我們建置了 Life Sciences Research(在新視窗中開啟)Life Sciences NGS Analysis(在新視窗中開啟) 外掛程式,為 GPT‑Rosalind 提升後的智慧延伸出可重複科學工作流程的實用執行層。這些外掛程式共同把有來源的證據檢索、生物學詮釋與生物資訊執行帶入同一個工作區,協助研究人員連結外部證據與內部體學分析,同時保留成品與來源脈絡。所有使用者現在都可透過 Codex 存取這兩個外掛程式。符合資格的 GPT‑Rosalind 企業使用者還可以使用 GPT‑Rosalind 來驅動這些外掛程式。

為了讓科學家更充分運用 Codex 這個動態工作台,我們新增了生物原生檔案類型的互動式檢視器。初始的序列、比對與結構檢視器旨在讓科學家在 GPT‑Rosalind 跨工作流程推理時貼近證據,並使用目前檢視器的脈絡直接回答後續問題。

上方示範展示了這些由 GPT‑Rosalind 編排的能力如何運作。我們跟隨一位科學家研究液體腫瘤活檢,以識別可能提供治療資訊的突變與其他分子變化。Life Sciences NGS Analysis 外掛程式將已處理 ctDNA 紀錄的審查轉為互動式筆記本,呈現反覆出現的變異、低頻判讀與樣本軌跡,使研究聚焦於 KRAS G12C。接著,Life Sciences Research 外掛程式加入有來源的靶點、抑制劑與抗藥性脈絡,而原生序列、比對與結構檢視器讓科學家直接檢視突變殘基 12、其在 RAS 家族中的保守性,以及抑制劑結合口袋。工作流程最後將這些證據轉譯為具體的後續選項,每個步驟與成品都可供專家審查。

電腦螢幕顯示一個工作區,指示使用 NGS Analysis 外掛探索 ctDNA 突變資料。畫面包含數個標示為「主要詳細機構學」與「依突變 cfDNA 樣本排序的主要變異基因」的長條圖,顯示癌症類型與基因變異資料。文字描述資料集、關鍵發現與分析參數。

Life Sciences NGS Analysis 外掛程式

scRNA-seq QC & 註釋

螢幕截圖顯示生物資訊工作流程分割畫面。左側面板顯示 AI 助理摘要已完成的單細胞 RNA 定序(scRNA-seq)品質控制分析,包括產生的檔案、QC 指標、UMAP 視覺化與細胞類型註釋。右側面板顯示「scRNA QC Review」報告,包含總計數、偵測到的基因與粒線體百分比直方圖,以及顯示 QC 通過/不通過計數與篩選後細胞族群的長條圖。介面顯示在藍綠漸層背景上。

將 10x 風格矩陣套件轉換為經 QC 篩選、可在 Codex 中檢查與修訂的單細胞成品、註釋與 UMAP。Life Sciences NGS Analysis 外掛會將請求路由至 scrna-seq-qc,依資料選擇 QC 門檻,保留篩選與註釋周邊的來源脈絡,並呈現缺少 doublet 偵測相依項等阻礙。

大量 RNA-seq FASTQ QC

RNA-seq 工作流程的分割畫面:左側 AI 助理摘要已完成的大量 RNA-seq 品質控制結果,右側顯示包含定序統計與 Salmon 指標的互動式 MultiQC 報告。

將大量 RNA-seq 樣本表、FASTQ 套件與參考檔轉換成經 QC 審查、可在 Codex 中檢查與重複使用的計數套件。Life Sciences NGS Analysis 外掛會路由請求、驗證輸入,並回傳可稽核的執行封套,其中包含 MultiQC、Salmon 矩陣、來源脈絡與明確注意事項。

為受信任機構擴大存取

我們正在將 GPT‑Rosalind 系列的存取擴展至全球符合資格的機構。GPT‑Rosalind 將透過我們的可信存取部署架構,以研究預覽形式提供給正在進行具明確公共利益的合法科學研究、具備強健治理與安全監督,並以企業級安全性控管存取的機構。

作為這項全球擴展的一部分,我們很高興協助支援 Novo Nordisk 透過 GPT‑Rosalind 協助 Novo Nordisk 擴大醫學研究規模,推進其加速將創新治療方案帶給患者的使命。Novo Nordisk 正運用前沿 AI 能力,協助研究人員分析複雜資料集、發掘有用模式,並更快速地檢驗假設。GPT‑Rosalind 更強的生物學理解將協助團隊連結文獻、基因體學、轉錄體學、序列、結構與實驗結果中的證據,使從資料走向更清晰研究決策變得更容易。

「生命科學研究複雜、資料豐富且跨學科。為了為研究人員提供有意義的價值,先進 AI 模型必須植基於可信的科學資料,連結至經驗證的工具,並整合到研究人員每天使用的真實工作流程中。我們很高興能與 OpenAI 合作,並有機會探索 GPT‑Rosalind 如何支持更嚴謹、實用的藥物探索方法。」

Mishal Patel,Novo Nordisk 研發部 AI 與數位創新資深副總裁

我們現在也為沒有 Enterprise 帳戶的合格機構提供 OpenAI 代管工作區。

下一步

更新後的 GPT‑Rosalind 是我們更廣泛承諾中的下一步:建構能協助加速科學發現的 AI 系統,同時確保先進生物能力以適當防護措施部署。我們將持續改善模型的生物學推理,擴大對工具密集與長時間跨度研究工作流程的支援,並與各地區符合資格的機構合作評估真實世界影響。

這也意味著將生命科學 AI 應用於具高影響力的公共利益工作,從藥物探索與轉譯醫學,到公共衛生、準備工作與生物防禦。透過 Rosalind Biodefense 與我們的可信存取部署模型,我們的目標是把前沿生物能力交到致力於改善人類健康並強化社會韌性的研究人員、機構與防衛者手中。

我們將持續打造 GPT‑Rosalind,使其成為整個科學研究生命週期中更有能力的夥伴,協助科學家更快從正確問題走向更清晰證據、更好的實驗,並最終為患者帶來新療法。