2026年6月3日

GPT‑Rosalind 推出新能力

为生命科学行业带来扎根真实科学工作流的更强智能

我们正在为专为企业规模生命科学研究打造的 GPT‑Rosalind 系列推出新的模型更新。它将 GPT‑5.5 的智能体编程和工具使用能力，与药物化学、基因组学等核心药物发现领域中更强的模型智能相结合，同时提升更广泛生命科学分析、设计和实验工作流的表现。

生命科学的进步依赖于跨尺度、跨模态综合数据和证据：分子、基因、通路和生命系统。在我们的评估中，更新后的 GPT‑Rosalind 在生物学专家研究任务、复杂药物化学查询、定量生物学和湿实验室故障排查方面均有广泛性能提升。

GPT‑Rosalind 现已通过我们的可信访问部署结构，以研究预览形式向全球符合条件的组织开放。

提升在具有科学价值任务上的表现

为衡量并持续改进 GPT‑Rosalind 的现实影响，我们设计了 LifeSciBench，这是一个由外部专家评判、聚焦生命科学研究基础方面的基准。不同于现有基准孤立评估模型性能的单一组件或生物学领域，LifeSciBench 以端到端视角衡量具有科学价值的工作，任务来自生命科学研究的六个核心工作流领域：证据处理、分析、设计与优化、科学推理、验证与运营，以及转化与传播。我们使用这一基准，使进展与生命科学研究的需求和现实保持一致。

GPT‑Rosalind 在行业和学术专家确定的具有科学价值任务中表现领先。

从论文、图表、表格和实验记录中提取、协调并审计科学证据。

评估示例

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

备选回复

底线：按目前呈现的资料包，其强度不足以支持将微抗肌萎缩蛋白表达作为合理可能预测临床获益的替代终点来加速批准。持怀疑态度的 FDA 审评员可能会认为生物标志物、功能、持久性、安全性和普适性证据均存在实质性支持不足。

资料包项目	关键失败模式	所需内容
Western blot 定量	MANEX1A 结合内源性全长抗肌萎缩蛋白和微抗肌萎缩蛋白转基因共有的 N 端表位，因此该检测无法清晰区分转基因与残余/回复突变抗肌萎缩蛋白。用健康全长抗肌萎缩蛋白标准品来定量 138 kDa 微抗肌萎缩蛋白也是无效的。	使用重组微抗肌萎缩蛋白标准品，以及可区分转基因与内源性抗肌萎缩蛋白的正交方法，如靶向质谱或转基因特异性/表位特异性检测。
免疫荧光	C 端多克隆抗体并不适合，因为 138 kDa 构建体缺少 C 端结构域。许多 DMD 患者有回复肌纤维，而回复突变抗肌萎缩蛋白可保留 C 端表位。回复肌纤维可能随年龄克隆性扩增，使 IF 信号产生偏倚，尤其是在年龄较大的男孩中。	使用针对转基因中存在但回复突变抗肌萎缩蛋白中不存在表位的抗体重复 IF。将转基因阳性纤维与回复肌纤维分开定量。
替代终点有效性	该资料包将蛋白量与临床功能混为一谈。“健康对照蛋白质量的 38%”并不意味着正常抗肌萎缩蛋白功能的 38%，因为微抗肌萎缩蛋白在结构上被截短。	在将表达作为替代终点前，应经验性验证微抗肌萎缩蛋白质量百分比、肌膜定位、下游功能恢复与临床获益之间的关系。
活检设计	治疗前后对侧股外侧肌活检会引入左右侧和肌内空间变异。疾病进展和纤维脂肪替代也会改变按总蛋白归一化的信号。	使用一致解剖标志标准化活检部位，按肌肉特异性蛋白归一化，并同步测量纤维脂肪成分。
NSAA 比较组/统计	外部自然史队列不是随机同期对照。试验入选条件、支持治疗、参与效应、基线 NSAA、类固醇方案、年龄和外显子类别都可能使比较产生偏倚。非配对 t 检验并不足够。此外，+1.4 NSAA 变化处于该年龄组的重测变异范围内。	开展随机同期安慰剂对照研究，或至少使用校正分析，纳入基线 NSAA、年龄、类固醇方案、外显子类别和其他混杂因素。
年龄窗口混杂	4–7 岁男孩处于发育窗口，未经治疗的可行走 DMD 患者在衰退占主导前可能获得运动功能。48 周 NSAA 变化混合了发育增益、疾病进展和可能的治疗效应。	使用按年龄分层的同期随机对照，以将发育轨迹与治疗效应分开。
既往临床先例	开放标签微抗肌萎缩蛋白功能信号未能可靠预测确证获益；已发表先例包括微抗肌萎缩蛋白基因治疗确证试验未能复现开放标签 NSAA 改善。	不要把开放标签 NSAA 变化作为决定性支持。需要受控的功能证据。
构建体的结构限制	138 kDa 构建体删除了含 nNOS 结合位点的血影蛋白重复 R16/17。nNOS 招募丧失会损害运动期间的功能性交感溶解和缺血保护，形成独立于表达水平的机制性救援上限。	增加机制研究，显示该特定构建体是否恢复相关抗肌萎缩蛋白相关复合物功能、nNOS 定位、运动生理和肌肉保护。
AAV 持久性	12 周的载体基因组不能证明表达持久。AAV9 基因组大多是不整合的游离体，可能随时间下降。载体基因组持续存在并不等同于蛋白表达持续。	测量 12 周以后的纵向转基因蛋白表达和功能生物标志物持久性。
免疫/安全性特征	8/12 名患者出现转氨酶升高，与对 AAV 转导细胞的免疫反应一致，但机制尚未确定。鉴于 AAV9 的心脏嗜性，一例心肌炎令人担忧。	提供更深入的免疫监测、肝脏/心脏安全性表征，并强化心脏随访。
患者选择/普适性	排除抗 AAV9 中和抗体阳性患者会限制普适性。排除外显子 44 缺失会限制对该 DMD 亚组的适用性。n=12 太小，无法表征更广泛 DMD 人群的安全性和疗效。	在可能情况下扩大入选范围，或在使用结果支持广泛批准前，预先规定按抗体状态、基因型/外显子类别、年龄和基线功能进行分层分析。

监管结论：该资料包可能显示生物活性，但尚未确立测得的微抗肌萎缩蛋白表达是合理可能预测临床获益的可靠替代指标。主要缺口包括检测特异性、无效定量标准、可能的回复肌纤维混杂、缺乏随机对照、年龄相关 NSAA 混杂、持久性不确定，以及未解决的安全性/普适性问题。

为弥合差距，该项目需要采用受控、年龄分层的临床设计，并配备转基因特异性表达检测、正交蛋白定量、组织成分控制、纵向持久性数据、针对截短构建体的机制性功能检测，以及更强的安全监测，尤其是肝脏和心脏方面。

评分标准和等级

标准

分数

Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.

+24

Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.

+22

Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.

+19

Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.

+12

Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.

+15

Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.

更强的科学推理

药物化学

GPT‑Rosalind 在药物化学领域达到行业领先表现；该领域专注于将分子转化为有用药物。我们设计 MedChemBench 以反映真实药物化学工作流，评估多模态化学结构理解；构效关系（SAR）；药物效力、毒性和吸收、分布、代谢、排泄（ADME）预测；多参数先导优化决策；以及逆合成。在 MedChemBench 上，GPT‑Rosalind 以 27.5% 对 25.1% 优于 GPT‑5.5，同时少用 7.2% 的 Token。

GPT‑Rosalind 在药物化学中展现出更好的多模态综合和机制推理。

基因组学与定量生物学

在 GeneBench（我们针对基因组学和定量生物学中长程、端到端分析的智能体评估）上，GPT‑Rosalind 比 GPT‑5.5 少用 31% 的 Token，同时准确率更高，为 21.6% 对 20.4%。GeneBench 评估智能体在长程定量任务上的表现：基于真实科学数据，智能体能否规划有效的分析、QC、建模和校正，以得出与决策相关的答案？所含问题覆盖多种领域，包括功能基因组学、空间转录组学、蛋白质组学、表观基因组学和应用遗传学。

GPT‑Rosalind 比 GPT‑5.5 少用 31% 的 Token，同时提升准确率。

辅助真实世界实验室工作

我们推出一项新评估，用于测试 GPT‑Rosalind 帮助科学家开展真实世界实验室工作的能力。LabWorkBench 测试模型在科学家使用的真实湿实验室方案中，将扰动与实验结果联系起来的能力，目的涵盖故障排查到优化。LabWorkBench 使用的数据为专有数据，因此未受污染。GPT‑Rosalind 得分为 63.2%，GPT‑5.5 为 55.8%，同时少用 5.3% 的 Token。

在真实湿实验室方案辅助方面，GPT‑Rosalind 相比 GPT‑5.5 显著提升，同时提高了 Token 效率。

从推理到执行的工作流

我们构建了生命科学研究⁠（在新窗口中打开）和生命科学 NGS 分析⁠（在新窗口中打开）插件，为 GPT‑Rosalind 增强的智能扩展一个用于可重复科学工作流的实用执行层。这些插件共同将有来源的证据检索、生物学解读和生物信息学执行纳入同一工作空间，帮助研究人员在保留产物和溯源的同时，将外部证据与内部组学分析连接起来。所有用户现在都可通过 Codex 访问这两个插件。符合条件的 GPT‑Rosalind 企业用户还可使用 GPT‑Rosalind 为这些插件提供支持。

为更好地将 Codex 用作科学家的动态工作台，我们为生物学原生文件类型增加了交互式查看器。初始的序列、比对和结构查看器旨在让科学家在 GPT‑Rosalind 跨工作流推理时贴近证据，并可在上下文中使用活动查看器直接回答后续问题。

上方演示展示了由 GPT‑Rosalind 编排的这些能力如何发挥作用。我们跟随一位科学家研究液体肿瘤活检，以识别可为治疗提供信息的突变和其他分子变化。生命科学 NGS 分析插件将对已处理 ctDNA 记录的审查转化为交互式笔记本，呈现反复出现的改变、低频检出和样本轨迹，使调查聚焦于 KRAS G12C。随后，生命科学研究插件补充有来源的靶点、抑制剂和耐药性背景，而原生序列、比对和结构查看器让科学家直接检查突变残基 12、其在 RAS 家族中的保守性，以及抑制剂结合口袋。该工作流最终将这些证据转化为具体后续选项，并且每一步和产物都可供专家审查。

一台电脑屏幕显示一个工作空间，指示使用 NGS 分析插件探索 ctDNA 突变数据。屏幕包含多个柱状图，标注为“Top detailed histologies”和“Top altered genes by mutated cfDNA samples”，展示癌症类型和基因改变数据。文本描述了数据集、关键发现和分析参数。 — 生命科学 NGS 分析插件

scRNA-seq QC 与注释

分屏生物信息学工作流截图。左侧面板显示一位 AI 助手总结已完成的单细胞 RNA 测序（scRNA-seq）质量控制分析，包括生成的文件、QC 指标、UMAP 可视化和细胞类型注释。右侧面板显示“scRNA QC Review”报告，包含总计数、检测到的基因和线粒体百分比直方图，以及显示 QC 通过/失败计数和过滤后细胞群的柱状图。界面显示在蓝绿色渐变背景上。 — 将 10x 风格矩阵包转化为经 QC 过滤的单细胞产物、注释和 UMAP，可在 Codex 中检查和修订。生命科学 NGS 分析插件将请求路由到 scrna-seq-qc，根据数据选择 QC 阈值，保留过滤和注释的溯源，并呈现缺少双细胞检测依赖项等阻碍因素。

批量 RNA-seq FASTQ QC

RNA-seq 工作流的分屏视图：左侧 AI 助手总结已完成的批量 RNA-seq 质量控制结果，右侧显示包含测序统计和 Salmon 指标的交互式 MultiQC 报告。 — 将批量 RNA-seq 样本表、FASTQ 包和参考文件转化为经 QC 审核的计数包，可在 Codex 中检查和复用。生命科学 NGS 分析插件会路由请求、验证输入，并返回可审计的运行封套，包含 MultiQC、Salmon 矩阵、溯源和明确注意事项。

扩大可信组织的访问权限

我们正在向全球符合条件的组织扩大 GPT‑Rosalind 系列的访问权限。GPT‑Rosalind 将通过我们的可信访问部署结构以研究预览形式提供给相关组织，这些组织需开展具有明确公共利益的合法科学研究，具备强治理和安全监督，并以企业级安全控制访问。

作为此次全球扩展的一部分，我们很高兴支持 Novo Nordisk 的使命：借助 GPT‑Rosalind 扩展其医学研究，帮助更快地为患者带来创新治疗选择。Novo Nordisk 正在利用前沿 AI 能力，帮助研究人员分析复杂数据集、发现有用模式，并更快检验假设。GPT‑Rosalind 更强的生物学理解将帮助团队连接文献、基因组学、转录组学、序列、结构和实验结果中的证据，使从数据走向更清晰研究决策更容易。

“生命科学研究复杂、数据丰富且跨学科。要为研究人员交付有意义的价值，先进 AI 模型必须扎根于可信科学数据，连接经过验证的工具，并融入研究人员每天使用的真实工作流。我们很高兴能与 OpenAI 合作，并有机会探索 GPT‑Rosalind 如何支持更严谨、更实用的药物发现方法。”

Mishal Patel，Novo Nordisk 研发 AI 与数字创新集团副总裁

我们现在还为没有 Enterprise 账户的合格组织提供 OpenAI 托管工作空间。

申请访问

未来展望

更新后的 GPT‑Rosalind 是我们更广泛承诺的下一步：构建能够帮助加速科学发现的 AI 系统，同时确保先进生物能力在适当保障下部署。我们将继续提升模型的生物学推理，扩展对工具密集型和长程研究工作流的支持，并与各地区合格组织合作评估现实影响。

这也意味着将生命科学 AI 应用于具有高影响力的公共利益工作，从药物发现和转化医学到公共卫生、准备工作和生物防御。通过 Rosalind Biodefense 和我们的可信访问部署模式，我们旨在把前沿生物能力交到致力于改善人类健康、增强社会韧性的研究人员、机构和防御者手中。

我们将继续打造 GPT‑Rosalind，使其在科学研究全生命周期中成为更有能力的伙伴，帮助科学家更快从正确问题走向更清晰证据、更好实验，并最终为患者带来新疗法。

继续阅读

查看全部

以 GPT 5.6 推进性价比前沿

产品2026年7月30日

开启两项设置后，我们在 ARC-AGI-3 基准测试中的得分增至三倍

研究2026年7月29日

oai Science Academic Research Academic Research 1x1

Accelerating scientific discovery with ChatGPT for Academic Researchers

公司2026年7月29日