今天,我们正式推出 GPT‑Rosalind。这是一款前沿推理模型,旨在为生物学、药物研发及转化医学领域的科学研究提供支持。该生命科学系列模型针对科学工作流进行了优化,不仅提升了工具调用能力,更深化了对化学、蛋白质工程及基因组学的理解。
在美国,一种新药从靶点发现到获批上市,平均耗时约为 10 至 15 年。在研发早期阶段取得的进展,将对后续环节产生复利效应:有助于更精准地筛选靶点、提出更严谨的生物学假设,并设计更高质量的实验。目前,生命科学领域的发展不仅受限于基础科学的难度,还受制于科研流程本身的复杂性。科学家必须处理海量的文献、专业数据库及实验数据,并在不断演进的假设中反复推敲,以产生并评估新思路。这些流程通常非常耗时、环节碎片化,且难以大规模扩展。
我们相信,先进的 AI 系统能够协助科研人员加速完成这些流程。这不仅体现在提升现有工作的效率,更在于帮助科学家探索更多可能性、挖掘潜在关联,并更早地得出更优假设。通过支持证据合成、假设生成及实验规划等一系列多步骤科研任务,该模型旨在帮助研究者缩短早期研发周期。长远来看,这些系统有望助力生命科学机构实现突破性进展,并大幅提升研发成功率。
目前,GPT‑Rosalind 已通过我们的“受信访问计划 (trusted access program)”,向符合条件的客户在 ChatGPT、Codex 及 API 中开放研究预览。同时,我们还为 Codex 推出了免费开放的“生命科学研究插件”,协助科学家将模型连接至 50 多种科学工具及数据源。目前,我们正与安进 (Amgen)、莫德纳 (Moderna)、艾伦研究所 (Allen Institute) 及赛默飞世尔科技 (Thermo Fisher Scientific) 等合作伙伴携手,共同将 GPT‑Rosalind 应用于加速科研与发现的工作流中。
该模型以罗莎琳德·富兰克林 (Rosalind Franklin) 的名字命名,其严谨的研究成果揭示了 DNA 的结构,并为现代分子生物学奠定基础。
了解我们专为科研打造的模型如何加速研究工作流,包括原始数据、可靠的发现决策等环节。
GPT‑Rosalind 生命科学系列模型旨在应对涵盖学术文献、实验数据、科研工具及各类实验的现代科学挑战。根据我们的评估,该模型在涉及分子、蛋白质、基因、通路及疾病相关生物学的推理任务中表现卓越。在文献综述、序列功能解读、实验规划及数据分析等需要多步骤协作的工作流中,它在调用科学工具与数据库方面展现出更高的效能。
作为 GPT‑Rosalind 系列的首次发布,我们将持续拓展模型在长周期、重工具 (tool-heavy) 的科学工作流中的生化推理能力边界。依托 OpenAI 的计算基础设施,我们能够针对真实的科学任务,不断训练、评估并优化领域模型。随着科研流程复杂度的日益提升,这些系统也将随之变得更加高效实用。
了解我们的系列解决方案如何为科研工作流带来可衡量的显著提升,包括基于证据的发现洞察、高影响力实验等。
我们正与领先的制药公司、生物技术企业、科研机构,以及生命科学领域的科技组织展开合作,共同将 GPT‑Rosalind 应用于各类工作流,以全面推动科学发现。
“生命科学领域对每一步的精准度都有着极高的要求。这里面临的问题极其复杂,数据具有高度的独特性,且利害关系极其重大。我们与 OpenAI 的独特合作方式,使我们能够以创新的姿态应用其最尖端的能力与工具,这有望加快我们将药物交付至患者手中的速度。”
我们针对一系列对科学发现和行业研究至关重要的核心能力,对 GPT‑Rosalind 进行了全面评估。这些评估涵盖了各科学子领域的核心推理能力,包括:化学反应机制;蛋白质结构、突变效应及相互作用;以及 DNA 序列的系统发育解读。同时,评估还考察了模型对真实科研工作流的支持力度,例如解读实验结果、识别专家级模式,以及综合外部信息以设计后续实验。最后,我们测试了模型能否准确选择并调用计算工具、数据库及特定领域功能,以增强其推理能力。综合来看,这些评估结果展示了模型在端到端科研流程中的显著进展,表明其在辅助研究人员应对极具挑战性的研发任务方面,具备更强的实力。
我们在一系列公开基准测试中对 GPT‑Rosalind 进行了评估。在围绕真实生物信息学及数据分析设计的 BixBench 测试中,GPT‑Rosalind 在所有已公布评分的模型中名列前茅。
在衡量文献检索、数据库访问、序列操作和方案设计等科研任务的 LABBench2 测试中,GPT‑Rosalind 在 11 项任务中有 6 项表现优于 GPT‑5.4。其中最显著的提升体现在 CloningQA 任务上,该任务要求对分子克隆方案中的 DNA 和酶试剂进行端到端的设计。
此外,我们还与利用 AI 开启基因疗法先河的 Dyno Therapeutics 公司合作,使用未公开且无污染的序列数据,评估模型在 RNA 序列功能预测与生成任务中的表现。我们将评估结果与 AI 生物领域人类专家的 57 份历史评分进行了对比。在 Codex 应用中进行的直接测试显示,模型在十次提交中的最佳表现,在预测任务中排名超过了 95% 的人类专家,在序列生成任务中则超过了约 84% 的人类专家。
这些评估为模型在各类工作流中的表现提供了有力证明。科学家正是依赖这些工作流来获取证据、分析复杂数据,并得出具备科学依据的生物学结论。
从即日起,科学家可以从 GitHub 获取我们专为 Codex 打造的全新生命科学研究插件(在新窗口中打开)。该软件包为最常见的科研工作流提供了一套丰富的模块化技能,旨在协助用户开展人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据及公开研究检索等领域的工作。

这些技能构成了一个编排层 (orchestration layer),能有效协助科学家应对广泛、模糊且复杂的多步骤问题。通过该插件,用户可以访问 50 多个公开的多组学数据库、文献资源及生物学工具;对于蛋白质结构查询、序列搜索、文献综述及公开数据集检索等常见的重复性流程,它也提供了一个灵活的切入点。
符合条件的 Enterprise 用户可以在研究工作流中将此插件与 GPT‑Rosalind 结合使用,以获得更深层次的生物学推理能力。同时,所有用户均可在我们的主干模型中使用该插件包。
我们希望在确保严防生物技术滥用的前提下,将这些能力开放给那些最有能力推动人类健康事业发展的科学家和科研机构。该生命科学模型正通过受信访问 (trusted access) 部署机制率先面向美国符合条件的 Enterprise 客户开放,并围绕资格条件、访问管理和组织治理设置相应控制措施。与此同时,我们将广泛开放一系列连接器及“生命科学研究插件”,以便研究人员能更高效地利用我们的主干模型开展生命科学研究。
生命科学模型在开发过程中加强了企业级安全管控和访问管理,支持在受监管的科研环境中进行专业科学应用。我们基于三大核心原则评估访问权限:公益性用途、严谨的治理与安全监管,以及具备企业级安全保障的受控访问。在实践中,这意味着参与机构必须开展具有明确公共利益的正当科学研究;维持适当的治理、合规及防滥用管控;并将访问权限严格限制在安全且管理完善环境下的核准用户内。此外,相关机构须同意生命科学研究预览条款并遵守 OpenAI 的使用政策,我们也可能在入驻或持续参与过程中要求提供补充信息。
各机构可通过我们的资质审核与安全评估流程申请访问权限。
在研究预览期间,该模型的使用将不消耗现有的额度或 Token(受防滥用机制约束)。随着项目的扩展,我们将进一步公布有关定价和可用性的详细信息。
生命科学模型旨在帮助科研机构在兼具技术实力与运营管控的环境中,更高效地开展高质量工作。我们的生命科学 (Life Sciences) 专职团队,以及包括麦肯锡 (McKinsey & Company)、波士顿咨询 (BCG) 和贝恩 (Bain & Company) 在内的咨询合作伙伴,将协助各机构识别高价值的应用场景,将模型整合至企业级环境,并推动产生可量化的成果。若有意探索 OpenAI Life Sciences 如何助力贵组织的工作,欢迎联系生命科学团队。
这是我们生命科学系列模型的首次发布,标志着我们践行一项长期承诺:构建能够加速社会关键领域(从人类健康到更广泛的生物学研究)科学发现的 AI 系统。我们将持续优化模型的生物学推理能力,扩展对重工具及长周期科研工作流的支持,并与领先的科学机构紧密协作,以评估其实际影响力。这包括与洛斯阿拉莫斯国家实验室 (Los Alamos National Laboratory) 等重要实验室持续合作,共同探索 AI 引导的蛋白质及催化剂设计,以及 AI 系统在保留或优化核心功能特性的前提下,对生物结构进行改造的能力。
长远来看,我们期待这些系统能成为日益强大的科研伙伴:协助科学家实现跨越式加速,包括从“提出问题”到“获取证据”、从“提炼证据”到“洞察本质”,以及从“科学洞察”转化为“患者新疗法”等环节。


