跳至主要内容
OpenAI

2025年11月20日

研究刊发

利用 GPT‑5 加速科学研究的早期实验

我们从与科学家的合作中获得的启示

一个拼贴风格图形,其中包含抽象形状和颜色。左上方区域显示柔和的橙色色块,部分文字清晰可见。右上方区域包含分支图示:黑色细箭头从中心黑点辐射展开,橙色小圆点则标记不同位置的点。左下角区域呈柔和的橙色、粉色和紫色渐变效果。右下角区域是浅蓝色背景上,背景上显示黑色大号数字“5”。
正在加载…

科学研究深刻影响着人类健康、能源生产、国家安全及宇宙认知等诸多领域。如果 AI 能够加速科学研究进程,缩短概念构想或从概念到验证结果所需的时间,那么整个社会都将受益匪浅。

但创新的速度仍然是一个制约因素。即使你得出正确的构想,也需要投入数年时间,才能将其转化为产品或方案。在近期开展的一项调查(在新窗口中打开)中,美国受访者中有 60% 的人表示,科学和医疗技术突破成果的普及速度过于缓慢;73% 的人表示,我们需要借助更好的方法来加速发现;而 69% 的人则认为科学领导力是国家的首要战略重点。

我们发布的“利用 GPT‑5 加速科学研究的早期实验(在新窗口中打开)”一文,由 OpenAI 与范德比尔特大学、加州大学伯克利分校、哥伦比亚大学、牛津大学、剑桥大学、劳伦斯利弗莫尔国家实验室 (Lawrence Livermore National Laboratory) 和杰克森实验室 (The Jackson Laboratory) 等高校及国家实验室的合作者共同撰写。它汇集了数学、物理学、生物学、计算机科学、天文学和材料科学的早期案例研究,其中 GPT‑5 用于帮助研究人员以新颖的方式整合已知结果,编撰深入的文献综述,加速复杂计算,并为未解决的命题生成新的证明。本文还记录了相关制约因素。我们的目标是帮助业界人士清晰了解这些系统在当今研究环境中的能力边界。

这些案例研究展示了专家如何运用 GPT‑5 加速科学发现,以及这一加速功能的重要性:

  • 生物学:在由 Derya Unutmaz 医学博士主导的一项研究中,科学家们耗费数月时间,阐释人类免疫细胞中令人困惑的变化趋势。GPT‑5 在几分钟内就从一张未公开的图表中识别出潜在机制,并建议通过实验加以验证。这一加速能力可以帮助研究人员更快解析疾病机制,并开发更优疗法。
  • 数学:在另一个案例中,研究人员 Mehtaab Sawhney 和 Mark Sellke 正致力于解决一个最初由 Paul Erdős 提出、已有数十年历史的未决问题。他们在最后一步遇到了瓶颈,而 GPT‑5 提出了一个关于某个奇数如何打破规律的新设想,从而助其完成证明。此类技术进展强化了诸多算法和安全技术所依赖的数学基础。
  • 算法和优化:研究人员 Sébastien Bubeck 和 Christian Coester 正在测试机器人技术和路径规划中常用的决策方法是否如人们设想的那样可靠。GPT‑5 不仅发现了该方法可能失效的新例证,还改进了优化理论中的经典结论 — 这类数学方法常用于寻找最优解决方案。这类先进技术可帮助工程师更好地理解机器人技术、路径规划和其他实际应用场景中所用的决策系统。

OpenAI for Science 是什么?

OpenAI for Science 的使命是加速科学发现:帮助研究人员探索更多理念、更快验证假设,并发掘那些原本需要投入大量时间才能获取的洞察数据。我们通过将前沿模型与对应工具、工作流程和协作相结合来实现这一目标。

我们与学术界、相关行业和国家实验室的研究人员密切合作。这些合作有助于我们了解模型的用途、缺陷,以及如何将其集成至科学研究过程,包括文献综述、证据生成、建模、模拟和实验设计。

我们的方法结合了两种互补理念。专业的科学工具(如模拟引擎、蛋白质数据库和计算机代数系统),对于提高效率和精确性至关重要。与此同时,基础模型的扩展将持续解锁新的推理能力:实现跨领域概念关联、绘制证明、设立机制,并以概念而非关键词的方式检索大量文献。在需要专业工具的领域,我们充分利用现有工具;在需要通用推理的场景,我们构建具备相应处理能力的模型。两种方案相辅相成。

当今的科学家如何利用 GPT‑5

最有意义的技术进展来自人类与 AI 团队的合作。科学家负责制定议程:定义问题、选择方法、批判观点,并验证结果。GPT‑5 则带来了广度优势、速度提升以及并行探索多个方向的能力。

充分发挥 GPT‑5 的效力是一项技能。研究人员要学会如何提出问题、如何确定反驳时机、如何将问题分解成多个步骤以及需独立验证的环节。富有成效的工作往往表现为对话形式:研究人员和模型不断迭代,直到确定前进方向或放弃原有构想

GPT‑5 在科学研究中的现状

早期研究标明,在专家的操控下,GPT‑5 似乎能够缩短研究工作流程的部分环节。它无法自主运行项目或解决科学问题,但可以扩大探索的范围,从而帮助研究人员更快获取正确的结果。

  • 其中一种新兴能力是概念性文献检索。GPT‑5 通常能够识别概念间更深层次的联系,并跨语言和难以获取的来源检索相关材料。研究人员表示,他们已发现此前未知的参考文献、关联性及学术论点。
  • 在数学和理论计算机科学中,针对结构明确且反馈循环快速的情况,GPT‑5 尤为实用。数学家运用 GPT‑5 在几分钟内生成可行的证明大纲,从而彻底革新原本可能耗时几天或数周的工作。在物理学和计算领域,该模型可以提出简化转换建议,或指向其他领域的类似结构。
  • 在生物学和其他经验科学领域,该模型可以提出相关机制并设计实验,以便在湿实验室中验证这些假设。

我们已超越模型仅能总结现有知识的阶段。如今,在专家的监督下,GPT‑5 的早期贡献可以为研究人员提供实质性帮助。随着能力与工具的进步,这种改进速度预示着更深层次加速的潜力。

实践中的具体表现:部分案例研究

在科学前沿独立重现已知成果

深度文献检索

与 AI 协同配合

借助 AI 取得的新科学研究成果

限制

这些案例研究精选展示了 GPT‑5 的应用成效,它们并非系统性抽样,也未涵盖所有失效模式。专家监督仍然至关重要。GPT‑5 偶尔会产生幻觉,生成看似合理的引文、机制或证明;它可能对问题引导和预热训练较为敏感;它有时会忽略特定领域的细微差别;如果不加以纠正,它可能会沿着无效的推理路线前进。这些都是活跃的研究领域,我们正与合作者密切配合,在完善后续系统的同时,衡量并减少此类失效情况。

下一步发展

综合来看,这些早期研究表明 GPT‑5 有助于开展新型科学研究。该模型无法自主运行,但专家可以用其证明定理、重新发现和扩展结构、揭示跨领域联系,并生成机制和实验供科学家验证。

我们还发现,随着时间的推移和计算量的增加,这些系统会不断完善。如果 GPT‑5 能在 20 分钟内有效协助处理部分研究问题,当模型能投入数小时乃至数天进行持续推理时,我们预期将获得更具深度的研究成果。结合全球顶尖科学家的智慧,这预示着科学生产力将随时间的推移迎来质的飞跃。

作者

Kevin Weil