跳至主要内容
OpenAI

2026年2月5日

研究刊发

GPT‑5 降低无细胞蛋白质合成成本

我们与 Ginkgo Bioworks 合作创建了一个 AI 驱动的自主实验室,成功将蛋白质生产成本降低了 40%。

正在加载…

我们已见证 AI 在数学、物理等领域的快速发展,这些领域的想法常可在数字世界中进行验证。生物学则不同。其进步深深扎根于实验室,科学家们在此进行着耗费时间与资金的实验。

但这一局面正在发生改变。如今,前沿模型已能直接连接实验室自动化设备:提出实验方案、进行大规模实验、从结果中学习,并自主决定下一步行动。在众多生命科学领域,迭代速度是核心瓶颈,而自主实验室正是为突破这一限制而生。

在早期工作中,我们已证明 GPT‑5 可通过闭环实验改进湿实验室操作流程。本文则进一步展示,该方法同样能显著降低蛋白质生产成本。

我们与 Ginkgo Bioworks(在新窗口中打开) 合作将 GPT‑5 接入一个云端实验室(通过软件远程运行的自动化湿实验室,由机器人执行实验并返回数据),并利用这种“实验室在环”配置来优化一项应用广泛的生物流程:无细胞蛋白质合成 (CFPS)。在六轮闭环实验中,该系统在 580 块自动化板上测试了超过 36,000 种独特的 CFPS 反应配方。在获得计算机、网络浏览器及相关论文的访问权限后,GPT‑5 仅经过三轮实验,便确立了低成本 CFPS 的新技术标杆:将蛋白质生产成本降低40%,试剂成本改善达57%。这其中还包括一些对自主实验室常见条件(如低氧环境)更具为稳健性的新型反应配方。

为何无细胞蛋白质合成至关重要

无细胞蛋白质合成 (CFPS) 是一种无需培养活细胞即可制造蛋白质的方法。与将 DNA 植入细胞并等待其产生蛋白不同,CFPS 则是直接在受控的混合体系中运行蛋白质合成机制。这使其成为快速原型构建与测试的利器 — 科学家可在同一天内完成大量实验并获得结果。

蛋白质是现代生物学成果的基石。许多重要药物基于蛋白质;众多诊断与研究方法也依赖于蛋白质。在工业领域,蛋白质作为酶,能使化学过程更清洁、更高效。蛋白质甚至存在于日常的洗衣液中。当蛋白质生产变得更快、成本更低时,科研人员往往能更早测试更多设想,也能以更低成本将前期研究成果转化为惠及日常生活的实际应用。

CFPS 本身非常适合此类快速迭代。其瓶颈在于优化过程极为复杂,且规模化后成本高昂。

无细胞蛋白质合成:优化难且成本高

CFPS 需要多种复杂且相互作用的成分:编码目标蛋白的 DNA 模板、细胞裂解物(内含细胞机器的“汤”),以及从能量源到盐类的大量生化组分。对整个系统进行理性设计极其困难。为此,已有许多(在新窗口中打开)(在新窗口中打开)研究(在新窗口中打开)尝试应用各类机器学习方法来降低生产成本。

标准的无细胞蛋白质合成 (CFPS) 配方与商业试剂盒通常按人工批量实验的节奏来定价。而自主实验室在人工团队可能只完成几十次反应的时间内,便可运行数千次反应。在此规模下,试剂成本成了决定性限制因素。

CFPS 同样难以仅凭直觉进行优化。这一体系由多种彼此作用的组分构成,结构复杂;即便是微小的调整,也可能对结果产生显著影响,但这种影响的方向往往并不直观。正因如此,若不通过大量实验反复验证,往往难以找到真正最优的组合。尽管此前的方法已经在一定程度上降低了成本,但由于全面探索这一参数空间极为耗费人力,相关进展通常只能以渐进式方式推进。

将 GPT‑5 与机器人实验室连接

我们将 GPT‑5 与 Ginkgo Bioworks 的云端实验室配对,构建了一个用于优化无细胞蛋白质合成 (CFPS) 的闭环自主系统。

GPT‑5 设计批量实验。实验室执行实验。结果反馈给模型。模型运用数据提出下一轮方案。我们重复此循环六次。

示意图标题为“AI 驱动的自主实验室”。GPT-5 负责数据分析、生化推理和假设生成,随后将实验方案发送至可重构自动化小车 (RAC)。这些小车执行物理实验、自动处理液体、孵育样本并测量荧光信号。自动化小车将实验数据与指标回传至 GPT-5,形成一个闭环反馈系统。

GPT‑5 以标准 384 孔板格式成批设计实验,并在 Ginkgo Bioworks 的云实验室中执行。每一轮实验结束后,云实验室会将数据回传给 GPT‑5,由模型分析结果、提出新的假设,并据此规划下一轮实验方案。

为确保循环基于自主实验室的实际能力,我们在任何实验运行前都加入了严格的程序化验证。该验证确保AI设计的实验在自动化平台上具备物理可执行性,从而杜绝了那些“纸上谈兵”、无法在机器人工作流中落地的方案。

在整个实验周期内,系统在 580 块自动化板上完成了逾 36,000 次 CFPS 反应。这样的规模才足以让真正的规律从数据中浮现出来。在生物学研究中,单次实验往往噪声很大。只有依靠高通量和反复迭代,才能将有意义的信号从随机波动中分离出来。GPT‑5 在获得相关论文和工具的访问权限后,仅用三轮实验、历时两个月,就在先前最佳基准(在新窗口中打开)之上再将蛋白质生产成本压低 40%,实现了新的技术突破。

Ginkgo Bioworks 的可重构自动化小车。来源:Ginkgo Bioworks

我们的研究发现

我们的分析表明,这些改进主要得益于识别出一些既能良好协同、又能经受高通量自动化真实条件考验的配方组合。

GPT‑5 找到了多种成本更低的反应配方,而在这种具体配置下,人类研究者此前从未试验过这些方案。无细胞蛋白质合成 (CFPS) 研究虽已历时多年,但潜在的混合配比空间仍然巨大;当系统能在短时间内提出并执行数千种组合时,就能挖掘出那些在传统手动流程中极易被忽略的可行区域。

我们还发现,基于微孔板的高通量实验通常与手动台式实验不同。高通量反应形式下的氧合水平可能较低,混合效果与反应容器几何形状也可能存在差异。大多数 CFPS 反应在试管中的蛋白质产量远高于微孔板,因为更大体积通常意味着更好的氧气供应与混合效果。事实上,对于低体积板式反应,GPT‑5 在获得计算机的数据分析及浏览器的文献检索权限后,立即提出了许多超越先前最佳方案的反应。总体而言,GPT‑5 提出了许多在高通量限制下表现优异的试剂组合,其中不少在自动化实验室常见的低氧条件下表现更为稳健。

此外,我们发现缓冲体系、能量再生组分和多胺的微小调整往往能带来远超其成本比例的巨大影响。这些参数并非传统意义上优先优化的对象,但在高通量体系中,它们从背景性设定转化为可被系统验证的关键假设。

归根结底,成本结构本身决定了优化工作的重点。在 CFPS 中,成本目前主要由裂解物和 DNA 主导。因此,提高产率是杠杆效益最高的策略。只要能在每单位高成本投入上产出更多蛋白质,即便尚未进一步压缩其他边际成本,总体成本也已实现了显著改善。

自主实验室迭代:让蛋白质生产降本增效

经过六轮自主实验,系统持续优化无细胞蛋白质合成过程,在提高蛋白质产量的同时降低了成本。结果以每轮实验的“反应成本”与“蛋白质滴度”关系图呈现,其中的最优权衡点构成了一条前沿边界线。图中较大的点标示了每轮达到的最低每克成本。星形或虚线则代表先前在 384 孔板中实现的最佳性能基准 (Olsen et al., 2025)。对后几轮实验的深入分析突显了最终的成果提升。逐轮总结显示,最优每克成本随实验推进而持续下降。

功能局限

本研究结果目前仅在一种蛋白质 sfGFP 和一种无细胞蛋白质合成 (CFPS) 体系中得到验证,能否推广至其他蛋白质和其他 CFPS 体系仍有待进一步证明。

氧合水平和反应体系的几何结构会显著影响产率,而且这些因素在不同规模下可能发生变化。一些改进效果可能对这些条件高度敏感,弄清这种敏感性也是下一步工作的重点之一。

在实验流程优化和试剂处理方面,仍然需要人工监督。系统可以负责设计和解析实验,但具体的实验操作仍包含大量需要经验丰富的实验人员来处理的实际细节。

未来展望

我们计划将这种“实验室在环”的优化方法扩展到更多生物学工作流程中,在这些场景下,更快的迭代往往意味着实质性突破。我们认为,自主实验室与模型是相辅相成的:模型可以提出设计方案,但生物学研究最终仍离不开真实世界中的测试与反复试验。只有打通“生成—实验—再生成”的闭环,才能把有前景的构想真正转化为可重复的研究成果。

在致力于以安全、负责任的方式加速科学进步的同时,我们也会持续评估并降低风险,尤其是与生物安全相关的风险。本研究表明,模型已经能够在湿实验室环境中进行推理并改进实验流程,这一能力可能对生物安全产生深远影响,我们会依托准备框架⁠对相关风险进行系统评估与缓释。我们承诺在模型和系统层面建立⁠必要且细致的防护机制,以降低这些风险,并开发评估方法来持续监测当前风险水平。

我们衷心感谢 Ginkgo Bioworks 的合作伙伴,以及所有参与设计、运行并支持本项工作背后自动化云实验室的团队。

作者

OpenAI