GPT‑5は無細胞タンパク質合成のコストを低減する
Ginkgo Bioworksと協力して、AIを活用した自律型ラボを構築し、タンパク質生産コストを40%削減しました。
私たちは、数学や物理学のように、現実世界に触れることなくアイデアを評価できる分野で、AIの急速な進展を目にしてきました。しかし生物学は違います。進歩はラボで生まれます。そこでは科学者たちが時間と費用がかかる実験を行っています。
今、それが変わり始めています。フロンティアモデルは、ラボオートメーションに直接接続し、実験を提案して大規模に実行し、結果から学習し、次に何をすべきかを決定できるようになりました。ライフサイエンスの多くの分野において、反復作業がボトルネックとなっており、自律型ラボはその制約を取り除けるよう設計されています。
これまでの研究で、GPT‑5が閉ループ実験を通じてウェットラボプロトコルを改善できることを示しました。ここで、同じアプローチがタンパク質生産のコストを削減できることを示します。
OpenAI は Ginkgo Bioworks(新しいウィンドウで開く) と提携し、GPT‑5をクラウドラボに接続しました。クラウドラボとは、ソフトウェアを通じて遠隔操作される自動化されたウェットラボです。ロボットが実験を行い、データを返します。このラボ・イン・ザ・ループの構成を使い、広く利用されている生物学的プロセスである無細胞タンパク質合成(CFPS)を最適化しました。6回の閉ループ実験を通じて、このシステムは580枚の自動化プレートで、36,000種類以上の CFPS 反応組成をテストしました。コンピューター、ウェブブラウザ、関連論文へのアクセスが提供された後、GPT‑5 は3回の実験で、低コスト CFPS における新たな最良水準を達成しました。タンパク質生産コストを40%削減し、試薬コストは57%改善しました。さらに、自律型ラボで一般的な反応条件に対して、より堅牢な新しい反応組成も含まれています。
無細胞タンパク質合成(CFPS)は、生きた細胞を培養せずにタンパク質を生成する方法です。DNAを細胞に導入してタンパク質が生成されるのを待つのではなく、CFPSは制御された混合物内でタンパク質合成装置を稼働させます。そのため、科学者が多くの実験を迅速に行い、同日に結果を測定できるため、迅速なプロトタイピングとテストにおいて実用的なツールとなります。
現代生物学がもたらすものの大部分が、タンパク質です。多くの重要な医薬品はタンパク質に基づいています。多くの診断および研究用アッセイはタンパク質に依存しています。工業環境において、タンパク質は酵素として機能し、化学プロセスをより清潔で効率的にします。タンパク質は洗濯用洗剤にさえも含まれています。タンパク質の生産が速く安価になると、通常、科学者はより多くのアイデアを早く試すことができ、初期研究を人々の日常生活に役立つものに変えるコストを削減できます。
CFPSはその種の反復にすでに役立っています。ボトルネックは、最適化が難しく、規模が大きくなるとコストがかさむ点です。
無細胞タンパク質合成には、複雑に相互作用する成分が必要です。たとえば、作製するタンパク質をコードする DNA テンプレート、細胞溶解液(細胞内の分子機構を含む液体)、エネルギー源から塩類に至るまでの多くの生化学成分などです。システム全体を把握するのは非常に難しく、これまで多くの(新しいウィンドウで開く) 過去の(新しいウィンドウで開く) 研究(新しいウィンドウで開く)で、タンパク質生産コストを削減するために、さまざまな種類の機械学習が適用されてきました。
標準的な無細胞タンパク質合成(CFPS)の処方や市販キットは、しばしば人間の作業ペースに合わせた価格設定がされています。自律型ラボは、人間のチームが数十件の反応を行う間に、数千件の反応を行うことができます。その規模では、試薬のコストが制約要因となります。
CFPSは直感だけでは最適化が困難です。相互作用する多くの要素が混ざり合っています。小さな変更が重要になることもありますが、どこに影響があるかは必ずしも明確ではなく、多くの実験を行わなければ最適な組み合わせを見つけるのは難しいことがあります。従来のアプローチでコストは削減されてきましたが、空間を徹底的に探索するには多大な労力が必要なため、進展は段階的になりがちです。
GPT‑5をGinkgo Bioworksのクラウドラボラトリーと組み合わせて、セルフリータンパク質合成(CFPS)の最適化を目的とした閉ループ自律システムを形成しました。
GPT‑5が実験のバッチを設計しました。ラボがそれらを実行しました。結果はモデルにフィードバックされました。モデルはそのデータを用いて次のラウンドを提案しました。そのサイクルを6回繰り返しました。

GPT‑5は標準的な384ウェルプレート形式で実験のバッチを設計し、Ginkgo Bioworksのクラウドラボラトリーで実行しました。実験が完了すると、クラウドラボはデータをGPT‑5に送り返し、モデルは結果を分析して新たな仮説を立て、次の実験ラウンドを設計しました。
自律型ラボで実行可能な範囲にループを確実に収めるために、実験を開始する前に厳格なプログラム検証を追加しました。その検証により、AIが設計した実験が自動化プラットフォーム上で物理的に実行可能であることが確認されました。それにより、文章ではもっともらしく見えても、ロボットによるワークフローでは実行できない「紙の上の実験」が防がれました。
一連の実験を通じて、このシステムは580枚の自動化プレートで36,000件以上の CFPS 反応を実行しました。この規模が重要なのは、十分なデータが集まることでパターンが見えてくるためです。生物学では、1回ごとの実験結果にノイズが多く含まれます。高いスループットと反復によって、ランダムなノイズの中からシグナルを見分けられるようになります。GPT‑5 が関連論文とツールにアクセスできるようになると、2か月間で3回の実験を行い、新たな最先端水準を達成しました。その結果、従来の最良ベースライン(新しいウィンドウで開く)と比較して、タンパク質生産コストを40%削減しました。
Ginkgo Bioworksの再構成可能なオートメーションカート。クレジット:Ginkgo Bioworks
互いにうまく機能し、高スループット自動化の現実にも耐えうる組み合わせを特定できたことによって改善が実現したことが分かりました。
GPT‑5により、この構成で人間がこれまで試したことのない低コストの反応組成が特定されたことが明らかになりました。無細胞タンパク質合成(CFPS)は長年研究されてきましたが、可能な混合物の範囲は依然として広範です。何千もの組み合わせを迅速に提案し実行できると、手作業のワークフローでは見落としがちな実用的な領域を見つけることができます。
また、高スループットのプレートベースの実験は、手作業のベンチトップ実験としばしば異なることがわかりました。高スループット反応フォーマットでは、酸素化が低下する可能性があります。混合と幾何学は異なることがあります。ほとんどのCFPS反応は、マイクロタイタープレートよりも試験管での方がはるかに多くのタンパク質を生成します。これは、一般にスケールが大きいほど酸素の供給が豊富で、混合がより良好になるためです。実際、低容量のプレートベースの反応において、GPT‑5はデータ分析用のコンピューターと関連論文を検索するためのウェブブラウザーにアクセスできるようになった直後に、従来の最良結果を上回る多くの反応を提案しました。全体として、GPT‑5は高スループットの制約下で優れた性能を発揮する試薬の組み合わせを多数提案しました。その中には、自動化されたラボ環境で一般的な低酸素条件下でもより堅牢なものが多く含まれています。
さらに、バッファリング、エネルギー再生コンポーネント、ポリアミンにおける小さな変更が、コストに大きな影響を与えることが判明しました。これらは、必ずしも最初に選ばれるパラメータではありませんが、高スループットの状況では、背景の前提ではなく検証可能な仮説となります。
最終的に、コスト構造そのものが、重要な要素を決定しました。CFPSでは、コストの大部分を占めるのは現在、ライセートとDNAです。つまり、収率こそが最も効果的な戦略です。高価な投入物あたりのタンパク質産生量を増やすことができれば、他の部分でわずかな節約を追い求める前に、コスト面で実質的な前進が得られます。
6回の自律実験を通じて、システムは無細胞タンパク質合成を着実に改善し、タンパク質の収量を増やしつつコストを削減しました。結果はラウンドごとに反応コストとタンパク質力価の比較として示され、最適なトレードオフがフロンティアを形成します。各ラウンドで達成された最小のグラム当たりコストを示すのが大きな点であり、星印と点線の基準は、384ウェルプレートにおける従来の最先端ベンチマーク(Olsen et al., 2025)を示しています。後半のラウンドを詳しく見ると、最終的な改善点が明らかになり、ラウンドごとの要約では、最良のグラム当たりコストが時間の経過とともに低下していることが示されています。
これらの結果は、1つのタンパク質であるsfGFPと、1つの無細胞タンパク質合成(CFPS)システムで実証されました。この結果が他のタンパク質や別のCFPSシステムでも通用することは、まだ確認されていません。
酸素化と反応の形状は収率に大きく影響を与える可能性がありますが、これらの要因はスケールによって変わることがあります。いくつかの改良点はこれらの条件に影響を受けやすく、その影響の受けやすさを理解することも、今後取り組むべき課題の一つです。
プロトコルの改善や試薬の取り扱いには、人間の監督が必要でした。システムは実験の設計と解釈が可能ですが、実験室での作業には、経験豊富なオペレーターが必要とする実務的な詳細が依然として含まれています。
反復の高速化が進展を促進する他の生物学的ワークフローにも、ラボインザループ最適化を適用する予定です。私たちは、自律型ラボをモデルの補完として見ています。モデルは設計を生成できますが、最終的に生物学にはテストと反復が必要です。生成と実験のプロセスを完結させることが、有望なアイデアを実用的な成果に変える方法です。
科学の進展を安全かつ責任ある方法で加速させる一方で、私たちはリスクの評価と低減、特にバイオセキュリティに関連するリスクにも取り組んでいます。これらの結果は、モデルがウェットラボでプロトコルを改善するために推論できることを示しており、バイオセキュリティに関する示唆があるかもしれません。これらの示唆は、私たちのPreparedness Frameworkを通じて評価し、緩和しています。私たちは、これらのリスクを低減するために、モデルレベルおよびシステムレベルで必要かつ微妙なセーフガードを構築し、現在のリスク水準を追跡するための評価手法も開発することに取り組んでいます。
私たちは、Ginkgo Bioworksのパートナーの皆様と、このプロジェクトを支える自動化されたクラウドラボの設計、運用、サポートに尽力してくださったチームの皆様に感謝しています。


