Zum Hauptinhalt springen
OpenAI

GPT‑5 senkt die Kosten der zellfreien Proteinsynthese

In Zusammenarbeit mit Ginkgo Bioworks haben wir ein KI-gestütztes autonomes Labor entwickelt und die Kosten für die Proteinproduktion um 40 % gesenkt.

Laden …

Wir haben schnelle Fortschritte von KI in Bereichen wie Mathematik und Physik gesehen, wo sich Ideen oft bewerten lassen, ohne die physische Welt einzubeziehen. In der Biologie ist das anders. Fortschritt entsteht im Labor, wo Wissenschaftler:innen Experimente durchführen, die Zeit und Geld erfordern.

Das beginnt sich zu ändern. Frontier-Modelle lassen sich jetzt direkt mit Laborautomatisierung verbinden, schlagen Experimente vor, führen sie in großem Maßstab durch, lernen aus den Ergebnissen und entscheiden, was als Nächstes zu tun ist. In vielen Bereichen der Biowissenschaften ist die Iteration der Engpass, und autonome Labore sind darauf ausgelegt, diese Hürde zu überwinden.

In früheren Arbeiten haben wir gezeigt, dass GPT‑5 durch Closed-Loop-Experimentieren Nasslaborprotokolle verbessern kann. Hier zeigen wir, dass derselbe Ansatz die Kosten der Proteinproduktion senken kann.

Wir haben mit Ginkgo Bioworks(wird in einem neuen Fenster geöffnet) zusammengearbeitet, um GPT‑5 mit einem Cloud-Labor zu verbinden – einem automatisierten Nasslabor, das per Software aus der Ferne betrieben wird, in dem Roboter Experimente durchführen und Daten zurücksenden – und haben dieses Lab-in-the-Loop-Setup genutzt, um einen weit verbreiteten biologischen Prozess zu optimieren: die zellfreie Proteinsynthese (CFPS). Über sechs Runden von Closed-Loop-Experimenten testete das System mehr als 36.000 einzigartige CFPS-Reaktionszusammensetzungen auf 580 automatisierten Platten. Nachdem GPT‑5 Zugang zu einem Computer, einem Webbrowser und zu relevanten Unterlagen erhalten hatte, brauchte es drei Versuchsrunden, um einen neuen Stand der Technik für kostengünstige CFPS zu erreichen. Dabei wurde eine Reduzierung der Proteinproduktionskosten um 40 % erzielt (sowie eine Senkung der Reagenzienkosten um 57 %), einschließlich neuartiger Reaktionszusammensetzungen, die robuster gegenüber den in autonomen Laboren üblichen Reaktionsbedingungen sind.

Warum die zellfreie Proteinsynthese wichtig ist

Zellfreie Proteinsynthese (CFPS) ist eine Methode zur Herstellung von Proteinen, ohne lebende Zellen zu kultivieren. Anstatt DNA in Zellen einzubringen und darauf zu warten, dass sie ein Protein produzieren, nutzt CFPS die proteinherstellende Maschinerie in einer kontrollierten Mischung. Das macht sie zu einem praktischen Werkzeug für schnelles Prototyping und Tests, da Wissenschaftler viele Experimente zügig durchführen und die Ergebnisse noch am selben Tag messen können.

Proteine sind ein zentraler Bestandteil moderner Biologie. Viele wichtige Medikamente basieren auf Proteinen. Zahlreiche diagnostische und Forschungsassays sind auf Proteine angewiesen. In industriellen Umgebungen wirken Proteine als Enzyme, die chemische Prozesse sauberer und effizienter machen. Proteine sind sogar in deinem Waschmittel enthalten. Wenn die Proteinproduktion schneller und günstiger wird, können Wissenschaftler in der Regel mehr Ideen früher testen und die Kosten senken, um frühe Forschung in Anwendungen zu überführen, die Menschen im Alltag zugutekommen.

CFPS ist für diese Art von Iteration bereits nützlich. Der Engpass ist, dass die Optimierung schwierig ist und im größeren Maßstab teuer wird.

Zellfreie Proteinsynthese ist teuer und schwer zu optimieren

Die zellfreie Proteinsynthese erfordert komplexe, miteinander interagierende Bestandteile: die DNA-Vorlage, die das gewünschte Protein kodiert, das Zelllysat (die „Suppe“ aus zellulärer Maschinerie aus dem Inneren von Zellen) und viele biochemische Komponenten, von Energiequellen bis zu Salzen. Das System als Ganzes zu verstehen, ist äußerst schwierig, und viele(wird in einem neuen Fenster geöffnet) frühere(wird in einem neuen Fenster geöffnet) Studien(wird in einem neuen Fenster geöffnet) haben verschiedene Formen von maschinellem Lernen eingesetzt, um die Kosten der Proteinproduktion zu senken.

Standardformulierungen und kommerzielle Kits für zellfreie Proteinsynthese (CFPS) sind oft auf Arbeit im menschlichen Tempo ausgelegt und entsprechend bepreist. Autonome Labore können Tausende Reaktionen in der Zeit durchführen, in der ein menschliches Team vielleicht Dutzende schafft. In diesem Maßstab werden Reagenzienkosten zum begrenzenden Faktor.

CFPS lässt sich auch nicht allein durch Intuition optimieren. Es ist eine Mischung aus vielen interagierenden Komponenten. Kleine Änderungen können wichtig sein, aber die Richtung des Effekts ist nicht immer offensichtlich, und die besten Kombinationen sind ohne viele Experimente schwer zu finden. Frühere Ansätze haben die Kosten gesenkt, aber die Fortschritte sind meist schrittweise, weil eine gründliche Erkundung des Parameterraums arbeitsintensiv ist.

GPT‑5 mit einem Robotiklabor verbinden

Wir haben GPT‑5 mit dem Cloud-Labor von Ginkgo Bioworks verbunden, um ein autonomes Closed-Loop-System zur Optimierung der zellfreien Proteinsynthese (CFPS) zu schaffen.

GPT‑5 entwarf Versuchsreihen. Das Labor führte sie durch. Die Ergebnisse wurden an das Modell zurückgegeben. Das Modell nutzte diese Daten, um die nächste Runde vorzuschlagen. Diesen Zyklus haben wir sechsmal wiederholt.

Diagramm mit dem Titel „KI-gesteuertes autonomes Labor“. GPT-5 führt Datenanalysen, biochemisches Schlussfolgern und Hypothesengenerierung durch und sendet Versuchsdesigns an Reconfigurable Automation Carts (RACs), die physische Experimente durchführen, die Flüssigkeitshandhabung automatisieren, Proben inkubieren und Fluoreszenz messen. RACs senden experimentelle Daten und Metriken an GPT-5 zurück und bilden einen geschlossenen Feedback-Kreislauf.

GPT‑5 entwarf Versuchsreihen im standardmäßigen 384-Well-Plattenformat und führte sie im Cloud-Labor von Ginkgo Bioworks durch. Sobald die Experimente abgeschlossen waren, übermittelte das Cloud-Labor die Daten an GPT‑5 zurück, wo das Modell die Ergebnisse analysierte, neue Hypothesen entwickelte und die nächste Experimentierrunde plante.

Um die Schleife an die realen Möglichkeiten eines autonomen Labors anzupassen, haben wir vor der Durchführung eine strenge programmgesteuerte Validierung ergänzt. Diese Validierung stellte sicher, dass die von KI entworfenen Experimente auf der Automatisierungsplattform physisch durchführbar waren. Sie verhinderte „Papierexperimente“, die im Text plausibel wirken, aber in einem robotischen Arbeitsablauf nicht umsetzbar sind.

Während des gesamten Projekts führte das System über 36.000 CFPS-Reaktionen auf 580 automatisierten Platten durch. Diese Größenordnung ist wichtig, weil so Muster erkennbar werden. In der Biologie sind einzelne Experimente oft ungenau. Durchsatz und Iteration sind die Mittel, mit denen das Signal und zufällige Störungen identifiziert werden können. Sobald GPT‑5 Zugriff auf das relevante Paper und die Tools hatte, brauchte es drei Versuchsrunden und zwei Monate, um einen neuen Stand der Technik zu erreichen: 40 % niedrigere Kosten für die Proteinproduktion im Vergleich zur besten bisherigen Baseline(wird in einem neuen Fenster geöffnet).

Rekonfigurierbare Automatisierungswagen von Ginkgo Bioworks. Bildnachweis: Ginkgo Bioworks

Was wir gelernt haben

Wir haben festgestellt, dass die Verbesserungen aus der Identifizierung von Kombinationen resultieren, die gut zusammenarbeiten und den Anforderungen der Hochdurchsatzautomatisierung standhalten.

Wir haben herausgefunden, dass GPT‑5 kostengünstige Reaktionszusammensetzungen identifiziert hat, die Menschen in dieser Konfiguration zuvor nicht getestet hatten. Zellfreie Proteinsynthese (CFPS) wird seit Jahren erforscht, aber der Raum möglicher Mischungen ist weiterhin groß. Wenn man schnell Tausende von Kombinationen vorschlagen und ausführen kann, finden sich praktikable Bereiche, die in manuellen Arbeitsabläufen leicht übersehen werden.

Wir haben außerdem festgestellt, dass Hochdurchsatz- und plattenbasierte Experimente oft von manuellen Bench-Top-Experimenten abweichen. Die Sauerstoffanreicherung kann in Hochdurchsatz-Reaktionsformaten geringer sein. Mischen und Geometrie können sich unterscheiden. Die meisten CFPS-Reaktionen erzeugen in Reagenzgläsern deutlich mehr Protein als in Mikrotiterplatten, da größere Maßstäbe in der Regel mit höherer Sauerstoffverfügbarkeit und besserer Durchmischung einhergehen. Tatsächlich schlug GPT‑5 bei plattenbasierten Reaktionen mit geringem Volumen viele Reaktionen vor, die die bisherigen Bestwerte übertrafen, unmittelbar nachdem es Zugriff auf einen Computer zur Datenanalyse und einen Webbrowser zur Suche nach relevanten Fachartikeln erhalten hatte. Insgesamt schlug GPT‑5 viele Reagenzienkombinationen vor, die unter Hochdurchsatzbedingungen gut abschnitten, darunter viele, die unter sauerstoffarmen Bedingungen, wie sie in automatisierten Laborumgebungen üblich sind, robuster sind.

Außerdem haben wir festgestellt, dass kleine Änderungen bei der Pufferung, den Energieregenerationskomponenten und den Polyaminen im Verhältnis zu ihren Kosten einen überproportional großen Einfluss hatten. Das sind nicht immer die ersten Parameter, die man betrachtet, aber bei hohem Durchsatz werden sie zu überprüfbaren Hypothesen statt zu Hintergrundannahmen.

Schließlich prägte die Kostenstruktur selbst, was wirklich ins Gewicht fiel. In der CFPS werden die Kosten inzwischen hauptsächlich durch Lysat und DNA dominiert. Das bedeutet, dass eine höhere Ausbeute den größten Einfluss hat. Ein höherer Proteinertrag pro Einheit teurer Ausgangsstoffe senkt die Kosten spürbar, noch bevor man anderswo nach marginalenEinsparungen sucht.

Autonome Laboriteration senkt die Kosten und erhöht die Proteinausbeute

Über sechs Runden autonomer Experimente hinweg verbesserte das System stetig die zellfreie Proteinsynthese, senkte die Kosten und erhöhte die Proteinausbeute. Die Ergebnisse werden für jede Runde als Reaktionskosten im Vergleich zum Proteintiter dargestellt, wobei die besten Kompromisse eine Pareto-Frontier bilden. Größere Punkte kennzeichnen die niedrigsten Kosten pro Gramm, die in jeder Runde erreicht wurden, und die Stern-/gepunktete Referenz zeigt den bisherigen Stand-der-Technik-Benchmark in 384-Well-Platten (Olsen et al., 2025). Ein genauerer Blick auf die späteren Runden hebt die endgültigen Fortschritte hervor, und eine Rundenübersicht zeigt, dass die besten Kosten pro Gramm im Zeitverlauf sinken.

Einschränkungen

Diese Ergebnisse wurden an einem Protein, sfGFP, und einem zellfreien Proteinsynthesesystem (CFPS) demonstriert. Die Generalisierung auf andere Proteine und andere CFPS-Systeme muss noch nachgewiesen werden.

Sauerstoffanreicherung und Reaktionsgeometrie können die Ausbeuten stark beeinflussen, und diese Faktoren können je nach Maßstab variieren. Einige Verbesserungen könnten empfindlich auf diese Bedingungen reagieren, und das Verständnis dieser Empfindlichkeiten gehört zu den nächsten Schritten.

Für Protokollverbesserungen und den Umgang mit Reagenzien war menschliche Aufsicht erforderlich. Das System kann Experimente entwerfen und interpretieren, aber Laborarbeit umfasst weiterhin praktische Details, die erfahrene Operator:innen erfordern.

Wie geht‘s weiter?

Wir planen, die Lab-in-the-Loop-Optimierung auf andere biologische Workflows anzuwenden, bei denen schnellere Iterationen Fortschritte ermöglichen können. Wir betrachten autonome Labore als Ergänzung zu Modellen. Modelle können Designs generieren, aber die Biologie erfordert letztlich weiterhin Tests und Iterationen. Den Kreislauf zwischen Generierung und Experimentieren zu schließen, ist entscheidend, um vielversprechende Ideen in funktionierende Ergebnisse zu überführen.

Während wir daran arbeiten, den wissenschaftlichen Fortschritt sicher und verantwortungsvoll zu beschleunigen, bemühen wir uns auch, Risiken zu bewerten und zu minimieren, insbesondere solche im Zusammenhang mit der Biosicherheit. Diese Ergebnisse zeigen, dass Modelle im Nasslabor Schlussfolgerungen ziehen können, um Protokolle zu verbessern, und könnten Auswirkungen auf die Biosicherheit haben, die wir im Rahmen unseres Preparedness Framework⁠ bewerten und mindern. Wir sind entschlossen, notwendige und differenzierte Sicherheitsvorkehrungen auf Modell- und Systemebene zu schaffen, um diese Risiken zu verringern, sowie Evaluierungen zu entwickeln, um das aktuelle Niveau zu erfassen.

Wir sind unseren Partnern bei Ginkgo Bioworks und den Teams dankbar, die geholfen haben, das automatisierte Cloud-Labor hinter dieser Arbeit zu entwerfen, zu betreiben und zu unterstützen.