Messung der Fähigkeit von KI, die biologische Forschung im Nasslabor zu beschleunigen
GPT‑5 hat neuartige Verbesserungen für Nasslaborprotokolle entwickelt und damit die Effizienz eines molekularen Klonierungsprotokolls um das 79-Fache optimiert.

Die Beschleunigung des wissenschaftlichen Fortschritts ist eine der wertvollsten Arten, auf die KI der Menschheit zugutekommen kann. Mit GPT‑5 sehen wir erste Anzeichen dafür – nicht nur, indem es Forschenden hilft, sich schneller durch die wissenschaftliche Literatur zu arbeiten, sondern auch, indem es neue Formen des wissenschaftlichen Denkens unterstützt, wie z. B. das Aufdecken unerwarteter Zusammenhänge, das Vorschlagen von Beweisstrategien oder das Aufzeigen plausibler Mechanismen, die von Expert:innen bewertet und getestet werden können.
Der bisherige Fortschritt ist am deutlichsten in Bereichen wie Mathematik, theoretischer Physik und theoretischer Informatik sichtbar, wo Ideen ohne physikalische Experimente rigoros überprüft werden können. Biologie ist anders: Die meisten Fortschritte hängen von experimenteller Durchführung, Iteration und empirischer Validierung im Labor ab.
Um besser zu verstehen, wie sich Frontier-Modelle in diesen Umgebungen verhalten, haben wir gemeinsam mit Red Queen Bio, einem Start-up-Unternehmen im Bereich Biosicherheit, einen Bewertungsrahmen entwickelt, mit dem getestet wird, wie ein Modell Ideen im Nasslabor vorschlägt, analysiert und iteriert. Wir haben ein einfaches molekularbiologisches Versuchssystem eingerichtet und GPT‑5 beauftragt, ein Molekülklonierungsprotokoll im Hinblick auf Effizienz zu optimieren.
In mehreren Versuchsrunden hat GPT‑5 einen neuartigen Mechanismus eingeführt, der die Klonierungseffizienz um das 79-Fache verbessert hat. Das Klonen ist ein grundlegendes Werkzeug der Molekularbiologie. Die Effizienz von Klonierungsmethoden ist entscheidend für das Erstellen großer, komplexer Bibliotheken, die zentral für Protein-Engineering(wird in einem neuen Fenster geöffnet), genetische Screenings(wird in einem neuen Fenster geöffnet) und Engineering von Organismenstämmen(wird in einem neuen Fenster geöffnet) sind. Dieses Projekt bietet einen Einblick darin, wie KI Seite an Seite mit Biolog:innen arbeiten könnte, um die Forschung zu beschleunigen. Die Verbesserung der Versuchsmethoden wird menschlichen Forschenden helfen, schneller voranzukommen, Kosten zu senken und Entdeckungen in reale Wirkung umzusetzen.
Da Fortschritte im Bereich des biologischen Reasoning Implikationen für die Biosicherheit haben, haben wir diese Arbeit unter streng kontrollierten Bedingungen durchgeführt – unter Verwendung eines harmlosen Versuchssystems, Einschränkung des Aufgabenumfangs und Bewertung des Modellverhaltens, um unsere Biosicherheits-Risikobewertungen und die Entwicklung von Sicherheitsvorkehrungen auf Modell- und Systemebene zu informieren, wie in unserem Preparedness Framework(wird in einem neuen Fenster geöffnet) dargelegt.
In dieser Konfiguration hat GPT‑5 eigenständig über das Klonierungsprotokoll nachgedacht, Änderungen vorgeschlagen und Daten aus neuen Experimenten einbezogen, um weitere Verbesserungen vorzuschlagen. Das einzige menschliche Eingreifen bestand darin, dass Wissenschaftler:innen das modifizierte Protokoll durchgeführt und experimentelle Daten hochgeladen haben.
Im Laufe mehrerer Runden optimierte GPT‑5 das Klonierungsverfahren, um die Effizienz um mehr als das 79-Fache zu steigern – das bedeutet, dass wir bei einer festen Menge an Eingabe-DNA 79-mal mehr sequenzverifizierte Klone als beim Basisprotokoll gewonnen haben. Am bemerkenswertesten ist, dass zwei Enzyme eingeführt wurden, die einen neuartigen Mechanismus darstellen: die Rekombinase RecA aus E. coli und das einzelsträngige DNA-bindende Protein aus dem Gen 32 des Phagen T4 (gp32). Ihre Zusammenarbeit sieht wie folgt aus: gp32 entwirrt die losen DNA-Enden, woraufhin RecA jeden Strang zu seinem korrekten Gegenstück führt.
In ersten Screening- und Folgeexperimenten wurden RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) und Transformation 7 (T7) als die besten Enzym- bzw. Transformationsprotokolle identifiziert. Sowohl die RAPF-Assemblierung als auch die T7-Transformation verbesserten unabhängig voneinander die Klonierungseffizienz im Vergleich zum Basis-HiFi-Reaktions-Konierungsprotokoll um das 2,6-Fache bzw. 36-Fache; in Kombination führten sie zu einer additiven Leistungssteigerung um das 79-Fache. Alle Klone wurden durch Sequenzierung bestätigt. (Fehlerbalken: Standardabweichung aus n=3 unabhängigen Validierungsexperimenten).
Auch wenn dies noch die Frühphase ist, sind diese Ergebnisse vielversprechend. Die Verbesserungen beziehen sich speziell auf unsere spezielle Klonierungskonfiguration, die in unserem Modellsystem verwendet wird, und erfordern weiterhin menschliche Wissenschaftler:innen, um die Protokolle einzurichten und auszuführen. Dennoch zeigen diese Experimente, dass KI-Systeme die reale Laborarbeit sinnvoll unterstützen können und in Zukunft die Arbeit menschlicher Wissenschaftler:innen beschleunigen können.
Bemerkenswerterweise wurde die KI-Labor-Schleife mit festem Prompting und ohne menschliches Eingreifen durchgeführt. Dieses Gerüst trug dazu bei, die Fähigkeit des Modells zu offenbaren, unabhängig von menschlicher Anleitung wirklich neuartige Protokolländerungen vorzuschlagen, aber es beschränkte das System auch auf die Erforschung und schränkte seine Fähigkeit ein, die Leistung neu entdeckter Ideen zu maximieren. Ein besseres dynamisches Gleichgewicht zwischen Erkundung und Nutzung würde wahrscheinlich größere Gewinne bringen, da sowohl die enzymatischen als auch die Transformationsverbesserungen erhebliches Potenzial zur Verfeinerung haben. Wir erwarten, dass Fortschritte in der Planung und im Aufgaben-Horizont-Reasoning die Fähigkeit einfacher fester Prompts verbessern werden, sowohl die Entdeckung als auch die anschließende Optimierung zu unterstützen.
Die Gibson assembly(wird in einem neuen Fenster geöffnet)-Reaktion ist seit ihrer Erfindung im Jahr 2009 eine primäre Klonierungsmethode und findet in der Molekularbiologie breite Anwendung. Die Gibson assembly ermöglicht es Molekularbiologen, DNA-Stücke „zusammenzukleben“, indem sie kurzzeitig ihre Enden schmelzt, sodass passende Sequenzen zu einem einzigen Molekül versiegelt werden können. Ein großer Reiz der Gibson assembly ist ihre Einfachheit: Alles geschieht in einem einzigen Reagenzglas bei einer einzigen Temperatur. Diese Einschränkungen lassen natürlich Raum für Verbesserungen. Darüber hinaus machen die folgenden Eigenschaften es besonders geeignet, um die Fähigkeiten von KI-Modellen zur Verbesserung von Nasslabortechniken zu bewerten:
- Gut definiert mit kontrollierten Komponenten, im Gegensatz zu einem zellbasierten System
- Hat eine klare Optimierungsfunktion: transformierbare zirkularisierte DNA, die aus einer festen Menge an linearen DNA-Eingaben hergestellt wird.
- Relativ schnelle Versuchszyklen (1–2 Tage)
- Hochdimensionaler Designraum, der mechanistisches Denken erfordert, um verbessert zu werden: Optimale Puffer, Reagenzien und Temperaturen sind alle voneinander abhängig.
Als Ausgangspunkt für die Optimierung haben wir HiFi assembly(wird in einem neuen Fenster geöffnet) verwendet, ein proprietäres Enzymsystem, das von New England Biolabs entwickelt wurde und auf der Gibson assembly basiert. Wir haben untersucht, ob eine KI innovativ sein und aus experimentellem Feedback lernen kann, sobald die Einschränkungen hinsichtlich eines einzigen Schritts und der Isothermie aufgehoben wurden, und dadurch Verbesserungen des Protokolls in diesem Szenario identifizieren kann.
Konkret haben wir eine zweiteilige Klonierungsreaktion durchgeführt, wobei wir ein Gen für grün fluoreszierendes Protein (GFP) und das weit verbreitete Plasmid pUC19 verwendet haben, einen Standard-DNA-„Träger“, der dazu dient, Gene in Bakterien einzuschleusen, damit sie kopiert werden können. Das Ziel war, die Anzahl erfolgreicher Kolonien zu erhöhen.
Wir haben die Klonierungsreaktion optimiert, indem wir einen evolutionären Rahmen für die Iteration von Vorschlägen eingeführt haben, der es dem Modell ermöglicht, „online“ aus seinen vergangenen Experimenten zu lernen. In jeder Runde schlug GPT‑5 eine Reihe von 8 bis 10 verschiedenen Reaktionen vor, wobei Reaktionen in spätere Runden verschoben wurden, wenn sie spezielle Reagenzien erforderten, die das Labor nicht sofort zur Verfügung hatte. Menschliche Wissenschaftler:innen führten dann die Reaktionen durch und maßen in einem ersten Screening die Koloniezahlen relativ zur Baseline-HiFi-Gibson-assembly. Die am besten abschneidenden Daten aus der vorherigen Runde wurden dann in die nächste Runde übernommen. Wichtig ist, dass das Prompting standardisiert wurde und außer klärenden Fragen keine menschlichen Eingaben erforderlich waren, sodass wir neue mechanistische Erkenntnisse direkt der KI und nicht menschlicher Anleitung zuschreiben können.
Wir haben die acht besten Reaktionen aus der vollständigen Optimierungsreihe mit einer breiteren Palette von DNA-Verdünnungen erneut getestet und festgestellt, dass viele geringere Effekte zeigten als im ursprünglichen Screening; letztendlich war der stärkste validierte Kandidat eine Reaktion aus Runde 5, die ihre ursprüngliche Leistung reproduzierte. Viele Hochleistungsprodukte gehörten zur Ligase-Polish-Familie, die besonders empfindlich auf kleine Schwankungen im Zustand der kompetenten Zellen und/oder die Handhabung der DNA nach der Reaktion zu reagieren scheint. Da diese Reaktionen einen kurzen HiFi-Schritt verwendeten, gehen wir davon aus, dass viele Produkte wahrscheinlich nur mit einer versiegelten Verbindung und einer durch Annealing gehaltenen Verbindung in E. coli eindringen, sodass die nachgeschaltete Rettung den zellulären Reparaturwegen überlassen bleibt. Dies führt zu einer hohen Varianz und einer „Jackpot“-Dynamik: Selbst wenn die Varianten dieser Reaktion in den meisten Fällen keine überdurchschnittliche Leistung erzielen, kann ein einziger starker Ausreißer die Familie in die nächsten Runden bringen.
Während wir uns aufgrund der mechanistischen Komplexität auf die Optimierung der Klonierungsreaktion über mehrere Runden konzentriert haben, haben wir parallel dazu das Transformationsverfahren mithilfe einer einzigen „One-Shot“-Runde optimiert, in der das Modell viele unabhängige Änderungen vorschlug, und wir die Reaktion mit der besten Leistung ausgewählt haben.
Erste Optimierungs-Screenings des zweistufigen Klonierungs-Workflows: enzymatische Assemblierung und Transformation. (Links) Iterative Optimierung der enzymatischen Assemblierung über fünf Runden (insgesamt 44 Reaktionen). Ausgehend von der HiFi-Assembly-Baseline schlug GPT‑5 pro Runde 8–10 Varianten des Assembly-Protokolls vor; die Daten der besten Ergebnisse wurden in nachfolgende Prompts integriert. In jeder Runde zeichnen wir die bisher am besten abschneidende Reaktion auf (einschließlich der vorherigen Runden). (Rechts) One-Shot-Optimierung der Transformationsbedingungen beim Testen von 13 verschiedenen Protokollen. Für beide Optimierungs-Screenings stellen die Daten einzelne Messungen (n=1) pro Bedingung dar; für die besten Kandidaten wurde separat eine replizierte Validierung durchgeführt.
Durch die Verwendung standardisierter Prompts ohne menschliches Zutun hat GPT5 die End-to-End-Klonierungseffizienz um das 79-Fache verbessert, was durch experimentelle Wiederholungen bestätigt wurde.
Insbesondere schlug das Modell ein neues enzymatisches Verfahren vor, das das Modell als „RecA-Assisted Pair-and-Finish HiFi Assembly“ (RAPF-HiFi) bezeichnete und bei dem zwei neue Proteine zur Reaktion hinzugefügt werden: die Rekombinase RecA aus E. coli und das einzelsträngige DNA-bindende Protein (gp32) des Phagen T4-Gens 32. Weiterhin nahm das Modell gezielte Änderungen an der Inkubationstemperatur und -zeit sowie am Zeitpunkt der Enzymzugabe vor: Es schlug vor, RecA und gp32 nach einer anfänglichen HiFi-Reaktion 50 °C hinzuzufügen, diese Proteine bei 37 °C wirken zu lassen und dann zurück auf 50 °C zu gehen, um die Assembly abzuschließen. Zusammen haben diese neuen Modifikationen die Effizienz um mehr als das 2,5-Fache gesteigert. Es ist zu beachten, dass dies die anfängliche Leistung ohne iterative Optimierung der Reaktionsbedingungen und des Zeitablaufs darstellt.
Auf der Transformationsseite erwies sich die effektivste Modifikation als unerwartet einfach: Pelletieren der Zellen (Zentrifugieren, damit sie sich am Boden des Röhrchens sammeln), Entfernen der Hälfte des zugeführten Volumens und Resuspendieren der Zellen vor Zugabe der DNA, alles bei 4 °C. Obwohl chemisch kompetente Zellen mit hoher Effizienz in der Regel als empfindlich gelten, vertrugen die Zellen die Konzentration gut, und die erhöhten Molekülkollisionen steigerten die Transformationseffizienz erheblich (um mehr als das 30-Fache bei der abschließenden Validierung).

Die T5-Exonuklease erzeugt 3'-Überhänge, die gp32 durch Unterdrückung der Sekundärstruktur stabilisiert. RecA dringt dann von den 3′-Enden ein, verdrängt gp32 und fördert die Homologiesuche und das Annealing. Durch das Erhitzen auf 50 °C werden beide Proteine entfernt, was das Auffüllen der Polymerase-Lücke und die Ligation ermöglicht.
Die Gibson assembly funktioniert, indem DNA-Stücke mit passenden „klebrigen“ Enden versehen werden, sodass sie sich finden und verbinden können. Die Reaktion nutzt zwei verschiedene Enzyme (eine Polymerase und eine Ligase), um die verbundenen Stücke zu versiegeln. In RAPF-HiFi wurden zwei Proteine eingeführt, um den Abgleichschritt zu verbessern. Das erste, gp32, wirkt wie ein Kamm, der die losen DNA-Enden glättet und entwirrt. Das zweite, RecA, fungiert wie ein Lotse, der für jeden Strang den richtigen Partner sucht und die passenden Teile zusammenführt. Eine höhere Temperatur bewirkt, dass beide Helfer von der DNA abfallen, sodass die normalen Gibson-Enzyme die Reaktion vollenden können.
Zusammenfassend gehen wir davon aus, dass die Leistungssteigerung auf den folgenden Mechanismus zurückzuführen ist:
- Gp32 umhüllt nicht-annealierte einzelsträngige DNA (ssDNA)-Enden und entfernt dabei die Sekundärstruktur.
- RecA, das normalerweise durch die Struktur gehemmt wird, dringt von der 3'-Seite ein und verdrängt das gp32-Filament.
- RecA vermittelt eine ssDNA:ssDNA-Homologiesuche(wird in einem neuen Fenster geöffnet) und treibt die Annealing-Reaktion voran.
- Eine Rückkehr auf 50 °C verdrängt sowohl die recA- als auch die gp32-Filamente, sodass Polymerase und Ligase die Reaktion abschließen können.
Um zu testen, ob die neuen Enzyme funktionsfähig sind, und um auszuschließen, dass die Leistungssteigerung ausschließlich auf Änderungen der thermischen Schritte oder Puffer zurückzuführen ist, haben wir die Leistung von RAPF-HiFi ohne RecA und ohne RecA und gp32 getestet. Die Leistung beider Reaktionen war im Vergleich zu RAPF-HiFi reduziert, was darauf hindeutet, dass beide Proteine für den Wirkmechanismus von RAPF-HiFi notwendig sind.
Um den zugrunde liegenden Mechanismus zu testen, isolieren wir die beiden neuen Enzyme in der Reaktion: RecA und gp32. Wir zeigen, dass jede dieser Optionen für sich genommen die Effizienz im Vergleich zur HiFi-Baseline verringert. Zusammen übertreffen sie jedoch die Baseline mit einer 2,6-fachen Effizienzsteigerung. (Fehlerbalken: Standardabweichung aus n=3 unabhängigen Experimenten)
Die Entwicklung von RAPF-HiFi deutet darauf hin, dass GPT‑5 zu komplexem, mehrdimensionalem Reasoning fähig ist:
- RecA wird durch die DNA-Struktur gehemmt(wird in einem neuen Fenster geöffnet), und es ist bemerkenswert, dass das Modell zwei synergistische Modifikationen gleichzeitig eingeführt hat: Hinzufügen von RecA und Ergänzung durch gp32, um die Sekundärstruktur der DNA zu entfernen.
- Der natürliche Partner von E. coli RecA ist das E. coli Einzelstrang-Bindungsprotein (Single-stranded Binding Protein, SSB). SSB übernimmt eine ähnliche Rolle wie gp32 bei der Genomreplikation, Rekombination und Reparatur. Allerdings fällt E. coli SSB nicht schnell genug spontan von der DNA ab, um das Wachstum von RecA-Filamenten zu ermöglichen, wobei der RecFOR-Komplex die RecA-Nukleation am SSB-Filament in vivo fördert(wird in einem neuen Fenster geöffnet). SSB bindet als stabiles Tetramer mit extrem langsamen Abspaltungsraten(wird in einem neuen Fenster geöffnet). Im Gegensatz dazu ist das gp32-Filament dynamischer(wird in einem neuen Fenster geöffnet), was die Verdrängung von RecA ermöglicht.
Unseres Wissens nach wurden RecA und gp32 in molekularbiologischen Methoden bisher nicht gemeinsam funktional eingesetzt. Wie bei vielen neuartigen molekularbiologischen Techniken wurden die zugrunde liegenden biochemischen Aktivitäten bereits untersucht, aber ihre Anwendung als praktische, verallgemeinerbare Methode stellt den Fortschritt dar.
Beispielsweise wurde die Wechselwirkung von RecA und gp32 in mechanistischen In-vitro-Rekonstitutionsassays untersucht: In Studien zur D-Loop-Bildung wurde gezeigt, dass gp32(wird in einem neuen Fenster geöffnet) die RecA-Aktivität verstärken kann. Gp32 wurde zusammen mit seinem natürlichen T4-Rekombinase-Partner UvsX und dem Rekombinase-Ladefaktor uvsY bei der Rekombinase-Polymerase-Amplifikation (RPA)(wird in einem neuen Fenster geöffnet) eingesetzt. Obwohl in einer RPA-Patentschrift angegeben wird,(wird in einem neuen Fenster geöffnet) dass wirksame RPA-Reaktionen unter Verwendung von E. coli RecA in einem heterologen System mit einem beeinträchtigten (d. h. gentechnisch veränderten, nicht wildtypischen) gp32-Protein nachgewiesen wurden, erscheint diese Behauptung nur als Randbemerkung in einigen Patentveröffentlichungen und wurde unseres Wissens nach nicht durch veröffentlichte Daten gestützt oder als robustes RecA-basiertes RPA-System übernommen. Eine Klonierungsmethode namens SLiCE (wird in einem neuen Fenster geöffnet)verwendet einen ganzen Zellextrakt aus E. coli, der das λ-Red-Rekombinationssystem enthält, wobei Red beta eine doppelte Funktion als DNA-bindendes Protein und Rekombinase erfüllen kann (obwohl wir die Verwendung von Zellextrakten in unserem Prompt ausdrücklich untersagt haben). In einer anderen Anwendung haben Ferrin & Camerini-Otero(wird in einem neuen Fenster geöffnet) RecA allein verwendet, um DNA-Moleküle selektiv anhand übereinstimmender Sequenzen zu erfassen. Unabhängig davon wurde gp32 als Additiv(wird in einem neuen Fenster geöffnet) in einem DNA-Amplifikationsverfahren namens PCR verwendet, um die Sekundärstruktur zu reduzieren. Die NASBA-Amplifikation(wird in einem neuen Fenster geöffnet) wurde sowohl durch RecA als auch durch gp32 verstärkt, obwohl jedes einzelne die Reaktion separat verstärken konnte und keine Synergie festgestellt wurde. Allgemeiner gesagt sind Berichte über Verbesserungen der grundlegenden DNA-Assemblierungsreaktionen nach Gibson rar, wobei das bemerkenswerteste Beispiel ein hitzestabiles DNA-bindendes Protein (ET SSB) ist, das die Assemblierungseffizienz um etwa das 2,5-Fache verbessert(wird in einem neuen Fenster geöffnet).
Für die meisten Anwendungen erwarten wir nicht, dass RAPF-HiFi mit der Einfachheit und Robustheit der HiFi/Gibson-Klonierung konkurrieren kann. Bemerkenswert ist jedoch das Entstehen eines mechanistisch unterschiedlichen Assemblierungsweges: GPT‑5 gelangte zu einer Lösung, die eine unbekannte Kombination aus Rekombinationsproteinen und Reaktionsdynamik beinhaltet. Der zugrunde liegende Mechanismus könnte sich als modular erweisen und Komponenten bereitstellen, die in anderen molekularen Arbeitsabläufen wiederverwendet oder neu kombiniert werden können. Wir arbeiten auch weiterhin an Verbesserungen für RAPF-HiFi. Die Reaktionstemperaturen und Schrittdauern können angepasst werden, um die Aktivität von RecA und gp32 gegenüber einer Überverdauung durch Exonuklease auszugleichen, wobei die Mengen beider Proteine noch optimiert werden müssen. GPT‑5 hat außerdem eine hyperaktive RecA-Variante vorgeschlagen, die wir derzeit aufreinigen.
In Bezug auf das Transformationsprotokoll umfassten die erfolgreichen Optimierungsbedingungen eine Reihe von Additiven und thermischen Störungen, die die Hitzeschock-Effizienz kommerzieller 10-beta-kompetenter Zellen(wird in einem neuen Fenster geöffnet) verbessern sollten. Von den 13 KI-generierten One-Shot-Transformationen, die getestet wurden, war die effektivste Modifikation Transformation 7 (T7), bei der die Zellen pelletiert, die Hälfte des zugeführten Volumens entfernt und die Zellen vor der Zugabe von DNA bei 4 °C resuspendiert wurden. Hocheffiziente chemisch kompetente Zellen gelten in der Regel als empfindlich, weshalb solche Handhabungsschritte im Allgemeinen vermieden werden. Dennoch vertrugen die Zellen die Konzentration gut. Die kombinierten Effekte einer erhöhten DNA-Exposition pro Zelle und eines geringeren hemmenden Puffers, die zu einem stärkeren Hitzeschock führten, bewirkten eine erhebliche Steigerung der Transformationseffizienz (>30-fach).
Dieses Transformationsprotokoll ist neuartig, obwohl ein konzeptionell ähnlicher Ansatz(wird in einem neuen Fenster geöffnet), bei dem die Zellen in einem früheren Schritt konzentriert werden, bereits beschrieben wurde. Bemerkenswerterweise ist die hier von GPT‑5 entwickelte Methode mit handelsüblichen chemisch kompetenten Zellen kompatibel, sodass keine interne Zellpräparation erforderlich ist, während sie die gemeldeten Effizienzsteigerungen ähnlicher Ansätze bei vergleichbaren Zellstämmen übertrifft.
Um den Durchsatz dieses experimentellen Modellsystems zu steigern, haben Robot on Rails und Red Queen Bio gemeinsam ein Robotersystem entwickelt, das ein Klonierungsprotokoll in natürlicher Sprache aufnimmt und im Nasslabor ausführt.
Das System kombiniert drei Komponenten: 1) ein Mensch-Roboter-LLM, das einfache englische Sprache in Roboteraktionen umwandelt; 2) ein Bildverarbeitungssystem, das Laborgeräte in Echtzeit identifiziert und lokalisiert und 3) einen Roboter-Pfadplaner, der bestimmt, wie jede Aktion sicher und präzise ausgeführt wird. Das Ergebnis ist ein flexibler, generalisierter Laborroboter, der weiter für Varianten des Gibson-Klonierungsprotokolls optimiert wurde.
Wir haben getestet, ob der autonome Roboter ein vollständiges Klonierungsexperiment durchführen kann, indem wir zwei Protokolle gleichzeitig ausgeführt haben: die Standard-HiFi-Methode und R8, das leistungsstärkste KI-modifizierte Protokoll aus der ersten Optimierungsrunde.
Wir haben die Arbeit des Roboters bei jedem Schritt mit von Menschen durchgeführten Experimenten verglichen. Der Roboter hat den Transformationsprozess erfolgreich bewältigt, der verschiedene physische Operationen erforderte: das Übertragen und Mischen von Flüssigkeiten, das Bewegen von Probenröhrchen, das kontrollierte Erhitzen von Zellen und das Ausstreichen von Zellen auf Nährböden. Im direkten Vergleich mit von Menschen durchgeführten Transformationen generierte der Roboter ähnlich hochwertige Daten mit gleichwertigen Verbesserungen gegenüber der Baseline und zeigte damit frühzeitig Potenzial für die Automatisierung und Beschleunigung der Optimierung biologischer Experimente.
Während die Veränderungsfaktoren zwischen den Roboter- und Humanexperimenten ähnlich waren, lagen die absoluten Koloniezahlen des Roboters etwa um den Faktor zehn niedriger als bei der manuellen Durchführung. Dies weist auf Verbesserungsbereiche hin, wie die Präzision der Flüssigkeitshandhabung, die Kalibrierung der Temperaturkontrolle und die Nachbildung der Feinheiten manueller Zellhandhabungstechniken.
Sowohl die Standard-HiFi-Methode (Baseline) als auch die verbesserte R8-Methode wurden von menschlichen Forschenden und dem autonomen Roboter durchgeführt, wobei die Transformationseffizienzen auf die jeweiligen HiFi-Baseline-Kontrollen (auf 1,0 gesetzt) normalisiert wurden. Die von Menschen ausgeführte R8 zeigte eine 2,39-fache Verbesserung; die von Robotern ausgeführte R8 erzielte eine 2,13-fache Verbesserung (89 % der menschlichen Leistung), was trotz geringerer absoluter Erträge eine vergleichbare Protokollrangfolge zeigt.
Wir glauben, dass diese Experimente einen Schnappschuss der zukünftigen, durch KI beschleunigten Wissenschaft bieten: Modelle, die kontinuierlich lernen und mit der realen Welt interagieren. Obwohl unsere Experimente menschliche Eingriffe ausschlossen, um ausschließlich die Fähigkeiten des Modells zu messen, sind wir besonders begeistert davon, dass KI menschlichen Wissenschaftlern dabei helfen könnte, Experimente zu entwerfen und zu Forschungsdurchbrüchen beizutragen.
Während wir daran arbeiten, den wissenschaftlichen Fortschritt sicher und verantwortungsvoll zu beschleunigen, bemühen wir uns auch, Risiken zu bewerten und zu minimieren, insbesondere solche im Zusammenhang mit der Biosicherheit. Diese Evaluierungsergebnisse zeigen, dass Modelle Reasoning im Nasslabor zur Verbesserung von Protokollen betreiben können, und könnten Auswirkungen auf die Biosicherheit haben, wie in unserem Preparedness Framework(wird in einem neuen Fenster geöffnet) beschrieben. Wir sind entschlossen, notwendige und differenzierte Sicherheitsvorkehrungen auf Modell- und Systemebene zu schaffen, um diese Risiken zu verringern, sowie Evaluierungen zu entwickeln, um das aktuelle Niveau zu erfassen.


