Mesurar la capacitat de la IA per accelerar la recerca biològica al laboratori humit
GPT‑5 va crear millores noves en protocols de laboratori humit i va optimitzar l’eficiència d’un protocol de clonatge molecular en 79x.

Accelerar el progrés científic és una de les maneres més valuoses en què la IA pot beneficiar la humanitat. Amb GPT‑5, comencem a veure’n senyals primerencs, no només ajudant els investigadors a avançar més ràpid per la literatura científica, sinó també donant suport a noves formes de raonament científic, com ara fer aflorar connexions inesperades, proposar estratègies de demostració o suggerir mecanismes plausibles que els experts puguin avaluar i provar.
Fins ara, el progrés ha estat més visible en camps com les matemàtiques, la física teòrica i la informàtica teòrica, on les idees es poden comprovar rigorosament sense experiments físics. La biologia és diferent: la majoria d’avenços depenen de l’execució experimental, la iteració i la validació empírica al laboratori.
Per ajudar a entendre com es comporten els models d'avantguarda en aquests entorns, vam treballar amb Red Queen Bio, una start-up de bioseguretat, per construir un marc d’avaluació que prova com un model proposa, analitza i itera sobre idees al laboratori humit. Vam establir un sistema experimental senzill de biologia molecular i vam fer que GPT‑5 optimitzés un protocol de clonatge molecular per eficiència.
Al llarg de múltiples rondes d’experimentació, GPT‑5 va introduir un mecanisme nou que va millorar l’eficiència de clonatge en 79x. El clonatge és una eina fonamental de la biologia molecular. L’eficiència dels mètodes de clonatge és crítica per crear biblioteques grans i complexes, centrals per a la enginyeria de proteïnes(s'obre en una finestra nova), els cribratges genètics(s'obre en una finestra nova) i l’enginyeria de soques d’organismes(s'obre en una finestra nova). Aquest projecte ofereix una mostra de com la IA podria treballar colze a colze amb biòlegs per accelerar la recerca. Millorar els mètodes experimentals ajudarà els investigadors humans a avançar més ràpid, reduir costos i traduir descobriments en impacte real.
Com que els avenços en el raonament biològic tenen implicacions de bioseguretat, vam dur a terme aquest treball en un entorn estretament controlat: fent servir un sistema experimental innocu, limitant l’abast de la tasca i avaluant el comportament del model per informar les nostres avaluacions de risc de bioseguretat i el desenvolupament de salvaguardes a nivell de model i de sistema, tal com es descriu al nostre Entorn de treball de preparació(s'obre en una finestra nova).
En aquesta configuració, GPT‑5 va raonar de manera autònoma sobre el protocol de clonatge, va proposar modificacions i va incorporar dades de nous experiments per suggerir més millores. L’única intervenció humana va ser que els científics duguessin a terme el protocol modificat i carreguessin les dades experimentals.
Al llarg de múltiples rondes, GPT‑5 va optimitzar el procediment de clonatge per millorar-ne l’eficiència en més de 79x, cosa que significa que, per a una quantitat fixa d’ADN d’entrada, vam recuperar 79x més clons verificats per seqüència que amb el protocol de referència. Més destacadament, va introduir dos enzims que constitueixen un mecanisme nou: la recombinasa RecA d’E. coli i la proteïna d’unió a ADN monocatenari del gen 32 del fag T4 (gp32). Treballant en tàndem, gp32 allisa i desembolica els extrems solts de l’ADN, i RecA després guia cada cadena cap a la seva correspondència correcta.
El cribratge inicial i els experiments secundaris van identificar el muntatge HiFi Pair-and-Finish assistit per RecA (RAPF) i la Transformació 7 (T7) com els millors protocols enzimàtic i de transformació, respectivament. Tant el muntatge RAPF com la transformació T7 van millorar de manera independent l’eficiència de clonatge en relació amb el protocol base de clonatge amb reacció HiFi, amb 2,6 i 36 vegades més, respectivament; i combinats van aportar una millora additiva del rendiment de 79 vegades. Tots els clons es van confirmar per seqüenciació. (Barres d’error: DE de n=3 experiments de validació independents).
Tot i que encara és aviat, aquests resultats són encoratjadors. Les millores són específiques del nostre muntatge de clonatge concret utilitzat en el nostre sistema model, i encara requereixen que científics humans preparin i executin els protocols. Tot i així, aquests experiments mostren que els sistemes d’IA poden ajudar de manera significativa en el treball real de laboratori i poden accelerar els científics humans en el futur.
Cal destacar que el bucle IA-laboratori es va executar amb una indicació fixa i sense intervenció humana. Aquest bastiment va ajudar a revelar la capacitat del model per proposar canvis de protocol genuïnament nous independentment de la guia humana, però també va bloquejar el sistema en l’exploració i en va limitar la capacitat de maximitzar el rendiment de les idees acabades de descobrir. Un millor equilibri dinàmic entre exploració i explotació probablement produiria guanys més grans, ja que tant les millores enzimàtiques com les de transformació tenen un marge substancial de refinament. Esperem que els avenços en planificació i en el raonament sobre l’horitzó de tasques millorin la capacitat de les indicacions fixes simples per donar suport tant al descobriment com a l’optimització posterior.
La reacció de muntatge Gibson(s'obre en una finestra nova) ha estat un mètode principal de clonatge des de la seva invenció el 2009, amb una adopció generalitzada en biologia molecular. El muntatge Gibson permet als biòlegs moleculars «enganxar» fragments d’ADN junts fonent-ne breument els extrems perquè les seqüències coincidents es puguin segellar en una sola molècula. Un dels grans atractius del muntatge Gibson és la seva simplicitat: tot passa en un sol tub a una sola temperatura. Aquestes restriccions deixen naturalment marge de millora. A més, les propietats següents el fan especialment adequat per avaluar les capacitats dels models d’IA per millorar tècniques de laboratori humit:
- Ben definit i amb components controlats, a diferència d’un sistema basat en cèl·lules
- Té una funció d’optimització clara: ADN circularitzat transformable fet a partir d’una quantitat fixa d’entrades d’ADN lineal
- Cicles experimentals relativament ràpids (1-2 dies)
- Espai de disseny d’alta dimensionalitat que requereix raonament mecanístic per millorar-lo: els òptims de tampó, reactius i temperatures són interdependents
Vam utilitzar el muntatge HiFi(s'obre en una finestra nova), un sistema enzimàtic propietari desenvolupat per New England Biolabs i basat en el muntatge Gibson, com a punt de partida per a l’optimització. Vam explorar si una IA podia innovar i aprendre de la retroalimentació experimental un cop eliminades les restriccions d’un sol pas i isotèrmiques, i així identificar millores del protocol en aquest escenari.
Concretament, vam dur a terme una reacció de clonatge de dues peces amb un gen de la proteïna fluorescent verda (GFP) i el plasmidi pUC19, àmpliament utilitzat, un «vehicle» estàndard d’ADN que serveix per introduir gens en bacteris perquè es puguin copiar. L’objectiu era augmentar el nombre de colònies reeixides.
Vam optimitzar la reacció de clonatge introduint un marc evolutiu per iterar sobre propostes, cosa que permet al model aprendre «en línia» dels seus experiments anteriors. A cada ronda, GPT‑5 proposava un lot de 8-10 reaccions diferents, i les reaccions es desplaçaven a rondes posteriors si requerien reactius personalitzats que el laboratori no tenia fàcilment a mà. Els científics humans després van dur a terme les reaccions i van mesurar el recompte de colònies en relació amb el muntatge Gibson HiFi de referència en un cribratge inicial. Les millors dades de rendiment de la ronda anterior es van alimentar després a la ronda següent. És important destacar que la indicació estava estandarditzada i no hi havia cap entrada humana més enllà de preguntes d’aclariment, cosa que ens permet atribuir directament a la IA els coneixements mecanístics nous i no a la guia humana.
Vam tornar a provar les vuit millors reaccions de tota la sèrie d’optimització utilitzant un rang més ampli de dilucions d’ADN, i vam trobar que moltes mostraven efectes més petits que en el cribratge inicial; en última instància, el candidat validat més fort va ser una reacció de la ronda 5 que va reproduir el seu rendiment original. Molts dels resultats més alts pertanyien a la família ligase-polish, que sembla particularment sensible a petites variacions en l’estat de les cèl·lules competents i/o en la manipulació de l’ADN després de la reacció. Com que aquestes reaccions utilitzaven un pas HiFi curt, plantegem la hipòtesi que molts productes probablement entren a E. coli amb només una unió segellada i l’altra mantinguda per aparellament, deixant el rescat posterior a les vies de reparació cel·lular. Això crea una variància alta i una dinàmica de «jackpot»: encara que la majoria de vegades les variants d’aquesta reacció no superin les altres, un únic valor atípic molt fort pot arrossegar tota la família a rondes posteriors.
Tot i que ens vam centrar a optimitzar la reacció de clonatge al llarg de les rondes a causa de la seva complexitat mecanística, en paral·lel vam optimitzar el procediment de transformació fent servir una sola ronda «amb un sol exemple» en què el model va proposar molts canvis independents, i vam prendre la reacció amb millor rendiment.
Cribratges inicials d’optimització del flux de treball de clonatge en dos passos: muntatge enzimàtic i transformació. (Esquerra) Optimització iterativa del muntatge enzimàtic al llarg de cinc rondes (44 reaccions en total). Partint de la base del muntatge HiFi, GPT‑5 va proposar 8-10 variants de protocol de muntatge per ronda; les dades dels millors resultats es van incorporar a les indicacions posteriors. A cada ronda, representem la reacció amb millor rendiment fins al moment (incloses les rondes anteriors). (Dreta) Optimització amb un sol exemple de les condicions de transformació provant 13 protocols diferents. En tots dos cribratges d’optimització, les dades representen mesures úniques (n=1) per condició; la validació replicada es va fer per separat per als millors candidats.
Amb indicacions estandarditzades i sense entrada humana, GPT5 va millorar l’eficiència de clonatge d’extrem a extrem 79 vegades, confirmat en rèpliques experimentals.
Cal destacar que el model va proposar un nou procediment enzimàtic, que el model va anomenar muntatge HiFi Pair-and-Finish assistit per RecA (RAPF-HiFi), que afegeix dues proteïnes noves a la reacció: la recombinasa RecA d’E. coli i la proteïna d’unió a ADN monocatenari del gen 32 del fag T4 (gp32). A més, el model va fer modificacions deliberades a la temperatura i el temps d’incubació, i a la temporització de les addicions enzimàtiques: va proposar afegir RecA i gp32 després d’una reacció HiFi inicial a 50°C, deixar actuar aquestes proteïnes a 37°C i després tornar a 50°C per completar el muntatge. En conjunt, aquestes noves modificacions van augmentar l’eficiència en més de 2,5 vegades. Cal assenyalar que això representa el rendiment inicial sense optimització iterativa de les condicions i la temporització de la reacció.
Pel que fa a la transformació, la modificació més efectiva va resultar inesperadament simple: sedimentar les cèl·lules (centrifugar-les perquè es recullin al fons del tub), retirar la meitat del volum subministrat i resuspendre les cèl·lules abans d’afegir-hi ADN, tot a 4°C. Tot i que les cèl·lules químicament competents d’alta eficiència se solen considerar fràgils, les cèl·lules van tolerar bé la concentració i l’augment de col·lisions moleculars va impulsar substancialment l’eficiència de transformació (>30 vegades en la validació final).

L’exonucleasa T5 crea sortints 3′ que gp32 estabilitza suprimint l’estructura secundària. Després, RecA envaeix des dels extrems 3′, desplaçant gp32 i promovent la cerca d’homologia i l’aparellament. L’escalfament a 50 °C elimina totes dues proteïnes i permet l’emplenament de buits per la polimerasa i la ligació.
El muntatge Gibson funciona donant als fragments d’ADN extrems «enganxosos» coincidents perquè es puguin trobar i unir. La reacció utilitza dos enzims diferents (una polimerasa i una ligasa) per segellar les peces unides. A RAPF-HiFi, es van introduir dues proteïnes perquè el pas d’aparellament funcionés millor. La primera, gp32, actua com una pinta que allisa i desembolica els extrems solts de l’ADN. La segona, RecA, actua com una guia que busca la parella correcta per a cada cadena i ajunta les peces coincidents. Una temperatura més alta fa que tots dos ajudants es desprenguin de l’ADN, cosa que permet que els enzims Gibson normals completin la reacció.
En resum, plantegem la hipòtesi que la millora del rendiment està mediada pel mecanisme següent:
- Gp32 recobreix les cues d’ADN monocatenari (ssDNA) no aparellades i n’elimina l’estructura secundària
- RecA, normalment inhibida per l’estructura, envaeix des de l’extrem 3’ i desplaça el filament de gp32
- RecA media una cerca d’homologia ssDNA:ssDNA(s'obre en una finestra nova), que impulsa l’aparellament
- Un retorn a 50°C desplaça tant els filaments de recA com de gp32, cosa que permet que la polimerasa i la ligasa completin la reacció.
Per comprovar si els enzims nous eren funcionals, i per descartar que la millora del rendiment estigui impulsada únicament per canvis en els passos tèrmics o els tampons, vam provar el rendiment de RAPF-HiFi sense RecA i sense RecA ni gp32. El rendiment de totes dues reaccions es va reduir en relació amb RAPF-HiFi, cosa que suggereix que totes dues proteïnes són necessàries per al mecanisme d’acció de RAPF-HiFi.
Per provar el mecanisme subjacent, separem els dos nous enzims de la reacció: RecA i gp32. Mostrem que qualsevol d’aquests per si sol redueix l’eficiència en relació amb la base HiFi. Junts, superen la base amb un guany d’eficiència de 2,6x. (Barres d’error: DE de n=3 experiments independents)
El desenvolupament de RAPF-HiFi suggereix que GPT‑5 és capaç d’un raonament complex i multidimensional:
- RecA està inhibida per l’estructura de l’ADN(s'obre en una finestra nova), i és destacable que el model introduís alhora dues modificacions sinèrgiques: afegir RecA i complementar-la amb gp32 per eliminar l’estructura secundària de l’ADN.
- La parella natural de la RecA d’E. coli és la proteïna d’unió a cadena simple (SSB) d’E. coli . L’SSB exerceix un paper similar al de gp32 durant la replicació, la recombinació i la reparació del genoma. Tanmateix, l’SSB d’E. coli no es desprèn espontàniament de l’ADN amb prou rapidesa perquè creixi el filament de RecA, i el complex RecFOR promou la nucleació de RecA al filament d’SSB in vivo(s'obre en una finestra nova). L’SSB s’uneix com un tetràmer estable amb taxes de dissociació extremadament lentes(s'obre en una finestra nova). En canvi, el filament de gp32 és més dinàmic(s'obre en una finestra nova), cosa que permet el desplaçament per RecA.
Segons el nostre coneixement, RecA i gp32 no s’han utilitzat conjuntament de manera funcional en mètodes de biologia molecular. Com passa amb moltes tècniques noves de biologia molecular, les activitats bioquímiques subjacents ja s’havien estudiat, però el seu ús com a mètode pràctic i generalitzable constitueix l’avenç.
Per exemple, la interacció de RecA i gp32 s’ha estudiat en assajos mecanístics de reconstitució in vitro: en estudis de formació de D loop, es va mostrar que gp32(s'obre en una finestra nova) és capaç de potenciar l’activitat de RecA. Gp32 s’ha utilitzat juntament amb la seva parella natural de recombinasa T4 UvsX i el factor de càrrega de recombinasa uvsY en l’amplificació per polimerasa amb recombinasa (RPA(s'obre en una finestra nova)). Tot i que una especificació de patent de RPA afirma(s'obre en una finestra nova) que s’han demostrat reaccions d’RPA efectives utilitzant RecA d’E. coli en un sistema heteròleg amb una proteïna gp32 compromesa (és a dir, dissenyada, no salvatge), aquesta afirmació només apareix tangencialment en algunes divulgacions de patents i, segons el nostre coneixement, no ha estat recolzada per dades publicades ni adoptada com un sistema RPA robust basat en RecA. Un mètode de clonatge anomenat SLiCE(s'obre en una finestra nova) utilitza un extracte cel·lular complet d’E. coli que conté el sistema de recombinació λ Red, on Red beta pot fer un doble paper tant de proteïna d’unió a l’ADN com de recombinasa (tot i que vam prohibir explícitament l’ús d’extractes cel·lulars a la nostra indicació). En una aplicació diferent, Ferrin & Camerini-Otero(s'obre en una finestra nova) van utilitzar RecA sola per capturar selectivament molècules d’ADN en funció de seqüències coincidents. Per separat, gp32 s’ha utilitzat com a additiu(s'obre en una finestra nova) en un procés d’amplificació d’ADN anomenat PCR per reduir l’estructura secundària. Es va demostrar que l’amplificació NABSA(s'obre en una finestra nova) millorava tant amb RecA com amb gp32, tot i que cadascuna podia millorar la reacció per separat i no es va identificar cap sinergia. De manera més àmplia, han estat escasses les millores reportades a les reaccions bàsiques de muntatge d’ADN d’estil Gibson, amb l’exemple més destacat d’una proteïna d’unió a l’ADN termoestable (ET SSB) que millora l’eficiència de muntatge aproximadament 2,5 vegades(s'obre en una finestra nova).
Per a la majoria d’aplicacions, no esperem que RAPF-HiFi competeixi amb la simplicitat i robustesa del clonatge HiFi/Gibson. Tanmateix, l’aparició d’una via de muntatge mecanísticament diferent és remarcable: GPT‑5 va arribar a una solució que incorpora una combinació poc familiar de proteïnes de recombinació i dinàmiques de reacció. El mecanisme subjacent pot resultar modular i aportar components que es puguin reutilitzar o recombinar en altres fluxos de treball moleculars. També continuem explorant millores a RAPF-HiFi. Les temperatures de reacció i les durades dels passos es poden ajustar per equilibrar l’activitat de RecA i gp32 amb la sobredigestió per exonucleasa, i les quantitats d’ambdues proteïnes encara s’han d’optimitzar. GPT‑5 també ha proposat una variant hiperactiva de RecA, que actualment estem purificant.
Pel que fa al protocol de transformació, les condicions d’optimització reeixides abastaven una sèrie d’additius i pertorbacions tèrmiques destinades a millorar l’eficiència del xoc tèrmic de les cèl·lules competents 10-beta(s'obre en una finestra nova) comercials. De les 13 transformacions amb un sol intent generades per IA que es van provar, la modificació més efectiva, la Transformació 7 (T7), sedimentava les cèl·lules, retirava la meitat del volum subministrat i les resuspenia abans d’afegir-hi ADN, tot a 4°C. Les cèl·lules químicament competents d’alta eficiència se solen considerar fràgils, i aquests passos de manipulació generalment s’eviten. Malgrat això, les cèl·lules van tolerar bé la concentració. Els efectes combinats d’una exposició més gran a l’ADN per cèl·lula i d’un tampó menys inhibidor, que produeix un xoc tèrmic més marcat, van generar un augment substancial de l’eficiència de transformació (>30 vegades).
Aquest protocol de transformació és nou, tot i que s’ha descrit un enfocament semblant(s'obre en una finestra nova) conceptualment en què les cèl·lules es concentren en un pas anterior. Cal destacar que el mètode desenvolupat aquí per GPT‑5 és compatible amb cèl·lules químicament competents comercials, cosa que elimina la necessitat de preparar cèl·lules internament, alhora que supera els guanys d’eficiència reportats per l’enfocament similar en soques cel·lulars comparables.
Per augmentar el rendiment d’aquest sistema experimental model, Robot on Rails i Red Queen Bio van col·laborar per construir un sistema robòtic que rep un protocol de clonatge en llenguatge natural i l’executa al laboratori humit.
El sistema combina tres components: 1) un LLM d’humà a robot que converteix anglès planer en accions del robot; 2) un sistema de visió que identifica i localitza el material de laboratori en temps real; i 3) un planificador de trajectòria robòtica que determina com dur a terme cada acció de manera segura i precisa. El resultat és un robot de laboratori flexible i generalitzat que es va optimitzar encara més per a variants del protocol de clonatge Gibson.
Vam provar si el robot autònom podia executar un experiment complet de clonatge fent córrer simultàniament dos protocols: el mètode HiFi estàndard i R8, el protocol modificat per IA amb millor rendiment de la primera ronda d’optimització.
Vam comparar la feina del robot amb experiments fets per humans en cada pas. El robot va gestionar amb èxit el procés de transformació, que requeria operacions físiques diverses: transferir i barrejar líquids, moure tubs de mostres, aplicar calor controlada a les cèl·lules i escampar les cèl·lules sobre plaques de cultiu. En comparació directa amb transformacions fetes per humans, el robot va generar dades de qualitat similar amb millores equivalents respecte de la línia de base, mostrant un potencial inicial per automatitzar i accelerar l’optimització d’experiments biològics.
Tot i que els canvis multiplicatius entre els experiments del robot i els humans eren similars, els recomptes absoluts de colònies del robot eren aproximadament deu vegades més baixos que en l’execució manual, cosa que indica àrees de millora com la precisió en la manipulació de líquids, el calibratge del control de temperatura i la reproducció dels matisos de les tècniques manuals de manipulació cel·lular.
Tant el mètode HiFi estàndard (referència) com el mètode R8 millorat van ser executats per investigadors humans i pel robot autònom, amb les eficiències de transformació normalitzades als respectius controls de referència HiFi (fixats a 1,0). L’R8 executat per humans va mostrar una millora de 2,39 vegades; l’R8 executat pel robot va assolir una millora de 2,13 vegades (89% del rendiment humà), demostrant una classificació de protocols comparable malgrat rendiments absoluts més baixos.
Creiem que aquests experiments ofereixen una instantània de com serà la ciència accelerada per IA del futur: models que aprenen contínuament i interactuen amb el món real. Tot i que els nostres experiments excloïen la intervenció humana per mesurar purament les capacitats del model, ens entusiasma especialment que la IA ajudi els científics humans a dissenyar experiments i contribuir a avenços en la recerca.
Mentre treballem per accelerar el progrés científic de manera segura i responsable, també busquem avaluar i reduir riscos, especialment els relacionats amb la bioseguretat. Els resultats d’aquestes avaluacions mostren que els models poden raonar al laboratori humit per millorar protocols, i poden tenir implicacions per a la bioseguretat tal com es descriu al nostre Entorn de treball de preparació(s'obre en una finestra nova). Estem compromesos a construir les salvaguardes necessàries i matisades a nivell de model i de sistema per reduir aquests riscos, així com a desenvolupar avaluacions per fer el seguiment dels nivells actuals.
Autors
Nikolai Eroshenko, Miles Wang, Rachel Smith, Liliana Abramson, Tejal Patwardhan, Kemo Jammeh, Chase Olle, Azadeh Samadian i Nitin Mahadeo


