16 de diciembre de 2025

El impacto de la IA en la aceleración de la investigación biológica en el laboratorio húmedo

GPT‑5 introdujo mejoras innovadoras en protocolos de laboratorio experimental y consiguió una optimización de la eficiencia 79 veces superior en un protocolo de clonación molecular.

Gráfico estilo collage con degradados suaves en tonos azul y naranja, un diagrama de ensamblaje de ADN y el texto «Biology Research» en negrita, rotulado debajo de «OpenAI for Science».

Cargando…

Acelerar el progreso científico es una de las formas más valiosas en que la IA puede beneficiar a la humanidad. Con GPT‑5, empezamos a ver señales tempranas⁠ de esto, no solo al ayudar a los investigadores a avanzar más rápido en la literatura científica, sino también al respaldar nuevas formas de razonamiento científico, por ejemplo, revelar conexiones inesperadas, proponer estrategias de demostración o sugerir mecanismos plausibles que los expertos pueden evaluar y poner a prueba.

Hasta ahora, el progreso ha sido más evidente en campos como las matemáticas, la física teórica y la informática teórica, donde las ideas pueden comprobarse rigurosamente sin experimentos físicos. La biología es distinta: la mayoría de los avances dependen de la ejecución experimental, la iteración y la validación empírica en el laboratorio.

Para entender mejor cómo se comportan los modelos de frontera en estos entornos, colaboramos con Red Queen Bio, una empresa emergente de bioseguridad, para crear un marco de evaluación que pone a prueba cómo un modelo propone, analiza e itera ideas en el laboratorio experimental. Establecimos un sistema experimental sencillo de biología molecular y empleamos GPT‑5 para optimizar un protocolo de clonación molecular con el fin de mejorar la eficiencia.

A lo largo de múltiples rondas de experimentación, GPT‑5 introdujo un mecanismo novedoso que logró una eficiencia de clonación 79 veces superior. La clonación es una herramienta fundamental en biología molecular. La eficiencia de los métodos de clonación es crucial para crear bibliotecas grandes y complejas, esenciales para la ingeniería de proteínas⁠(se abre en una ventana nueva), los cribados genéticos⁠(se abre en una ventana nueva) y la ingeniería de cepas de organismos⁠(se abre en una ventana nueva). El proyecto nos muestra cómo la IA podría asistir a los biólogos para agilizar la investigación. Optimizar los métodos experimentales permitirá a los investigadores avanzar más rápido, reducir costos y lograr que sus descubrimientos tengan un impacto tangible en el mundo real.

Dado que los avances en el razonamiento biológico tienen implicaciones de bioseguridad, realizamos este trabajo en un entorno estrictamente controlado: utilizamos un sistema experimental benigno, acotamos el alcance de la tarea y evaluamos el comportamiento del modelo para informar nuestras evaluaciones de riesgo y el desarrollo de salvaguardas a nivel de modelo y de sistema, tal como se describe en nuestro Marco de preparación⁠(se abre en una ventana nueva).

Resultados experimentales

En esta configuración, GPT‑5 ha razonado de manera autónoma sobre el protocolo de clonación, propuso modificaciones e incorporó datos de nuevos experimentos para sugerir más mejoras. La única intervención humana fue que los científicos realizaran el protocolo modificado y cargaran los datos experimentales.

A lo largo de múltiples rondas, GPT‑5 optimizó el procedimiento de clonación, mejorando la eficiencia más de 79 veces, lo que significa que, para una cantidad fija de ADN inicial, se recuperaron más de 79 veces la cantidad de clones verificados por secuencia que con el protocolo base. Lo más notable es que el modelo introdujo dos enzimas que constituyen un mecanismo novedoso: la recombinasa RecA de E. coli y la proteína de unión al ADN de cadena simple del fago T4 (gp32). Trabajando en conjunto, gp32 alisa y desenreda los extremos sueltos del ADN, mientras que RecA guía cada hebra hacia su pareja correcta.

La evaluación inicial y los experimentos secundarios identificaron al ensamblaje HiFi RecA-Assisted Pair-and-Finish (RAPF) y a la Transformación 7 (T7) como los principales protocolos enzimáticos y de transformación, respectivamente. Tanto el ensamblaje RAPF como la transformación T7 mejoraron de manera independiente la eficiencia de clonación respecto al protocolo base de clonación HiFi, 2,6 veces y 36 veces, respectivamente; combinados, proporcionaron una mejora aditiva en el desempeño de 79 veces. Todos los clones se confirmaron mediante secuenciación. (Barras de error: DE de n = 3 experimentos de validación independientes).

A pesar de ser resultados preliminares, resultan alentadores. Las mejoras son específicas para la configuración de clonación que usamos en nuestro sistema modelo y todavía requieren que los científicos preparen y lleven a cabo los protocolos. Aun así, estos experimentos demuestran que los sistemas de IA pueden asistir de manera significativa en el trabajo de laboratorio real y podrían impulsar a los científicos en el futuro.

Es importante señalar que el ciclo IA-laboratorio se realizó con prompts fijos y sin intervención humana. Esta estructura permitió evidenciar la capacidad del modelo para proponer cambios realmente novedosos en los protocolos sin orientación humana. Sin embargo, también restringió el sistema a la exploración y limitó su capacidad para maximizar el potencial de las ideas recién descubiertas. Probablemente, un mejor equilibrio dinámico entre exploración y explotación generaría mayores avances, ya que tanto las mejoras enzimáticas como las de transformación aún tienen un amplio margen de optimización. Esperamos que los avances en planificación y en el razonamiento a largo plazo de la tarea mejoren la capacidad de los prompts fijos y simples para facilitar tanto el descubrimiento como la optimización posterior.

Un marco evolutivo para optimizar protocolos en el mundo real

La reacción de ensamblaje de Gibson⁠(se abre en una ventana nueva) se ha consolidado como un método de clonación fundamental desde su invención en 2009, con una amplia adopción en biología molecular. Esta técnica permite a los biólogos moleculares «pegar» fragmentos de ADN, calentando brevemente sus extremos para que las secuencias complementarias se unan en una sola molécula. Uno de los principales atractivos del ensamblaje de Gibson es la simplicidad: todo ocurre en un único tubo y a temperatura constante, lo que deja un margen natural para mejoras. Además, estas características lo hacen especialmente adecuado para evaluar la capacidad de los modelos de IA para optimizar técnicas de laboratorio experimental:

Bien definido, con componentes controlados, a diferencia de un sistema basado en células.
Tiene una función de optimización clara: ADN que puede circularizarse y transformarse a partir de una cantidad fija de ADN lineal.
Ciclos experimentales relativamente rápidos (1 a 2 días).
Espacio de diseño de alta dimensión que requiere razonamiento mecanístico para mejorar: los tampones, los reactivos y las temperaturas óptimos son interdependientes.

Utilizamos HiFi assembly⁠(se abre en una ventana nueva), un sistema enzimático propietario desarrollado por New England Biolabs y basado en el ensamblaje de Gibson, como punto de partida para la optimización. Exploramos si una IA podía innovar y aprender de la retroalimentación experimental una vez eliminadas las restricciones de un solo paso e isotérmicas, para así identificar mejoras en el protocolo en este escenario.

Específicamente, realizamos una reacción de clonación de dos fragmentos con un gen de la proteína verde fluorescente (GFP) y el plásmido pUC19, ampliamente utilizado como vector estándar de ADN para introducir genes en bacterias y permitir su replicación. El objetivo era aumentar el número de colonias exitosas.

Optimizamos la reacción de clonación mediante un marco evolutivo para iterar sobre las propuestas, lo que permitió al modelo aprender «en línea» a partir de sus experimentos previos. En cada ronda, GPT‑5 propuso un lote de 8 a 10 reacciones diferentes, y aquellas que requerían reactivos específicos no disponibles en el laboratorio se trasladaron a rondas posteriores. Los científicos realizaron las reacciones y midieron el número de colonias en comparación con el ensamblaje HiFi Gibson utilizado como referencia en la evaluación inicial. Los datos de mejor desempeño de cada ronda se incorporaron a la siguiente. Hay que destacar que los prompts se estandarizaron y no tuvieron intervención humana más allá de preguntas aclaratorias, lo que nos permitió atribuir los nuevos hallazgos mecanísticos directamente a la IA y no a la orientación humana.

Volvimos a evaluar las ocho reacciones principales de toda la serie de optimización utilizando un rango más amplio de diluciones de ADN y encontramos que muchas mostraron efectos menores que en la evaluación inicial. Finalmente, el candidato validado más sólido fue una reacción de la ronda 5 que reprodujo su desempeño original. Muchos elementos de alto rendimiento eran de la familia ligasa-polish, que parece especialmente sensible a pequeñas variaciones en el estado de las células competentes o en el manejo del ADN después de la reacción. Dado que estas reacciones usaron un paso HiFi breve, planteamos la hipótesis de que muchos productos probablemente ingresan a E. coli con solo una unión sellada y la otra mantenida por apareamiento, dejando la reparación posterior a las vías celulares. Esto genera alta variabilidad y un efecto donde solo un resultado excepcional puede marcar la diferencia: aunque la mayoría de las veces las variantes de esta reacción no superen el rendimiento, un único resultado sobresaliente puede llevar a toda la familia a las rondas siguientes.

Aunque nos enfocamos en optimizar la reacción de clonación a lo largo de varias rondas debido a su complejidad mecanística, paralelamente mejoramos el procedimiento de transformación en una ronda de un solo intento en la que el modelo propuso múltiples cambios independientes y seleccionamos la reacción con mejor desempeño.

Ensayos iniciales de optimización del flujo de trabajo de clonación en dos pasos: ensamblaje enzimático y transformación. (Izquierda) Optimización iterativa del ensamblaje enzimático a lo largo de cinco rondas (44 reacciones en total). Partiendo del punto de referencia de ensamblaje HiFi, GPT‑5 propuso entre 8 y 10 variantes de protocolo de ensamblaje por ronda; los datos de los resultados más destacados se incorporaron en los siguientes prompts. En cada ronda, se representa la reacción con mejor desempeño hasta el momento (incluyendo las rondas anteriores). (Derecha) Optimización de condiciones de transformación en un solo intento con 13 protocolos diferentes. Para ambos ensayos de optimización, los datos representan mediciones individuales (n = 1) por condición; la validación replicada se realizó por separado para los principales candidatos.

Con prompts estandarizados y sin intervención humana, GPT‑5 aumentó 79 veces la eficiencia de clonación de principio a fin, confirmado en réplicas experimentales.

Conviene destacar que el modelo propuso un nuevo procedimiento enzimático, al que llamó ensamblaje HiFi RecA-Assisted Pair-and-Finish (RAPF-HiFi), que incorpora dos proteínas nuevas en la reacción: la recombinasa RecA de E. coli y la proteína de unión al ADN de cadena simple del fago T4 (gp32). Además, el modelo realizó modificaciones deliberadas en la temperatura y el tiempo de incubación, así como en el momento de la adición de enzimas: propuso agregar RecA y gp32 después de una reacción HiFi inicial a 50 °C, permitir que estas proteínas actúen a 37 °C y luego volver a 50 °C para completar el ensamblaje. En conjunto, estas nuevas modificaciones aumentaron la eficiencia más de 2.5 veces. Cabe señalar que esto representa el desempeño inicial sin optimización iterativa de las condiciones de reacción y del tiempo.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

En cuanto a la transformación, la modificación más efectiva resultó sorprendentemente sencilla: sedimentar las células (centrifugarlas para que se acumulen en el fondo del tubo), retirar la mitad del volumen suministrado y resuspender las células antes de agregar el ADN, todo a 4 °C. Aunque las células químicamente competentes de alta eficiencia se consideran generalmente frágiles, toleraron bien la concentración y el aumento de colisiones moleculares incrementó sustancialmente la eficiencia de transformación (>30 veces en la validación final).

Una mejora innovadora en la clonación basada en homología

Diagrama que muestra los pasos del ensamblaje de ADN HiFi RecA-Assisted Pair-and-Finish, con etapas etiquetadas para la exonucleasa T5, gp32, RecA, polimerasa y ligasa que actúan secuencialmente sobre las cadenas de ADN.

La exonucleasa T5 crea salientes 3’ que gp32 estabiliza al suprimir la estructura secundaria. Luego, RecA invade desde los extremos 3′, desplazando a gp32 y promoviendo la búsqueda de homología y el apareamiento. Un calentamiento a 50 °C elimina ambas proteínas, lo que permite el llenado de huecos por la polimerasa y la ligación.

El ensamblaje de Gibson funciona al dar a las piezas de ADN extremos «pegajosos» coincidentes para que puedan encontrarse y unirse. La reacción usa dos enzimas distintas (una polimerasa y una ligasa) para sellar las piezas unidas. En RAPF-HiFi, se introdujeron dos proteínas para mejorar el funcionamiento del paso de emparejamiento. El primero, gp32, actúa como un peine que alisa y desenreda los extremos sueltos del ADN. El segundo, RecA, actúa como una guía que busca el compañero adecuado para cada hebra y une las piezas coincidentes. Una temperatura más alta hace que ambos ayudantes se desprendan del ADN, permitiendo que las enzimas normales de Gibson completen la reacción.

En resumen, planteamos la hipótesis de que el mejor desempeño se logra mediante el siguiente mecanismo:

Gp32 recubre las colas de ADN de cadena simple (ADNcs) no apareadas, eliminando la estructura secundaria.
RecA, normalmente inhibida por la estructura, invade desde el extremo 3’ y desplaza el filamento de gp32.
RecA realiza una búsqueda de homología ADNcs:ADNcs⁠(se abre en una ventana nueva), promoviendo el apareamiento.
Volver a 50 °C desplaza tanto los filamentos de recA como los de gp32, lo que permite que la polimerasa y la ligasa completen la reacción.

Para comprobar si las nuevas enzimas eran funcionales y descartar que la mejora en el desempeño se debiera únicamente a cambios en los pasos térmicos o en los tampones, evaluamos el RAPF-HiFi sin RecA y también sin RecA ni gp32. El desempeño de ambas reacciones disminuyó en comparación con el RAPF-HiFi, lo que indica que ambas proteínas son necesarias para su mecanismo de acción.

Para probar el mecanismo subyacente, separamos las dos nuevas enzimas en la reacción: RecA y gp32. Demostramos que cualquiera de estas por sí sola reduce la eficiencia en comparación con el punto de referencia HiFi, mientras que combinadas superan el punto de referencia con un aumento de eficiencia de 2,6 veces. (Barras de error: desviación estándar [DE] de n = 3 experimentos independientes)

El desarrollo del RAPF-HiFi sugiere que GPT‑5 puede llevar a cabo razonamientos complejos y multidimensionales:

La proteína RecA se inhibe por la estructura del ADN⁠(se abre en una ventana nueva), y es notable que el modelo introdujo dos modificaciones sinérgicas a la vez: añadir RecA y complementarlo con gp32 para eliminar la estructura secundaria del ADN.
El complemento natural de RecA de E. coli es la proteína de unión al ADN de cadena simple de E. coli (SSB), que desempeña un papel similar al de gp32 durante la replicación del genoma, la recombinación y la reparación. Sin embargo, la SSB de E. coli no se desprende espontáneamente del ADN lo suficientemente rápido para el crecimiento del filamento de RecA, con el complejo RecFOR promoviendo la nucleación de RecA en el filamento de la SSB in vivo⁠(se abre en una ventana nueva). La SSB se une como un tetrámero estable con tasas de disociación extremadamente lentas⁠(se abre en una ventana nueva). En contraste, el filamento gp32 es más dinámico⁠(se abre en una ventana nueva), lo que permite el desplazamiento de RecA.

Hasta donde sabemos, RecA y gp32 no se han usado conjuntamente de manera funcional en métodos de biología molecular. Como ocurre con muchas técnicas novedosas de biología molecular, las actividades bioquímicas subyacentes ya se han estudiado, pero su uso como un método práctico y generalizable es lo que constituye el avance.

Por ejemplo, la interacción de RecA y gp32 se ha estudiado en ensayos mecanísticos de reconstrucción in vitro: en estudios sobre la formación de bucle D, se demostró que gp32⁠(se abre en una ventana nueva) es capaz de mejorar la actividad de RecA . La proteína gp32 se ha usado junto con su complemento natural T4 recombinasa UvsX y el factor de carga de recombinasa uvsY en la amplificación de la polimerasa recombinasa (RPA)⁠(se abre en una ventana nueva). Aunque una especificación de patente de RPA indica⁠(se abre en una ventana nueva) que se han logrado reacciones efectivas de RPA usando RecA de E. coli junto con una proteína gp32 modificada (diseñada, no silvestre) en un sistema heterólogo, esta afirmación aparece solo de manera tangencial en algunas patentes. Hasta donde sabemos, no ha sido respaldada por datos publicados ni adoptada como un sistema RPA robusto basado en RecA. Un método de clonación llamado SLiCE⁠(se abre en una ventana nueva) utiliza un extracto celular completo de E. coli que contiene el sistema de recombinación λ Red, donde Red beta puede desempeñar funciones duales como proteína de unión al ADN y recombinasa (aunque explícitamente prohibimos el uso de extractos celulares en nuestro prompt). En otra aplicación, Ferrin y Camerini-Otero⁠(se abre en una ventana nueva) usaron RecA por sí sola para capturar selectivamente moléculas de ADN según secuencias coincidentes. Por separado, gp32 se ha usado como aditivo⁠(se abre en una ventana nueva) en un proceso de amplificación de ADN llamado PCR para reducir la estructura secundaria. Se demostró que la amplificación NABSA⁠(se abre en una ventana nueva) se mejora con ambas proteínas, RecA y gp32, aunque cada una podía potenciar la reacción por separado y no se identificó sinergia. De manera más general, las mejoras reportadas en las reacciones básicas de ensamblaje de ADN tipo Gibson han sido escasas, siendo el ejemplo más notable una proteína de unión al ADN termoestable (ET SSB) que mejora la eficiencia del ensamblaje aproximadamente 2,5 veces⁠(se abre en una ventana nueva).

Para la mayoría de las aplicaciones, no esperamos que RAPF-HiFi compita con la simplicidad y la robustez de la clonación HiFi/Gibson. Sin embargo, es notable la aparición de una vía de ensamblaje mecanística distinta: GPT‑5 desarrolló una solución que combina de manera poco habitual proteínas de recombinación y dinámicas de reacción. El mecanismo subyacente podría ser modular, ofreciendo componentes que pueden reutilizarse o recombinarse en otros flujos de trabajo moleculares. También seguimos explorando mejoras para RAPF-HiFi. Para lograrlo, se pueden ajustar las temperaturas de reacción y la duración de los pasos, equilibrando la actividad de RecA y gp32 frente a la degradación excesiva por exonucleasa; además, las cantidades de ambas proteínas aún requieren optimización. GPT‑5 también propuso una variante hiperactiva de RecA, que estamos purificando actualmente.

Con respecto al protocolo de transformación, las condiciones de optimización exitosas abarcaron una variedad de aditivos y perturbaciones térmicas destinadas a mejorar la eficiencia del choque térmico de las células competentes 10-beta⁠(se abre en una ventana nueva) comerciales. De las 13 transformaciones de un solo intento generadas por IA que se probaron, la modificación más efectiva, Transformación 7 (T7), consistió en sedimentar las células, eliminar la mitad del volumen suministrado y resuspenderlas antes de agregar el ADN, todo a 4 °C. Las células químicamente competentes de alta eficiencia suelen considerarse frágiles, por lo que generalmente se evitan los pasos de manipulación. No obstante, las células toleraron bien la concentración. La combinación de una exposición mayor del ADN por célula y de un tampón menos inhibidor, que condujo a un choque térmico más pronunciado, tuvo como resultado un aumento sustancial en la eficiencia de transformación (>30 veces).

Este protocolo de transformación es novedoso, aunque se ha reportado un enfoque similar⁠(se abre en una ventana nueva) en el que las células se concentran en un paso anterior. Es importante señalar que el método desarrollado por GPT‑5 es compatible con células químicamente competentes comerciales, lo que elimina la necesidad de preparar células internamente y, al mismo tiempo, supera las ganancias de eficiencia reportadas para enfoques similares en cepas celulares comparables.

Sistema robótico

A fin de aumentar el rendimiento de este modelo de sistema experimental, Robot on Rails y Red Queen Bio colaboraron para construir un sistema robótico que recibe un protocolo de clonación en lenguaje natural y lo ejecuta en el laboratorio experimental.

El sistema combina tres componentes: 1) un LLM de humano a robot que convierte el lenguaje natural en acciones robóticas; 2) un sistema de visión que identifica y localiza el material de laboratorio en tiempo real; y 3) un planificador de trayectorias robóticas que determina cómo ejecutar cada acción de manera segura y precisa. El resultado es un robot de laboratorio versátil que se optimizó aún más para variantes del protocolo de clonación Gibson.

Probamos si el robot autónomo podía ejecutar un experimento de clonación completo realizando dos protocolos de manera simultánea: el método HiFi estándar y R8, el protocolo modificado por IA con mejor desempeño de la primera ronda de optimización.

Comparamos el trabajo del robot con experimentos realizados por humanos en cada paso. El robot manejó con éxito el proceso de transformación, que requirió diversas operaciones físicas: transferir y mezclar líquidos, mover tubos de muestra, aplicar calor controlado a las células y distribuir las células en placas de crecimiento. Al compararlo directamente con las transformaciones realizadas por humanos, el robot generó datos de calidad similar con mejoras equivalentes respecto al punto de referencia, demostrando un potencial inicial para automatizar y acelerar la optimización de experimentos biológicos.

Aunque la variación relativa entre los experimentos del robot y los realizados por humanos fueron similares, los recuentos absolutos de colonias del robot fueron aproximadamente diez veces menores que los obtenidos manualmente. Esto indica áreas de mejora, como la precisión en el manejo de líquidos, la calibración del control de temperatura y la reproducción de las sutilezas de las técnicas manuales de manipulación celular.

Los investigadores y el robot autónomo llevaron a cabo tanto el método HiFi estándar (punto de referencia) como el método mejorado R8, normalizando las eficiencias de transformación frente a los controles de referencia HiFi correspondientes (establecidos en 1,0). El R8 que realizaron los humanos mostró una mejora de 2,39 veces, mientras que el R8 ejecutado por el robot alcanzó una mejora de 2,13 veces (89 % del desempeño humano), demostrando una clasificación de protocolos comparable pese a los rendimientos absolutos más bajos.

El futuro

Creemos que estos experimentos ofrecen un panorama de cómo será la ciencia acelerada por IA: modelos que aprenden continuamente e interactúan con el mundo real. Aunque los experimentos excluyeron la intervención humana para medir únicamente las capacidades del modelo, nos entusiasma especialmente cómo la IA puede ayudar a los científicos⁠ a diseñar experimentos y contribuir a los avances en la investigación.

Mientras trabajamos para acelerar el progreso científico de manera segura y responsable, también buscamos evaluar y reducir riesgos, especialmente los relacionados con la bioseguridad. Los resultados de estas evaluaciones muestran que los modelos pueden razonar en el laboratorio experimental para mejorar protocolos, y pueden tener implicaciones para la bioseguridad, tal como se describe en nuestro Marco de preparación⁠(se abre en una ventana nueva). Estamos comprometidos con establecer⁠ las salvaguardas necesarias y precisas a nivel de modelo y sistema para reducir estos riesgos, así como desarrollar evaluaciones que permitan monitorizar los niveles actuales.

Autores

Sigue leyendo

Ver todo

Scientific computing agentic AI card image (1x1)

Scientific computing in the age of agentic AI

Publicación28 jul 2026

GPT-Red: abrir la puerta a la automejora para la robustez

Seguridad15 jul 2026

Separar la señal del ruido en evaluaciones de código

Investigación8 jul 2026