Saltar para o conteúdo principal
OpenAI

16 de dezembro de 2025

InvestigaçãoPublicação

A medir a capacidade da IA de acelerar a investigação biológica no laboratório húmido

O GPT‑5 criou melhorias inéditas em protocolos de laboratório húmido, otimizando a eficiência de um protocolo de clonagem molecular em 79x.

Gráfico em estilo de colagem, com gradientes suaves de azul–laranja, um diagrama de montagem de DNA e texto a negrito com a frase «Biology Research», identificado sob «OpenAI for Science».
A carregar…

Acelerar o progresso científico é uma das formas mais valiosas de a IA beneficiar a humanidade. Com o GPT‑5, começamos a ver sinais precoces disso — não só ao ajudar investigadores a avançar mais depressa na literatura científica, mas também ao apoiar novas formas de raciocínio científico, como revelar ligações inesperadas, propor estratégias de prova ou sugerir mecanismos plausíveis que especialistas possam avaliar e testar.

Até agora, o progresso tem sido mais visível em áreas como a matemática, a física teórica e a ciência da computação teórica, onde as ideias podem ser verificadas de forma rigorosa sem experiências físicas. A biologia é diferente: a maioria dos avanços depende de execução experimental, iteração e validação empírica no laboratório.

Para ajudar a compreender como os modelos de ponta se comportam nestes contextos, trabalhámos com a Red Queen Bio, uma startup de biosegurança, para criar um framework de avaliação que testa como um modelo propõe, analisa e itera ideias no laboratório húmido. Montámos um sistema experimental simples de biologia molecular e colocámos o GPT‑5 a otimizar um protocolo de clonagem molecular em termos de eficiência.

Ao longo de várias rondas de experimentação, o GPT‑5 introduziu um mecanismo novo que melhorou a eficiência da clonagem em 79x. A clonagem é uma ferramenta fundamental da biologia molecular. A eficiência dos métodos de clonagem é crucial para criar bibliotecas grandes e complexas, centrais para a engenharia de proteínas(abre numa nova janela), as triagens genéticas(abre numa nova janela) e a engenharia de estirpes de organismos(abre numa nova janela). Este projeto oferece uma visão de como a IA pode trabalhar lado a lado com biólogos para acelerar a investigação. Melhorar métodos experimentais ajudará investigadores a avançar mais depressa, reduzir custos e traduzir descobertas em impacto no mundo real.

Como os avanços no raciocínio biológico têm implicações de biosegurança, realizámos este trabalho num ambiente rigorosamente controlado — utilizando um sistema experimental benigno, limitando o âmbito da tarefa e avaliando o comportamento do modelo para informar as nossas avaliações de risco de biosegurança e o desenvolvimento de salvaguardas ao nível do modelo e do sistema, conforme descrito no nosso Preparedness Framework(abre numa nova janela).

Resultados experimentais

Nesta configuração, o GPT‑5 raciocinou de forma autónoma sobre o protocolo de clonagem, propôs modificações e incorporou dados de novas experiências para sugerir mais melhorias. A única intervenção humana foi a de os cientistas executarem o protocolo modificado e carregarem os dados experimentais.

Ao longo de várias rondas, o GPT‑5 otimizou o procedimento de clonagem para melhorar a eficiência em mais de 79x — o que significa que, para uma quantidade fixa de DNA de entrada, recuperámos 79x mais clones verificados por sequenciação do que com o protocolo de base. Em particular, introduziu duas enzimas que constituem um mecanismo novo: a recombinase RecA de E. coli e a proteína de ligação a DNA de fita simples do gene 32 do fago T4 (gp32). Em conjunto, a gp32 suaviza e desembaraça as extremidades soltas de DNA, e a RecA guia depois cada fita até ao seu par correto.

A triagem inicial e as experiências secundárias identificaram o RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) e a Transformation 7 (T7) como os principais protocolos enzimático e de transformação, respetivamente. Tanto o assembly RAPF como a transformação T7 melhoraram, de forma independente, a eficiência de clonagem face ao protocolo de clonagem por reação HiFi de base, em 2,6x e 36x, respetivamente; e, em conjunto, proporcionaram uma melhoria aditiva de desempenho de 79x. Todos os clones foram confirmados por sequenciação. (Barras de erro: desvio-padrão de n=3 experiências de validação independentes).

Embora ainda preliminares, estes resultados são encorajadores. As melhorias são específicas da nossa configuração de clonagem, usada no nosso sistema‑modelo, e continuam a exigir que cientistas humanos preparem e executem os protocolos. Ainda assim, estas experiências mostram que os sistemas de IA podem ajudar de forma significativa o trabalho real de laboratório e poderão acelerar o trabalho dos cientistas humanos no futuro.

É de notar que o ciclo IA‑laboratório foi executado com prompting fixo e sem intervenção humana. Esta estrutura ajudou a revelar a capacidade do modelo para propor alterações de protocolo genuinamente novas, independentemente de orientação humana, mas também prendeu o sistema numa lógica de exploração e limitou a sua capacidade de maximizar o desempenho de ideias recém‑descobertas. Um melhor equilíbrio dinâmico entre exploração e aproveitamento provavelmente traria ganhos maiores, uma vez que tanto as melhorias enzimáticas como as de transformação têm ampla margem para refinamento. Esperamos que avanços no planeamento e no raciocínio sobre o horizonte das tarefas melhorem a capacidade de prompts simples e fixos para suportar tanto a descoberta como a otimização subsequente.

Um framework evolutivo para otimizar protocolos do mundo real

A reação Gibson assembly(abre numa nova janela) tem sido um método de clonagem de referência desde a sua invenção, em 2009, e é amplamente adotada na biologia molecular. O Gibson assembly permite aos biólogos moleculares «colar» peças de DNA, fundindo brevemente as extremidades para que sequências correspondentes possam ser seladas numa única molécula. Um dos grandes atrativos do Gibson assembly é a sua simplicidade: tudo acontece num único tubo, a uma única temperatura. Essas restrições deixam naturalmente margem para melhorias. Além disso, as seguintes características tornam-no adequado para avaliar a capacidade dos modelos de IA de melhorar técnicas de laboratório húmido:

  • Bem definido, com componentes controlados, ao contrário de um sistema baseado em células
  • Tem uma função de otimização clara: DNA circularizado, transformável, feito a partir de uma quantidade fixa de DNA linear de entrada
  • Ciclos experimentais relativamente rápidos (1-2 dias)
  • Espaço de design de elevada dimensionalidade que exige raciocínio mecanístico para melhorar: tampões, reagentes e temperaturas ideais são todos interdependentes

Usámos o HiFi assembly(abre numa nova janela), um sistema enzimático proprietário desenvolvido pela New England Biolabs e baseado no Gibson assembly, como ponto de partida para a otimização. Explorámos se uma IA poderia inovar e aprender com feedback experimental depois de removidas as restrições de passo único e isotérmicas e, assim, identificar melhorias de protocolo neste cenário.

Em concreto, realizámos uma reação de clonagem em duas partes usando um gene para proteína fluorescente verde (GFP) e o plasmídeo pUC19, amplamente utilizado — um «veículo» de DNA padrão usado para transportar genes para bactérias, para que possam ser copiados. O objetivo era aumentar o número de colónias bem-sucedidas.

Otimizámos a reação de clonagem introduzindo um framework evolutivo para iterar propostas, permitindo ao modelo aprender «online» com as suas experiências anteriores. Em cada ronda, o GPT‑5 propôs um lote de 8 a 10 reações diferentes, passando algumas para rondas posteriores caso exigissem reagentes personalizados que o laboratório não tinha prontamente disponíveis. Depois, cientistas humanos executaram as reações e mediram a contagem de colónias face ao HiFi Gibson assembly de referência, numa triagem inicial. De seguida, os dados com melhor desempenho da ronda anterior foram incorporados na ronda seguinte. Importa salientar que o prompting foi normalizado, sem qualquer contributo humano para além de questões de esclarecimento, permitindo-nos atribuir as novas perspetivas mecanísticas diretamente à IA, e não a orientação humana.

Voltámos a testar as oito melhores reações de toda a série de otimização, usando uma gama mais ampla de diluições de DNA, e verificámos que muitas apresentavam efeitos menores do que na triagem inicial; no final, o candidato validado mais forte foi uma reação da ronda 5 que reproduziu o desempenho original. Muitos dos melhores resultados enquadravam-se na família ligase-polish, que parece ser particularmente sensível a pequenas variações no estado das células competentes e/ou no manuseamento do DNA após a reação. Como estas reações usaram um passo HiFi curto, levantamos a hipótese de que muitos produtos provavelmente entram em E. coli com apenas uma junção selada e a outra mantida por anelamento, deixando o resgate subsequente a cargo das vias celulares de reparação. Isto cria uma elevada variância e uma dinâmica de «jackpot»: mesmo que, na maioria das vezes, variantes desta reação não tenham melhor desempenho, um único valor atípico forte pode levar a família para rondas seguintes.

Embora nos tenhamos focado em otimizar a reação de clonagem ao longo de várias rondas, devido à sua complexidade mecanicista, em paralelo otimizámos o procedimento de transformação usando uma única ronda «one-shot», em que o modelo propôs muitas alterações independentes, e selecionámos a reação com melhor desempenho.

Triagens iniciais de otimização do fluxo de trabalho de clonagem em duas etapas: assembly enzimático e transformação. (Esquerda) Otimização iterativa do assembly enzimático ao longo de cinco rondas (44 reações no total). Partindo do assembly HiFi de base, o GPT‑5 propôs 8-10 variantes de protocolos de assembly por ronda; os dados dos resultados com melhor desempenho foram incorporados em prompts subsequentes. Em cada ronda, apresentamos a reação com melhor desempenho até ao momento (incluindo rondas anteriores). (Direita) Otimização one-shot das condições de transformação, testando 13 protocolos diferentes. Em ambas as triagens de otimização, os dados representam medições únicas (n=1) por condição; a validação com replicação foi realizada separadamente para os principais candidatos.

Usando prompts normalizados e sem contributo humano, o GPT5 melhorou a eficiência de clonagem de ponta a ponta em 79x, confirmada em réplicas experimentais.

Em particular, o modelo propôs um novo procedimento enzimático, a que chamou RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), que acrescenta duas novas proteínas à reação: a recombinase RecA de E. coli e a proteína de ligação a DNA de fita simples do gene 32 do fago T4 (gp32). Além disso, o modelo fez alterações deliberadas à temperatura e ao tempo de incubação e ao momento das adições enzimáticas: propôs adicionar RecA e gp32 após uma reação HiFi inicial a 50°C, deixar estas proteínas atuar a 37°C e, depois, voltar a 50°C para concluir o assembly. Em conjunto, estas novas alterações aumentaram a eficiência em mais de 2,5x. Importa notar que isto representa o desempenho inicial, sem otimização iterativa das condições de reação e do momento de cada etapa.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

Do lado da transformação, a modificação mais eficaz revelou-se inesperadamente simples: formar um pellet das células (centrifugando-as para que se depositem no fundo do tubo), remover metade do volume fornecido e ressuspender as células antes de adicionar DNA, tudo a 4°C. Embora as células quimicamente competentes de alta eficiência sejam normalmente consideradas frágeis, as células toleraram bem a concentração e o aumento de colisões moleculares aumentou substancialmente a eficiência de transformação (>30x na validação final).

Uma melhoria inédita na clonagem baseada em homologia

Diagrama que mostra as etapas do RecA-assisted pair-and-finish HiFi DNA assembly, com fases identificadas para a exonuclease T5, a GP32, a RecA, a polimerase e a ligase a atuar sequencialmente em fitas de DNA.

A exonuclease T5 cria saliências 3′ que a gp32 estabiliza ao suprimir a estrutura secundária. A RecA invade então a partir das extremidades 3′, deslocando a gp32 e promovendo a procura de homologia e o anelamento. O aquecimento a 50 °C remove ambas as proteínas, permitindo o preenchimento de lacunas pela polimerase e a ligação.

O Gibson assembly funciona ao dar a fragmentos de DNA extremidades correspondentes e «coesivas», para que se encontrem e se unam. A reação utiliza duas enzimas diferentes (uma polimerase e uma ligase) para selar os fragmentos unidos. No RAPF-HiFi, foram introduzidas duas proteínas para melhorar o passo de emparelhamento. A primeira, gp32, atua como um pente que alisa e desembaraça as extremidades soltas de DNA. A segunda, RecA, atua como um guia que procura o par correto para cada fita e aproxima os fragmentos correspondentes. Uma temperatura mais alta faz com que ambos os auxiliares se desprendam do DNA, permitindo que as enzimas normais do Gibson concluam a reação.

Em resumo, colocamos a hipótese de que o melhor desempenho é mediado pelo seguinte mecanismo:

  • Gp32 reveste as caudas de DNA de fita simples (ssDNA) não aneladas, removendo a estrutura secundária
  • RecA, normalmente inibida pela estrutura, invade a partir das extremidades 3’ e desloca o filamento de gp32
  • RecA medeia uma procura de homologia ssDNA:ssDNA(abre numa nova janela), promovendo o anelamento
  • O regresso a 50°C desloca os filamentos de recA e de gp32, permitindo que a polimerase e a ligase concluam a reação.

Para testar se as novas enzimas eram funcionais e para excluir que a melhoria de desempenho seja explicada apenas por alterações nos passos térmicos ou nos tampões, testámos o desempenho do RAPF-HiFi sem RecA, e sem RecA nem gp32. O desempenho de ambas as reações diminuiu face ao RAPF-HiFi, o que sugere que ambas as proteínas são necessárias para o mecanismo de ação do RAPF-HiFi.

Para testar o mecanismo subjacente, separamos as duas novas enzimas na reação: RecA e gp32. Mostramos que, isoladamente, qualquer uma delas reduz a eficiência face ao HiFi de base. Em conjunto, superam o protocolo de base, com um ganho de eficiência de 2,6x. (Barras de erro: desvio-padrão de n=3 experiências independentes)

O desenvolvimento do RAPF-HiFi sugere que o GPT‑5 é capaz de raciocínio complexo e multidimensional:

Tanto quanto sabemos, RecA e gp32 ainda não foram usadas em conjunto, de forma funcional, em métodos de biologia molecular. Como acontece com muitas técnicas novas de biologia molecular, as atividades bioquímicas subjacentes já tinham sido estudadas, mas a sua utilização como um método prático e generalizável é o que constitui o avanço.

Por exemplo, a interação entre RecA e gp32 foi estudada em ensaios de reconstituição mecanística in vitro: em estudos de formação de D loop, demonstrou-se que a gp32(abre numa nova janela) é capaz de potenciar a atividade da RecA. A gp32 tem sido usada em conjunto com o seu parceiro natural, a recombinase UvsX do T4, e com o fator de carregamento de recombinase uvsY, na amplificação por polimerase recombinase (RPA)(abre numa nova janela). Embora uma especificação de patente de RPA afirme(abre numa nova janela) que foram demonstradas reações de RPA eficazes usando RecA de E. coli num sistema heterólogo com uma proteína gp32 comprometida (isto é, concebida por engenharia e não wild-type), esta afirmação surge apenas como uma tangente em algumas divulgações de patentes e, tanto quanto sabemos, não foi suportada por dados publicados nem adotada como um sistema de RPA robusto baseado em RecA. Um método de clonagem chamado SLiCE(abre numa nova janela) usa um extrato de célula inteira de E. coli que contém o sistema de recombinação λ Red, em que o Red beta pode desempenhar um duplo papel, tanto como proteína de ligação ao DNA como recombinase (embora tenhamos explicitamente proibido o uso de extratos celulares no nosso prompt). Numa aplicação diferente, Ferrin & Camerini-Otero(abre numa nova janela) usaram apenas RecA para capturar seletivamente moléculas de DNA com base em sequências correspondentes. Em separado, a gp32 tem sido usada como aditivo(abre numa nova janela) num processo de amplificação de DNA chamado PCR, para reduzir a estrutura secundária. Mostrou-se que a amplificação NABSA(abre numa nova janela) é potenciada tanto pela RecA como pela gp32, embora cada uma possa melhorar a reação separadamente e não tenha sido identificada sinergia. De forma mais geral, têm sido raras as melhorias reportadas nas reações de montagem de DNA ao estilo Gibson, sendo o exemplo mais notável uma proteína de ligação ao DNA termoestável (ET SSB) que melhora a eficiência de montagem em cerca de 2,5x(abre numa nova janela).

Para a maioria das aplicações, não esperamos que o RAPF-HiFi concorra com a simplicidade e a robustez da clonagem HiFi/Gibson. No entanto, o surgimento de uma via de montagem mecanisticamente distinta é digno de nota: o GPT‑5 chegou a uma solução que incorpora uma combinação pouco familiar de proteínas de recombinação e dinâmicas de reação. O mecanismo subjacente poderá revelar-se modular, disponibilizando componentes que podem ser reaproveitados ou recombinados noutros fluxos de trabalho moleculares. Continuamos também a explorar melhorias ao RAPF-HiFi. As temperaturas de reação e a duração das etapas podem ser ajustadas para equilibrar a atividade da RecA e da gp32 face à digestão excessiva por exonuclease, e as quantidades de ambas as proteínas ainda têm de ser otimizadas. O GPT‑5 também propôs uma variante hiperativa de RecA, que estamos atualmente a purificar.

Quanto ao protocolo de transformação, as condições de otimização bem-sucedidas abrangeram uma série de aditivos e perturbações térmicas destinadas a aumentar a eficiência do choque térmico em células competentes comerciais 10-beta(abre numa nova janela). Das 13 transformações «one-shot» geradas por IA e testadas, a modificação mais eficaz, Transformation 7 (T7), sedimentou as células, removeu metade do volume fornecido e ressuspendeu-as antes de adicionar DNA, tudo a 4°C. As células quimicamente competentes de alta eficiência são normalmente consideradas frágeis, e este tipo de manuseamento é geralmente evitado. Ainda assim, as células toleraram bem a concentração. Os efeitos combinados de uma maior exposição de DNA por célula e de um tampão menos inibitório — que levou a um choque térmico mais acentuado — resultaram num aumento substancial da eficiência de transformação (>30x).

Este protocolo de transformação é novo, embora tenha sido reportada uma abordagem conceptualmente semelhante(abre numa nova janela) em que as células são concentradas numa etapa anterior. Importa salientar que o método desenvolvido aqui pelo GPT‑5 é compatível com células quimicamente competentes prontas a usar, eliminando a necessidade de preparação interna de células, e supera os ganhos de eficiência reportados pela abordagem semelhante em estirpes celulares comparáveis.

Sistema robótico

Para aumentar a produtividade deste sistema experimental modelo, a Robot on Rails e a Red Queen Bio colaboraram para construir um sistema robótico que recebe um protocolo de clonagem em linguagem natural e o executa no laboratório húmido.

O sistema combina três componentes: 1) um LLM humano-para-robô que converte inglês simples em ações do robô; 2) um sistema de visão que identifica e localiza material de laboratório em tempo real; e 3) um planeador de trajetórias robóticas que determina como executar cada ação de forma segura e precisa. O resultado é um robô de laboratório flexível e de uso geral, que foi ainda otimizado para variantes do protocolo de clonagem Gibson.

Testámos se o robô autónomo conseguia executar uma experiência completa de clonagem ao correr, em simultâneo, dois protocolos: o método HiFi padrão e o R8, o protocolo modificado por IA com melhor desempenho da primeira ronda de otimização.Comparámos o trabalho do robô com experiências realizadas por humanos em cada etapa. O robô executou com êxito o processo de transformação, que exigia operações físicas diversas: transferir e misturar líquidos, mover tubos de amostra, aplicar calor controlado às células e espalhar as células em placas de crescimento. Quando comparado diretamente com transformações realizadas por humanos, o robô gerou dados de qualidade semelhante, com melhorias equivalentes face ao protocolo de base, mostrando potencial inicial para automatizar e acelerar a otimização de experiências biológicas.

Embora as variações (em vezes) entre as experiências do robô e as humanas fossem semelhantes, as contagens absolutas de colónias obtidas pelo robô foram cerca de dez vezes inferiores às da execução manual, indicando áreas de melhoria como a precisão no manuseamento de líquidos, a calibração do controlo de temperatura e a replicação das nuances das técnicas manuais de manuseamento de células.

Tanto o método HiFi padrão (protocolo de base) como o método R8 melhorado foram executados por investigadores humanos e pelo robô autónomo, com as eficiências de transformação normalizadas aos respetivos controlos HiFi de base (definidos como 1,0). O R8 executado por humanos mostrou uma melhoria de 2,39x; o R8 executado pelo robô atingiu uma melhoria de 2,13x (89% do desempenho humano), demonstrando uma classificação de protocolos comparável apesar de rendimentos absolutos mais baixos.

O futuro

Consideramos que estas experiências oferecem um vislumbre do que será a ciência acelerada por IA no futuro: modelos a aprender continuamente e a interagir com o mundo real. Embora estas experiências tenham excluído intervenção humana para medir exclusivamente as capacidades do modelo, estamos particularmente entusiasmados com a possibilidade de a IA ajudar cientistas humanos a conceber experiências e a contribuir para avanços na investigação.


À medida que trabalhamos para acelerar o progresso científico de forma segura e responsável, procuramos também avaliar e reduzir riscos, em particular os relacionados com a biosegurança. Estes resultados de avaliação mostram que os modelos conseguem raciocinar no laboratório húmido para melhorar protocolos, e podem ter implicações para a biosegurança conforme descrito no nosso
Preparedness Framework(abre numa nova janela). Estamos empenhados em criar salvaguardas necessárias e criteriosas, ao nível do modelo e do sistema, para reduzir estes riscos, bem como em desenvolver avaliações para acompanhar os níveis atuais.