16 de dezembro de 2025

Medindo a capacidade da IA de acelerar a pesquisa biológica em laboratório úmido

O GPT‑5 criou melhorias inéditas em protocolos de laboratório úmido, otimizando a eficiência de um protocolo de clonagem molecular em 79x.

Gráfico em estilo colagem com degradês suaves em azul e laranja, um diagrama de montagem de DNA e um texto em negrito que diz “Biology Research”, sob o rótulo “OpenAI for Science.”

Carregando…

Acelerar o progresso científico é uma das formas mais valiosas de a IA beneficiar a humanidade. Com o GPT‑5, começamos a ver sinais iniciais⁠ disso — não só ao ajudar pesquisadores a avançar mais rápido pela literatura científica, mas também ao apoiar novas formas de raciocínio científico, como revelar conexões inesperadas, propor estratégias de prova ou sugerir mecanismos plausíveis que especialistas podem avaliar e testar.

Até agora, o progresso tem sido mais visível em áreas como matemática, física teórica e ciência da computação teórica, onde ideias podem ser verificadas com rigor sem experimentos físicos. A biologia é diferente: a maioria dos avanços depende de execução experimental, iteração e validação empírica no laboratório.

Para entender melhor como modelos de fronteira se comportam nesses cenários, trabalhamos com a Red Queen Bio, uma startup de biosegurança, para criar um framework de avaliação que testa como um modelo propõe, analisa e itera sobre ideias em laboratório úmido. Montamos um sistema experimental simples de biologia molecular e pedimos ao GPT‑5 que otimizasse um protocolo de clonagem molecular para aumentar a eficiência.

Ao longo de várias rodadas de experimentação, o GPT‑5 introduziu um mecanismo inédito que melhorou a eficiência de clonagem em 79x. A clonagem é uma ferramenta fundamental da biologia molecular. A eficiência dos métodos de clonagem é crucial para criar bibliotecas grandes e complexas, centrais para a engenharia de proteínas⁠(abre em uma nova janela), triagens genéticas⁠(abre em uma nova janela) e a engenharia de cepas de organismos⁠(abre em uma nova janela). Este projeto oferece um vislumbre de como a IA poderia trabalhar lado a lado com biólogos para acelerar a pesquisa. Aprimorar métodos experimentais vai ajudar pesquisadores humanos a avançar mais rápido, reduzir custos e transformar descobertas em impacto no mundo real.

Como avanços no raciocínio biológico têm implicações de biosegurança, conduzimos este trabalho em um ambiente rigidamente controlado — usando um sistema experimental benigno, limitando o escopo da tarefa e avaliando o comportamento do modelo para embasar nossas avaliações de risco de biosegurança e o desenvolvimento de salvaguardas em nível de modelo e de sistema, conforme descrito em nosso Preparedness Framework⁠(abre em uma nova janela).

Resultados experimentais

Neste setup, o GPT‑5 raciocinou autonomamente sobre o protocolo de clonagem, propôs modificações e incorporou dados de novos experimentos para sugerir mais melhorias. A única intervenção humana foi a execução do protocolo modificado por cientistas e o envio dos dados experimentais.

Ao longo de várias rodadas, o GPT‑5 otimizou o procedimento de clonagem e aumentou a eficiência em mais de 79x — ou seja, para uma quantidade fixa de DNA de entrada, recuperamos 79x mais clones com sequência verificada do que no protocolo de referência. Mais importante, ele introduziu duas enzimas que constituem um mecanismo inédito: a recombinase RecA de E. coli e a proteína de ligação ao DNA de fita simples do gene 32 do fago T4 (gp32). Trabalhando em conjunto, a gp32 alisa e desembaraça as extremidades soltas de DNA, e a RecA então guia cada fita até sua correspondência correta.

Triagens iniciais e experimentos secundários identificaram a RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) e a Transformação 7 (T7) como os principais protocolos enzimático e de transformação, respectivamente. Tanto a montagem RAPF quanto a transformação T7 melhoraram independentemente a eficiência de clonagem em relação ao protocolo base de clonagem HiFi, em 2,6x e 36x, respectivamente; e, combinadas, forneceram uma melhoria aditiva de desempenho de 79x. Todos os clones foram confirmados por sequenciamento. (Barras de erro: SD de n=3 experimentos independentes de validação).

Embora ainda seja cedo, esses resultados são animadores. As melhorias são específicas do nosso setup de clonagem usado no sistema modelo e ainda exigem que cientistas montem e executem os protocolos. Ainda assim, esses experimentos mostram que sistemas de IA podem ajudar de forma significativa o trabalho real de laboratório e podem acelerar cientistas humanos no futuro.

Vale notar que o loop IA-laboratório rodou com prompts fixos e sem intervenção humana. Esse arcabouço ajudou a revelar a capacidade do modelo de propor mudanças de protocolo genuinamente inéditas, sem depender de orientação humana, mas também prendeu o sistema na exploração e limitou sua capacidade de maximizar o desempenho de ideias recém-descobertas. Um equilíbrio dinâmico melhor entre exploração e aproveitamento provavelmente renderia ganhos maiores, já que tanto as melhorias enzimáticas quanto as de transformação têm bastante espaço para refinamento. Esperamos que avanços em planejamento e raciocínio sobre horizonte de tarefas melhorem a capacidade de prompts fixos e simples de apoiar tanto a descoberta quanto a otimização posterior.

Um framework evolutivo para otimizar protocolos do mundo real

A reação de Gibson assembly⁠(abre em uma nova janela) é um método de clonagem fundamental desde sua invenção, em 2009, e é amplamente adotada na biologia molecular. A Gibson assembly permite que biólogos moleculares “colem” pedaços de DNA ao derreter brevemente suas extremidades, para que sequências correspondentes possam ser seladas em uma única molécula. Um dos maiores atrativos da Gibson assembly é a simplicidade: tudo acontece em um único tubo, a uma única temperatura. Essas restrições naturalmente deixam espaço para melhorias. Além disso, as propriedades abaixo tornam esse cenário adequado para avaliar a capacidade de modelos de IA de melhorar técnicas de laboratório úmido:

Bem definido, com componentes controlados, ao contrário de um sistema baseado em células
Tem uma função de otimização clara: DNA circularizado transformável feito a partir de uma quantidade fixa de DNA linear de entrada
Ciclos experimentais relativamente rápidos (1-2 dias)
Espaço de design de alta dimensionalidade que exige raciocínio mecanístico para melhorar: buffers, reagentes e temperaturas ideais são todos interdependentes

Usamos a HiFi assembly⁠(abre em uma nova janela), um sistema enzimático proprietário desenvolvido pela New England Biolabs e baseado em Gibson assembly, como ponto de partida para a otimização. Exploramos se uma IA poderia inovar e aprender a partir do feedback experimental depois que as restrições de etapa única e isotermais foram removidas e, assim, identificar melhorias de protocolo neste cenário.

Mais especificamente, realizamos uma reação de clonagem de duas partes usando um gene de proteína fluorescente verde (GFP) e o plasmídeo pUC19, amplamente utilizado — um “veículo” padrão de DNA usado para levar genes a bactérias para que possam ser copiados. O objetivo era aumentar o número de colônias bem-sucedidas.

Otimizamos a reação de clonagem introduzindo um framework evolutivo para iterar sobre propostas, permitindo que o modelo aprendesse “online” com experimentos anteriores. Em cada rodada, o GPT‑5 propôs um lote de 8-10 reações diferentes; as reações eram adiadas para rodadas posteriores se exigissem reagentes personalizados que o laboratório não tinha prontamente disponíveis. Cientistas humanos então executaram as reações e mediram a contagem de colônias em relação ao baseline de HiFi Gibson assembly em uma triagem inicial. Os dados com melhor desempenho da rodada anterior foram então alimentados na rodada seguinte. É importante destacar que o prompting foi padronizado, sem contribuição humana além de perguntas de esclarecimento, o que nos permitiu atribuir insights mecanísticos inéditos diretamente à IA, e não à orientação humana.

Retestamos as oito melhores reações de toda a série de otimização usando uma faixa mais ampla de diluições de DNA e vimos que muitas tiveram efeitos menores do que na triagem inicial; no fim, o candidato mais forte validado foi uma reação da rodada 5 que reproduziu seu desempenho original. Muitos dos melhores resultados caíram na família ligase-polish, que parece particularmente sensível a pequenas variações no estado de células competentes e/ou no manuseio do DNA pós-reação. Como essas reações usaram uma etapa curta de HiFi, levantamos a hipótese de que muitos produtos provavelmente entram em E. coli com apenas uma junção selada e a outra mantida por anelamento, deixando o resgate posterior a cargo das vias de reparo celular. Isso gera alta variância e um efeito de “jackpot”: mesmo que, na maior parte do tempo, variantes dessa reação não superem o desempenho, um único outlier forte pode levar a família para as próximas rodadas.

Embora tenhamos focado em otimizar a reação de clonagem ao longo das rodadas por sua complexidade mecanística, em paralelo otimizamos o procedimento de transformação em uma única rodada “one-shot”, em que o modelo propôs muitas mudanças independentes e nós selecionamos a reação com melhor desempenho.

Triagens iniciais de otimização do workflow de clonagem em duas etapas: montagem enzimática e transformação. (Esquerda) Otimização iterativa da montagem enzimática ao longo de cinco rodadas (44 reações no total). Partindo do baseline da montagem HiFi, o GPT‑5 propôs 8-10 variações de protocolo de montagem por rodada; os dados dos resultados com melhor desempenho foram incorporados aos prompts seguintes. Em cada rodada, mostramos a reação com melhor desempenho até então (incluindo rodadas anteriores). (Direita) Otimização one-shot das condições de transformação, testando 13 protocolos diferentes. Em ambas as triagens de otimização, os dados representam medições únicas (n=1) por condição; a validação com réplicas foi feita separadamente para os melhores candidatos.

Com prompts padronizados e sem contribuição humana, o GPT‑5 melhorou a eficiência de clonagem de ponta a ponta em 79x, confirmado em réplicas experimentais.

Notavelmente, o modelo propôs um novo procedimento enzimático, que chamou de RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), que adiciona duas novas proteínas à reação: a recombinase RecA de E. coli e a proteína de ligação ao DNA de fita simples do gene 32 do fago T4 (gp32). Além disso, o modelo fez modificações deliberadas na temperatura e no tempo de incubação, e no momento das adições enzimáticas: ele propôs adicionar RecA e gp32 após uma reação HiFi inicial a 50°C, deixar essas proteínas atuarem a 37°C e, em seguida, voltar a 50°C para completar a montagem. Juntas, essas novas modificações aumentaram a eficiência em mais de 2,5x. Vale notar que isso representa o desempenho inicial, sem otimização iterativa das condições e do tempo da reação.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

Do lado da transformação, a modificação mais eficaz se mostrou inesperadamente simples: formar um pellet das células (centrifugando para que se depositem no fundo do tubo), remover metade do volume fornecido e ressuspender as células antes de adicionar DNA, tudo a 4°C. Embora células quimicamente competentes de alta eficiência sejam tipicamente consideradas frágeis, elas toleraram bem a concentração, e o aumento de colisões moleculares elevou substancialmente a eficiência de transformação (>30x na validação final).

Uma melhoria inédita na clonagem baseada em homologia

Diagrama mostrando as etapas da RecA-assisted pair-and-finish HiFi DNA assembly, com estágios rotulados para exonuclease T5, gp32, RecA, polimerase e ligase atuando sequencialmente nas fitas de DNA.

A exonuclease T5 cria extremidades 3′ salientes, que a gp32 estabiliza ao suprimir estruturas secundárias. A RecA então invade a partir das extremidades 3′, desloca a gp32 e promove a busca de homologia e o anelamento. O aquecimento a 50 °C remove as duas proteínas, permitindo o preenchimento de lacunas pela polimerase e a ligação pela ligase.

A Gibson assembly funciona dando aos fragmentos de DNA extremidades coesivas correspondentes, para que eles se encontrem e se unam. A reação usa duas enzimas diferentes (uma polimerase e uma ligase) para selar os fragmentos unidos. No RAPF-HiFi, duas proteínas foram introduzidas para melhorar a etapa de pareamento. A primeira, gp32, atua como um pente que alisa e desembaraça as extremidades soltas de DNA. A segunda, RecA, atua como um guia que procura o parceiro correto para cada fita e puxa as partes correspondentes para se juntarem. Temperaturas mais altas fazem com que essas duas proteínas auxiliares se desprendam do DNA, permitindo que as enzimas normais da Gibson completem a reação.

Em resumo, levantamos a hipótese de que o melhor desempenho é mediado pelo seguinte mecanismo:

Gp32 recobre caudas de DNA de fita simples (ssDNA) não aneladas, removendo estruturas secundárias
RecA, normalmente inibida por estruturas, invade a partir da extremidade 3’ e desloca o filamento de gp32
RecA medeia uma busca de homologia ssDNA:ssDNA⁠(abre em uma nova janela), conduzindo o anelamento
O retorno a 50°C desloca tanto os filamentos de RecA quanto os de gp32, permitindo que a polimerase e a ligase concluam a reação.

Para testar se as novas enzimas eram funcionais e descartar que a melhoria de desempenho seja causada apenas por mudanças em etapas térmicas ou buffers, testamos o desempenho do RAPF-HiFi sem RecA e sem RecA e gp32. O desempenho de ambas as reações foi reduzido em relação ao RAPF-HiFi, sugerindo que as duas proteínas são necessárias para o mecanismo de ação do RAPF-HiFi.

Para testar o mecanismo subjacente, separamos as duas novas enzimas da reação: RecA e gp32. Mostramos que qualquer uma delas, isoladamente, reduz a eficiência em relação ao baseline HiFi. Juntas, elas superam o baseline com um ganho de eficiência de 2,6x. (Barras de erro: SD de n=3 experimentos independentes)

O desenvolvimento do RAPF-HiFi sugere que o GPT‑5 é capaz de um raciocínio complexo e multidimensional:

RecA é inibida pela estrutura do DNA⁠(abre em uma nova janela), e é notável que o modelo tenha introduzido duas modificações sinérgicas de uma só vez: adicionar RecA e complementá-la com gp32 para remover estruturas secundárias do DNA.
A parceira natural da RecA de E. coli é a proteína de ligação ao DNA de fita simples (SSB) de E. coli. A SSB desempenha um papel semelhante ao da gp32 durante replicação, recombinação e reparo do genoma. No entanto, a SSB de E. coli não se desprende espontaneamente do DNA rápido o bastante para o crescimento do filamento de RecA, com o complexo RecFOR promovendo a nucleação de RecA no filamento de SSB in vivo⁠(abre em uma nova janela). A SSB se liga como um tetrâmero estável, com taxas de dissociação extremamente lentas⁠(abre em uma nova janela). Em contraste, o filamento de gp32 é mais dinâmico⁠(abre em uma nova janela), permitindo que a RecA o desloque.

Até onde sabemos, RecA e gp32 não foram usadas juntas, de forma funcional, em métodos de biologia molecular. Como acontece com muitas técnicas novas de biologia molecular, as atividades bioquímicas subjacentes já eram estudadas, mas seu uso como um método prático e generalizável constitui o avanço.

Por exemplo, a interação entre RecA e gp32 foi estudada em ensaios mecanísticos de reconstituição in vitro: em estudos de formação de D-loop, mostrou-se que a gp32⁠(abre em uma nova janela) é capaz de aumentar a atividade da RecA. Gp32 foi usada em conjunto com seu parceiro recombinase natural do T4, UvsX, e com o fator de carregamento de recombinase uvsY, na amplificação por recombinase-polimerase (RPA)⁠(abre em uma nova janela). Embora uma especificação de patente de RPA afirme⁠(abre em uma nova janela) que reações eficazes de RPA foram demonstradas usando RecA de E. coli em um sistema heterólogo com uma proteína gp32 comprometida (isto é, projetada, não selvagem), essa afirmação aparece apenas como um comentário lateral em algumas divulgações de patentes e, até onde sabemos, não foi sustentada por dados publicados nem adotada como um sistema robusto de RPA baseado em RecA. Um método de clonagem chamado SLiCE⁠(abre em uma nova janela) usa um extrato de célula inteira de E. coli contendo o sistema de recombinação λ Red, no qual a proteína Red beta pode desempenhar papéis duplos como proteína de ligação ao DNA e recombinase (embora tenhamos proibido explicitamente o uso de extratos celulares no nosso prompt). Em uma aplicação diferente, Ferrin & Camerini-Otero⁠(abre em uma nova janela) usaram RecA sozinha para capturar seletivamente moléculas de DNA com base em sequências correspondentes. Separadamente, gp32 tem sido usada como aditivo⁠(abre em uma nova janela) em um processo de amplificação de DNA chamado PCR para reduzir estruturas secundárias. Foi mostrado que a amplificação NABSA⁠(abre em uma nova janela) é aprimorada tanto por RecA quanto por gp32, embora cada uma pudesse melhorar a reação separadamente e nenhuma sinergia tenha sido identificada. De forma mais ampla, melhorias relatadas nas reações básicas de montagem de DNA no estilo Gibson têm sido raras, sendo o exemplo mais notável uma proteína de ligação ao DNA termoestável (ET SSB) que melhora a eficiência de montagem em aproximadamente 2,5x⁠(abre em uma nova janela).

Para a maioria das aplicações, não esperamos que o RAPF-HiFi concorra com a simplicidade e a robustez da clonagem HiFi/Gibson. No entanto, o surgimento de uma via de montagem mecanisticamente distinta é notável: o GPT‑5 chegou a uma solução que incorpora uma combinação pouco familiar de proteínas de recombinação e dinâmica de reação. O mecanismo subjacente pode se mostrar modular, fornecendo componentes que podem ser reaproveitados ou recombinados em outros fluxos de trabalho moleculares. Também seguimos explorando melhorias para o RAPF-HiFi. As temperaturas de reação e as durações de cada etapa podem ser ajustadas para equilibrar a atividade de RecA e gp32 contra a digestão excessiva por exonuclease, e as quantidades de ambas as proteínas ainda precisam ser otimizadas. O GPT‑5 também propôs uma variante hiperativa de RecA, que estamos purificando no momento.

Quanto ao protocolo de transformação, as condições de otimização bem-sucedidas abrangeram uma variedade de aditivos e perturbações térmicas destinadas a aumentar a eficiência do choque térmico de células competentes comerciais 10-beta⁠(abre em uma nova janela). Das 13 transformações “one-shot” geradas por IA que testamos, a modificação mais eficaz, a Transformação 7 (T7), formou um pellet das células, removeu metade do volume fornecido e ressuspendeu as células antes de adicionar DNA, tudo a 4°C. Células quimicamente competentes de alta eficiência são tipicamente consideradas frágeis, e etapas de manuseio desse tipo geralmente são evitadas. Ainda assim, as células toleraram bem a concentração. Os efeitos combinados do aumento da exposição de DNA por célula e de um buffer menos inibitório, levando a um choque térmico mais intenso, resultaram em um aumento substancial na eficiência de transformação (>30x).

Este protocolo de transformação é inédito, embora uma abordagem conceitualmente semelhante⁠(abre em uma nova janela) — em que as células são concentradas em uma etapa anterior — já tenha sido relatada. Notavelmente, o método desenvolvido aqui pelo GPT‑5 é compatível com células quimicamente competentes comerciais, eliminando a necessidade de preparação interna de células e, ao mesmo tempo, superando os ganhos de eficiência relatados por uma abordagem semelhante em linhagens comparáveis.

Sistema robótico

Para aumentar o throughput deste sistema experimental modelo, a Robot on Rails e a Red Queen Bio colaboraram para construir um sistema robótico que recebe um protocolo de clonagem em linguagem natural e o executa no laboratório úmido.

O sistema combina três componentes: 1) um LLM de humano para robô que converte inglês simples nas ações do robô; 2) um sistema de visão que identifica e localiza utensílios de laboratório em tempo real; e 3) um planejador de trajetória do robô que determina como executar cada ação com segurança e precisão. O resultado é um robô de laboratório flexível e de uso geral, ainda mais otimizado para variações do protocolo de clonagem Gibson.

Testamos se o robô autônomo conseguiria executar um experimento completo de clonagem rodando dois protocolos simultaneamente: o método HiFi padrão e o R8, o protocolo modificado por IA com melhor desempenho na primeira rodada de otimização.Comparamos o trabalho do robô com experimentos realizados por humanos em cada etapa. O robô conduziu com sucesso o processo de transformação, que exigiu operações físicas diversas: transferir e misturar líquidos, mover tubos de amostra, aplicar calor controlado às células e espalhar células em placas de crescimento. Em comparação direta com transformações feitas por humanos, o robô gerou dados de qualidade semelhante, com melhorias equivalentes em relação ao baseline, mostrando um potencial inicial para automatizar e acelerar a otimização de experimentos biológicos.

Embora as variações em vezes entre os experimentos do robô e os feitos por humanos fossem semelhantes, as contagens absolutas de colônias do robô foram cerca de dez vezes menores do que na execução manual, indicando oportunidades de melhoria como precisão no manuseio de líquidos, calibração do controle de temperatura e reprodução das nuances das técnicas manuais de manuseio de células.

Tanto o método HiFi padrão (baseline) quanto o método R8 aprimorado foram executados por pesquisadores humanos e pelo robô autônomo, com as eficiências de transformação normalizadas pelos respectivos controles de baseline HiFi (definidos como 1,0). O R8 executado por humanos mostrou uma melhora de 2,39x; o R8 executado pelo robô atingiu 2,13x (89% do desempenho humano), demonstrando uma classificação de protocolos comparável apesar de rendimentos absolutos menores.

O futuro

Acreditamos que esses experimentos oferecem um retrato do que a ciência acelerada por IA será no futuro: modelos aprendendo continuamente e interagindo com o mundo real. Embora nossos experimentos tenham excluído a intervenção humana para medir puramente as capacidades do modelo, estamos especialmente animados com a IA ajudando cientistas⁠ a desenhar experimentos e contribuir para avanços na pesquisa.

À medida que trabalhamos para acelerar o progresso científico com segurança e responsabilidade, também buscamos avaliar e reduzir riscos, especialmente os relacionados à biosegurança. Os resultados dessas avaliações mostram que modelos podem raciocinar no laboratório úmido para melhorar protocolos e podem ter implicações para a biosegurança, como descrito em nosso Preparedness Framework⁠(abre em uma nova janela). Temos o compromisso de desenvolver⁠ salvaguardas necessárias e detalhadas, em nível de modelo e de sistema, para reduzir esses riscos, além de criar avaliações para acompanhar os níveis atuais.

Autores

Continuar lendo

Ver tudo

Scientific computing agentic AI card image (1x1)

Scientific computing in the age of agentic AI

Publicação28 de jul. de 2026

GPT-Red: Desbloqueando autoaperfeiçoamento para robustez

Segurança15 de jul. de 2026

Separando sinal de ruído em avaliações de programação

Pesquisa8 de jul. de 2026