17 de junho de 2026

Um químico de AI quase autônomo melhora uma reação desafiadora na química medicinal

Com a Maria, da Molecule.one, o GPT‑5.4 encontrou um aditivo surpreendente que aumentou os rendimentos do acoplamento Chan-Lam em mais de 80% dos substratos testados.

Leia o artigo Leia a versão resumida da Cadeia de Pensamentos

O trabalho da OpenAI em ciência é motivado por uma crença simples: a AI avançada pode se tornar uma parceira poderosa para cientistas, ajudando-os a explorar mais ideias, conectar conceitos distantes, projetar experimentos melhores e acelerar descobertas que beneficiem a humanidade. Já compartilhamos exemplos iniciais de modelos que contribuíram para resultados inéditos em matemática, incluindo trabalhos sobre o problema da distância unitária⁠, em física teórica, por meio de um novo resultado sobre amplitudes de glúons⁠, e em biologia, onde o GPT‑5 ajudou a reduzir o custo da síntese de proteínas livre de células⁠ em um laboratório automatizado. Também apresentamos o GPT‑Rosalind⁠, um modelo criado especificamente para apoiar pesquisas em ciências da vida e fluxos de trabalho de descoberta de medicamentos.

Este projeto estende essa trajetória para a química medicinal, em que o progresso não pode ser medido apenas pelo raciocínio. Uma hipótese precisa funcionar no laboratório, com moléculas, instrumentos e ruído experimental reais. Trabalhando com a Molecule.one⁠(abre em uma nova janela), conectamos o GPT‑5.4 à Maria — uma IA química agêntica integrada a um laboratório de alta produtividade para pesquisa autônoma — e demos a ela um objetivo em aberto: melhorar uma de várias classes importantes de reações. O sistema gerou propostas de pesquisa, projetou e executou experimentos, analisou dados experimentais e propôs experimentos de acompanhamento. Humanos permaneceram no loop ao criar prompts de direcionamento e avaliação e selecionar propostas a serem testadas. Eles também fizeram correções limitadas aos planos experimentais, auxiliaram em operações laboratoriais básicas e validaram independentemente o resultado final.

A proposta mais promissora, OAI-M1-03, concentrou-se em uma versão difícil, mas útil, do acoplamento Chan–Lam, uma reação que químicos usam para formar ligações carbono-nitrogênio. Partindo da meta em aberto de melhorar o acoplamento Chan–Lam para química de processos, o GPT‑5.4 identificou de forma independente as sulfonamidas primárias como uma classe de substratos desafiadora e de alto valor, e sugeriu que oxidantes suaves, incluindo TEMPO, poderiam melhorar a reação.

Ao longo de dois ciclos de experimentação no Maria Lab, essa ideia produziu uma melhoria significativa. Nas condições otimizadas, os rendimentos medidos melhoraram para 88% dos ácidos borônicos e 83% das sulfonamidas testadas. O rendimento médio subiu de 16,6% para 25,2%, e a parcela de reações com rendimento acima de 30% aumentou de 15,6% para 37,5%. Em seguida, químicos humanos repetiram reações representativas em escala de bancada. Esses experimentos confirmaram os resultados em escala de microlitros, mostrando rendimentos maiores em 11 de 14 pares de substratos, com aumento superior a duas vezes na maioria dos casos. Isso importa porque químicos medicinais precisam de reações que funcionem não apenas em experimentos de triagem em microlitros, mas também em fluxos de trabalho práticos de laboratório usados durante a descoberta de medicamentos.

Melhorias nessa área da química medicinal são particularmente empolgantes porque a síntese costuma ser um grande gargalo na descoberta de medicamentos: cientistas só podem testar as moléculas que conseguem produzir ou obter de outra forma. O grupo sulfonamida aparece em medicamentos de uma ampla gama de áreas terapêuticas, incluindo fármacos anticâncer, antimicrobianos e diuréticos, mas o acoplamento Chan–Lam de sulfonamidas primárias com ácidos borônicos historicamente produziu baixos rendimentos. Tornar essa forma da reação mais confiável poderia oferecer aos químicos medicinais uma maneira mais ampla e prática de produzir e explorar moléculas potencialmente úteis.

Embora este ainda seja um resultado inicial, ele oferece outro exemplo concreto da direção mais ampla em que estamos trabalhando: sistemas de AI que possam se tornar parceiros valiosos para cientistas em grande parte do ciclo de pesquisa. O modelo revisou a literatura, propôs uma ideia inesperada, ajudou a projetar e analisar experimentos e chegou a uma descoberta científica que químicos humanos puderam avaliar.

Maria Lab: laboratório especializado de alta produtividade da Molecule.one que realizou 10.080 reações no OAI-M1-03

Por que o problema de química é importante

A química orgânica sustenta todos os medicamentos de pequenas moléculas, além de produtos na agricultura, eletrônica e ciência dos materiais. Uma reação é especialmente útil quando consegue formar o mesmo tipo de ligação química de maneira confiável em muitos materiais de partida diferentes. Quando as reações produzem baixos rendimentos ou subprodutos indesejados demais, químicos podem ter de abandonar moléculas que de outra forma seriam promissoras ou dedicar muito tempo ao desenvolvimento de uma rota diferente. Isso torna a síntese um grande gargalo na descoberta de medicamentos: em geral, cientistas só podem testar as moléculas que conseguem produzir ou obter de outra forma.

O acoplamento Chan–Lam é útil na química medicinal porque forma ligações carbono-nitrogênio, comuns em medicamentos. No entanto, a reação não funciona igualmente bem para todas as classes de moléculas. Em particular, o acoplamento de sulfonamidas primárias com ácidos borônicos historicamente produziu baixos rendimentos. As sulfonamidas são uma família importante de moléculas encontradas em medicamentos usados em oncologia e doenças infecciosas. Tornar essa reação mais confiável poderia oferecer aos químicos medicinais uma maneira mais ampla e prática de produzir e explorar moléculas potencialmente úteis.

Conectando o GPT‑5.4 à Maria AI e ao Lab

O sistema combinado reuniu capacidades complementares. Prompts escritos por cientistas que trabalhavam com a Maria AI foram usados com o GPT‑5.4 dentro de um arcabouço para gerar e classificar milhares de possíveis propostas de pesquisa. Químicos humanos revisaram o pequeno subconjunto de propostas que recebeu a classificação mais alta segundo o sistema e selecionaram quatro para testes em laboratório. Em seguida, a Maria AI traduziu os planos de alto nível selecionados em instruções detalhadas de laboratório, executou milhares de experimentos de alta taxa de processamento, analisou os dados brutos e retornou resultados estruturados ao GPT‑5.4.

Uma das quatro propostas selecionadas, OAI-M1-03, sugeriu o uso de oxidantes suaves, como TEMPO, para melhorar o desempenho da reação de Chan-Lam na síntese de sulfonamidas. Químicos consideraram a sugestão ao mesmo tempo surpreendente e interessante. Compartilhamos as descobertas detalhadas do OAI-M1-03 nesta publicação do blog e no artigo⁠(abre em uma nova janela). Também estamos compartilhando a cadeia de pensamento do modelo reescrita⁠(abre em uma nova janela) para OAI-M1-03.

A proposta final de pesquisa foi então usada pela Maria para gerar grades experimentais, com pequenas correções feitas por humanos. A maior correção humana foi evitar o dimetilsulfóxido, ou DMSO, como solvente, porque os químicos temiam que ele pudesse reagir com os oxidantes mais fortes usados como comparadores.

O processo completo levou três meses, do primeiro prompt em 4 de março ao compartilhamento dos resultados de OAI-M1-03 com especialistas independentes em 4 de junho.

Descrevemos esse fluxo de trabalho como quase autônomo, não totalmente autônomo, porque químicos humanos ainda tomaram decisões importantes ao longo do processo. O modelo propôs as principais ideias de pesquisa, enquanto químicos humanos forneceram direcionamento e julgamento em alto nível, corrigiram detalhes experimentais, ajudaram a preparar consumíveis e reagentes de laboratório e repetiram manualmente experimentos importantes.

O que descobrimos

OAI-M1-03 identificou o TEMPO como um aditivo útil para o acoplamento Chan-Lam de sulfonamida primária estudado aqui. Nas condições otimizadas, a reação melhorou de duas maneiras: o rendimento médio aumentou, e mais combinações de substratos alcançaram rendimentos praticamente úteis.

Ao longo de dois ciclos, a Maria executou um total de 10.080 reações — mais do que um químico executando três reações todos os dias faria em uma década. Essa escala foi importante porque resultados de química podem ser enganosos quando são testados em apenas alguns exemplos. Uma reação pode parecer promissora em um par de materiais de partida, mas falhar em um conjunto mais amplo de moléculas. Milhares de reações tornaram possível identificar o TEMPO entre dez oxidantes testados, observar o efeito se repetir em combinações diversas e encontrar suas limitações.

Após analisar a primeira rodada de dados, o sistema propôs uma segunda rodada de experimentos mais focada para testar hipóteses de acompanhamento. Uma descoberta útil de acompanhamento foi que o TEMPO poderia ser substituído por um análogo muito mais barato, 4-hidroxi-TEMPO, com pouca perda de desempenho.

Gráfico comparando o desempenho de TEMPO, 4-hidroxi-TEMPO, 4-oxo-TEMPO e PMP com estruturas químicas.

O resultado também se manteve além do formato de triagem em escala de microlitros do Maria Lab. Químicos humanos reproduziram manualmente reações representativas em escala de bancada e observaram aumento no rendimento em 11 de 14 pares de substratos; em oito pares, o aumento foi superior a duas vezes. Essa replicação importa porque experimentos em escala muito pequena às vezes podem introduzir artefatos que desaparecem em uma escala maior. A validação em escala de bancada também é habitual antes de uma pesquisa ser publicada em uma revista científica.

Frascos de reação de vidro rotulados dos experimentos de validação em escala de bancada da Molecule.one.

Frascos de reação da validação manual em escala de bancada.

TEMPO melhora a formação de produto em escala de bancada

Quatro especialistas externos em química revisaram o preprint que descreve OAI-M1-03. Suas avaliações apoiaram nossa visão de que o resultado era novo e valia a pena ser compartilhado com a comunidade científica. O teste mais forte virá a seguir: se laboratórios independentes conseguem reproduzir o resultado e se químicos o consideram útil em uma gama mais ampla de moléculas.

“A fusão entre experimentação de alta taxa de processamento e AI moderna representa uma nova fronteira da descoberta científica. Essa nova reação é uma demonstração poderosa, em que condições excepcionalmente suaves e um oxidante prático possibilitam um escopo de substratos bastante geral para uma das reações mais populares na síntese de medicamentos.”

—Tim Cernak, professor associado de Química Medicinal, Universidade de Michigan

Das outras três propostas geradas pelo GPT‑5.4 e testadas pela Maria durante o período de três meses, OAI-M1-02 e OAI-M1-04 foram comprovadas experimentalmente no Maria Lab, enquanto OAI-M1-01 foi refutada. A análise desses resultados está em andamento.

Limitações

Este trabalho mostra que um modelo pode fazer uma contribuição útil na química orgânica. Ele fez mais do que resumir a literatura ou sugerir um experimento pontual: propôs uma hipótese específica e surpreendente e a submeteu à revisão humana, projetou experimentos, interpretou dados experimentais e projetou experimentos de acompanhamento.

Ele não mostra que a AI pode conduzir de forma independente um programa de pesquisa em química do início ao fim. O julgamento humano permaneceu essencial, e o fluxo de trabalho dependeu de infraestrutura especializada de alta taxa de processamento. Ele também não estabelece que o método vá se generalizar para outras reações de acoplamento, outras classes de substratos ou condições de fabricação.

As estimativas de rendimento vieram de uma plataforma de alta taxa de processamento, e a validação em bancada cobriu 14 pares de substratos representativos. É necessário mais trabalho para caracterizar o mecanismo da reação, definir o escopo de substratos, medir o desempenho em diferentes condições de laboratório e reproduzir o resultado de forma independente.

Preparedness

Capacidades em química exigem tratamento cuidadoso porque as mesmas ferramentas que podem apoiar a medicina e a ciência dos materiais também poderiam ser usadas indevidamente. Deliberadamente delimitamos este trabalho a um problema legítimo de química medicinal: melhorar uma reação de acoplamento conhecida usada para produzir moléculas semelhantes a fármacos. Os experimentos não envolveram toxinas, armas químicas nem solicitações para projetar compostos nocivos. Esses resultados não devem ser lidos como evidência de que o sistema pode ajudar nessas aplicações nocivas. O projeto não testou nem demonstrou isso.

Avaliamos e mitigamos riscos emergentes de capacidades avançadas de modelos por meio do nosso Preparedness Framework⁠, incluindo riscos relacionados aos domínios químico e biológico. O modelo usado neste trabalho já havia passado por avaliações relevantes com o UK AI Security Institute, e o sistema foi projetado para recusar solicitações focadas em aplicações nocivas. O fluxo de trabalho experimental adicionou outra camada de controle: químicos humanos selecionaram quais propostas entrariam no laboratório, revisaram planos experimentais e mantiveram o controle da infraestrutura física.

Acreditamos que esta é a maneira responsável de estudar o potencial da AI na química experimental: escolher um espaço de problemas com valor científico claro, combinar salvaguardas no nível do modelo com supervisão especializada e avaliar o sistema por meio de experimentos físicos restritos. À medida que essas capacidades melhorarem, continuaremos avaliando riscos emergentes, fortalecendo salvaguardas e sendo específicos sobre o que um resultado implica e não implica.

O que vem a seguir

Os próximos passos imediatos são científicos: testar uma gama mais ampla de materiais de partida, investigar por que os aditivos melhoram a reação, mapear onde o efeito funciona e falha, e apoiar a replicação independente. Juntos, esses estudos determinarão quão amplamente o método pode ser aplicado e quão útil ele é em fluxos de trabalho práticos de química medicinal.

Nosso objetivo de longo prazo é tornar os sistemas de AI parceiros científicos confiáveis que ajudem pesquisadores a gerar hipóteses, projetar experimentos, interpretar resultados e decidir o que testar em seguida, mantendo-se fundamentados no julgamento de especialistas, em medições confiáveis e em salvaguardas robustas. A química orgânica é uma área de alavancagem particularmente alta porque o progresso na descoberta e fabricação de pequenas moléculas depende da capacidade de produzir moléculas de forma confiável. Cientistas só podem testar moléculas que conseguem produzir, e uma síntese melhor pode ampliar a gama de ideias que podem explorar na medicina, agricultura, eletrônica, energia e ciência dos materiais. Este resultado é um exemplo inicial dessa direção mais ampla: um modelo de fronteira, agentes especializados, um laboratório automatizado e químicos humanos trabalhando juntos para avançar mais rápido pelo ciclo de pesquisa e produzir descobertas que a comunidade científica possa avaliar, reproduzir e desenvolver.

Agradecemos à equipe da Molecule.one e aos químicos independentes que revisaram este trabalho.

2026

Autoria

OpenAI