17 de junho de 2026

Um químico de AI quase autónomo melhora uma reação desafiante em química medicinal

Com a Maria da Molecule.one, o GPT‑5.4 encontrou um aditivo surpreendente que aumentou os rendimentos do acoplamento de Chan-Lam em mais de 80% dos substratos testados.

Ler o artigo Ler a versão resumida da Cadeia de Pensamento

O trabalho da OpenAI em ciência é motivado por uma convicção simples: a AI avançada pode tornar-se uma parceira poderosa para os cientistas, ajudando-os a explorar mais ideias, a ligar conceitos distantes, a conceber melhores experiências e a acelerar descobertas que beneficiem a humanidade. Já partilhámos exemplos iniciais de modelos que contribuíram para resultados inéditos em matemática, incluindo trabalho sobre o problema da distância unitária⁠, em física teórica, através de um novo resultado sobre amplitudes de gluões⁠, e em biologia, onde o GPT‑5 ajudou a reduzir o custo da síntese de proteínas sem células⁠ num laboratório automatizado. Também apresentámos o GPT‑Rosalind⁠, um modelo criado especificamente para apoiar a investigação em ciências da vida e fluxos de trabalho de descoberta de fármacos.

Este projeto prolonga essa trajetória para a química medicinal, onde o progresso não pode ser medido apenas pelo raciocínio. Uma hipótese tem de funcionar no laboratório, com moléculas, instrumentos e ruído experimental reais. Em colaboração com a Molecule.one⁠(abre numa nova janela), ligámos o GPT‑5.4 à Maria — uma IA agêntica para química integrada num laboratório de alto rendimento para investigação autónoma — e demos-lhe um objetivo em aberto: melhorar uma de várias classes importantes de reações. O sistema gerou propostas de investigação, concebeu e executou experiências, analisou dados experimentais e propôs experiências de seguimento. Os humanos permaneceram no ciclo ao conceberem prompts de orientação e avaliação e ao selecionarem propostas a testar. Também fizeram correções limitadas aos planos experimentais, ajudaram em operações laboratoriais básicas e validaram de forma independente o resultado final.

A proposta mais promissora, OAI-M1-03, centrou-se numa versão difícil mas útil do acoplamento de Chan–Lam, uma reação que os químicos usam para formar ligações carbono-azoto. Partindo do objetivo aberto de melhorar o acoplamento de Chan–Lam para química de processos, o GPT‑5.4 identificou de forma independente as sulfonamidas primárias como uma classe de substratos desafiante e de elevado valor, e sugeriu que oxidantes suaves, incluindo TEMPO, poderiam melhorar a reação.

Ao longo de dois ciclos de experimentação no Maria Lab, essa ideia produziu uma melhoria significativa. Nas condições otimizadas, os rendimentos medidos melhoraram em 88% dos ácidos borónicos e 83% das sulfonamidas testados. O rendimento médio subiu de 16,6% para 25,2%, e a percentagem de reações com rendimento acima de 30% aumentou de 15,6% para 37,5%. Depois, químicos humanos repetiram reações representativas à escala de bancada. Essas experiências confirmaram os resultados à escala de microlitros, mostrando rendimentos mais elevados em 11 de 14 pares de substratos, com um aumento superior ao dobro na maioria dos casos. Isto é importante porque os químicos medicinais precisam de reações que funcionem não só em experiências de rastreio à escala de microlitros, mas também nos fluxos de trabalho laboratoriais práticos usados durante a descoberta de fármacos.

As melhorias nesta área da química medicinal são particularmente entusiasmantes porque a síntese é muitas vezes um grande estrangulamento na descoberta de fármacos: os cientistas só podem testar as moléculas que conseguem produzir ou obter de outra forma. O grupo sulfonamida aparece em medicamentos de uma vasta gama de áreas terapêuticas, incluindo fármacos anticancerígenos, antimicrobianos e diuréticos, mas o acoplamento de Chan–Lam de sulfonamidas primárias com ácidos borónicos tem historicamente produzido baixos rendimentos. Tornar esta forma da reação mais fiável poderá dar aos químicos medicinais uma forma mais ampla e prática de produzir e explorar moléculas potencialmente úteis.

Embora este ainda seja um resultado inicial, oferece outro exemplo concreto da direção mais ampla em que estamos a trabalhar: sistemas de AI que podem tornar-se parceiros valiosos para cientistas em grande parte do ciclo de investigação. O modelo reviu a literatura, propôs uma ideia inesperada, ajudou a conceber e analisar experiências, e chegou a uma descoberta científica que químicos humanos puderam avaliar.

Maria Lab: o laboratório especializado de alto rendimento da Molecule.one que executou 10 080 reações no OAI-M1-03

Porque é que o problema de química importa

A química orgânica sustenta todos os medicamentos de moléculas pequenas, bem como produtos na agricultura, na eletrónica e na ciência dos materiais. Uma reação é especialmente útil quando consegue formar o mesmo tipo de ligação química de forma fiável em muitos materiais de partida diferentes. Quando as reações produzem baixos rendimentos ou demasiados subprodutos indesejados, os químicos podem ter de abandonar moléculas de outro modo promissoras ou dedicar muito tempo ao desenvolvimento de uma rota diferente. Isto torna a síntese um grande estrangulamento na descoberta de fármacos: em geral, os cientistas só podem testar as moléculas que conseguem produzir ou obter de outra forma.

O acoplamento de Chan–Lam é útil em química medicinal porque forma ligações carbono-azoto, que são comuns nos medicamentos. No entanto, a reação não funciona igualmente bem para todas as classes de moléculas. Em particular, o acoplamento de sulfonamidas primárias com ácidos borónicos tem historicamente produzido baixos rendimentos. As sulfonamidas são uma família importante de moléculas presentes em medicamentos usados em oncologia e doenças infeciosas. Tornar esta reação mais fiável poderá dar aos químicos medicinais uma forma mais ampla e prática de produzir e explorar moléculas potencialmente úteis.

Ligar o GPT‑5.4 à Maria AI e ao Lab

O sistema combinado juntou capacidades complementares. Prompts escritos por cientistas que trabalhavam com a Maria AI foram usados com o GPT‑5.4 dentro de um harness para gerar e ordenar milhares de possíveis propostas de investigação. Químicos humanos analisaram o pequeno subconjunto de propostas mais bem classificadas pelo sistema e selecionaram quatro para testes laboratoriais. Depois, a Maria AI traduziu os planos de alto nível selecionados em instruções laboratoriais detalhadas, executou milhares de experiências de alto rendimento, analisou os dados brutos e devolveu resultados estruturados ao GPT‑5.4.

Uma das quatro propostas selecionadas, OAI-M1-03, sugeriu a utilização de oxidantes suaves, como o TEMPO, para melhorar o desempenho da reação de Chan-Lam na síntese de sulfonamidas. Os químicos consideraram a sugestão simultaneamente surpreendente e interessante. Partilhamos as conclusões detalhadas do OAI-M1-03 nesta publicação do blog e no artigo⁠(abre numa nova janela). Estamos também a partilhar a cadeia de pensamento do modelo reescrita⁠(abre numa nova janela) para o OAI-M1-03.

A proposta de investigação final foi então usada pela Maria para gerar grelhas experimentais, com ligeiras correções por humanos. A maior correção humana foi evitar o dimetilsulfóxido, ou DMSO, como solvente, porque os químicos receavam que pudesse reagir com os oxidantes mais fortes usados como comparadores.

O processo completo demorou três meses, desde o primeiro prompt em 4 de março até à partilha dos resultados de OAI-M1-03 com especialistas independentes em 4 de junho.

Descrevemos este fluxo de trabalho como quase autónomo, não totalmente autónomo, porque os químicos humanos continuaram a tomar decisões importantes ao longo de todo o processo. O modelo propôs as principais ideias de investigação, enquanto químicos humanos forneceram orientação e juízo de alto nível, corrigiram detalhes experimentais, ajudaram a preparar consumíveis e reagentes laboratoriais, e repetiram manualmente experiências-chave.

O que descobrimos

OAI-M1-03 identificou o TEMPO como um aditivo útil para o acoplamento de Chan-Lam de sulfonamidas primárias aqui estudado. Nas condições otimizadas, a reação melhorou de duas formas: o rendimento médio aumentou e mais combinações de substratos atingiram rendimentos praticamente úteis.

Ao longo de dois ciclos, a Maria executou um total de 10 080 reações — mais do que um químico que fizesse três reações todos os dias executaria numa década. Essa escala foi importante porque os resultados de química podem ser enganadores quando são testados apenas em poucos exemplos. Uma reação pode parecer promissora num par de materiais de partida, mas falhar num conjunto mais amplo de moléculas. Milhares de reações permitiram identificar o TEMPO entre dez oxidantes testados, observar a repetição do efeito em combinações diversas e encontrar as suas limitações.

Depois de analisar a primeira ronda de dados, o sistema propôs uma segunda ronda de experiências mais focada para testar hipóteses de seguimento. Uma conclusão útil de seguimento foi que o TEMPO podia ser substituído por um análogo muito mais barato, 4-hidroxi-TEMPO, com pouca perda de desempenho.

Gráfico que compara o desempenho de TEMPO, 4-hydroxy-TEMPO, 4-oxo-TEMPO e PMP com estruturas químicas.

O resultado também se manteve para além do formato de rastreio à escala de microlitros do Maria Lab. Químicos humanos reproduziram manualmente reações representativas à escala de bancada e observaram um aumento do rendimento em 11 de 14 pares de substratos; em oito pares, o aumento foi superior ao dobro. Essa replicação é importante porque experiências em escala muito pequena podem por vezes introduzir artefactos que desaparecem a uma escala maior. A validação à escala de bancada também é habitual antes de a investigação ser publicada numa revista científica.

Frascos de reação de vidro rotulados de experiências de validação à escala de bancada da Molecule.one.

Tubos de reação da validação manual à escala de bancada.

O TEMPO melhora a formação de produto à escala de bancada

Quatro especialistas externos em química analisaram a pré-publicação que descreve OAI-M1-03. As suas avaliações sustentaram a nossa perspetiva de que o resultado era novo e merecia ser partilhado com a comunidade científica. O teste mais forte virá a seguir: saber se laboratórios independentes conseguem reproduzir o resultado e se os químicos o consideram útil numa gama mais ampla de moléculas.

“A fusão da experimentação de alto rendimento com a AI moderna representa uma nova fronteira da descoberta científica. Esta nova reação é uma demonstração poderosa, na qual condições excecionalmente suaves e um oxidante prático permitem um âmbito de substratos agradavelmente geral para uma das reações mais populares na síntese de fármacos.”

—Tim Cernak, Professor Associado de Química Medicinal, Universidade do Michigan

Das outras três propostas geradas pelo GPT‑5.4 e testadas pela Maria durante o período de três meses, OAI-M1-02 e OAI-M1-04 foram comprovadas experimentalmente no Maria Lab, enquanto OAI-M1-01 foi refutada. A análise destes resultados está em curso.

Limitações

Este trabalho mostra que um modelo pode dar um contributo útil em química orgânica. Fez mais do que resumir a literatura ou sugerir uma experiência isolada: propôs uma hipótese específica e surpreendente e apresentou-a para análise humana, concebeu experiências, interpretou dados experimentais e concebeu experiências de seguimento.

Não mostra que a AI consiga executar de forma independente um programa de investigação em química do princípio ao fim. O juízo humano continuou a ser essencial, e o fluxo de trabalho dependeu de infraestrutura especializada de alto rendimento. Também não estabelece que o método vá generalizar-se a outras reações de acoplamento, outras classes de substratos ou condições de fabrico.

As estimativas de rendimento vieram de uma plataforma de alto rendimento, e a validação em bancada abrangeu 14 pares de substratos representativos. É necessário mais trabalho para caracterizar o mecanismo da reação, definir o âmbito dos substratos, medir o desempenho em diferentes condições laboratoriais e reproduzir o resultado de forma independente.

Preparação

As capacidades em química exigem tratamento cuidadoso, porque as mesmas ferramentas que podem apoiar a medicina e a ciência dos materiais também podem ser usadas indevidamente. Delimitámos deliberadamente este trabalho a um problema legítimo de química medicinal: melhorar uma reação de acoplamento conhecida usada para produzir moléculas semelhantes a fármacos. As experiências não envolveram toxinas, armas químicas nem pedidos para conceber compostos nocivos. Estes resultados não devem ser lidos como prova de que o sistema pode ajudar nessas aplicações nocivas. O projeto não testou nem demonstrou isso.

Avaliamos e mitigamos riscos emergentes decorrentes das capacidades avançadas dos modelos através do nosso Preparedness Framework⁠, incluindo riscos relacionados com os domínios químico e biológico. O modelo usado neste trabalho já tinha passado por avaliações relevantes com o UK AI Security Institute, e o sistema foi concebido para recusar pedidos focados em aplicações nocivas. O fluxo de trabalho experimental acrescentou outra camada de controlo: químicos humanos selecionaram que propostas entravam no laboratório, reviram planos experimentais e mantiveram o controlo da infraestrutura física.

Pensamos que esta é a forma responsável de estudar o potencial da AI em química experimental: escolher um espaço de problema com valor científico claro, combinar salvaguardas ao nível do modelo com supervisão especializada e avaliar o sistema através de experiências físicas limitadas. À medida que estas capacidades melhorarem, continuaremos a avaliar riscos emergentes, a reforçar salvaguardas e a ser específicos sobre o que um resultado implica e não implica.

O que se segue

Os próximos passos imediatos são científicos: testar uma gama mais ampla de materiais de partida, investigar por que razão os aditivos melhoram a reação, mapear onde o efeito funciona e falha, e apoiar a replicação independente. Em conjunto, estes estudos determinarão quão amplamente o método pode ser aplicado e quão útil é em fluxos de trabalho práticos de química medicinal.

O nosso objetivo a mais longo prazo é tornar os sistemas de AI parceiros científicos fiáveis que ajudem os investigadores a gerar hipóteses, conceber experiências, interpretar resultados e decidir o que testar a seguir, mantendo-se fundamentados no juízo especializado, em medições fiáveis e em salvaguardas fortes. A química orgânica é uma área de impacto particularmente elevado porque o progresso na descoberta e no fabrico de moléculas pequenas depende da capacidade de produzir moléculas de forma fiável. Os cientistas só podem testar moléculas que conseguem produzir, e uma síntese melhor pode expandir a gama de ideias que podem explorar na medicina, na agricultura, na eletrónica, na energia e na ciência dos materiais. Este resultado é um exemplo inicial dessa direção mais ampla: um modelo de fronteira, agentes especializados, um laboratório automatizado e químicos humanos a trabalhar em conjunto para avançar mais depressa no ciclo de investigação e produzir conclusões que a comunidade científica possa avaliar, reproduzir e desenvolver.

Estamos gratos à equipa da Molecule.one e aos químicos independentes que analisaram este trabalho.

2026

Autor

OpenAI