17 de juny del 2026

Un químic d’IA gairebé autònom millora una reacció difícil en química medicinal

Amb Maria de Molecule.one, GPT‑5.4 va trobar un additiu sorprenent que augmenta els rendiments de l'acoblament Chan-Lam en més del 80 % dels substrats provats.

Llegeix l'article Llegeix la cadena de pensament abreujada

La feina d’OpenAI en l’àmbit de la ciència es basa en una convicció senzilla: la IA avançada pot esdevenir una aliada poderosa per als científics, ajudant-los a explorar més idees, connectar conceptes llunyans, dissenyar experiments millors i accelerar descobriments que beneficiïn la humanitat. Ja hem compartit exemples inicials de models que contribueixen a resultats nous en matemàtiques, inclosa la feina sobre el problema de la distància unitària⁠, en física teòrica, mitjançant un nou resultat sobre amplituds de gluons⁠, i en biologia, on GPT‑5 va ajudar a reduir el cost de la síntesi proteica sense cèl·lules⁠ en un laboratori automatitzat. També hem presentat GPT‑Rosalind⁠, un model dissenyat específicament per donar suport a la recerca en ciències de la vida i als fluxos de treball de descobriment de fàrmacs.

Aquest projecte estén aquesta trajectòria cap a la química medicinal, on el progrés no es pot mesurar només amb el raonament. Una hipòtesi ha de funcionar al laboratori amb molècules reals, instruments i soroll experimental. Treballant amb Molecule.one⁠(s'obre en una finestra nova), vam connectar GPT‑5.4 a Maria —una IA química agentiva integrada amb un laboratori d'alt rendiment per a la recerca autònoma— i li vam assignar un objectiu obert: millorar una de diverses classes de reaccions importants. El sistema va generar propostes de recerca, va dissenyar i executar experiments, va analitzar dades experimentals i va proposar experiments de seguiment. Els humans van continuar participant en el procés dissenyant indicacions d’orientació i d’avaluació, i seleccionant les propostes que calia provar. També van fer correccions puntuals als plans experimentals, van ajudar en operacions bàsiques de laboratori i van validar de manera independent el resultat final.

La proposta més prometedora, OAI-M1-03, se centrava en una versió difícil però útil de l’acoblament de Chan–Lam, una reacció que els químics utilitzen per formar enllaços carboni-nitrogen. Partint de l’objectiu obert de millorar l’acoblament de Chan–Lam per a la química de processos, GPT‑5.4 va identificar de manera independent les sulfonamides primàries com una classe de substrats difícil i d’alt valor, i va suggerir que oxidants suaus, inclòs TEMPO, podrien millorar la reacció.

Al llarg de dos cicles d’experimentació a Maria Lab, aquella idea va produir una millora significativa. En les condicions optimitzades, els rendiments mesurats van millorar per al 88 % dels àcids bòrics provats i per al 83 % de les sulfonamides provades. El rendiment mitjà va augmentar del 16,6 % al 25,2 %, i la proporció de reaccions amb un rendiment superior al 30 % va augmentar del 15,6 % al 37,5 %. A continuació, químics humans van repetir reaccions representatives a escala de laboratori. Aquests experiments van confirmar els resultats a escala de microlitres i van mostrar rendiments més elevats en 11 de les 14 parelles de substrats, amb un augment de més del doble en la majoria dels casos. Això és important perquè els químics especialitzats en química mèdica necessiten reaccions que funcionin no només en experiments de cribratge a escala de microlitres, sinó també en fluxos de treball de laboratori pràctics utilitzats durant el descobriment de fàrmacs.

Les millores en aquest àmbit de la química mèdica són especialment emocionants perquè la síntesi sovint és un coll d'ampolla important en el descobriment de fàrmacs: els científics només poden provar les molècules que poden sintetitzar o obtenir d'una altra manera. El grup sulfonamida apareix en medicaments d'una àmplia gamma d'àrees terapèutiques, incloent-hi fàrmacs anticancerígens, antimicrobians i diürètics, però l'acoblament Chan–Lam de sulfonamides primàries amb àcids bòrics ha donat històricament rendiments baixos. Fer que aquesta forma de la reacció sigui més fiable podria oferir als químics mèdics una manera més àmplia i pràctica de produir i explorar molècules potencialment útils.

Tot i que encara és un resultat preliminar, proporciona un altre exemple concret de la direcció més àmplia cap a la qual estem avançant: sistemes d’IA que poden esdevenir col·laboradors valuosos per als científics al llarg de bona part del cicle de recerca. El model va revisar la bibliografia científica, va proposar una idea inesperada, va ajudar a dissenyar i analitzar experiments i va arribar a una troballa científica que els químics humans podien avaluar.

Maria Lab: el laboratori d'alt rendiment especialitzat de Molecule.one que va executar 10.080 reaccions en OAI-M1-03

Per què és important el problema de química

La química orgànica fonamenta tots els medicaments de molècula petita, així com productes dels àmbits de l’agricultura, l’electrònica i la ciència dels materials. Una reacció és especialment útil quan pot formar de manera fiable el mateix tipus d’enllaç químic en molts materials de partida diferents. Quan les reaccions tenen rendiments baixos o generen massa subproductes no desitjats, els químics poden haver d’abandonar molècules que, altrament, serien prometedores o dedicar molt de temps a desenvolupar una via diferent. Això fa que la síntesi sigui un coll d’ampolla important en el descobriment de fàrmacs: en general, els científics només poden provar les molècules que poden produir o obtenir d’una altra manera.

L’acoblament de Chan–Lam és útil en química medicinal perquè forma enllaços carboni-nitrogen, que són habituals en els medicaments. Tanmateix, la reacció no funciona igual de bé per a totes les classes de molècules. En particular, la combinació de sulfonamides primàries amb àcids bòrics ha produït històricament rendiments baixos. Les sulfonamides són una família important de molècules que es troben en medicaments utilitzats en oncologia i en malalties infeccioses. Augmentar la fiabilitat d’aquesta reacció podria oferir als especialistes en química medicinal una manera més àmplia i pràctica de produir i explorar molècules potencialment útils.

Connectant GPT‑5.4 a Maria AI i Lab

El sistema combinat aparellava capacitats complementàries. Les indicacions escrites per científics que treballaven amb Maria AI es van utilitzar amb GPT‑5.4 dins d’un marc d’execució per generar i classificar milers de possibles propostes de recerca. Químics humans van revisar el petit subconjunt de propostes que el sistema havia classificat en les posicions més altes i en van seleccionar quatre per fer proves de laboratori. Després, Maria AI va traduir els plans d’alt nivell seleccionats en instruccions de laboratori detallades, va executar milers d’experiments d’alt rendiment, va analitzar les dades en brut i va retornar resultats estructurats a GPT‑5.4.

Una de les quatre propostes seleccionades, OAI-M1-03, suggeria utilitzar oxidants suaus com ara TEMPO per millorar el rendiment de la reacció de Chan-Lam en la síntesi de sulfonamides. Els químics van trobar el suggeriment alhora sorprenent i interessant. Compartim les conclusions detallades d'OAI-M1-03 en aquesta entrada del blog i a l'article⁠(s'obre en una finestra nova). També compartim la cadena de pensament reescrita del model⁠(s'obre en una finestra nova) OAI-M1-03.

La proposta de recerca final va ser després utilitzada per Maria per generar xarxes experimentals, amb lleugeres correccions humanes. La correcció humana més important va ser evitar el dimetilsulfòxid, o DMSO, com a dissolvent perquè els químics temien que pogués reaccionar amb els oxidants més forts utilitzats com a comparació.

El procés complet va durar tres mesos, des de la primera indicació el 4 de març fins que es van compartir els resultats d’OAI-M1-03 amb experts independents.

Descrivim aquest flux de treball com a gairebé autònom, i no com a plenament autònom, perquè els químics humans encara van prendre decisions importants al llarg de tot el procés. El model va proposar les idees clau de recerca, mentre que els químics humans van proporcionar orientació d’alt nivell i criteri, van corregir detalls experimentals, van ajudar a preparar consumibles de laboratori i reactius, i van repetir manualment els experiments clau.

El que hem trobat

OAI-M1-03 va identificar el TEMPO com un additiu útil per a l’acoblament de Chan-Lam de sulfonamida primària estudiat aquí. En les condicions optimitzades, la reacció va millorar de dues maneres: el rendiment mitjà va augmentar i més combinacions de substrats van assolir rendiments útils a efectes pràctics.

En dos cicles, Maria va dur a terme un total de 10.080 reaccions, més que un químic que fes tres reaccions cada dia en una dècada. Aquesta escala era important perquè els resultats químics poden ser enganyosos quan es posen a prova només amb uns quants exemples. Una reacció pot semblar prometedora amb un parell concret de materials de partida, però no funcionar en un conjunt més ampli de molècules. Milers de reaccions van permetre identificar TEMPO entre deu oxidants assajats, observar que l’efecte es repetia en combinacions diverses i trobar-ne les limitacions.

Després d’analitzar la primera ronda de dades, el sistema va proposar una segona ronda d’experiments més focalitzada per provar hipòtesis de seguiment. Una troballa posterior útil va ser que el TEMPO es podia substituir per un anàleg molt més barat, el 4-hidroxi-TEMPO, amb poca pèrdua de rendiment.

Gràfic que compara el rendiment de TEMPO, 4-hidroxi-TEMPO, 4-oxo-TEMPO i PMP amb estructures químiques.

El resultat també es va mantenir més enllà del format de cribratge a escala de microlitres de Maria Lab. Els químics humans van reproduir manualment reaccions representatives a escala de laboratori i van observar un augment del rendiment en 11 dels 14 parells de substrats; en vuit parells, l’augment va ser superior al doble. Aquesta replicació és important perquè els experiments a molt petita escala de vegades poden introduir artefactes que desapareixen a una escala més gran. La validació a escala de banc també és habitual abans que la recerca es publiqui en una revista científica.

Vials de reacció de vidre etiquetats dels experiments de validació a escala de laboratori de Molecule.one.

Vials de reacció de la validació manual a escala de laboratori.

TEMPO millora la formació del producte a escala de laboratori

Quatre experts externs en química van revisar l'article preliminar que descrivia l'OAI-M1-03. Les seves avaluacions van avalar la nostra opinió que el resultat era nou i mereixia ser compartit amb la comunitat científica. La prova més exigent vindrà a continuació: si els laboratoris independents poden reproduir el resultat i si els químics el troben útil per a una gamma més àmplia de molècules.

“La fusió de l’experimentació d’alt rendiment i la IA moderna representa un nou àmbit d’avantguarda del descobriment científic. Aquesta nova reacció és una demostració contundent, en què unes condicions excepcionalment suaus i un oxidant pràctic permeten un abast de substrats força general per a una de les reaccions més populars en la síntesi de fàrmacs.”

—Tim Cernak, professor titular de Química Medicinal, Universitat de Michigan

De les altres tres propostes generades per GPT‑5.4 i provades per la Maria durant el període de tres mesos, OAI-M1-02 i OAI-M1-04 van quedar demostrades experimentalment al Maria Lab, mentre que OAI-M1-01 va quedar refutada. L’anàlisi d’aquests resultats està en curs.

Limitacions

Aquest treball demostra que un model pot fer una aportació útil en química orgànica. Va fer més que resumir la literatura o suggerir un experiment puntual: va proposar una hipòtesi concreta i sorprenent i la va presentar perquè fos revisada per humans, va dissenyar experiments, va interpretar dades experimentals i va dissenyar experiments de seguiment.

Això no demostra que l’IA pugui dirigir de manera independent un programa de recerca en química de principi a fi. El judici humà va seguir sent essencial i el flux de treball va dependre d’una infraestructura especialitzada d’alt rendiment. Tampoc no estableix que el mètode sigui generalitzable a altres reaccions d’acoblament, altres classes de substrats o altres condicions de fabricació.

Les estimacions del rendiment provenien d’una plataforma d’alt rendiment i la validació al banc va cobrir 14 parells de substrats representatius. Cal dur a terme més treball per caracteritzar el mecanisme de reacció, definir l’abast dels substrats, mesurar el rendiment en diferents condicions de laboratori i reproduir el resultat de manera independent.

Preparació

Les capacitats en química s’han de tractar amb cura, perquè les mateixes eines que poden donar suport a la medicina i a la ciència dels materials també es podrien utilitzar indegudament. Vam delimitar deliberadament l’abast d’aquest treball a un problema legítim de química medicinal: millorar una reacció d’acoblament coneguda que s’utilitza per fabricar molècules amb característiques semblants a les dels fàrmacs. Els experiments no van implicar toxines, armes químiques ni peticions per dissenyar compostos nocius. Aquests resultats no s’han d’interpretar com a prova que el sistema pugui ajudar en aquestes aplicacions perjudicials. El projecte no ho va comprovar ni demostrar.

Avaluem i mitiguem els riscos emergents derivats de les capacitats avançades dels models mitjançant el nostre entorn de treball de preparació⁠, inclosos els riscos relacionats amb els àmbits químic i biològic. El model utilitzat en aquest treball ja s’havia sotmès a avaluacions pertinents amb l’Institut de Seguretat de la IA del Regne Unit, i el sistema estava dissenyat per rebutjar sol·licituds centrades en aplicacions perjudicials. El flux de treball experimental va afegir una capa addicional de control: els químics humans seleccionaven quines propostes passaven al laboratori, revisaven els plans experimentals i mantenien el control de la infraestructura física.

Creiem que aquesta és la manera responsable d’estudiar el potencial de la IA en la química experimental: triar un àmbit de problemes amb un valor científic clar, combinar salvaguardes a escala de model amb supervisió d’experts i avaluar el sistema mitjançant experiments físics acotats. A mesura que aquestes capacitats millorin, continuarem avaluant els riscos emergents, reforçant les mesures de protecció i serem explícits sobre què implica i què no implica un resultat.

¿Quin és el següent pas?

Els propers passos immediats són de caràcter científic: provar una gamma més àmplia de materials de partida, investigar per què els additius milloren la reacció, determinar en quins casos l’efecte funciona i en quins falla i donar suport a la replicació independent. En conjunt, aquests estudis determinaran fins a quin punt es pot aplicar el mètode i quina utilitat té en fluxos de treball pràctics de química medicinal.

El nostre objectiu a més llarg termini és fer que els sistemes d’IA siguin col·laboradors científics fiables que ajudin els investigadors a formular hipòtesis, dissenyar experiments, interpretar resultats i decidir què cal provar a continuació, alhora que es mantenen fonamentats en el criteri expert, mesures fiables i salvaguardes sòlides. La química orgànica és una àrea especialment estratègica i d’alt impacte perquè el progrés en el descobriment i la fabricació de molècules petites depèn de la capacitat de sintetitzar molècules de manera fiable. Els científics només poden provar les molècules que poden sintetitzar, i una síntesi millor pot ampliar el ventall d’idees que poden explorar en medicina, agricultura, electrònica, energia i ciència dels materials. Aquest resultat és un primer exemple d’aquesta direcció més àmplia: un model d’avantguarda, agents especialitzats, un laboratori automatitzat i químics humans que treballen plegats per avançar més de pressa pel cicle de recerca i produir resultats que la comunitat científica pugui avaluar, reproduir i prendre com a base.

Estem agraïts a l’equip de Molecule.one i als químics independents que han revisat aquest treball.

2026

Autor

OpenAI