Takmer autonómny chemik s AI zlepšuje náročnú reakciu v medicínskej chémii
S Mariou od Molecule.one našiel GPT‑5.4 prekvapivú prísadu, ktorá zvýšila výťažky Chanovej-Lamovej kopulácie pri viac než 80 % testovaných substrátov.
Prácu OpenAI vo vede motivuje jednoduché presvedčenie: pokročilá AI sa môže stať silným partnerom vedcov a pomáhať im skúmať viac nápadov, prepájať vzdialené koncepty, navrhovať lepšie experimenty a urýchľovať objavy prospešné pre ľudstvo. Už sme sa podelili o prvé príklady modelov, ktoré prispeli k novým výsledkom v matematike vrátane práce na probléme jednotkovej vzdialenosti, v teoretickej fyzike prostredníctvom nového výsledku o gluonových amplitúdach a v biológii, kde GPT‑5 pomohol znížiť náklady na bezbunkovú syntézu proteínov v automatizovanom laboratóriu. Predstavili sme aj GPT‑Rosalind, účelovo vytvorený model na podporu výskumu vied o živote a pracovných postupov pri objavovaní liekov.
Tento projekt rozširuje túto trajektóriu do medicínskej chémie, kde pokrok nemožno merať iba uvažovaním. Hypotéza musí fungovať v laboratóriu so skutočnými molekulami, prístrojmi a experimentálnym šumom. V spolupráci s Molecule.one(otvorí sa v novom okne) sme prepojili GPT‑5.4 s Mariou – agentnou chemickou AI integrovanou s vysokopriepustným laboratóriom pre autonómny výskum – a dali sme jej otvorený cieľ: zlepšiť jednu z viacerých dôležitých tried reakcií. Systém generoval výskumné návrhy, navrhoval a vykonával experimenty, analyzoval experimentálne údaje a navrhoval nadväzujúce experimenty. Ľudia zostali zapojení tým, že navrhovali usmerňovacie a hodnotiace príkazy a vyberali návrhy na testovanie. Vykonali aj obmedzené opravy experimentálnych plánov, pomáhali so základnými laboratórnymi operáciami a nezávisle overili konečný výsledok.
Najsľubnejší návrh, OAI-M1-03, sa zameral na náročnú, ale užitočnú verziu Chanovej-Lamovej kopulácie, reakcie, ktorú chemici používajú na tvorbu väzieb uhlík-dusík. Vychádzajúc z otvoreného cieľa zlepšiť Chanovu-Lamovu kopuláciu pre procesnú chémiu GPT‑5.4 nezávisle identifikoval primárne sulfónamidy ako náročnú, vysoko hodnotnú triedu substrátov a navrhol, že mierne oxidanty vrátane TEMPO by mohli reakciu zlepšiť.
Počas dvoch cyklov experimentovania v Maria Lab táto myšlienka priniesla významné zlepšenie. Za optimalizovaných podmienok sa namerané výťažky zlepšili pri 88 % testovaných borónových kyselín a 83 % sulfónamidov. Priemerný výťažok vzrástol zo 16,6 % na 25,2 % a podiel reakcií s výťažkom nad 30 % sa zvýšil z 15,6 % na 37,5 %. Ľudskí chemici potom zopakovali reprezentatívne reakcie v stolovej mierke. Tieto experimenty potvrdili výsledky v mikrolitrovej mierke a ukázali vyššie výťažky pri 11 zo 14 párov substrátov, vo väčšine prípadov s viac než dvojnásobným zvýšením. Je to dôležité, pretože medicínski chemici potrebujú reakcie, ktoré fungujú nielen v mikrolitrových skríningových experimentoch, ale aj v praktických laboratórnych pracovných postupoch používaných pri objavovaní liekov.
Zlepšenia v tejto oblasti medicínskej chémie sú obzvlášť vzrušujúce, pretože syntéza je pri objavovaní liekov často veľkým úzkym miestom: vedci môžu testovať iba molekuly, ktoré dokážu vyrobiť alebo inak získať. Sulfónamidová skupina sa vyskytuje v liekoch naprieč širokým spektrom terapeutických oblastí vrátane protinádorových liekov, antimikrobiálnych látok a diuretík, no Chanova-Lamova kopulácia primárnych sulfónamidov s borónovými kyselinami historicky poskytovala nízke výťažky. Zvýšenie spoľahlivosti tejto formy reakcie by medicínskym chemikom mohlo poskytnúť širší a praktickejší spôsob výroby a skúmania potenciálne užitočných molekúl.
Hoci ide stále o skorý výsledok, poskytuje ďalší konkrétny príklad širšieho smeru, ku ktorému smerujeme: systémy AI, ktoré sa môžu stať hodnotnými partnermi vedcov počas veľkej časti výskumného cyklu. Model preskúmal literatúru, navrhol nečakanú myšlienku, pomohol navrhnúť a analyzovať experimenty a dospel k vedeckému zisteniu, ktoré mohli ľudskí chemici vyhodnotiť.
Maria Lab: špecializované vysokokapacitné laboratórium spoločnosti Molecule.one, ktoré v OAI-M1-03 uskutočnilo 10 080 reakcií
Organická chémia je základom všetkých nízkomolekulových liekov, ako aj produktov v poľnohospodárstve, elektronike a materiálovej vede. Reakcia je obzvlášť užitočná, keď dokáže spoľahlivo vytvoriť rovnaký druh chemickej väzby z mnohých rôznych východiskových materiálov. Keď reakcie poskytujú nízke výťažky alebo príliš veľa nežiaducich vedľajších produktov, chemici môžu musieť opustiť inak sľubné molekuly alebo stráviť veľa času vývojom inej cesty. To robí zo syntézy veľké úzke miesto pri objavovaní liekov: vedci vo všeobecnosti môžu testovať iba molekuly, ktoré dokážu vyrobiť alebo inak získať.
Chanova-Lamova kopulácia je užitočná v medicínskej chémii, pretože vytvára väzby uhlík-dusík, ktoré sú v liekoch bežné. Reakcia však nefunguje rovnako dobre pre každú triedu molekúl. Najmä kopulácia primárnych sulfónamidov s borónovými kyselinami historicky poskytovala nízke výťažky. Sulfónamidy sú dôležitou skupinou molekúl nachádzajúcich sa v liekoch používaných v onkológii a pri infekčných ochoreniach. Zvýšenie spoľahlivosti tejto reakcie by medicínskym chemikom mohlo poskytnúť širší a praktickejší spôsob výroby a skúmania potenciálne užitočných molekúl.
Kombinovaný systém spojil doplnkové schopnosti. Príkazy napísané vedcami pracujúcimi s Maria AI sa použili s GPT‑5.4 v rámci kontrolného prostredia na generovanie a zoradenie tisícov možných výskumných návrhov. Ľudskí chemici preskúmali malú podmnožinu návrhov, ktoré systém ohodnotil najvyššie, a vybrali štyri na laboratórne testovanie. Maria AI potom preložila vybrané vysokoúrovňové plány do podrobných laboratórnych pokynov, vykonala tisíce vysokopriepustných experimentov, analyzovala surové údaje a vrátila štruktúrované výsledky GPT‑5.4.
Jeden zo štyroch vybraných návrhov, OAI-M1-03, navrhoval použiť mierne oxidanty, ako je TEMPO, na zlepšenie výkonu Chanovej-Lamovej reakcie pri syntéze sulfónamidov. Chemici považovali tento návrh za prekvapivý aj zaujímavý. Podrobné zistenia z OAI-M1-03 zdieľame v tomto blogovom príspevku a v tomto článku(otvorí sa v novom okne).
Konečný výskumný návrh potom Maria použila na vytvorenie experimentálnych mriežok s drobnými opravami od ľudí. Najväčšou ľudskou opravou bolo vyhnúť sa dimetylsulfoxidu, čiže DMSO, ako rozpúšťadlu, pretože chemici sa obávali, že by mohol reagovať so silnejšími oxidantmi použitými na porovnanie.
Celý proces trval tri mesiace, od prvého príkazu 4. marca po zdieľanie výsledkov OAI-M1-03 s nezávislými expertmi 4. júna.
Tento pracovný postup opisujeme ako takmer autonómny, nie plne autonómny, pretože ľudskí chemici počas celého procesu stále robili dôležité rozhodnutia. Model navrhol kľúčové výskumné myšlienky, zatiaľ čo ľudskí chemici poskytovali vysokoúrovňové usmernenie a úsudok, opravovali experimentálne detaily, pomáhali pripravovať laboratórny spotrebný materiál a reagencie a ručne opakovali kľúčové experimenty.
OAI-M1-03 identifikoval TEMPO ako užitočnú prísadu pre primárnu sulfónamidovú Chanovu-Lamovu kopuláciu skúmanú v tejto práci. Za optimalizovaných podmienok sa reakcia zlepšila dvoma spôsobmi: priemerný výťažok vzrástol a viac kombinácií substrátov dosiahlo prakticky užitočné výťažky.
Počas dvoch cyklov Maria vykonala spolu 10 080 reakcií – viac, než by chemik vykonal za desaťročie, keby robil tri reakcie každý deň. Na tomto rozsahu záležalo, pretože chemické výsledky môžu byť zavádzajúce, keď sa testujú iba na niekoľkých príkladoch. Reakcia môže vyzerať sľubne pri jednom páre východiskových materiálov, no zlyhať pri širšej sade molekúl. Tisíce reakcií umožnili identifikovať TEMPO spomedzi desiatich testovaných oxidantov, vidieť opakovanie účinku naprieč rôznymi kombináciami a nájsť jeho obmedzenia.
Po analýze údajov z prvého kola systém navrhol cielenejšie druhé kolo experimentov na testovanie nadväzujúcich hypotéz. Jedným užitočným nadväzujúcim zistením bolo, že TEMPO možno nahradiť oveľa lacnejším analógom, 4-hydroxy-TEMPO, s malou stratou výkonu.
Výsledok obstál aj mimo mikrolitrového skríningového formátu Maria Lab. Ľudskí chemici ručne reprodukovali reprezentatívne reakcie v stolovej mierke a pozorovali zvýšenie výťažku pri 11 zo 14 párov substrátov; pri ôsmich pároch bolo zvýšenie viac než dvojnásobné. Táto replikácia je dôležitá, pretože experimenty vo veľmi malej mierke môžu niekedy priniesť artefakty, ktoré vo väčšej mierke zmiznú. Validácia v stolovej mierke je tiež zvykom pred publikovaním výskumu vo vedeckom časopise.

Reakčné liekovky z manuálnej validácie v laboratórnom meradle.
Štyria externí experti na chémiu preskúmali preprint opisujúci OAI-M1-03. Ich hodnotenia podporili náš názor, že výsledok bol nový a stojí za zdieľanie s vedeckou komunitou. Silnejší test príde ďalej: či nezávislé laboratóriá dokážu výsledok reprodukovať a či ho chemici budú považovať za užitočný pri širšom spektre molekúl.
Z ďalších troch návrhov vytvorených GPT‑5.4 a testovaných Mariou počas trojmesačného obdobia boli OAI-M1-02 a OAI-M1-04 experimentálne potvrdené v Maria Lab, zatiaľ čo OAI-M1-01 bol vyvrátený. Analýza týchto výsledkov pokračuje.
Táto práca ukazuje, že model môže užitočne prispieť v organickej chémii. Urobil viac než len zhrnul literatúru alebo navrhol jednorazový experiment: navrhol konkrétnu prekvapivú hypotézu a predložil ju na ľudské posúdenie, navrhol experimenty, interpretoval experimentálne údaje a navrhol nadväzujúce experimenty.
Neukazuje to, že AI dokáže samostatne viesť chemický výskumný program od začiatku do konca. Ľudský úsudok zostal nevyhnutný a pracovný postup závisel od špecializovanej vysokopriepustnej infraštruktúry. Takisto to nedokazuje, že metóda sa zovšeobecní na iné kopulačné reakcie, iné triedy substrátov alebo výrobné podmienky.
Odhady výťažku pochádzali z vysokopriepustnej platformy a stolová validácia pokryla 14 reprezentatívnych párov substrátov. Je potrebná ďalšia práca na charakterizáciu reakčného mechanizmu, vymedzenie rozsahu substrátov, meranie výkonu za rôznych laboratórnych podmienok a nezávislú reprodukciu výsledku.
Chemické schopnosti si vyžadujú opatrný prístup, pretože tie isté nástroje, ktoré môžu podporiť medicínu a materiálovú vedu, by sa mohli aj zneužiť. Túto prácu sme zámerne zamerali na legitímny problém medicínskej chémie: zlepšiť známu kopulačnú reakciu používanú na výrobu liekom podobných molekúl. Experimenty nezahŕňali toxíny, chemické zbrane ani požiadavky na návrh škodlivých zlúčenín. Tieto výsledky by sa nemali chápať ako dôkaz, že systém môže pomáhať s takýmito škodlivými aplikáciami. Projekt to netestoval ani nepreukázal.
Prostredníctvom nášho Rámca pripravenosti posudzujeme a zmierňujeme vznikajúce riziká vyplývajúce z pokročilých modelových možností vrátane rizík súvisiacich s chemickými a biologickými oblasťami. Model použitý v tejto práci už prešiel príslušnými hodnoteniami britského Inštitútu pre bezpečnosť umelej inteligencie a systém bol navrhnutý tak, aby odmietal požiadavky zamerané na škodlivé aplikácie. Experimentálny pracovný postup pridal ďalšiu vrstvu kontroly: ľudskí chemici vyberali, ktoré návrhy vstupovali do laboratória, kontrolovali experimentálne plány a ponechávali si kontrolu nad fyzickou infraštruktúrou.
Myslíme si, že toto je zodpovedný spôsob štúdia potenciálu AI v experimentálnej chémii: vybrať problémový priestor s jasnou vedeckou hodnotou, skombinovať zabezpečenia na úrovni modelu s odborným dohľadom a hodnotiť systém prostredníctvom obmedzených fyzických experimentov. Ako sa tieto schopnosti zlepšujú, budeme naďalej posudzovať vznikajúce riziká, posilňovať zabezpečenia a konkrétne uvádzať, čo výsledok znamená a čo neznamená.
Bezprostredné ďalšie kroky sú vedecké: otestovať širší rozsah východiskových materiálov, preskúmať, prečo prísady zlepšujú reakciu, zmapovať, kde účinok funguje a kde zlyháva, a podporiť nezávislú replikáciu. Tieto štúdie spoločne určia, ako široko možno metódu uplatniť a aká užitočná je v praktických pracovných postupoch medicínskej chémie.
Naším dlhodobejším cieľom je vytvoriť zo systémov AI spoľahlivých vedeckých partnerov, ktorí pomáhajú výskumníkom generovať hypotézy, navrhovať experimenty, interpretovať výsledky a rozhodovať, čo testovať ďalej, pričom zostávajú ukotvené v odbornom úsudku, spoľahlivom meraní a silných zabezpečeniach. Organická chémia je oblasť s mimoriadne vysokým pákovým efektom, pretože pokrok v objavovaní a výrobe nízkomolekulových látok závisí od schopnosti spoľahlivo vyrábať molekuly. Vedci môžu testovať iba molekuly, ktoré dokážu vyrobiť, a lepšia syntéza môže rozšíriť škálu nápadov, ktoré môžu skúmať v medicíne, poľnohospodárstve, elektronike, energetike a materiálovej vede. Tento výsledok je jedným z prvých príkladov tohto širšieho smeru: hraničný model, špecializovaní agenti, automatizované laboratórium a ľudskí chemici spolupracujú, aby sa rýchlejšie posúvali výskumným cyklom a prinášali zistenia, ktoré môže vedecká komunita vyhodnotiť, reprodukovať a ďalej rozvíjať.
Sme vďační tímu Molecule.one a nezávislým chemikom, ktorí túto prácu posúdili.