Skoraj avtonomni kemik z UI izboljša zahtevno reakcijo v medicinski kemiji
Z Mario družbe Molecule.one je GPT‑5.4 odkril presenetljiv aditiv, ki je povečal izkoristke Chan–Lamove sklopitve pri več kot 80 % testiranih substratov.
Delo družbe OpenAI na področju znanosti izhaja iz preprostega prepričanja: napredna UI lahko postane zmogljiv partner znanstvenikom ter jim pomaga raziskati več zamisli, povezovati oddaljene koncepte, načrtovati boljše eksperimente in pospeševati odkritja, ki koristijo človeštvu. V preteklosti smo že predstavili zgodnje primere, v katerih so modeli prispevali k novim rezultatom v matematiki, med drugim pri delu na problemu enotske razdalje, v teoretični fiziki z novim rezultatom na področju gluonskih amplitud in v biologiji, kjer je GPT‑5 v avtomatiziranem laboratoriju pomagal znižati stroške brezcelične sinteze beljakovin. Predstavili smo tudi GPT‑Rosalind, namensko zasnovan model za podporo raziskavam življenjskih znanosti in delotokom odkrivanja zdravil.
Ta projekt to smer razširja na medicinsko kemijo, kjer napredka ni mogoče meriti zgolj s sklepanjem. Hipoteza mora delovati v laboratoriju, z resničnimi molekulami, instrumenti in eksperimentalnim šumom. V sodelovanju z Molecule.one(odpre se v novem oknu) smo GPT‑5.4 povezali z Mario — agentsko UI za kemijo, integrirano z visokopretočnim laboratorijem za avtonomno raziskovanje — in mu dali odprt cilj: izboljšati enega od več pomembnih razredov reakcij. Sistem je pripravljal raziskovalne predloge, načrtoval in izvajal poskuse, analiziral eksperimentalne podatke ter predlagal nadaljnje poskuse. Vloga človeka v zanki je ostala ključna: strokovnjaki so oblikovali pozive za usmerjanje in ocenjevanje ter izbirali predloge za testiranje. Izvedli so tudi manjše popravke eksperimentalnih načrtov, pomagali pri osnovnih laboratorijskih postopkih in neodvisno preverili končni rezultat.
Najobetavnejši predlog, OAI-M1-03, se je osredotočil na zahtevno, vendar uporabno različico Chan-Lamove sklopitve, reakcije, ki jo kemiki uporabljajo za tvorbo vezi med ogljikom in dušikom. GPT‑5.4 je pri odprto zastavljenem cilju izboljšanja Chan-Lamove sklopitve za procesno kemijo samostojno opredelil primarne sulfonamide kot zahteven in posebej pomemben razred substratov ter predlagal, da bi lahko blagi oksidanti, vključno s TEMPO, izboljšali potek reakcije.
V dveh ciklih poskusov v laboratoriju Maria Lab je ta zamisel prinesla pomembno izboljšanje. V optimiziranih pogojih so se izmerjeni izkoristki izboljšali pri 88 % testiranih boronskih kislin in 83 % testiranih sulfonamidov. Povprečni izkoristek se je povečal s 16,6 % na 25,2 %, delež reakcij z več kot 30-odstotnim izkoristkom pa se je povečal s 15,6 % na 37,5 %. Kemiki so nato reprezentativne reakcije ponovili v laboratorijskem merilu. Ti poskusi so potrdili rezultate iz mikrolitrskega merila in pokazali višje izkoristke pri 11 od 14 parov substratov. V večini primerov se je izkoristek več kot podvojil. To je pomembno, saj medicinski kemiki potrebujejo reakcije, ki ne delujejo le v mikrolitrskih presejalnih poskusih, temveč tudi v praktičnih laboratorijskih delotokih, ki se uporabljajo pri odkrivanju zdravil.
Izboljšave na tem področju medicinske kemije so posebej obetavne, ker je sinteza pogosto eno glavnih ozkih grl pri odkrivanju zdravil: znanstveniki lahko testirajo le molekule, ki jih lahko izdelajo ali kako drugače pridobijo. Sulfonamidna skupina se pojavlja v zdravilih na številnih terapevtskih področjih, vključno z zdravili proti raku, protimikrobnimi zdravili in diuretiki, vendar je Chan-Lamova sklopitev primarnih sulfonamidov z boronskimi kislinami v preteklosti pogosto dajala nizke izkoristke. Povečanje zanesljivosti te oblike reakcije bi lahko medicinskim kemikom ponudilo širši in bolj praktičen način za sintezo in raziskovanje potencialno uporabnih molekul.
Čeprav je rezultat še zgodnji, ponuja še en konkreten primer širše usmeritve našega dela: razvijati sisteme UI, ki lahko postanejo dragoceni partnerji znanstvenikov v velikem delu raziskovalnega procesa. Model je pregledal literaturo, predlagal nepričakovano zamisel, pomagal načrtovati in analizirati poskuse ter pripomogel k znanstveni ugotovitvi, ki so jo lahko ovrednotili kemiki.
Maria Lab: Molecule.one je specializirani visokopretočni laboratorij, ki je v okviru OAI-M1-03 izvedel 10.080 reakcij
Organska kemija je temelj vseh zdravil z majhnimi molekulami, pa tudi izdelkov v kmetijstvu, elektroniki in znanosti o materialih. Reakcija je posebej uporabna, kadar lahko pri številnih različnih izhodnih snoveh zanesljivo tvori isto vrsto kemijske vezi. Če je izkoristek reakcij nizek ali nastane preveč neželenih stranskih produktov, morajo kemiki morda opustiti sicer obetavne molekule ali porabiti veliko časa za razvoj druge sintezne poti. Zato je sinteza eno glavnih ozkih grl pri odkrivanju zdravil: znanstveniki lahko praviloma testirajo le molekule, ki jih lahko izdelajo ali kako drugače pridobijo.
Chan-Lamova sklopitev je uporabna v medicinski kemiji, ker tvori vezi med ogljikom in dušikom, ki so pogoste v zdravilih. Vendar reakcija ne deluje enako dobro pri vseh razredih molekul. Zlasti sklopitev primarnih sulfonamidov z boronskimi kislinami je v preteklosti pogosto dajala nizke izkoristke. Sulfonamidi so pomembna družina molekul, ki jih najdemo v zdravilih za zdravljenje raka in nalezljivih bolezni. Večja zanesljivost te reakcije bi lahko medicinskim kemikom omogočila širši in bolj praktičen način za pripravo in raziskovanje potencialno uporabnih molekul.
Združeni sistem je povezal komplementarne zmožnosti. Pozivi, ki so jih napisali znanstveniki v sodelovanju s sistemom Maria AI, so bili uporabljeni z GPT‑5.4 v preizkusnem ogrodju za generiranje in razvrščanje tisočih možnih raziskovalnih predlogov. Kemiki so pregledali manjši nabor predlogov, ki jih je sistem ocenil najvišje, in izbrali štiri za laboratorijsko testiranje. Maria AI je nato izbrane načrte na visoki ravni pretvorila v podrobna laboratorijska navodila, izvedla tisoče visokopretočnih poskusov, analizirala neobdelane podatke in GPT‑5.4 vrnila strukturirane rezultate.
Eden od štirih izbranih predlogov, OAI-M1-03, je za izboljšanje učinkovitosti Chan-Lamove sklopitve pri sintezi sulfonamidov predlagal uporabo blagih oksidantov, kot je TEMPO. Kemikom se je predlog zdel presenetljiv in zanimiv. Podrobne ugotovitve o OAI-M1-03 predstavljamo v tej objavi na blogu in v članku(odpre se v novem oknu).
Maria je nato na podlagi končnega raziskovalnega predloga pripravila eksperimentalne mreže, pri čemer so ljudje vnesli manjše popravke. Največji popravek, ki so ga vnesli strokovnjaki, je bila odločitev, da se kot topilo ne uporabi dimetil sulfoksid oziroma DMSO, saj so kemiki menili, da bi lahko reagiral z močnejšimi oksidanti, uporabljenimi za primerjavo.
Celoten postopek je trajal tri mesece, od prvega poziva 4. marca do predstavitve rezultatov OAI-M1-03 neodvisnim strokovnjakom 4. junija.
Ta delotok opisujemo kot skoraj avtonomen, ne kot popolnoma avtonomen, ker so kemiki med celotnim procesom še vedno sprejemali pomembne odločitve. Model je predlagal ključne raziskovalne zamisli, kemiki pa so zagotavljali usmeritve na visoki ravni in strokovno presojo, popravljali eksperimentalne podrobnosti, pomagali pripravljati laboratorijski potrošni material in reagente ter ročno ponovili ključne poskuse.
OAI-M1-03 je TEMPO prepoznal kot koristen dodatek pri Chan-Lamovi sklopitvi primarnih sulfonamidov, obravnavani v tej raziskavi. Pri optimiziranih pogojih se je reakcija izboljšala na dva načina: povečal se je povprečni izkoristek, več kombinacij substratov pa je doseglo praktično uporabne izkoristke.
V dveh ciklih je Maria izvedla skupno 10.080 reakcij, kar je več, kot bi jih kemik izvedel v desetletju, če bi vsak dan opravil tri reakcije. Ta obseg je bil pomemben, ker so lahko kemijski rezultati zavajajoči, kadar jih preverimo le na nekaj primerih. Reakcija je lahko videti obetavna pri enem paru izhodnih snovi, vendar odpove pri širšem naboru molekul. Tisoči reakcij so omogočili, da so med desetimi testiranimi oksidanti prepoznali TEMPO, preverili ponovljivost učinka pri raznolikih kombinacijah in ugotovili meje njegove uporabnosti.
Po analizi prvega kroga podatkov je sistem predlagal bolj osredotočen drugi krog poskusov za preverjanje nadaljnjih hipotez. Ena od koristnih nadaljnjih ugotovitev je bila, da je mogoče TEMPO nadomestiti z njegovim bistveno cenejšim analogom, 4-hidroksi-TEMPO, ob majhni izgubi učinkovitosti.
Rezultat se je potrdil tudi zunaj mikrolitrskega presejalnega formata laboratorija Maria Lab. Kemiki so reprezentativne reakcije ročno ponovili v laboratorijskem merilu in pri 11 od 14 parov substratov opazili povečanje izkoristka; pri osmih parih je bilo povečanje več kot dvakratno. Ta ponovitev je pomembna, ker lahko poskusi v zelo majhnem merilu včasih povzročijo artefakte, ki pri večjem merilu izginejo. Validacija v laboratorijskem merilu je poleg tega običajna pred objavo raziskave v znanstveni reviji.

Reakcijske epruvete iz ročnega preverjanja v laboratorijskem obsegu.
Štirje zunanji strokovnjaki za kemijo so pregledali predtisk, ki opisuje OAI-M1-03. Njihove ocene so podprle naše stališče, da je rezultat nov in vreden predstavitve znanstveni skupnosti. Strožji preizkus še sledi: ali bodo lahko neodvisni laboratoriji rezultat reproducirali in ali se bo kemikom zdel uporaben pri širšem naboru molekul.
Od treh drugih predlogov, ki jih je ustvaril GPT‑5.4 in jih je sistem Maria testiral v trimesečnem obdobju, sta bila OAI-M1-02 in OAI-M1-04 v laboratoriju Maria Lab eksperimentalno potrjena, OAI-M1-01 pa je bil ovržen. Analiza teh rezultatov še poteka.
To delo kaže, da lahko model koristno prispeva k organski kemiji. Ni zgolj povzel literature ali predlagal enkratnega poskusa, temveč je oblikoval konkretno in presenetljivo hipotezo ter jo posredoval v pregled strokovnjakom, načrtoval poskuse, interpretiral eksperimentalne podatke in zasnoval nadaljnje poskuse.
Ne kaže pa, da lahko UI samostojno vodi kemijski raziskovalni program od začetka do konca. Strokovna presoja ljudi je ostala ključna, delotok pa je bil odvisen od specializirane visokopretočne infrastrukture. Prav tako rezultat ne dokazuje, da bo mogoče metodo posplošiti na druge sklopitvene reakcije, druge razrede substratov ali proizvodne pogoje.
Ocene izkoristka so bile pridobljene na visokopretočni platformi, validacija v laboratorijskem merilu pa je zajela 14 reprezentativnih parov substratov. Potrebno bo še več dela, da se opredeli reakcijski mehanizem, določi obseg substratov, izmeri učinkovitost v različnih laboratorijskih pogojih in rezultat neodvisno reproducira.
Kemijske zmožnosti zahtevajo skrbno obravnavo, saj bi bilo mogoče ista orodja, ki lahko podpirajo medicino in znanost o materialih, tudi zlorabiti. To delo smo namenoma omejili na legitimen problem s področja medicinske kemije: izboljšanje znane sklopitvene reakcije, ki se uporablja za pripravo molekul, podobnih zdravilnim učinkovinam. Poskusi niso vključevali toksinov, kemičnega orožja ali zahtev za načrtovanje škodljivih spojin. Teh rezultatov ne bi smeli razumeti kot dokaz, da lahko sistem pomaga pri takšnih škodljivih uporabah. Projekt tega ni testiral ali pokazal.
Nastajajoča tveganja, ki izhajajo iz naprednih zmogljivosti modelov, ocenjujemo in blažimo prek našega Okvira pripravljenosti, vključno s tveganji, povezanimi s kemijskimi in biološkimi področji. Model, uporabljen pri tem delu, je bil že predhodno deležen ustreznih ocenjevanj pri Inštitutu za varnost umetne inteligence Združenega kraljestva, sistem pa je bil zasnovan tako, da zavrne zahteve, osredotočene na škodljive uporabe. Eksperimentalni delovni potek je dodal še eno raven nadzora: človeški kemiki so izbirali, kateri predlogi so prešli v laboratorijsko fazo, pregledovali eksperimentalne načrte in ohranili nadzor nad fizično infrastrukturo.
Menimo, da je to odgovoren način za preučevanje potenciala UI v eksperimentalni kemiji: izbrati problemsko področje z jasno znanstveno vrednostjo, zaščitne ukrepe na ravni modela združiti s strokovnim nadzorom in sistem ovrednotiti z omejenimi fizičnimi poskusi. Ko se bodo te zmožnosti izboljševale, bomo še naprej ocenjevali nastajajoča tveganja, krepili zaščitne ukrepe in natančno opredeljevali, kaj določen rezultat pomeni in česa ne pomeni.
Neposredni naslednji koraki so znanstveni: testirati širši nabor izhodnih snovi, raziskati, zakaj dodatki izboljšajo reakcijo, opredeliti, kje učinek deluje in kje odpove, ter podpreti neodvisno ponovitev rezultatov. Te raziskave bodo skupaj pokazale, kako široko je mogoče metodo uporabiti in kako koristna je v praktičnih delotokih medicinske kemije.
Naš dolgoročni cilj je razviti sisteme UI v zanesljive znanstvene partnerje, ki raziskovalcem pomagajo oblikovati hipoteze, načrtovati poskuse, interpretirati rezultate in odločati, kaj testirati v nadaljevanju, pri tem pa ostajajo utemeljeni v strokovni presoji, zanesljivih meritvah in močnih zaščitnih ukrepih. Organska kemija je področje z zelo velikim učinkom, saj je napredek pri odkrivanju in proizvodnji majhnih molekul odvisen od zmožnosti zanesljive priprave molekul. Znanstveniki lahko testirajo le molekule, ki jih lahko pripravijo, boljša sinteza pa lahko razširi nabor zamisli, ki jih lahko raziskujejo v medicini, kmetijstvu, elektroniki, energetiki in znanosti o materialih. Ta rezultat je zgodnji primer te širše smeri: napredni model, specializirani agenti, avtomatizirani laboratorij in kemiki so sodelovali, da bi hitreje napredovali skozi raziskovalni proces ter prišli do ugotovitev, ki jih lahko znanstvena skupnost ovrednoti, reproducira in nadgradi.
Hvaležni smo ekipi Molecule.one in neodvisnim kemikom, ki so pregledali to delo.