Lumaktaw sa pangunahing content
OpenAI

Isang halos awtonomong AI na chemist ang nagpapahusay ng mahirap na reaksyon sa medicinal chemistry

Gamit ang Molecule.one ng Maria, nakahanap ang GPT‑5.4 ng nakakagulat na additive na nagpapalakas ng Chan-Lam Coupling yield para sa mahigit 80% ng mga nasubok na substrate.

Ang gawain ng OpenAI sa agham ay nakabatay sa simpleng paniniwala: puwedeng maging makapangyarihang partner ng mga siyentipiko ang advanced na AI, na tumutulong sa kanila na mag-explore ng mas maraming ideya, mag-ugnay ng malalayong konsepto, magdisenyo ng mas mahusay na mga eksperimento, at pabilisin ang mga tuklas na pakikinabangan ng sangkatauhan. Nauna na naming ibinahagi ang mga maagang halimbawa ng mga modelong nakapag-ambag sa mga bagong resulta sa matematika, kabilang ang trabaho sa problema sa distansya ng unit, sa teoretikal na pisika sa pamamagitan ng bagong resulta sa mga gluon amplitude, at sa biyolohiya, kung saan nakatulong ang GPT‑5 na pababain ang gastos ng cell-free protein synthesis sa automated na laboratoryo. Ipinakilala rin namin ang GPT‑Rosalind, ang modelong partikular na dinisenyo para suportahan ang pananaliksik sa mga agham ng buhay at mga daloy ng trabaho sa pagtuklas ng mga gamot. 

Ipinagpapatuloy ng project na ito ang trajectory na iyon sa larangan ng medicinal chemistry, kung saan hindi masusukat ang pag-unlad sa pamamagitan lang ng pangangatwiran. Ang hypothesis ay kailangang mapatunayang gumagana sa laboratoryo gamit ang mga tunay na molekula, instrumento, at mga pagkakaiba-ibang dulot ng eksperimento. Sa pakikipagtulungan sa Molecule.one(magbubukas sa bagong window), ikinonekta namin ang GPT‑5.4 kay Maria—ang agentic chemistry AI na isinama sa high-throughput laboratory para sa autonomous na pananaliksik—at binigyan ito ng open-ended na goal: para mapabuti ang isa sa ilang mahahalagang klase ng reaksyon. Nag-generate ang system ng mga research proposal, nagdisenyo at nagsagawa ng mga eksperimento, nagsuri ng data mula sa mga eksperimento, at nagmungkahi ng mga follow-up na eksperimento. Nanatiling kasama ang tao sa proseso sa pamamagitan ng pagdidisenyo ng mga prompt sa pag-steer at pagmamarka, at sa pagpili ng mga proposal na susubukan. Gumawa rin sila ng mga limitadong pagwawasto sa mga planong pang-eksperimento, tumulong sa mga pangunahing operasyon sa laboratoryo, at nagsariling nagberipika ng panghuling resulta.

Ang may pinakamalaking potensyal na proposal, OAI-M1-03, ay nakatuon sa isang mahirap pero kapaki-pakinabang na bersyon ng Chan–Lam coupling, ang reaksiyong ginagamit ng mga chemist para bumuo ng mga carbon-nitrogen bond. Simula sa bukas na layunin na mapabuti ang Chan-Lam coupling para sa process chemistry, malayang kinilala ng GPT‑5.4 ang mga primary sulfonamide bilang ang mapanghamon at mataas na halagang substrate class at iminungkahi na ang mga mild oxidant, kabilang ang TEMPO, ay maaaring magpabuti sa reaksyon. 

Sa loob ng dalawang cycle ng eksperimento sa Maria Lab, nagbunga ang ideyang iyon ng makabuluhang pagbuti. Sa ilalim ng mga na-optimize na kondisyon, tumaas ang mga nasukat na ani para sa 88% ng mga boronic acid at 83% ng mga sulfonamide na sinuri. Tumaas ang karaniwang yield mula 16.6% tungo sa 25.2%, at ang bahagi ng mga reaksyon na higit sa 30% na yield ay tumaas mula 15.6% patungong 37.5%. Pagkatapos, inulit ng mga kemistang tao ang mga kinatawang reaksyon sa antas ng bench scale. Kinumpirma ng mga eksperimentong iyon ang mga resulta sa antas ng mikroliter, na nagpakita ng mas mataas na yield para sa 11 sa 14 na pares ng substrato, na may higit sa dalawang beses na pagtaas sa karamihan ng mga kaso. Mahalaga iyon dahil kailangan ng mga medikal na kemista ang mga reaksiyong gumagana, hindi lamang sa mga mikroliter na eksperimento sa screening, kundi pati na rin sa mga praktikal na daloy ng trabaho sa laboratoryo na ginagamit sa pagtuklas ng gamot.

Partikular na kapana-panabik ang mga pagsulong sa larangang ito ng kimikang panggamot dahil madalas na malaking hadlang ang synthesis sa pagtuklas ng gamot: masusubok lamang ng mga siyentipiko ang mga molekulang kaya nilang gawin o makuha sa ibang paraan. Matatagpuan ang grupong sulfonamide sa mga gamot na ginagamit sa iba’t ibang larangang panterapeutika, kabilang ang mga gamot laban sa kanser, antimicrobials, at diuretics, pero sa kasaysayan, ang Chan–Lam coupling ng mga primary sulfonamide sa mga boronic acid ay nagbibigay ng mababang yield. Ang paggawa ng ganitong uri ng reaksyon na mas maaasahan ay maaaring magbigay sa mga medicinal chemist ng mas malawak at mas praktikal na paraan para makagawa at makapagsaliksik ng mga potensyal na kapaki-pakinabang na molekula.

Bagaman maaga pa ang resulta na ito, nagbibigay ito ng isa pang kongkretong halimbawa ng mas malawak na direksyong tinutungo namin: mga system na AI na puwedeng maging mahalagang katuwang ng mga siyentipiko sa halos buong cycle ng pananaliksik. Sinuri ng modelo ang literatura, nagmungkahi ng hindi inaasahang ideya, tumulong sa pagdisenyo at pagsusuri ng mga eksperimento, at nakabuo ng siyentipikong natuklasan na maaaring suriin ng mga kemistang tao.

Maria Lab: ng Molecule.one na espesyalisadong high-throughput na laboratoryo na nagsagawa ng 10,080 reaksyon sa OAI-M1-03

Bakit mahalaga ang problema sa chemistry

Sinusuportahan ng organikong chemistry ang lahat ng gamot na maliliit ang molekula, pati na rin ang mga produkto sa agrikultura, elektronika, at agham ng mga materyal. Ang reaksyon ay lalong kapaki-pakinabang kapag puwede itong makagawa ng parehong uri ngchemical bond nang maaasahan sa maraming iba't ibang panimulang materyal. Kapag nagreresulta ang mga reaksyon ng mababang yield o sobrang dami ng mga hindi kanais-nais na byproduct, maaaring mapilitan ang mga kemista na iwanan ang mga molekulang sana’y may potensyal, o gumugol ng malaking oras sa pagbuo ng ibang ruta. Ginagawa nitong malaking sagabal ang synthesis sa pagtuklas ng gamot: sa pangkalahatan, masusubukan lang ng mga siyentipiko ang mga molekulang kaya nilang gawin o makuha sa ibang paraan.

Kapaki-pakinabang ang Chan–Lam coupling sa medicinal chemistry dahil bumubuo ito ng mga carbon-nitrogen bond, na karaniwan sa mga gamot. Gayunpaman, hindi gumagana nang pantay para sa bawat uri ng molekula ang reaksyon. Sa partikular, ang pagsasama ng mga pangunahing sulfonamide na may mga boronic acid ay kasaysayang nagbunga ng mababang yield. Ang mga sulfonamide ay ang mahalagang pamilya ng mga molekula na matatagpuan sa mga gamot na ginagamit sa oncology at mga nakakahawang sakit. Ang pagpapabuti sa pagiging maaasahan ng reaksyong ito ay maaaring magbigay sa mga medicinal chemist ng mas malawak at mas praktikal na paraan para makagawa at makapag-explore ng mga molekulang maaaring maging kapaki-pakinabang.

Ikokonekta ang GPT‑5.4 sa Maria AI at Lab

Pinagtambal ng pinagsamang system ang mga komplementaryong kakayahan. Ginamit kasama ng GPT‑5.4 sa loob ng harness ang mga prompt na isinulat ng mga siyentistang nakikipagtulungan sa Maria AI para bumuo at magranggo ng libu-libong posibleng panukalang pananaliksik. Sinuri ng mga chemist na tao ang maliit na subset ng mga panukala na pinakamataas ang ranggo ayon sa system at pumili ng apat para sa pagsusuri sa laboratoryo. Pagkatapos ay isinalin ng Maria AI ang mga piling planong may mataas na antas patungo sa detalyadong mga tagubilin sa laboratoryo, nagpatakbo ng libu-libong eksperimentong may mataas na throughput, sinuri ang raw na data, at ibinalik ang mga nakabalangkas na resulta sa GPT‑5.4. 

Isa sa apat na napiling proposal, ang OAI-M1-03, ay nagmungkahi ng paggamit ng mga banayad na oxidant gaya ng TEMPO para mapahusay ang performance ng Chan-Lam coupling reaction para sa sulfonamide synthesis. Itinuring mga chemist ang mungkahi na nakakagulat at kawili-wili. Ibinabahagi namin ang mga detalyadong natuklasan mula sa OAI-M1-03 sa post sa blog na ito at sa sanaysay tungkol sa pananaliksik(magbubukas sa bagong window).

Pagkatapos, ginamit ni Maria ang pinal na panukalang pananaliksik para bumuo ng mga eksperimental na grid, na may kaunting pagwawasto mula sa mga tao. Ang pinakamalaking pagwawasto ng tao ay ang pag-iwas sa paggamit ng dimethyl sulfoxide, o DMSO, bilang solvent, dahil nag-alala ang mga kemista na maaari itong mag-react sa mas malalakas na oxidant na ginamit bilang paghahambing.

Tumagal nang tatlong buwan ang buong proseso, mula sa unang prompt noong Marso 4 hanggang sa pagbabahagi ng mga resulta ng OAI-M1-03 sa mga independiyenteng eksperto noong Hunyo 4.

Inilalarawan namin ang workflow na ito bilang halos awtonomo, hindi ganap na awtonomo, dahil ang mga chemist na tao ay patuloy na gumawa ng mahahalagang desisyon sa buong proseso. Iminungkahi ng modelo ang mga pangunahing ideya sa pananaliksik, habang ang mga kemistang tao ay nagbigay ng mataas na antas na paggabay at paghusga, nagwasto ng mga detalye ng eksperimento, tumulong sa paghahanda ng mga nauubos na gamit sa laboratoryo at mga reagent, at manu-manong inulit ang mahahalagang eksperimento.

Ang aming natuklasan

Natukoy ng OAI-M1-03 ang TEMPO bilang ang kapaki-pakinabang na additive para sa primary sulfonamide Chan-Lam coupling na pinag-aralan dito. Sa mga na-optimize na kondisyon, bumuti ang reaksyon sa dalawang paraan: tumaas ang average yield at mas maraming kombinasyon ng substrate ang nakaabot sa mga yield na praktikal na magagamit.

Sa loob ng dalawang cycle, nagsagawa ang Maria ng kabuuang 10,080 reaksyon – higit pa kaysa sa maisasagawa ng chemist na nagsasagawa ng tatlong reaksyon bawat araw sa loob ng isang dekada. Mahalaga ang saklaw na iyon dahil maaaring makalinlang ang mga resulta sa kemika kapag sinusubok lang ang mga ito sa iilang halimbawa. Maaaring magmukhang promising ang reaksyon sa isang pares ng panimulang materyal, pero mabibigo ito sa mas malawak na hanay ng mga molekula. Libu-libong reaksiyon ang nagbigay-daan para matukoy ang TEMPO sa sampung nasubok na oxidant, makita ang pag-uulit ng epekto sa magkakaibang kombinasyon, at matuklasan ang mga limitasyon nito.


Matapos suriin ang unang yugto ng data, nagmungkahi ang system ng mas nakatuong ikalawang yugto ng mga eksperimento para subukan ang mga follow-up na hypotheses. Isang kapaki-pakinabang na follow-up na natuklasan ay maaaring palitan ang TEMPO ng mas murang analog na 4-hydroxy-TEMPO, na halos walang makabuluhang pagbaba sa performance.

Chart na naghahambing sa pagganap ng TEMPO, 4-hydroxy-TEMPO, 4-oxo-TEMPO, at PMP sa mga istrukturang kemikal.

Nanatili ring wasto ang resulta kahit lampas sa microliter-scale na format ng screening ng Maria Lab. Manu-manong muling isinagawa ng mga chemist ang mga kinatawang reaksyon sa antas ng bench at naobserbahan ang pagtaas ng yield para sa 11 sa 14 na pares ng substrate; para sa walong pares, ang pagtaas ay mahigit doble. Mahalaga ang replikasyong iyon dahil kung minsan, puwedeng makalikha ang mga eksperimento sa napakaliit na saklaw ng mga artifact o nawawala kapag nasa mas malaking saklaw. Nakaugalian din ang bench-scale validation bago i-publish ang pananaliksik sa siyentipikong journal.

Mga vial ng reaksyon na gawa sa salamin na may label mula sa mga eksperimento sa pagpapatunay na may bench-scale na Molecule.one.

Mga vial ng reaksyon mula sa manu-manong pagpapatunay ng bench-scale.

Pinapahusay ng TEMPO ang pagbuo ng produkto sa bench scale

Apat na eksperto sa panlabas na kemika ang sumuri sa preprint na naglalarawan sa OAI-M1-03. Pinagtibay ng kanilang mga pagsusuri ang aming pananaw na bago at karapat-dapat ibahagi sa pamayanang pang-agham ang resulta. Susunod ang mas matinding pagsubok: kung magagawa bang mareplika ng mga independiyenteng laboratoryo ang resulta, at kung makikita ng mga kemiko na kapaki-pakinabang ito sa mas malawak na hanay ng mga molekula.

Ang pagsasanib ng eksperimentasyong may mataas na throughput at makabagong AI ay kumakatawan sa isang bagong frontier ng siyentipikong pagtuklas. Ang bagong reaksiyong ito ay isang makapangyarihang pagpapakita, kung saan ang lubhang banayad na mga kundisyon at praktikal na oksidant ay nagbibigay-daan sa mahusay at pangkalahatang saklaw ng substrate para sa isa sa mga mas popular na reaksiyon sa synthesis ng gamot.
—Tim Cernak, Associate Professor ng Medicinal Chemistry, University ng Michigan

Sa tatlo pang proposal na na-generate ng GPT‑5.4 at sinubok ng Maria sa loob ng tatlong buwan, napatunayan sa pamamagitan ng eksperimento ang OAI-M1-02 at OAI-M1-04 sa Maria Lab, samantalang napabulaanan ang OAI-M1-01. Kasalukuyang isinasagawa ang pagsusuri sa mga resultang ito.

Mga limitasyon

Ipinapakita ng gawaing ito na maaaring makapagbigay ng kapaki-pakinabang na ambag sa organikong kemika ang modelo. Higit pa ang ginawa nito kaysa ibuod ang literatura o magmungkahi ng isang minsanang eksperimento: nagmungkahi ito ng tiyak at nakakagulat na hypothesis at iniharap ito para sa pagsusuri ng tao, nagdisenyo ng mga eksperimento, nag-interpret ng data ng eksperimento, at nagdisenyo ng mga follow-up na eksperimento.

Hindi nito ipinapakita na kayang magpatakbo ng program sa pananaliksik sa kemika nang nakapag-iisa ang AI. Nanatiling mahalaga ang paghuhusga ng tao, at nakadepende ang daloy ng trabaho sa espesyalisadong imprastraktura na may mataas na throughput. Hindi rin nito napapatunayan na magiging pangkalahatang angkop sa iba pang mga reaksiyong pagsasama ang pamamaraan, iba pang mga klase ng saligan, o mga kondisyon sa pagmamanupaktura.

Ang mga pagtatantya ng yield ay nagmula sa high-throughput na platform, at ang validation sa laboratoryo ay sumaklaw sa 14 na kinatawang pares ng substrate. Kailangan pa ng karagdagang trabaho para mailarawan nang mas detalyado ang mekanismo ng reaksiyon, matukoy ang saklaw ng substrato, masukat ang pagganap sa ilalim ng iba’t ibang kondisyon sa laboratoryo, at maulit nang independiyente ang resulta.

Paghahanda

Nangangailangan ng maingat na pagtrato ang mga kakayahan sa chemistry dahil ang parehong mga tool na sumusuporta sa medisina at agham ng mga materyal ay puwede ring magamit nang mali. Sadyang nilimitahan namin ang saklaw ng gawaing ito sa lehitimong suliranin sa medicinal-chemistry : ang pagpapahusay ng kilalang reaksiyong coupling na ginagamit para gumawa ng mga molekulang may katangiang tulad ng gamot. Hindi gumamit ng mga lason, kemikal na sandata, o mga kahilingang magdisenyo ng mga mapaminsalang compound ang mga eksperimento. Hindi dapat ipakahulugan ang mga resultang ito bilang ebidensiya na makakatulong ang system sa mga mapaminsalang paggamit na iyon. Hindi sinubok o ipinakita ng proyekto iyon.

Sinusuri at pinapababa namin ang mga umuusbong na panganib mula sa mga advanced na kakayahan ng modelo sa pamamagitan ng aming Preparedness Framework, kabilang ang mga panganib na may kaugnayan sa mga larangan ng kemikal at biyolohikal. Ang modelo na ginamit sa gawaing ito ay sumailalim na sa mga kaugnay na pagsusuri sa UK AI Security Institute, at idinisenyo ang system para tumanggi sa mga kahilingang nakatuon sa mapaminsalang application. Nagdagdag ang daloy ng gawaing pang-eksperimento ng isa pang antas ng kontrol: ang mga chemist na tao ang pumili kung aling mga panukala ang isasailalim sa laboratoryo, nagrepaso sa mga planong pang-eksperimento, at nanatiling may kontrol sa pisikal na imprastraktura ng laboratoryo.

Sa tingin namin, ito ang responsableng paraan para pag-aralan ang potensyal ng AI sa eksperimental na kimika: pumili ng espasyo para sa problema na may malinaw na siyentipikong halaga, ipares ang mga pananggalang sa antas ng modelo na may pangangasiwa ng eksperto, at suriin ang sistema sa pamamagitan ng mga limitadong pisikal na eksperimento. Habang bumubuti ang mga kakayahang ito, patuloy naming susuriin ang mga umuusbong na panganib, palalakasin ang mga pananggalang, at magiging tiyak tungkol sa kung ano ang ipinahihiwatig at hindi ipinahihiwatig ng resulta.

Ano ang susunod

Ang mga agarang susunod na hakbang ay makaagham: subukin ang mas malawak na hanay ng mga panimulang materyales, siyasatin kung bakit pinapabuti ng mga additive ang reaksyon, tukuyin kung saan gumagana at hindi gumagana ang epekto, at suportahan ang independiyenteng replikasyon. Sa kabuuan, tutukuyin ng mga pag-aaral na ito kung gaano kalawak maaaring ilapat ang pamamaraan at kung gaano ito kapaki-pakinabang sa mga praktikal na daloy ng trabaho sa medicinal chemistry.

Ang pangmatagalang layunin namin ay gawing maaasahang katuwang sa siyentipikong pananaliksik ang mga AI system na tumutulong sa mga mananaliksik sa pagbuo ng mga hypotheses, pagdisenyo ng mga eksperimento, pagbibigay-kahulugan sa mga resulta, at pagpapasya kung ano ang susunod na susuriin, habang nananatiling nakabatay sa eksperto, maaasahang pagsukat, at matibay na mga pananggalang. Ang organikong kemika ay partikular na mataas ang leverage na larangan dahil ang pag-unlad sa pagtuklas at pagmamanupaktura ng maliliit na molekula ay nakasalalay sa kakayahang makabuo ng mga molekula nang maaasahan. Masisiyasat lamang ng mga siyentipiko ang mga molekulang kaya nilang gawin, at mapapalawak ng mas mahusay na synthesis ang saklaw ng mga ideyang puwede nilang saliksikin sa medisina, agrikultura, elektronika, enerhiya, at agham ng mga materyal. Ang resultang ito ay isang maagang halimbawa ng mas malawak na direksyong iyon: isang frontier na modelo, mga espesyalisadong agent, isang automated na laboratoryo, at mga kemistang tao na nagtutulungan para mas mabilis na umusad sa cycle ng pananaliksik at makabuo ng mga natuklasang puwedeng suriin, i-reproduce, at pagbatayan ng komunidad ng siyensya.

Lubos kaming nagpapasalamat sa team ng Molecule.one at sa mga independiyenteng kemiko na nagsuri sa gawaing ito.

May-akda

OpenAI

Mga May-akda