Gotovo autonomni AI hemičar poboljšava zahtjevnu reakciju u medicinskoj hemiji
Uz Molecule.oneovu Mariu, GPT‑5.4 pronašao je iznenađujući aditiv koji povećava prinose Chan-Lam sprezanja za više od 80% testiranih supstrata.
OpenAI-jev rad u nauci motiviran je jednostavnim uvjerenjem: napredna AI može postati moćan partner naučnicima, pomažući im da istraže više ideja, povežu udaljene koncepte, osmisle bolje eksperimente i ubrzaju otkrića koja koriste čovječanstvu. Već smo podijelili rane primjere modela koji doprinose novim rezultatima u matematici, uključujući rad na problemu jedinične udaljenosti, u teorijskoj fizici, kroz novi rezultat o gluonskim amplitudama, i u biologiji, gdje je GPT‑5 pomogao smanjiti troškove sinteze proteina bez ćelija u automatiziranoj laboratoriji. Također smo predstavili GPT‑Rosalind, namjenski izgrađen model za podršku istraživanjima u životnim naukama i tokovima rada za otkrivanje lijekova.
Ovaj projekat proširuje tu putanju na medicinsku hemiju, gdje se napredak ne može mjeriti samo rezonovanjem. Hipoteza mora funkcionisati u laboratoriji sa stvarnim molekulama, instrumentima i eksperimentalnim šumom. Rad s Molecule.one(otvara se u novom prozoru), Povezali smo GPT‑5.4 s Marijom—agentskim hemijskim AI-jem integriranim s laboratorijem visokog protoka za autonomna istraživanja—i dali mu otvoreni cilj: da poboljša jednu od nekoliko važnih klasa reakcija. Sistem je generisao istraživačke prijedloge, osmislio i proveo eksperimente, analizirao eksperimentalne podatke i predložio naknadne eksperimente. Ljudi su ostali uključeni u proces osmišljavanja upita za usmjeravanje i ocjenjivanje te odabirom prijedloga za testiranje. Također su unijeli ograničene ispravke u eksperimentalne planove, pomagali u osnovnim laboratorijskim operacijama i nezavisno validirali konačni rezultat.
Najperspektivniji prijedlog, OAI-M1-03, fokusirao se na tešku, ali korisnu verziju Chan–Lam sprezanja, reakcije koju hemičari koriste za formiranje veza ugljik-azot. Polazeći od otvorenog cilja poboljšanja Chan–Lam sprezanja za procesnu hemiju, GPT‑5.4 je samostalno identificirao primarne sulfonamide kao zahtjevnu klasu supstrata visoke vrijednosti i sugerirao da blagi oksidansi, uključujući TEMPO, mogu poboljšati reakciju.
Kroz dva ciklusa eksperimentiranja u Maria Labu, ta ideja je dovela do značajnog poboljšanja. U optimiziranim uslovima, izmjereni prinosi su se poboljšali za 88% testiranih boronskih kiselina i 83% testiranih sulfonamida. Srednji prinos porastao je sa 16,6% na 25,2%, a udio reakcija s prinosom iznad 30% povećao se sa 15,6% na 37,5%. Hemičari su zatim ponovili reprezentativne reakcije na radnom laboratorijskom nivou. Ti eksperimenti su potvrdili rezultate na mikrolitarskoj skali, pokazujući veće prinose za 11 od 14 parova supstrata, uz više nego dvostruko povećanje u većini slučajeva. To je važno jer medicinskim hemičarima trebaju reakcije koje funkcioniraju ne samo u mikrolitarskim probirnim eksperimentima, već i u praktičnim laboratorijskim tokovima rada koji se koriste tokom otkrivanja lijekova.
Poboljšanja u ovom području medicinske hemije posebno su uzbudljiva jer je sinteza često veliko usko grlo u otkrivanju lijekova: naučnici mogu testirati samo molekule koje mogu napraviti ili na drugi način pribaviti. Sulfonamidna grupa pojavljuje se u lijekovima širom širokog raspona terapijskih područja, uključujući lijekove protiv raka, antimikrobne lijekove i diuretike, ali je Chan–Lam sprezanje primarnih sulfonamida s boronskim kiselinama historijski davalo niske prinose. Učiniti ovaj oblik reakcije pouzdanijim moglo bi medicinskim hemičarima dati širi i praktičniji način za proizvodnju i istraživanje potencijalno korisnih molekula.
Iako je ovo još uvijek rani rezultat, pruža još jedan konkretan primjer šireg pravca prema kojem radimo: AI sistemi koji mogu postati vrijedni partneri naučnicima kroz veliki dio istraživačkog ciklusa. Model je pregledao literaturu, predložio neočekivanu ideju, pomogao osmisliti i analizirati eksperimente te došao do naučnog nalaza koji su hemičari mogli procijeniti.
Maria Lab: Molecule.one specijalizirana laboratorija visokog protoka koja je izvela 10.080 reakcija u OAI-M1-03
Organska hemija temelj je svih lijekova malih molekula, kao i proizvoda u poljoprivredi, elektronici i nauci o materijalima. Reakcija je posebno korisna kada može pouzdano stvarati istu vrstu hemijske veze kroz mnogo različitih početnih materijala. Kada reakcije daju niske prinose ili previše neželjenih nusproizvoda, hemičari mogu morati napustiti inače obećavajuće molekule ili potrošiti mnogo vremena razvijajući drugačiji put. Zbog toga je sinteza veliko usko grlo u otkrivanju lijekova: naučnici uglavnom mogu testirati samo molekule koje mogu napraviti ili na drugi način pribaviti.
Chan–Lam sprezanje korisno je u medicinskoj hemiji jer formira veze ugljik-azot, koje su česte u lijekovima. Međutim, reakcija ne funkcionira jednako dobro za svaku klasu molekula. Posebno je sprezanje primarnih sulfonamida s boronskim kiselinama historijski davalo niske prinose. Sulfonamidi su važna porodica molekula koja se nalazi u lijekovima korištenim u onkologiji i infektivnim bolestima. Učiniti ovu reakciju pouzdanijom moglo bi medicinskim hemičarima dati širi i praktičniji način za proizvodnju i istraživanje potencijalno korisnih molekula.
Kombinirani sistem spojio je komplementarne sposobnosti. Upiti koje su napisali naučnici radeći s Maria AI korišteni su s GPT‑5.4 unutar okvira za generiranje i rangiranje hiljada mogućih istraživačkih prijedloga. Hemičari su pregledali mali podskup prijedloga koji su prema sistemu bili najviše rangirani i odabrali četiri za laboratorijsko testiranje. Maria AI je zatim prevela odabrane planove visokog nivoa u detaljne laboratorijske upute, izvela hiljade eksperimenata visokog protoka, analizirala sirove podatke i vratila strukturirane rezultate GPT‑5.4.
Jedan od četiri odabrana prijedloga, OAI-M1-03, predložio je upotrebu blagih oksidansa kao što je TEMPO za poboljšanje učinkovitosti Chan-Lamove reakcije u sintezi sulfonamida. Hemičari su prijedlog smatrali i iznenađujućim i zanimljivim. Detaljne nalaze iz OAI-M1-03 dijelimo u ovoj objavi na blogu i u radu(otvara se u novom prozoru).
Konačni istraživački prijedlog Maria je zatim koristila za generiranje eksperimentalnih mreža, uz manje korekcije ljudi. Najveća ljudska korekcija bila je izbjegavanje dimetil sulfoksida, odnosno DMSO-a, kao rastvarača jer su hemičari bili zabrinuti da bi mogao reagirati s jačim oksidansima korištenim za poređenje.
Cijeli proces trajao je tri mjeseca, od prvog upita 4. marta do dijeljenja rezultata OAI-M1-03 s nezavisnim stručnjacima 4. juna.
Ovaj tok rada opisujemo kao gotovo autonoman, a ne potpuno autonoman, jer su hemičari i dalje donosili važne odluke tokom cijelog procesa. Model je predložio ključne istraživačke ideje, dok su hemičari pružali usmjeravanje i prosudbu na visokom nivou, ispravljali eksperimentalne detalje, pomagali pripremiti laboratorijski potrošni materijal i reagense te ručno ponavljali ključne eksperimente.
OAI-M1-03 identificirao je TEMPO kao koristan aditiv za ovdje proučavano Chan-Lam sprezanje primarnih sulfonamida. U optimiziranim uslovima reakcija se poboljšala na dva načina: prosječni prinos je porastao, a više kombinacija supstrata dostiglo je praktično korisne prinose.
Kroz dva ciklusa Maria je izvela ukupno 10.080 reakcija – više nego što bi hemičar koji izvodi tri reakcije svaki dan izveo za deset godina. Taj obim je bio važan jer hemijski rezultati mogu zavarati kada se testiraju na samo nekoliko primjera. Reakcija može izgledati obećavajuće na jednom paru početnih materijala, ali zakazati na širem skupu molekula. Hiljade reakcija omogućile su da se TEMPO identificira među deset testiranih oksidansa, da se vidi kako se efekt ponavlja kroz raznolike kombinacije i da se pronađu njegova ograničenja.
Nakon analize prvog kruga podataka, sistem je predložio fokusiraniji drugi krug eksperimenata za testiranje naknadnih hipoteza. Jedan koristan naknadni nalaz bio je da se TEMPO može zamijeniti mnogo jeftinijim analogom, 4-hydroxy-TEMPO, uz mali gubitak performansi.
Rezultat se održao i izvan Maria Labovog probirnog formata na mikrolitarskoj skali. Hemičari su ručno reproducirali reprezentativne reakcije na radnom laboratorijskom nivou i uočili povećanje prinosa za 11 od 14 parova supstrata; kod osam parova povećanje je bilo veće od dvostrukog. Ta replikacija je važna jer eksperimenti na vrlo maloj skali ponekad mogu uvesti artefakte koji nestaju na većoj skali. Validacija na radnom laboratorijskom nivou također je uobičajena prije objave istraživanja u naučnom časopisu.

Reakcione bočice iz ručne validacije na radnom laboratorijskom nivou.
Četiri vanjska stručnjaka za hemiju pregledala su preprint koji opisuje OAI-M1-03. Njihove procjene podržale su naše mišljenje da je rezultat nov i vrijedan dijeljenja s naučnom zajednicom. Jači test slijedi: mogu li nezavisne laboratorije reproducirati rezultat i hoće li ga hemičari smatrati korisnim na širem rasponu molekula.
Od ostala tri prijedloga koja je generirao GPT‑5.4 i koje je Maria testirala tokom tromjesečnog perioda, OAI-M1-02 i OAI-M1-04 su eksperimentalno dokazana u Maria Labu, dok je OAI-M1-01 opovrgnut. Analiza ovih rezultata je u toku.
Ovaj rad pokazuje da model može dati koristan doprinos u organskoj hemiji. Učinio je više od sažimanja literature ili predlaganja jednokratnog eksperimenta: predložio je konkretnu iznenađujuću hipotezu i iznio je na ljudski pregled, osmislio eksperimente, protumačio eksperimentalne podatke i osmislio naknadne eksperimente.
To ne pokazuje da AI može samostalno voditi program hemijskih istraživanja od početka do kraja. Ljudska prosudba ostala je ključna, a tok rada zavisio je od specijalizirane infrastrukture visokog protoka. To također ne utvrđuje da će se metoda generalizirati na druge reakcije sprezanja, druge klase supstrata ili proizvodne uslove.
Procjene prinosa došle su s platforme visokog protoka, a validacija na radnom laboratorijskom nivou obuhvatila je 14 reprezentativnih parova supstrata. Potrebno je više rada da se okarakterizira mehanizam reakcije, definira opseg supstrata, izmjere performanse u različitim laboratorijskim uslovima i nezavisno reproducira rezultat.
Hemijske sposobnosti zahtijevaju pažljiv tretman jer se isti alati koji mogu podržati medicinu i nauku o materijalima mogu i zloupotrijebiti. Namjerno smo ovaj rad ograničili na legitiman problem medicinske hemije: poboljšanje poznate reakcije sprezanja koja se koristi za pravljenje molekula sličnih lijekovima. Eksperimenti nisu uključivali toksine, hemijsko oružje niti zahtjeve za dizajn štetnih spojeva. Ove rezultate ne treba čitati kao dokaz da sistem može pomoći u tim štetnim primjenama. Projekt to nije testirao niti demonstrirao.
Procjenjujemo i ublažavamo nove rizike koji proizlaze iz naprednih mogućnosti modela kroz naš okvir pripravnosti, uključujući rizike povezane sa hemijskim i biološkim domenima. Model korišten u ovom radu već je prošao relevantne evaluacije u saradnji s Institutom za sigurnost umjetne inteligencije Ujedinjenog Kraljevstva, a sistem je dizajniran tako da odbija zahtjeve usmjerene na štetne primjene. Eksperimentalni radni tok dodao je još jedan sloj kontrole: hemičari su odabrali koji će prijedlozi ući u laboratorij, pregledali eksperimentalne planove i zadržali kontrolu nad fizičkom infrastrukturom.
Smatramo da je ovo odgovoran način proučavanja potencijala AI-ja u eksperimentalnoj hemiji: odabrati problemski prostor s jasnom naučnom vrijednošću, upariti zaštitne mjere na nivou modela sa stručnim nadzorom i evaluirati sistem kroz ograničene fizičke eksperimente. Kako se ove sposobnosti budu poboljšavale, nastavit ćemo procjenjivati nove rizike, jačati zaštitne mjere i biti konkretni o tome šta rezultat implicira, a šta ne.
Neposredni naredni koraci su naučni: testirati širi raspon početnih materijala, istražiti zašto aditivi poboljšavaju reakciju, mapirati gdje efekt djeluje i gdje ne uspijeva te podržati nezavisnu replikaciju. Zajedno, ove studije će odrediti koliko se široko metoda može primijeniti i koliko je korisna u praktičnim tokovima rada medicinske hemije.
Naš dugoročniji cilj je učiniti AI sisteme pouzdanim naučnim partnerima koji pomažu istraživačima generirati hipoteze, osmišljavati eksperimente, tumačiti rezultate i odlučivati šta sljedeće testirati, uz oslanjanje na stručnu prosudbu, pouzdano mjerenje i snažne zaštitne mjere. Organska hemija je područje posebno velikog utjecaja jer napredak u otkrivanju i proizvodnji malih molekula zavisi od sposobnosti da se molekule pouzdano naprave. Naučnici mogu testirati samo molekule koje mogu napraviti, a bolja sinteza može proširiti raspon ideja koje mogu istraživati u medicini, poljoprivredi, elektronici, energiji i nauci o materijalima. Ovaj rezultat je jedan rani primjer tog šireg pravca: granični model, specijalizirani agenti, automatizirana laboratorija i hemičari koji zajedno rade da brže prođu kroz istraživački ciklus i proizvedu nalaze koje naučna zajednica može procijeniti, reproducirati i nadograditi.
Zahvalni smo timu Molecule.one i nezavisnim hemičarima koji su pregledali ovaj rad.