Egy közel autonóm AI-vegyszerész javít egy nehéz gyógyszerkémiai reakción
A Molecule.one Mariájával a GPT‑5.4 meglepő adalékot talált, amely a tesztelt szubsztrátok több mint 80%-ánál növelte a Chan-Lam-kapcsolás hozamát.
Az OpenAI tudományos munkáját egy egyszerű meggyőződés vezérli: a fejlett AI erőteljes partnerré válhat a tudósok számára, segítve őket több ötlet feltárásában, távoli fogalmak összekapcsolásában, jobb kísérletek tervezésében és az emberiség javát szolgáló felfedezések felgyorsításában. Már megosztottunk korai példákat arra, hogy modellek új eredményekhez járulnak hozzá a matematikában, többek között az egységtávolság-problémával kapcsolatos munkában; az elméleti fizikában, a gluonamplitúdókról szóló új eredmény révén; valamint a biológiában, ahol a GPT‑5 segített csökkenteni a sejtmentes fehérjeszintézis költségét egy automatizált laborban. Bemutattuk a GPT‑Rosalindot is, egy kifejezetten az élettudományi kutatások és a gyógyszerfelfedezési munkafolyamatok támogatására készült modellt.
Ez a projekt ezt az irányvonalat terjeszti ki a gyógyszerkémiára, ahol az előrehaladás nem mérhető pusztán érveléssel. Egy hipotézisnek a laborban is működnie kell, valódi molekulákkal, műszerekkel és kísérleti zajjal. A Molecule.one(új ablakban nyílik meg)-nal együttműködve összekapcsoltuk a GPT‑5.4‑et Mariával – egy ügynöki kémiai MI-vel, amely egy adatátviteli egység laboratóriummal van integrálva az autonóm kutatáshoz –, és egy nyílt végű célt adtunk neki: javítsa az egyik fontos reakcióosztályt a több közül. A rendszer kutatási javaslatokat generált, kísérleteket tervezett és hajtott végre, elemezte a kísérleti adatokat, és további kísérleteket javasolt. Az emberek továbbra is a folyamat részei maradtak: irányítási és értékelési utasításokat terveztek, valamint kiválasztották a tesztelendő javaslatokat. Emellett korlátozott mértékű javításokat végeztek a kísérleti terveken, segítettek az alapvető laboratóriumi műveletekben, és önállóan ellenőrizték a végső eredményt.
A legígéretesebb javaslat, az OAI-M1-03, a Chan–Lam-kapcsolás egy nehéz, de hasznos változatára összpontosított, amelyet a vegyészek szén–nitrogén kötések létrehozására használnak. A Chan–Lam-kapcsolás folyamatkémiai javításának nyílt végű céljából kiindulva a GPT‑5.4 önállóan azonosította az elsődleges szulfonamidokat mint kihívást jelentő, nagy értékű szubsztrátosztályt, és azt javasolta, hogy enyhe oxidálószerek, köztük a TEMPO, javíthatják a reakciót.
A Maria Labben végzett két kísérleti ciklus során ez az ötlet jelentős javulást eredményezett. Az optimalizált körülmények között a mért hozamok a tesztelt boronsavak 88%-ánál és a szulfonamidok 83%-ánál javultak. Az átlagos hozam 16,6%-ról 25,2%-ra nőtt, a 30% feletti hozamú reakciók aránya pedig 15,6%-ról 37,5%-ra emelkedett. Ezután emberi vegyészek megismételték a reprezentatív reakciókat laborpad-méretben. Ezek a kísérletek megerősítették a mikroliteres léptékű eredményeket: 14 szubsztrátpárból 11-nél magasabb hozamot mutattak, a legtöbb esetben több mint kétszeres növekedéssel. Ez azért fontos, mert a gyógyszerkémikusoknak olyan reakciókra van szükségük, amelyek nemcsak mikroliteres szűrőkísérletekben működnek, hanem a gyógyszerfelfedezés során használt gyakorlati laboratóriumi munkafolyamatokban is.
A gyógyszerkémia ezen területén elért javulások különösen izgalmasak, mert a szintézis gyakran jelentős szűk keresztmetszet a gyógyszerfelfedezésben: a tudósok csak azokat a molekulákat tudják tesztelni, amelyeket elő tudnak állítani vagy más módon meg tudnak szerezni. A szulfonamidcsoport számos terápiás terület gyógyszereiben megjelenik, beleértve a rákellenes szereket, az antimikrobiális szereket és a vízhajtókat, ugyanakkor az elsődleges szulfonamidok boronsavakkal történő Chan–Lam-kapcsolása történetileg alacsony hozamot adott. A reakció e formájának megbízhatóbbá tétele szélesebb és gyakorlatiasabb módot adhatna a gyógyszerkémikusoknak a potenciálisan hasznos molekulák előállítására és feltárására.
Bár ez még korai eredmény, újabb konkrét példát ad arra a tágabb irányra, amely felé dolgozunk: olyan AI-rendszerekre, amelyek értékes partnerekké válhatnak a tudósok számára a kutatási ciklus nagy részében. A modell áttekintette a szakirodalmat, váratlan ötletet javasolt, segített kísérleteket tervezni és elemezni, és olyan tudományos megállapításra jutott, amelyet emberi vegyészek értékelhettek.
Maria Lab: Molecule.one speciális, nagy adatátviteli egységű laboratórium, amely 10 080 reakciót futtatott az OAI-M1-03-ban
A szerves kémia minden kis molekulájú gyógyszer, valamint a mezőgazdaságban, az elektronikában és az anyagtudományban használt termékek alapja. Egy reakció akkor különösen hasznos, ha sok különböző kiindulási anyag esetében megbízhatóan képes ugyanazt a kémiai kötést létrehozni. Ha a reakciók alacsony hozamot vagy túl sok nem kívánt mellékterméket adnak, a vegyészeknek esetleg fel kell adniuk egyébként ígéretes molekulákat, vagy jelentős időt kell fordítaniuk egy másik útvonal kidolgozására. Ez a szintézist jelentős szűk keresztmetszetté teszi a gyógyszerfelfedezésben: a tudósok általában csak azokat a molekulákat tudják tesztelni, amelyeket elő tudnak állítani vagy más módon meg tudnak szerezni.
A Chan–Lam-kapcsolás azért hasznos a gyógyszerkémiában, mert szén–nitrogén kötéseket hoz létre, amelyek gyakoriak a gyógyszerekben. A reakció azonban nem működik egyformán jól minden molekulaosztály esetében. Különösen az elsődleges szulfonamidok boronsavakkal történő kapcsolása eredményezett történetileg alacsony hozamot. A szulfonamidok fontos molekulacsaládot alkotnak, amelyek megtalálhatók az onkológiában és a fertőző betegségek kezelésében használt gyógyszerekben. A reakció megbízhatóbbá tétele szélesebb és gyakorlatiasabb módot adhatna a gyógyszerkémikusoknak a potenciálisan hasznos molekulák előállítására és feltárására.
Az egyesített rendszer egymást kiegészítő képességeket kapcsolt össze. A Maria AI-jal dolgozó tudósok által írt utasításokat a GPT‑5.4‑gyel használták egy keretrendszerben, hogy több ezer lehetséges kutatási javaslatot generáljanak és rangsoroljanak. Emberi vegyészek áttekintették a rendszer szerint legmagasabbra rangsorolt javaslatok kis részhalmazát, és négyet kiválasztottak laboratóriumi tesztelésre. A Maria AI ezután a kiválasztott magas szintű terveket részletes laboratóriumi utasításokká fordította le, több ezer nagy áteresztőképességű kísérletet futtatott, elemezte a nyers adatokat, és strukturált eredményeket küldött vissza a GPT‑5.4‑nek.
A négy kiválasztott javaslat egyike, az OAI-M1-03, enyhe oxidálószerek, például a TEMPO alkalmazását javasolta a Chan-Lam-reakció hatékonyságának javítására a szulfonamid-szintézisben. A vegyészek egyszerre meglepőnek és érdekesnek találták a javaslatot. Az OAI-M1-03 részletes megállapításait ebben a blogbejegyzésben és a tanulmányban(új ablakban nyílik meg) osztjuk meg.
A végső kutatási javaslatot ezután Maria használta fel kísérleti rácsok létrehozására, emberek kisebb javításaival. A legnagyobb emberi korrekció az volt, hogy oldószerként elkerüljék a dimetil-szulfoxidot, vagyis a DMSO-t, mert a vegyészek attól tartottak, hogy reakcióba léphet az összehasonlításként használt erősebb oxidálószerekkel.
A teljes folyamat három hónapot vett igénybe: a március 4-i első utasítástól az OAI-M1-03 eredményeinek független szakértőkkel való június 4-i megosztásáig.
Ezt a munkafolyamatot közel autonómnak, nem teljesen autonómnak nevezzük, mert az emberi vegyészek továbbra is fontos döntéseket hoztak a folyamat során. A modell javasolta a kulcsfontosságú kutatási ötleteket, miközben az emberi vegyészek magas szintű irányítást és megítélést biztosítottak, javították a kísérleti részleteket, segítettek előkészíteni a laboratóriumi fogyóeszközöket és reagenseket, valamint kézzel megismételték a kulcskísérleteket.
Az OAI-M1-03 a TEMPO-t hasznos adalékanyagként azonosította az itt vizsgált elsődleges szulfonamid Chan-Lam-kapcsoláshoz. Az optimalizált körülmények között a reakció két módon javult: nőtt az átlagos hozam, és több szubsztrátkombináció ért el gyakorlatilag hasznos hozamot.
Két ciklus során Maria összesen 10 080 reakciót futtatott – többet, mint amennyit egy napi három reakciót végző vegyész egy évtized alatt lefuttatna. Ez a lépték azért számított, mert a kémiai eredmények félrevezetők lehetnek, ha csak néhány példán tesztelik őket. Egy reakció ígéretesnek tűnhet egy kiindulási anyagpár esetében, de a molekulák szélesebb körében kudarcot vallhat. A több ezer reakció lehetővé tette a TEMPO azonosítását tíz tesztelt oxidálószer között, a hatás ismétlődésének megfigyelését különféle kombinációkban, valamint a korlátainak feltárását.
Az első adatkör elemzése után a rendszer egy fókuszáltabb második kísérleti kört javasolt a további hipotézisek tesztelésére. Az egyik hasznos további megállapítás az volt, hogy a TEMPO-t egy sokkal olcsóbb analóggal, a 4-hidroxi-TEMPO-val lehet helyettesíteni, csekély teljesítményveszteséggel.
Az eredmény a Maria Lab mikroliteres szűrési formátumán túl is megállta a helyét. Emberi vegyészek kézzel, laborpad-méretben reprodukálták a reprezentatív reakciókat, és 14 szubsztrátpárból 11-nél hozamnövekedést figyeltek meg; nyolc pár esetében a növekedés több mint kétszeres volt. Ez az ismétlés azért fontos, mert a nagyon kis léptékű kísérletek néha olyan műtermékeket vezethetnek be, amelyek nagyobb léptékben eltűnnek. A laborpad-méretű validálás egy tudományos folyóiratban való publikálás előtt szintén bevett gyakorlat.

Manuális, laborléptékű validálásból származó reakciós fiolák.
Négy külső kémiai szakértő áttekintette az OAI-M1-03-at leíró preprintet. Értékeléseik alátámasztották azt a nézetünket, hogy az eredmény új és érdemes megosztani a tudományos közösséggel. Az erősebb teszt ezután következik: vajon független laborok reprodukálni tudják-e az eredményt, és a vegyészek hasznosnak találják-e a molekulák szélesebb körében.
A GPT‑5.4 által generált és Maria által a három hónapos időszakban tesztelt másik három javaslat közül az OAI-M1-02 és az OAI-M1-04 kísérletileg bizonyítást nyert a Maria Labben, míg az OAI-M1-01-et cáfolták. Ezeknek az eredményeknek az elemzése folyamatban van.
Ez a munka megmutatja, hogy egy modell hasznos hozzájárulást tehet a szerves kémiában. Többet tett annál, mint hogy összefoglalja a szakirodalmat vagy egyszeri kísérletet javasoljon: konkrét, meglepő hipotézist fogalmazott meg és emberi felülvizsgálatra felszínre hozta, kísérleteket tervezett, értelmezte a kísérleti adatokat, és további kísérleteket tervezett.
Nem mutatja meg, hogy az AI önállóan, az elejétől a végéig képes lenne levezényelni egy kémiai kutatási programot. Az emberi megítélés továbbra is elengedhetetlen volt, és a munkafolyamat speciális, nagy áteresztőképességű infrastruktúrától függött. Azt sem bizonyítja, hogy a módszer általánosítható lesz más kapcsolási reakciókra, más szubsztrátosztályokra vagy gyártási körülményekre.
A hozambecslések egy nagy áteresztőképességű platformról származtak, a laborpad-validálás pedig 14 reprezentatív szubsztrátpárt fedett le. További munkára van szükség a reakciómechanizmus jellemzéséhez, a szubsztrátkör meghatározásához, a teljesítmény méréséhez különböző laboratóriumi körülmények között, valamint az eredmény független reprodukálásához.
A kémiai képességek gondos kezelést igényelnek, mert ugyanazok az eszközök, amelyek támogathatják az orvostudományt és az anyagtudományt, visszaélésre is felhasználhatók. Ezt a munkát szándékosan egy legitim gyógyszerkémiai problémára korlátoztuk: egy ismert, gyógyszerszerű molekulák előállítására használt kapcsolási reakció javítására. A kísérletek nem érintettek toxinokat, vegyi fegyvereket, és nem tartalmaztak káros vegyületek tervezésére vonatkozó kéréseket. Ezeket az eredményeket nem szabad annak bizonyítékaként értelmezni, hogy a rendszer segíteni tudna ilyen káros alkalmazásokban. A projekt ezt nem tesztelte és nem demonstrálta.
A fejlett modellképességekből fakadó, újonnan felmerülő kockázatokat a Felkészültségi keretrendszerünk segítségével értékeljük és mérsékeljük, beleértve a kémiai és biológiai területekhez kapcsolódó kockázatokat is. Az ebben a munkában használt modell már átesett a releváns értékeléseken a UK AI Security Institute-tal, és a rendszert úgy tervezték, hogy elutasítsa a káros alkalmazásokra irányuló kéréseket. A kísérleti munkafolyamat az ellenőrzés egy újabb rétegét biztosította: emberi vegyészek választották ki, mely javaslatok kerüljenek be a laboratóriumba, áttekintették a kísérleti terveket, és megtartották az irányítást a fizikai infrastruktúra felett.
Úgy gondoljuk, ez a felelős módja annak, hogy az AI kísérleti kémiában rejlő potenciálját tanulmányozzuk: világos tudományos értékű problémateret választani, a modellszintű védelmi intézkedéseket szakértői felügyelettel párosítani, és a rendszert korlátozott fizikai kísérleteken keresztül értékelni. Ahogy ezek a képességek javulnak, továbbra is értékelni fogjuk a felmerülő kockázatokat, erősítjük a védelmi intézkedéseket, és pontosan megfogalmazzuk, mit jelent és mit nem jelent egy eredmény.
A közvetlen következő lépések tudományosak: a kiindulási anyagok szélesebb körének tesztelése, annak vizsgálata, hogy az adalékanyagok miért javítják a reakciót, annak feltérképezése, hol működik és hol nem a hatás, valamint a független reprodukció támogatása. Ezek a vizsgálatok együtt határozzák majd meg, milyen széles körben alkalmazható a módszer, és mennyire hasznos a gyakorlati gyógyszerkémiai munkafolyamatokban.
Hosszabb távú célunk, hogy az AI-rendszereket megbízható tudományos partnerekké tegyük, amelyek segítik a kutatókat hipotézisek generálásában, kísérletek tervezésében, eredmények értelmezésében és annak eldöntésében, mit teszteljenek legközelebb, miközben szakértői megítélésre, megbízható mérésre és erős védelmi intézkedésekre támaszkodnak. A szerves kémia különösen nagy hatású terület, mert a kis molekulájú vegyületek felfedezésében és gyártásában elért előrehaladás azon múlik, hogy megbízhatóan tudunk-e molekulákat előállítani. A tudósok csak azokat a molekulákat tudják tesztelni, amelyeket elő tudnak állítani, a jobb szintézis pedig kibővítheti az általuk feltárható ötletek körét az orvostudományban, a mezőgazdaságban, az elektronikában, az energiában és az anyagtudományban. Ez az eredmény ennek a tágabb iránynak egy korai példája: egy frontier modell, specializált ügynökök, egy automatizált laboratórium és emberi vegyészek együtt dolgoznak azért, hogy gyorsabban haladjanak végig a kutatási cikluson, és olyan megállapításokat hozzanak létre, amelyeket a tudományos közösség értékelhet, reprodukálhat és továbbépíthet.
Hálásak vagyunk a Molecule.one csapatának és azoknak a független vegyészeknek, akik áttekintették ezt a munkát.