Téměř autonomní AI chemik vylepšuje náročnou reakci v medicinální chemii
S Marií od Molecule.one našel GPT‑5.4 překvapivé aditivum, které zvýšilo výtěžnosti Chan-Lamovy kopulace u více než 80 % testovaných substrátů.
Práce OpenAI ve vědě vychází z jednoduchého přesvědčení: pokročilá AI se může stát silným partnerem vědců, pomáhat jim zkoumat více nápadů, propojovat vzdálené koncepty, navrhovat lepší experimenty a urychlovat objevy, které prospívají lidstvu. Už jsme sdíleli rané příklady modelů, které přispěly k novým výsledkům v matematice, včetně práce na problému jednotkové vzdálenosti, v teoretické fyzice prostřednictvím nového výsledku týkajícího se gluonových amplitud a v biologii, kde GPT‑5 pomohl v automatizované laboratoři snížit náklady na bezbuněčnou syntézu proteinů. Představili jsme také GPT‑Rosalind, účelově vytvořený model na podporu výzkumu v biologických vědách a pracovních postupů při objevování léčiv.
Tento projekt tuto trajektorii rozšiřuje do medicinální chemie, kde pokrok nelze měřit jen uvažováním. Hypotéza musí fungovat v laboratoři se skutečnými molekulami, přístroji a experimentálním šumem. Ve spolupráci se společností Molecule.one(otevře se v novém okně) jsme propojili GPT‑5.4 s aplikací Maria – agentní umělou inteligencí pro chemii integrovanou s vysokokapacitní laboratoří pro autonomní výzkum – a dali jí otevřený cíl: zlepšit jednu z několika důležitých tříd reakcí. Systém generoval výzkumné návrhy, navrhoval a prováděl experimenty, analyzoval experimentální data a navrhoval navazující experimenty. Lidé zůstali zapojeni tím, že navrhovali řídicí a hodnoticí prompty a vybírali návrhy k otestování. Také prováděli omezené korekce experimentálních plánů, pomáhali se základními laboratorními operacemi a nezávisle ověřili konečný výsledek.
Nejslibnější návrh, OAI-M1-03, se zaměřil na obtížnou, ale užitečnou verzi Chan–Lamovy kopulace, reakce, kterou chemici používají k tvorbě vazeb uhlík–dusík. Na základě otevřeného cíle zlepšit Chan–Lamovu kopulaci pro procesní chemii GPT‑5.4 samostatně identifikoval primární sulfonamidy jako náročnou a hodnotnou třídu substrátů a navrhl, že mírná oxidační činidla, včetně TEMPO, by mohla reakci zlepšit.
Během dvou cyklů experimentování v Maria Lab tato myšlenka přinesla významné zlepšení. Za optimalizovaných podmínek se měřené výtěžnosti zlepšily u 88 % testovaných boronových kyselin a 83 % testovaných sulfonamidů. Průměrná výtěžnost vzrostla z 16,6 % na 25,2 % a podíl reakcí s výtěžností nad 30 % se zvýšil z 15,6 % na 37,5 %. Lidští chemici poté zopakovali reprezentativní reakce v laboratorním měřítku. Tyto experimenty potvrdily výsledky v mikrolitrovém měřítku a ukázaly vyšší výtěžnosti u 11 ze 14 párů substrátů, ve většině případů s více než dvojnásobným nárůstem. To je důležité, protože medicinální chemici potřebují reakce, které fungují nejen v mikrolitrových screeningových experimentech, ale i v praktických laboratorních pracovních postupech používaných při objevování léčiv.
Zlepšení v této oblasti medicinální chemie jsou obzvlášť vzrušující, protože syntéza je při objevování léčiv často velkým úzkým hrdlem: vědci mohou testovat jen molekuly, které dokážou vyrobit nebo jinak získat. Sulfonamidová skupina se objevuje v léčivech napříč širokou škálou terapeutických oblastí, včetně protinádorových léků, antimikrobiálních látek a diuretik, avšak Chan–Lamova kopulace primárních sulfonamidů s boronovými kyselinami historicky poskytovala nízké výtěžnosti. Spolehlivější provedení této formy reakce by mohlo medicinálním chemikům poskytnout širší a praktičtější způsob, jak vyrábět a zkoumat potenciálně užitečné molekuly.
I když jde stále o raný výsledek, poskytuje další konkrétní příklad širšího směru, ke kterému směřujeme: systémy AI, které se mohou stát cennými partnery vědců napříč velkou částí výzkumného cyklu. Model prostudoval literaturu, navrhl nečekanou myšlenku, pomohl navrhnout a analyzovat experimenty a dospěl k vědeckému zjištění, které mohli lidští chemici vyhodnotit.
Maria Lab: Specializovaná vysoce výkonná laboratoř společnosti Molecule.one, která v OAI-M1-03 provedla 10 080 reakcí
Organická chemie je základem všech léčiv s malými molekulami, stejně jako produktů v zemědělství, elektronice a materiálových vědách. Reakce je obzvlášť užitečná, když dokáže spolehlivě vytvořit stejný typ chemické vazby u mnoha různých výchozích materiálů. Když reakce poskytují nízké výtěžnosti nebo příliš mnoho nežádoucích vedlejších produktů, chemici mohou muset jinak slibné molekuly opustit nebo strávit značný čas vývojem jiné cesty. To ze syntézy dělá zásadní úzké hrdlo při objevování léčiv: vědci obecně mohou testovat jen molekuly, které dokážou vyrobit nebo jinak získat.
Chan–Lamova kopulace je v medicinální chemii užitečná, protože vytváří vazby uhlík–dusík, které jsou v léčivech běžné. Reakce však nefunguje stejně dobře pro každou třídu molekul. Zejména kopulace primárních sulfonamidů s boronovými kyselinami historicky poskytovala nízké výtěžnosti. Sulfonamidy jsou důležitá rodina molekul obsažených v léčivech používaných v onkologii a při infekčních onemocněních. Spolehlivější provedení této reakce by mohlo medicinálním chemikům poskytnout širší a praktičtější způsob, jak vyrábět a zkoumat potenciálně užitečné molekuly.
Kombinovaný systém propojil doplňující se schopnosti. Prompty napsané vědci pracujícími s Maria AI byly použity s GPT‑5.4 v rámci harnessu ke generování a řazení tisíců možných výzkumných návrhů. Lidští chemici přezkoumali malou podmnožinu návrhů, které systém ohodnotil nejvýše, a vybrali čtyři k laboratornímu testování. Maria AI poté převedla vybrané vysokoúrovňové plány na podrobné laboratorní pokyny, provedla tisíce vysokokapacitních experimentů, analyzovala surová data a vrátila strukturované výsledky do GPT‑5.4.
Jeden ze čtyř vybraných návrhů, OAI-M1-03, navrhoval použít mírná oxidační činidla, jako je TEMPO, ke zlepšení účinnosti Chan–Lamovy reakce pro syntézu sulfonamidů. Chemikům připadal tento návrh překvapivý i zajímavý. Podrobná zjištění z OAI-M1-03 sdílíme v tomto příspěvku na blogu a v článku(otevře se v novém okně).
Konečný výzkumný návrh pak Maria použila ke generování experimentálních mřížek s drobnými korekcemi od lidí. Největší lidskou korekcí bylo vyhnout se dimethylsulfoxidu neboli DMSO jako rozpouštědlu, protože chemici se obávali, že by mohl reagovat se silnějšími oxidačními činidly použitými pro srovnání.
Celý proces trval tři měsíce, od prvního promptu 4. března po sdílení výsledků OAI-M1-03 s nezávislými experty 4. června.
Tento pracovní postup popisujeme jako téměř autonomní, nikoli plně autonomní, protože lidští chemici během celého procesu stále činili důležitá rozhodnutí. Model navrhl klíčové výzkumné myšlenky, zatímco lidští chemici poskytovali vysokoúrovňové řízení a úsudek, opravovali experimentální detaily, pomáhali připravovat laboratorní spotřební materiál a činidla a ručně opakovali klíčové experimenty.
OAI-M1-03 identifikoval TEMPO jako užitečné aditivum pro zde studovanou Chan-Lamovu kopulaci primárních sulfonamidů. Za optimalizovaných podmínek se reakce zlepšila dvěma způsoby: průměrná výtěžnost vzrostla a více kombinací substrátů dosáhlo prakticky užitečných výtěžností.
Během dvou cyklů provedla Maria celkem 10 080 reakcí — více, než by za deset let provedl chemik, který každý den spustí tři reakce. Na tomto rozsahu záleželo, protože výsledky v chemii mohou být zavádějící, když se testují jen na několika příkladech. Reakce může na jednom páru výchozích materiálů vypadat slibně, ale selhat u širší sady molekul. Tisíce reakcí umožnily identifikovat TEMPO mezi deseti testovanými oxidačními činidly, sledovat opakování účinku napříč rozmanitými kombinacemi a najít jeho omezení.
Po analýze prvního kola dat systém navrhl cílenější druhé kolo experimentů k otestování navazujících hypotéz. Jedním užitečným navazujícím zjištěním bylo, že TEMPO lze nahradit mnohem levnějším analogem, 4-hydroxy-TEMPO, s malou ztrátou účinnosti.
Výsledek obstál i mimo mikrolitrový screeningový formát Maria Lab. Lidští chemici ručně reprodukovali reprezentativní reakce v laboratorním měřítku a pozorovali zvýšení výtěžnosti u 11 ze 14 párů substrátů; u osmi párů bylo zvýšení větší než dvojnásobné. Tato replikace je důležitá, protože experimenty ve velmi malém měřítku mohou někdy zavést artefakty, které ve větším měřítku zmizí. Ověření v laboratorním měřítku je také obvyklé před publikováním výzkumu ve vědeckém časopise.

Reakční ampulky z ruční validace v laboratorním měřítku.
Čtyři externí odborníci na chemii přezkoumali preprint popisující OAI-M1-03. Jejich hodnocení podpořila náš názor, že výsledek je nový a stojí za sdílení s vědeckou komunitou. Silnější test přijde následně: zda nezávislé laboratoře dokážou výsledek reprodukovat a zda jej chemici shledají užitečným u širší škály molekul.
Z dalších tří návrhů vygenerovaných GPT‑5.4 a otestovaných Marií během tříměsíčního období byly OAI-M1-02 a OAI-M1-04 experimentálně prokázány v Maria Lab, zatímco OAI-M1-01 byl vyvrácen. Analýza těchto výsledků pokračuje.
Tato práce ukazuje, že model může užitečně přispět v organické chemii. Dokázal víc než shrnout literaturu nebo navrhnout jednorázový experiment: navrhl konkrétní překvapivou hypotézu a předložil ji k lidskému posouzení, navrhl experimenty, interpretoval experimentální data a navrhl navazující experimenty.
Neukazuje však, že AI dokáže samostatně vést chemický výzkumný program od začátku do konce. Lidský úsudek zůstal nezbytný a pracovní postup závisel na specializované vysokokapacitní infrastruktuře. Také neprokazuje, že metoda bude zobecnitelná na jiné kopulační reakce, jiné třídy substrátů nebo výrobní podmínky.
Odhady výtěžnosti pocházely z vysokokapacitní platformy a ověření v laboratorním měřítku zahrnovalo 14 reprezentativních párů substrátů. Je zapotřebí další práce k charakterizaci mechanismu reakce, vymezení rozsahu substrátů, měření výkonu za různých laboratorních podmínek a nezávislé reprodukci výsledku.
Chemické schopnosti vyžadují opatrné zacházení, protože stejné nástroje, které mohou podporovat medicínu a materiálové vědy, by mohly být také zneužity. Tuto práci jsme záměrně vymezili na legitimní problém medicinální chemie: zlepšení známé kopulační reakce používané k výrobě molekul podobných léčivům. Experimenty nezahrnovaly toxiny, chemické zbraně ani požadavky na návrh škodlivých sloučenin. Tyto výsledky by neměly být chápány jako důkaz, že systém může s takovými škodlivými aplikacemi pomáhat. Projekt to netestoval ani neprokázal.
Prostřednictvím rámce připravenosti posuzujeme a řešíme vznikající rizika plynoucí ze schopností pokročilých modelů, včetně rizik souvisejících s oblastí biologie a chemie. Model použitý v této práci již prošel příslušnými hodnoceními u britského Institutu pro bezpečnost umělé inteligence a systém byl navržen tak, aby odmítal požadavky zaměřené na škodlivé využití. Do experimentálního pracovního postupu byla přidána další vrstva kontroly: lidští chemici vybírali, které návrhy postoupí do laboratoře, posuzovali experimentální plány a ponechali si kontrolu nad fyzickou infrastrukturou.
Myslíme si, že toto je odpovědný způsob, jak studovat potenciál AI v experimentální chemii: zvolit problémový prostor s jasnou vědeckou hodnotou, spojit bezpečnostní opatření na úrovni modelu s odborným dohledem a hodnotit systém prostřednictvím omezených fyzických experimentů. Jak se tyto schopnosti budou zlepšovat, budeme dál posuzovat vznikající rizika, posilovat bezpečnostní opatření a přesně uvádět, co určitý výsledek znamená a co ne.
Bezprostřední další kroky jsou vědecké: otestovat širší škálu výchozích materiálů, prozkoumat, proč aditiva reakci zlepšují, zmapovat, kde účinek funguje a kde selhává, a podpořit nezávislou replikaci. Tyto studie společně určí, jak široce lze metodu použít a jak užitečná je v praktických pracovních postupech medicinální chemie.
Naším dlouhodobějším cílem je vytvořit ze systémů AI spolehlivé vědecké partnery, kteří výzkumníkům pomáhají vytvářet hypotézy, navrhovat experimenty, interpretovat výsledky a rozhodovat, co testovat dál, a přitom zůstávají ukotveni v odborném úsudku, spolehlivém měření a silných bezpečnostních opatřeních. Organická chemie je oblast s obzvlášť vysokým dopadem, protože pokrok v objevování a výrobě malých molekul závisí na schopnosti spolehlivě vytvářet molekuly. Vědci mohou testovat jen molekuly, které dokážou vyrobit, a lepší syntéza může rozšířit okruh myšlenek, které mohou zkoumat napříč medicínou, zemědělstvím, elektronikou, energetikou a materiálovými vědami. Tento výsledek je jedním z raných příkladů tohoto širšího směru: frontier model, specializovaní agenti, automatizovaná laboratoř a lidští chemici spolupracují, aby rychleji procházeli výzkumným cyklem a vytvářeli zjištění, která může vědecká komunita vyhodnotit, reprodukovat a dále rozvíjet.
Jsme vděční týmu Molecule.one a nezávislým chemikům, kteří tuto práci přezkoumali.