Прескокни до главната содржина
OpenAI

Речиси автономен AI хемичар подобрува предизвикувачка реакција во медицинската хемија

Со Maria на Molecule.one, GPT‑5.4 најде изненадувачки адитив што ги зголемува приносите од Chan-Lam спојување кај над 80% од тестираните супстрати.

Работата на OpenAI во науката е мотивирана од едноставно верување: напредната AI може да стане моќен партнер за научниците, помагајќи им да истражуваат повеќе идеи, да поврзуваат оддалечени концепти, да осмислуваат подобри експерименти и да ги забрзаат откритијата што му користат на човештвото. Веќе споделивме рани примери на модели што придонесуваат за нови резултати во математиката, вклучително и работа на проблемот со единично растојание, во теоретската физика, преку нов резултат за глуонски амплитуди, и во биологијата, каде што GPT‑5 помогна да се намалат трошоците за бесклеточна синтеза на протеини во автоматизирана лабораторија. Го претставивме и GPT‑Rosalind, наменски изграден модел за поддршка на истражувања во животните науки и работни текови за откривање лекови. 

Овој проект ја проширува таа траекторија во медицинската хемија, каде што напредокот не може да се мери само со расудување. Хипотезата мора да функционира во лабораторија со вистински молекули, инструменти и експериментален шум. Работејќи со Molecule.one(се отвора во нов прозорец), Го поврзавме GPT‑5,4 со Maria – агентска хемиска вештачка интелигенција интегрирана со лабораторија со висок капацитет за автономно истражување – и ѝ зададовме отворена цел: да подобри една од неколкуте важни класи на реакции. Системот генерираше истражувачки предлози, осмислуваше и изведуваше експерименти, анализираше експериментални податоци и предлагање дополнителни експерименти. Луѓето останаа вклучени во процесот преку креирање насочувачки и оценувачки инструкции и избирање предлози за тестирање. Тие исто така направија ограничени корекции на експерименталните планови, помагаа со основните лабораториски операции и независно го потврдија конечниот резултат.

Најперспективниот предлог, OAI-M1-03, се фокусираше на тешка но корисна верзија на Chan–Lam спојување, реакција што хемичарите ја користат за создавање врски јаглерод-азот. Почнувајќи од отворената цел за подобрување на Chan–Lam спојувањето за процесна хемија, GPT‑5.4 независно ги идентификуваше примарните сулфонамиди како предизвикувачка и високовредна класа супстрати и предложи дека благи оксиданти, вклучително и TEMPO, можат да ја подобрат реакцијата. 

Во два циклуса на експериментирање во Maria Lab, таа идеја донесе значително подобрување. Под оптимизираните услови, измерените приноси се подобрија кај 88% од тестираните боронски киселини и кај 83% од тестираните сулфонамиди. Просечниот принос се зголеми од 16,6% на 25,2%, а уделот на реакции со принос над 30% се зголеми од 15,6% на 37,5%. Потоа човечки хемичари повторија претставителни реакции во лабораториски размер. Тие експерименти ги потврдија резултатите од микролитарски размер, покажувајќи повисоки приноси за 11 од 14 парови супстрати, со повеќе од двојно зголемување во повеќето случаи. Тоа е важно затоа што на медицинските хемичари им требаат реакции што функционираат не само во скрининг-експерименти во микролитарски размер, туку и во практични лабораториски работни текови што се користат при откривање лекови.

Подобрувањата во оваа област на медицинската хемија се особено возбудливи бидејќи синтезата често е големо тесно грло во откривањето лекови: научниците можат да ги тестираат само молекулите што можат да ги создадат или на друг начин да ги добијат. Сулфонамидната група се јавува во лекови во широк спектар терапевтски области, вклучително и антиканцерогени лекови, антимикробни средства и диуретици, но Chan–Lam спојувањето на примарни сулфонамиди со боронски киселини историски давало ниски приноси. Ако оваа форма на реакцијата стане посигурна, медицинските хемичари би добиле поширок и попрактичен начин за производство и истражување потенцијално корисни молекули.

Иако ова сè уште е ран резултат, тој дава уште еден конкретен пример за пошироката насока кон која работиме: AI системи што можат да станат вредни партнери на научниците во голем дел од истражувачкиот циклус. Моделот ја прегледа литературата, предложи неочекувана идеја, помогна да се осмислат и анализираат експерименти и стигна до научно откритие што човечките хемичари можеа да го оценат.

Maria Lab: Molecule.one специјализирана лабораторија со висок капацитет што изведе 10.080 реакции во OAI-M1-03

Зошто хемискиот проблем е важен

Органската хемија е основа за сите лекови со мали молекули, како и за производи во земјоделството, електрониката и науката за материјали. Реакцијата е особено корисна кога може сигурно да создаде ист вид хемиска врска кај многу различни почетни материјали. Кога реакциите даваат ниски приноси или премногу несакани нуспроизводи, хемичарите може да мора да се откажат од инаку перспективни молекули или да потрошат значително време развивајќи поинаков пат. Ова ја прави синтезата големо тесно грло во откривањето лекови: научниците генерално можат да ги тестираат само молекулите што можат да ги создадат или на друг начин да ги добијат.

Chan–Lam спојувањето е корисно во медицинската хемија бидејќи создава врски јаглерод-азот, кои се чести во лековите. Сепак, реакцијата не функционира еднакво добро за секоја класа молекули. Особено, спојувањето на примарни сулфонамиди со боронски киселини историски давало ниски приноси. Сулфонамидите се важно семејство молекули што се наоѓаат во лекови користени во онкологијата и заразните болести. Ако оваа реакција стане посигурна, медицинските хемичари би добиле поширок и попрактичен начин за производство и истражување потенцијално корисни молекули.

Поврзување на GPT‑5.4 со Maria AI и Lab

Комбинираниот систем спои комплементарни способности. Промптови напишани од научници што работеа со Maria AI беа користени со GPT‑5.4 во рамка за извршување за да се генерираат и рангираат илјадници можни истражувачки предлози. Човечки хемичари го прегледаа малиот подмножество предлози што системот ги рангираше највисоко и избраа четири за лабораториско тестирање. Потоа Maria AI ги претвори избраните планови на високо ниво во детални лабораториски инструкции, изведе илјадници експерименти со висок капацитет, ги анализираше суровите податоци и му врати структурирани резултати на GPT‑5.4. 

Еден од четирите избрани предлози, OAI-M1-03, предложи употреба на благи оксиданси како што е TEMPO за подобрување на ефикасноста на реакцијата Chan-Lam за синтеза на сулфонамиди. Хемичарите го најдоа предлогот изненадувачки и интересен. Ги споделуваме деталните наоди од OAI-M1-03 во оваа објава на блогот и во истражувачки труд(се отвора во нов прозорец).

Конечниот истражувачки предлог потоа беше користен од Maria за генерирање експериментални мрежи, со мали корекции од луѓе. Најголемата човечка корекција беше да се избегне диметил сулфоксид, или DMSO, како растворувач, бидејќи хемичарите беа загрижени дека може да реагира со посилните оксиданти користени за споредба.

Целиот процес траеше три месеци, од првиот промпт на 4 март до споделувањето на резултатите од OAI-M1-03 со независни експерти на 4 јуни.

Овој работен тек го опишуваме како речиси автономен, а не целосно автономен, бидејќи човечките хемичари сè уште носеа важни одлуки во текот на процесот. Моделот ги предложи клучните истражувачки идеи, додека човечките хемичари обезбедија насочување и проценка на високо ниво, коригираа експериментални детали, помогнаа во подготовка на лабораториски потрошни материјали и реагенси и рачно ги повторија клучните експерименти.

Што откривме

OAI-M1-03 го идентификуваше TEMPO како корисен адитив за примарното сулфонамидно Chan-Lam спојување што се проучува тука. Под оптимизираните услови, реакцијата се подобри на два начина: просечниот принос се зголеми, а повеќе комбинации на супстрати достигнаа практично корисни приноси.

Во два циклуса, Maria изведе вкупно 10.080 реакции — повеќе отколку што би извел хемичар што секој ден изведува по три реакции во текот на една деценија. Тој размер беше важен бидејќи резултатите во хемијата можат да бидат погрешни кога се тестираат само на неколку примери. Реакцијата може да изгледа ветувачки кај еден пар почетни материјали, но да не успее кај поширок сет молекули. Илјадници реакции овозможија TEMPO да се идентификува меѓу десет тестирани оксиданти, да се види дека ефектот се повторува кај разновидни комбинации и да се откријат неговите ограничувања.


По анализата на првиот круг податоци, системот предложи пофокусиран втор круг експерименти за тестирање дополнителни хипотези. Еден корисен дополнителен наод беше дека TEMPO може да се замени со многу поевтин аналог, 4-хидрокси-TEMPO, со мала загуба во изведбата.

Графикон што ја споредува изведбата на TEMPO, 4-хидрокси-TEMPO, 4-оксо-TEMPO и PMP со хемиски структури.

Резултатот се одржа и надвор од форматот за микролитарски скрининг на Maria Lab. Човечки хемичари рачно репродуцираа претставителни реакции во лабораториски размер и забележаа зголемување на приносот кај 11 од 14 парови супстрати; кај осум парови зголемувањето беше поголемо од двојно. Таа репликација е важна бидејќи експериментите во многу мал размер понекогаш можат да внесат артефакти што исчезнуваат во поголем размер. Валидацијата во лабораториски размер е исто така вообичаена пред истражување да се објави во научно списание.

Означени стаклени вијали за реакции од експериментите за валидација во лабораториски размер на Molecule.one.

Вијали за реакции од рачна валидација на лабораториски размер.

TEMPO го подобрува создавањето производ во лабораториски размер

Четири надворешни експерти по хемија го прегледаа препринтот што го опишува OAI-M1-03. Нивните оценки го поддржаа нашето гледиште дека резултатот е нов и вреди да се сподели со научната заедница. Посилниот тест допрва следи: дали независни лаборатории можат да го репродуцираат резултатот и дали хемичарите ќе го најдат корисен кај поширок опсег молекули.

Спојувањето на експериментирање со висок капацитет и современа AI претставува нова граница на научното откритие. Оваа нова реакција е моќна демонстрација, каде што исклучително благи услови и практичен оксидант овозможуваат убаво општ опсег на супстрати за една од попопуларните реакции во синтезата на лекови.
—Тим Цернак, вонреден професор по медицинска хемија, Универзитет во Мичиген

Од другите три предлози генерирани од GPT‑5.4 и тестирани од Maria во тримесечниот период, OAI-M1-02 и OAI-M1-04 беа експериментално докажани во Maria Lab, додека OAI-M1-01 беше побиен. Анализата на овие резултати е во тек.

Ограничувања

Оваа работа покажува дека модел може да даде корисен придонес во органската хемија. Тој направи повеќе од сумирање на литературата или предлагање еднократен експеримент: предложи конкретна изненадувачка хипотеза и ја изнесе за човечка проверка, осмисли експерименти, толкуваше експериментални податоци и осмисли дополнителни експерименти.

Тоа не покажува дека AI може независно да води хемиска истражувачка програма од почеток до крај. Човечката проценка остана неопходна, а работниот тек зависеше од специјализирана инфраструктура со висок капацитет. Исто така, не се утврдува дека методот ќе се генерализира на други реакции на спојување, други класи супстрати или производствени услови.

Проценките на приносот дојдоа од платформа со висок капацитет, а валидацијата во лабораториски размер опфати 14 претставителни парови супстрати. Потребна е дополнителна работа за да се карактеризира механизмот на реакцијата, да се дефинира опсегот на супстрати, да се измери изведбата под различни лабораториски услови и резултатот независно да се репродуцира.

Подготвеност

Хемиските способности бараат внимателен третман бидејќи истите алатки што можат да ја поддржат медицината и науката за материјали би можеле и да се злоупотребат. Намерно го ограничивме опсегот на оваа работа на легитимен проблем од медицинската хемија: подобрување позната реакција на спојување што се користи за создавање молекули слични на лекови. Експериментите не вклучуваа токсини, хемиско оружје или барања за дизајнирање штетни соединенија. Овие резултати не треба да се читаат како доказ дека системот може да помогне со такви штетни примени. Проектот не го тестираше ниту го демонстрираше тоа.

Ги проценуваме и ублажуваме новонастанатите ризици од напредните способности на моделите преку нашата „Рамка за подготвеност“, вклучувајќи ризици поврзани со хемиските и биолошките домени. Моделот користен во оваа работа веќе беше подложен на релевантни евалуации од Институтот за безбедност на ВИ на Обединетото Кралство, а системот беше дизајниран да одбива барања насочени кон штетни примени. Експерименталниот работен процес додаде уште еден слој на контрола: човечките хемичари избираа кои предлози ќе преминат во лабораторијата, ги прегледуваа експерименталните планови и ја задржуваа контролата врз физичката инфраструктура.

Сметаме дека ова е одговорниот начин да се проучува потенцијалот на AI во експерименталната хемија: да се избере проблемски простор со јасна научна вредност, да се спојат заштитни мерки на ниво на модел со експертски надзор и системот да се оцени преку ограничени физички експерименти. Како што овие способности се подобруваат, ќе продолжиме да ги проценуваме новите ризици, да ги зајакнуваме заштитните мерки и јасно да наведуваме што еден резултат подразбира, а што не подразбира.

Што следува

Непосредните следни чекори се научни: да се тестира поширок опсег почетни материјали, да се истражи зошто адитивите ја подобруваат реакцијата, да се мапира каде ефектот функционира и каде не, и да се поддржи независна репликација. Заедно, овие студии ќе утврдат колку широко може да се примени методот и колку е корисен во практични работни текови во медицинската хемија.

Нашата подолгорочна цел е AI системите да станат сигурни научни партнери што им помагаат на истражувачите да генерираат хипотези, да осмислуваат експерименти, да толкуваат резултати и да одлучуваат што следно да тестираат, останувајќи засновани на експертска проценка, сигурно мерење и силни заштитни мерки. Органската хемија е област со особено голем потенцијален ефект бидејќи напредокот во откривањето и производството на мали молекули зависи од способноста сигурно да се создаваат молекули. Научниците можат да ги тестираат само молекулите што можат да ги создадат, а подобрата синтеза може да го прошири опсегот на идеи што можат да ги истражуваат во медицината, земјоделството, електрониката, енергијата и науката за материјали. Овој резултат е еден ран пример за таа поширока насока: граничен модел, специјализирани агенти, автоматизирана лабораторија и човечки хемичари што работат заедно за побрзо да се движат низ истражувачкиот циклус и да создадат наоди што научната заедница може да ги оцени, репродуцира и надгради.

Му благодариме на тимот на Molecule.one и на независните хемичари што ја прегледаа оваа работа.

Автор

OpenAI

Автори