Почти полностью автономный ИИ-химик усовершенствовал сложную реакцию для медицинской химии
С Maria от Molecule.one GPT‑5.4 нашел неожиданную добавку, повышающую выходы сочетания Чана—Лама более чем у 80% протестированных субстратов.
Работа OpenAI в области науки основана на простой убежденности: передовой ИИ может стать мощным партнером для ученых, помогая им изучать больше идей, связывать далекие концепции, проводить более качественные эксперименты и ускорять открытия на благо человечества. Мы уже делились ранними примерами того, как модели способствуют получению новых результатов в математике, включая работу над задачей о единичных расстояниях, в теоретической физике — благодаря новому результату по глюонным амплитудам, а также в биологии, где GPT‑5 помог снизить стоимость бесклеточного синтеза белка в автоматизированной лаборатории. Мы также представили GPT‑Rosalind — специализированную модель для поддержки исследований в науках о жизни и рабочих процессов разработки лекарств.
Этот проект продолжает этот вектор развития в области медицинской химии, где прогресс нельзя измерять одними лишь рассуждениями. Гипотеза должна работать в лаборатории с реальными молекулами, приборами и экспериментальным шумом. Работая с Molecule.one(открывается в новом окне), мы подключили GPT‑5.4 к Maria — агентному ИИ для химии, интегрированному с лабораторией с высокой пропускной способностью для автономных исследований, — и поставили перед ним цель с открытой формулировкой: улучшить один из нескольких важных классов реакций. Система формировала исследовательские предложения, планировала и проводила эксперименты, анализировала экспериментальные данные и предлагала последующие эксперименты. Люди оставались вовлеченными в процесс: они разрабатывали направляющие и оценочные промпты и выбирали предложения для тестирования. Они также вносили ограниченные исправления в экспериментальные планы, помогали с базовыми лабораторными операциями и независимо верифицировали финальный результат.
Наиболее перспективное предложение под кодом OAI-M1-03 было сосредоточено на сложной, но полезной версии кросс-сочетания Чана—Лама — реакции, которую химики используют для образования связей углерод—азот. Исходя из открытой цели оптимизировать сочетание Чана—Лама для технологической химии, GPT‑5.4 самостоятельно определил первичные сульфонамиды как сложный и ценный класс субстратов и предположил, что мягкие окислители, включая TEMPO, могут улучшить течение реакции.
За два цикла экспериментов в Maria Lab эта идея привела к существенному улучшению. В оптимизированных условиях измеренные выходы улучшились для 88% протестированных бороновых кислот и 83% сульфонамидов. Средний выход вырос с 16,6% до 25,2%, а доля реакций с выходом выше 30% увеличилась с 15,6% до 37,5%. Затем химики повторили репрезентативные реакции в условиях лаборатории. Эти эксперименты подтвердили результаты микролитрового скрининга, показав более высокие выходы для 11 из 14 пар субстратов, причем в большинстве случаев рост был более чем двукратным. Это важно, потому что медицинским химикам нужны реакции, которые работают не только в микролитровых скрининговых экспериментах, но и в практических лабораторных процессах, используемых при разработке лекарств.
Улучшения в этой области медицинской химии особенно интересны, потому что синтез часто является крупным узким местом в разработке лекарств: ученые могут тестировать только те молекулы, которые они могут синтезировать или получить иным способом. Сульфонамидная группа встречается в лекарствах самого широкого терапевтического спектра, включая противораковые препараты, антимикробные средства и диуретики, однако сочетание Чана—Лама первичных сульфонамидов с бороновыми кислотами исторически давало низкие выходы. Если сделать эту форму реакции более надежной, медицинские химики получат более широкий и практичный способ синтезировать и исследовать потенциально полезные молекулы.
Хотя это все еще ранний результат, он дает еще один конкретный пример более широкого направления, к которому мы движемся: ИИ-системы, способные стать ценными партнерами ученых на большей части исследовательского цикла. Модель изучила литературу, предложила неожиданную идею, помогла спроектировать и проанализировать эксперименты и пришла к научному результату, который смогли оценить эксперты-химики.
Maria Lab от Molecule.one специализированная лаборатория с высокой пропускной способностью, которая провела 10 080 реакций в OAI-M1-03
Органическая химия лежит в основе всех низкомолекулярных лекарственных препаратов а также продуктов в сельском хозяйстве, электронике и материаловедении. Реакция особенно полезна, когда она позволяет надежно создавать один и тот же тип химической связи на множестве разных исходных веществ Когда реакции дают низкие выходы или слишком много нежелательных побочных продуктов, химикам может приходиться отказываться от от молекул, которые в иных условиях могли бы стать перспективными лекарствами или тратить много времени на разработку другого пути. Это делает синтез главным препятствием в разработке лекарств: ученые, как правило, могут тестировать только те молекулы, которые способны синтезировать или получить иным образом.
Сочетание Чана—Лама полезно в медицинской химии, потому что образует связи углерод—азот, часто встречающиеся в лекарствах. Однако реакция не работает одинаково хорошо для каждого класса молекул. В частности, сочетание первичных сульфонамидов с бороновыми кислотами исторически давало низкие выходы. Сульфонамиды — важное семейство молекул, встречающихся в лекарствах, применяемых в онкологии и при инфекционных заболеваниях. Если сделать эту реакцию более надежной, медицинские химики получат более широкий и практичный практичный инструмент для синтеза и исследования потенциально полезных молекул.
Интегрированная система объединила в себе взаимодополняющие возможности обеих платформ. Промпты, составленные работавшими с Maria AI учеными, передавались в GPT‑5.4 в рамках единой программной оболочки для генерации и ранжирования тысяч потенциальных планов исследований. Эксперты-химики изучили небольшую выборку предложений, получивших наивысшие оценки системы, и отобрали четыре из них для лабораторных испытаний. Затем Maria AI перевела эти высокоуровневые планы в подробные лабораторные инструкции, провела тысячи высокопроизводительных экспериментов, проанализировала первичные данные и передала структурированные результаты обратно в GPT‑5.4.
Одно из четырех выбранных предложений, OAI-M1-03, предлагало использовать мягкие окислители, такие как TEMPO, для повышения эффективности реакции Чана—Лама при синтезе сульфонамидов. Химики сочли это предложение одновременно удивительным и интересным. Подробными результатами OAI-M1-03 мы делимся в этом блоге и в научной статье(открывается в новом окне).
Затем итоговое исследовательское предложение было использовано Maria для создания матрицы экспериментов с небольшими исправлениями со стороны учёных. Самой крупной правкой человека было исключение диметилсульфоксида (ДМСО) в качестве растворителя, поскольку химики опасались, что он может реагировать с более сильными окислителями, использованными для сравнения.
Весь процесс занял три месяца: от первого промпта 4 марта до передачи результатов OAI-M1-03 независимым экспертам 4 июня.
Мы описываем этот рабочий процесс как почти автономный, а не полностью автономный, потому что химики по-прежнему принимали важные решения на всем протяжении процесса. Модель предложила ключевые исследовательские идеи, а специалисты обеспечивали высокоуровневое направление и оценку, исправляли экспериментальные детали, помогали готовить лабораторные расходные материалы и реагенты и вручную повторяли ключевые эксперименты.
В рамках плана исследований OAI-M1-03 добавка TEMPO была определена как эффективный компонент для изучаемого здесь сочетания Чана—Лама первичных сульфонамидов. В оптимизированных условиях реакция улучшилась по двум ключевым показателям: вырос средний выход продукта, а также увеличилось число комбинаций субстратов, позволяющих достичь практически значимых объемов выхода.
За два цикла Maria провела в общей сложности 10 080 реакций — больше, чем химик, выполняющий по три реакции каждый день, провел бы за десятилетие. Такой масштаб был важен, потому что химические результаты могут вводить в заблуждение, если их проверяют лишь на нескольких примерах. Реакция может выглядеть перспективной на одной паре исходных веществ, но не сработать на более широком наборе молекул. Тысячи реакций позволили выявить TEMPO среди десяти протестированных окислителей, увидеть повторяемость эффекта на разных комбинациях и определить его ограничения.
После анализа первого раунда данных система предложила более сфокусированный второй раунд экспериментов для проверки последующих гипотез. Одним полезным последующим результатом стало то, что TEMPO можно заменить гораздо более дешевым аналогом, 4-hydroxy-TEMPO, с небольшой потерей эффективности.
Полученный результат также подтвердился и за пределами микролитрового формата скрининга, использовавшегося в Maria Lab. Химики вручную повторили репрезентативные реакции в препаративном (стандартном) масштабе и зафиксировали увеличение выхода продукта для 11 из 14 пар субстратов, причем для 8 пар этот рост оказался более чем двукратным. Такое воспроизведение важно, поскольку в экспериментах очень малого масштаба иногда могут возникать артефакты, которые исчезают при увеличении масштаба. Подобная проверка воспроизводимости имеет большое значение, поскольку эксперименты в ультрамалых объемах могут приводить к возникновению артефактов, исчезающих при масштабировании.

Реакционные флаконы на этапе лабораторной валидации процесса.
Четыре внешних эксперта по химии рассмотрели препринт с описанием OAI-M1-03. Их оценки подтвердили наше мнение о том, что результат был новым и заслуживал того, чтобы поделиться им с научным сообществом. Более строгая проверка впереди: смогут ли независимые лаборатории воспроизвести результат и сочтут ли химики его полезным для более широкого диапазона молекул.
Из трех других предложений, сгенерированных моделью GPT‑5.4 и протестированных системой Maria за трехмесячный период работы, проекты OAI-M1-02 и OAI-M1-04 получили экспериментальное подтверждение в условиях Maria Lab, в то время как гипотеза OAI-M1-01 была опровергнута. Анализ этих данных продолжается в настоящее время.
Эта работа показывает, что модель может внести полезный вклад в органическую химию. Она сделала больше, чем просто обобщила литературу или предложила разовый эксперимент: она сформулировала конкретную неожиданную гипотезу и вынесла ее на рассмотрение людей, спроектировала эксперименты, интерпретировала экспериментальные данные и разработала последующие эксперименты.
Это не показывает, что AI может самостоятельно вести химическую исследовательскую программу от начала до конца. Человеческое суждение оставалось необходимым, а рабочий процесс зависел от специализированной высокопроизводительной инфраструктуры. Это также не доказывает, что метод будет распространяться и на другие реакции сочетания, другие классы субстратов или производственные условия.
Оценки выхода были получены на высокопроизводительной платформе, а лабораторная валидация охватила 14 репрезентативных пар субстратов. Необходима дополнительная работа, чтобы охарактеризовать механизм реакции, определить область применимости по субстратам, измерить эффективность в разных лабораторных условиях и независимо воспроизвести результат.
Применение ИИ в области химии требует крайне осмотрительного подхода, поскольку те же инструменты, которые призваны развивать медицину и материаловедение, могут быть использованы в деструктивных целях. Мы намеренно ограничили рамки исследования исключительно безопасной и законной задачей медицинской химии — повышением эффективности известной реакции сочетания, применяемой для создания фармакоподобных молекул. Эксперименты не были связаны с токсинами, химическим оружием или запросами на моделирование опасных соединений. Данные результаты не должны рассматриваться как свидетельство того, что система способна помогать в подобных опасных сферах применения. В рамках проекта такие сценарии не тестировались и не демонстрировались.
Мы оцениваем и снижаем возникающие риски, связанные с передовыми возможностями моделей, в рамках нашей Программы готовности, включая риски в химической и биологической областях. Модель, использованная в этой работе, уже прошла соответствующие оценки в Институте безопасности ИИ Великобритании (UK AI Security Institute), а система была спроектирована так, чтобы отклонять запросы, направленные на вредоносное применение. Экспериментальный рабочий процесс добавлял еще один уровень контроля: химики-специалисты отбирали предложения, которые допускались к лабораторной проверке, анализировали планы экспериментов и сохраняли контроль над физической инфраструктурой.
Мы считаем, что это ответственный способ изучать потенциал ИИ в экспериментальной химии: выбирать проблемную область с очевидной научной ценностью, сочетать защитные меры на уровне модели с экспертным надзором и оценивать систему через ограниченные физические эксперименты. По мере улучшения этих возможностей мы продолжим оценивать возникающие риски, усиливать защитные меры и точно указывать, что тот или иной результат означает, а что нет.
Ближайшие следующие шаги носят научный характер: протестировать более широкий диапазон исходных материалов, выяснить, почему добавки улучшают реакцию, определить, где эффект работает и где не работает, и поддержать независимое воспроизведение. В совокупности эти исследования определят, насколько широко можно применять метод и насколько он полезен в практических рабочих процессах медицинской химии.
Наша долгосрочная цель — сделать ИИ-системы надежными научными партнерами, которые помогают исследователям генерировать гипотезы, проектировать эксперименты, интерпретировать результаты и решать, что тестировать дальше, оставаясь при этом основанными на экспертном суждении, надежных измерениях и строгих защитных мерах. Ученые могут тестировать только те молекулы, которые способны получить, а лучший синтез может расширить круг идей, которые они могут исследовать в медицине, сельском хозяйстве, электронике, энергетике и материаловедении. Ученые могут испытывать только те молекулы, которые они могут синтезировать, а более совершенные методы синтеза способны расширить круг идей, которые они могут исследовать в медицине, сельском хозяйстве, электронике, энергетике и материаловедении. Этот результат — один из ранних примеров такого более широкого направления: передовая модель, специализированные агенты, автоматизированная лаборатория и химики работают вместе, чтобы быстрее проходить исследовательский цикл и получать результаты, которые научное сообщество может оценить, воспроизвести и развить.
Мы благодарны команде Molecule.one и независимым химикам, которые рецензировали эту работу.