Преминаване към основното съдържание
OpenAI

Почти автономен ИИ химик подобрява трудна реакция в медицинската химия

С Maria на Molecule.one GPT‑5.4 откри изненадваща добавка, която повишава добивите при свързване на Чан-Лам за над 80% от тестваните субстрати.

Работата на OpenAI в науката е мотивирана от проста убеденост: напредналият AI може да стане мощен партньор на учените, като им помага да изследват повече идеи, да свързват отдалечени концепции, да проектират по-добри експерименти и да ускоряват открития в полза на човечеството. Вече споделихме ранни примери за модели, допринесли за нови резултати в математиката, включително работа по проблема за единичното разстояние, в теоретичната физика чрез нов резултат за глуонните амплитуди, и в биологията, където GPT‑5 помогна да се намали цената на безклетъчния синтез на протеини в автоматизирана лаборатория. Представихме и GPT‑Rosalind, специално създаден модел в подкрепа на изследванията в науките за живота и работните процеси за откриване на лекарства. 

Този проект разширява тази траектория към медицинската химия, където напредъкът не може да се измерва само чрез структурирано анализиране. Една хипотеза трябва да работи в лабораторията с реални молекули, инструменти и експериментален шум. В сътрудничество с Molecule.one(отваря се в нов прозорец) свързахме GPT‑5.4 с Maria — изкуствен интелект за агентична химия, интегриран с лаборатория с висока производителност за автономни изследвания — и му зададохме отворена цел: да подобри един от няколко важни класа реакции. Системата генерира изследователски предложения, проектира и проведе експерименти, анализира експериментални данни и предложи последващи експерименти. Хората останаха в процеса, като проектираха насочващи и оценяващи подкани и избираха предложенията за тестване. Те също направиха ограничени корекции на експерименталните планове, помогнаха с основни лабораторни операции и независимо валидираха крайния резултат.

Най-обещаващото предложение, OAI-M1-03, се фокусира върху трудна, но полезна версия на свързването на Чан–Лам реакция, която химиците използват за образуване на въглерод-азотни връзки. Изхождайки от отворената цел да подобри свързването на Чан–Лам за процесна химия, GPT‑5.4 самостоятелно идентифицира първичните сулфонамиди като предизвикателен клас субстрати с висока стойност и предположи, че меки окислители, включително TEMPO, могат да подобрят реакцията. 

В рамките на два цикъла експерименти в Maria Lab тази идея доведе до значително подобрение. При оптимизираните условия измерените добиви се подобриха за 88% от тестваните боронови киселини и 83% от сулфонамидите. Средният добив се повиши от 16,6% на 25,2%, а делът на реакциите с добив над 30% нарасна от 15,6% на 37,5%. След това химиците повториха представителни реакции в лабораторен мащаб. Тези експерименти потвърдиха резултатите в микролитров мащаб, показвайки по-високи добиви при 11 от 14 двойки субстрати, като в повечето случаи увеличението беше повече от двукратно. Това е важно, защото медицинските химици се нуждаят от реакции, които работят не само в микролитрови скринингови експерименти, но и в практични лабораторни работни процеси, използвани при откриването на лекарства.

Подобренията в тази област на медицинската химия са особено вълнуващи, защото синтезът често е основно тясно място при откриването на лекарства: учените могат да тестват само молекулите, които могат да направят или по друг начин да получат. Сулфонамидната група присъства в лекарства от широк спектър терапевтични области, включително противоракови лекарства, антимикробни средства и диуретици, но свързването на Чан–Лам на първични сулфонамиди с боронови киселини исторически е давало ниски добиви. Повишаването на надеждността на тази форма на реакцията може да даде на медицинските химици по-широк и по-практичен начин да произвеждат и изследват потенциално полезни молекули.

Макар това все още да е ранен резултат, той предоставя още един конкретен пример за по-широката посока, към която работим: системи с ИИ, които могат да станат ценни партньори на учените в голяма част от изследователския цикъл. Моделът прегледа литературата, предложи неочаквана идея, помогна за проектирането и анализа на експерименти и стигна до научно откритие, което химиците можеха да оценят.

Maria Lab: Специализираната високопроизводителна лаборатория на Molecule.one, която проведе 10 080 реакции в OAI-M1-03

Защо химическият проблем е важен

Органичната химия е в основата на всички лекарства с малки молекули, както и на продукти в земеделието, електрониката и материалознанието. Една реакция е особено полезна, когато може надеждно да създава един и същ вид химична връзка при много различни изходни материали. Когато реакциите дават ниски добиви или твърде много нежелани странични продукти, химиците може да се наложи да изоставят иначе обещаващи молекули или да отделят значително време за разработване на друг път. Това прави синтеза основно тясно място при откриването на лекарства: учените обикновено могат да тестват само молекулите, които могат да направят или по друг начин да получат.

Свързването на Чан–Лам е полезно в медицинската химия, защото образува въглерод-азотни връзки, които са често срещани в лекарствата. Реакцията обаче не работи еднакво добре за всеки клас молекули. По-специално, свързването на първични сулфонамиди с боронови киселини исторически е давало ниски добиви. Сулфонамидите са важно семейство молекули, които се срещат в лекарства, използвани в онкологията и при инфекциозни заболявания. Повишаването на надеждността на тази реакция би могло да предостави на химиците в областта на медицинската химия по-широк и по-практичен подход за получаване и изследване на потенциално полезни молекули.

Свързване на GPT‑5.4 с Maria AI и Lab

Комбинираната система съчета допълващи се възможности. Подкани, написани от учени, работещи с Maria AI, бяха използвани с GPT‑5.4 в рамкова среда, за да се генерират и класират хиляди възможни изследователски предложения. Химици прегледаха малката подгрупа от предложения, класирани най-високо според системата, и избраха четири за лабораторно тестване. След това Maria AI преведе избраните планове на високо ниво в подробни лабораторни инструкции, проведе хиляди експерименти с висока производителност, анализира суровите данни и върна структурирани резултати на GPT‑5.4. 

Едно от четирите избрани предложения, OAI-M1-03, предложи използването на меки окислители като TEMPO за подобряване на ефективността на реакцията на Чан-Лам за синтез на сулфонамиди. Химиците намериха предложението едновременно изненадващо и интересно. Споделяме подробните констатации от OAI-M1-03 в тази публикация в блога и в статията(отваря се в нов прозорец).

След това крайното изследователско предложение беше използвано от Maria за генериране на експериментални решетки с леки корекции от хора. Най-голямата човешка корекция беше да се избегне диметилсулфоксидът, или DMSO, като разтворител, тъй като химиците се опасяваха, че той може да реагира с по-силните окислители, използвани за сравнение.

Целият процес отне три месеца, от първата подкана на 4 март до споделянето на резултатите от OAI-M1-03 с независими експерти на 4 юни.

Описваме този работен процес като почти автономен, а не напълно автономен, защото химиците все още вземаха важни решения през целия процес. Моделът предложи ключовите изследователски идеи, докато химици предоставиха насоки и преценки на високо ниво, коригираха експериментални детайли, помогнаха при подготовката на лабораторни консумативи и реактиви и повториха ключови експерименти ръчно.

Какво установихме

OAI-M1-03 идентифицира TEMPO като полезна добавка за изучаваното тук свързване на Чан-Лам на първични сулфонамиди. При оптимизираните условия реакцията се подобри по два начина: средният добив се повиши и повече комбинации от субстрати достигнаха практически полезни добиви.

В рамките на два цикъла Maria проведе общо 10 080 реакции — повече, отколкото химик, провеждащ по три реакции всеки ден, би провел за десетилетие. Този мащаб беше важен, защото химическите резултати могат да бъдат подвеждащи, когато се тестват само върху няколко примера. Една реакция може да изглежда обещаваща при една двойка изходни материали, но да се провали при по-широк набор от молекули. Хиляди реакции направиха възможно да се идентифицира TEMPO сред десет тествани окислителя, да се види как ефектът се повтаря при разнообразни комбинации и да се открият ограниченията му.


След като анализира първия кръг данни, системата предложи по-фокусиран втори кръг експерименти за тестване на последващи хипотези. Едно полезно последващо откритие беше, че TEMPO може да се замени с много по-евтин аналог, 4-хидрокси-TEMPO, с незначителна загуба на ефективност.

Диаграма, сравняваща представянето на TEMPO, 4-хидрокси-TEMPO, 4-оксо-TEMPO и PMP с химични структури.

Резултатът също така надмина формата за скрининг в микролитрови мащаби на Maria Lab. Химици възпроизведоха представителни реакции ръчно в лабораторен мащаб и наблюдаваха увеличение на добива при 11 от 14 двойки субстрати; при осем двойки увеличението беше над двукратно. Това повторение е важно, защото експериментите в много малък мащаб понякога могат да внесат артефакти, които изчезват при по-голям мащаб. Валидирането в лабораторен мащаб също е обичайна практика преди публикуване на изследване в научно списание.

Етикетирани стъклени реакционни флакони от експериментите за валидиране на Molecule.one в лабораторен мащаб.

Реакционните флакони от ръчното валидиране в лабораторен мащаб.

TEMPO подобрява образуването на продукт в лабораторен мащаб

Четирима външни експерти по химия прегледаха предпечатната публикация, описваща OAI-M1-03. Техните оценки подкрепиха нашето виждане, че резултатът е нов и си заслужава да бъде споделен с научната общност. По-сериозното изпитание предстои: дали независими лаборатории могат да възпроизведат резултата и дали химиците ще го намерят за полезен при по-широк набор от молекули.

Сливането на експериментите с висока производителност и съвременния ИИ представлява авангарден етап в научните открития. Тази нова реакция е мощна демонстрация, при която изключително меки условия и практичен окислител позволяват добре обобщим обхват на субстратите за една от най-популярните реакции в синтеза на лекарства.
— Тим Чернак, доцент по медицинска химия, Мичигански университет

От останалите три предложения, генерирани от GPT‑5.4 и тествани от Maria през тримесечния период, OAI-M1-02 и OAI-M1-04 бяха експериментално доказани в лаборатория Maria Lab, докато OAI-M1-01 беше опровергано. Анализът на тези резултати продължава.

Ограничения

Тази работа показва, че модел може да направи полезен принос в органичната химия. То направи повече от това да обобщи литературата или да предложи еднократен експеримент: предложи конкретна, изненадваща хипотеза и я представи за преглед от човек, разработи експерименти, интерпретира експериментални данни и разработи последващи експерименти.

Това не показва, че ИИ може самостоятелно да управлява програма за химически изследвания от край до край. Човешката преценка остана съществена, а работният процес зависеше от специализирана инфраструктура с висока производителност. Това също не установява, че методът ще се обобщи към други реакции на свързване, други класове субстрати или производствени условия.

Оценките на добива дойдоха от платформа с висока производителност, а лабораторното валидиране обхвана 14 представителни двойки субстрати. Необходима е допълнителна работа, за да се охарактеризира механизмът на реакцията, да се определи обхватът на субстратите, да се измери ефективността при различни лабораторни условия и резултатът да бъде възпроизведен независимо.

Готовност

Възможностите в областта на химията изискват внимателно третиране, защото същите инструменти, които могат да подкрепят медицината и материалознанието, могат също да бъдат използвани неправомерно. Умишлено ограничихме обхвата на тази работа до легитимен проблем в медицинската химия: подобряване на известна реакция на свързване, използвана за създаване на лекарствено-подобни молекули. Експериментите не включваха токсини, химически оръжия или заявки за проектиране на вредни съединения. Тези резултати не бива да се тълкуват като доказателство, че системата може да помага при такива вредни приложения. Проектът не тества и не демонстрира това.

Оценяваме и смекчаваме възникващите рискове от усъвършенстваните възможности на моделите чрез нашата Рамка за готовност, включително рискове, свързани с химични и биологични области. Моделът, използван в тази работа, вече беше преминал съответни оценки от Института за сигурност на изкуствения интелект в Обединеното кралство ((UK AI Security Institute) и системата беше проектирана да отказва заявки, фокусирани върху вредни приложения. Експерименталният работен процес добави още едно ниво на контрол: химици избираха кои предложения да влязат в лабораторията, преглеждаха експерименталните планове и запазваха контрол върху физическата инфраструктура.

Смятаме, че това е отговорният начин за изучаване на потенциала на ИИ в експерименталната химия: изберете проблемно пространство с ясна научна стойност, съчетайте предпазни мерки на ниво модел с експертен надзор и оценете системата чрез ограничени физически експерименти. С подобряването на тези възможности ще продължим да оценяваме възникващите рискове, да укрепваме предпазните мерки и да бъдем конкретни какво даден резултат предполага и какво не предполага.

Какво следва

Непосредствените следващи стъпки са научни: тестване на по-широк набор от изходни материали, изследване на причините, поради които добавките подобряват реакцията, съпоставяне на това къде ефектът работи и къде не работи, и подкрепа на независимата репликация. Заедно тези изследвания ще определят колко широко може да се прилага методът и колко полезен е той в практичните работни процеси на медицинската химия.

Нашата по-дългосрочна цел е да направим ИИ системите надеждни научни партньори, които помагат на изследователите да генерират хипотези, да проектират експерименти, да интерпретират резултати и да решават какво да тестват след това, като остават основани на експертна преценка, надеждно измерване и силни предпазни мерки. Органичната химия е област с особено висок лостов ефект, защото напредъкът в откриването и производството на малки молекули зависи от способността надеждно да се създават молекули. Учените могат да тестват само молекули, които могат да направят, а по-добрият синтез може да разшири обхвата на идеите, които могат да изследват в медицината, земеделието, електрониката, енергетиката и материалознанието. Този резултат е един ранен пример за тази по-широка посока: авангарден модел, специализирани агенти, автоматизирана лаборатория и химиците работят заедно, за да се движат по-бързо през изследователския цикъл и да създават открития, които научната общност може да оцени, възпроизведе и надгради.авангарден

Благодарни сме на екипа на Molecule.one и на независимите химици, които прегледаха тази работа.

Автор

OpenAI

Автори