Майже автономний ШІ-хімік оптимізував складну реакцію в медичній хімії
З Maria від Molecule.one GPT‑5.4 виявив несподівану добавку, яка підвищує вихід реакції сполучення Чена-Лема для понад 80% протестованих субстратів.
Робота OpenAI у сфері науки ґрунтується на простому переконанні: передовий ШІ може стати потужним партнером для науковців, допомагаючи їм досліджувати більше ідей, поєднувати віддалені поняття, проєктувати кращі експерименти та прискорювати відкриття на благо людства. Ми вже ділилися ранніми прикладами того, як моделі сприяли новим результатам у математиці, зокрема роботі над задачею про одиничну відстань, у теоретичній фізиці — через новий результат щодо глюонних амплітуд, а також у біології, де GPT‑5 допоміг знизити вартість безклітинного синтезу білків в автоматизованій лабораторії. Ми також представили GPT‑Rosalind, спеціально створену модель для підтримки досліджень у науках про життя та робочих процесів відкриття ліків.
Поточний проєкт продовжує цю траєкторію в медичній хімії, де прогрес не можна вимірювати лише міркуванням. Гіпотеза має працювати у лабораторії з реальними молекулами, приладами та експериментальним шумом. Працюючи з Molecule.one(відкривається у новому вікні), ми під’єднали GPT‑5.4 до Maria — агентного ШІ-хіміка, інтегрованого з високопродуктивною лабораторією для автономних досліджень, — і поставили перед ним відкриту мету: поліпшити один із кількох важливих класів реакцій. Система генерувала дослідницькі пропозиції, проєктувала й проводила експерименти, аналізувала експериментальні дані та пропонувала подальші експерименти. Люди залишалися залученими до процесу, розробляючи спрямовувальні й оцінювальні запити та обираючи пропозиції для тестування. Вони також вносили обмежені корективи до експериментальних планів, допомагали з базовими лабораторними операціями та незалежно підтверджували фінальний результат.
Найперспективніша пропозиція, OAI-M1-03, була зосереджена на складному, але корисному варіанті сполучення Чена-Лема — реакції, яку хіміки використовують для утворення вуглець-азотних зв’язків. Виходячи з відкритої мети поліпшити сполучення Чена-Лема для хімії процесів, GPT‑5.4 самостійно визначив первинні сульфонаміди як складний і цінний клас субстратів і припустив, що м’які окисники, зокрема TEMPO, можуть поліпшити реакцію.
Упродовж двох циклів експериментів у Maria Lab ця ідея дала суттєве поліпшення. За оптимізованих умов виміряний вихід зріс для 88% протестованих боронових кислот і 83% сульфонамідів. Середній вихід зріс із 16,6% до 25,2%, а частка реакцій із виходом понад 30% збільшилася з 15,6% до 37,5%. Потім хіміки-люди повторили репрезентативні реакції в лабораторному масштабі. Ці експерименти підтвердили результати мікролітрового масштабу, показавши вищий вихід для 11 із 14 пар субстратів, у більшості випадків — із більш ніж дворазовим зростанням. Це важливо, бо медичним хімікам потрібні реакції, що працюють не лише в мікролітрових скринінгових експериментах, а й у практичних лабораторних робочих процесах, які використовують під час відкриття ліків.
Поліпшення в цій галузі медичної хімії особливо захопливі, адже синтез часто є головним вузьким місцем у відкритті ліків: науковці можуть тестувати лише ті молекули, які здатні виготовити або інакше отримати. Сульфонамідна група трапляється в ліках у широкому спектрі терапевтичних напрямів, зокрема в протипухлинних препаратах, антимікробних засобах і діуретиках, але сполучення Чена-Лема первинних сульфонамідів із бороновими кислотами історично давало низький вихід. Якщо зробити цю форму реакції надійнішою, медичні хіміки отримають ширший і практичніший спосіб створювати й досліджувати потенційно корисні молекули.
Хоча це все ще ранній результат, він дає ще один конкретний приклад ширшого напряму, до якого ми рухаємося: ШІ-системи, що можуть стати цінними партнерами для науковців на більшій частині дослідницького циклу. Модель проаналізувала літературу, запропонувала несподівану ідею, допомогла спроєктувати й проаналізувати експерименти та дійшла наукового висновку, який хіміки-люди змогли оцінити.
Maria Lab: спеціалізована лабораторія від Molecule.one із високою пропускною здатністю, яка провела 10 080 реакцій у межах OAI-M1-03
Органічна хімія лежить в основі створення всіх маломолекулярних ліків, а також продуктів у сільському господарстві, електроніці та матеріалознавстві. Реакція особливо корисна, коли вона може надійно утворювати один і той самий тип хімічного зв’язку для багатьох різних вихідних матеріалів. Коли реакції дають низький вихід або забагато небажаних побічних продуктів, хімікам може доводитися відмовлятися від перспективних молекул або витрачати значний час на розробку іншого маршруту. Це робить синтез головним вузьким місцем у відкритті ліків: зазвичай науковці можуть тестувати лише ті молекули, які здатні виготовити або інакше отримати.
Сполучення Чена-Лема корисне в медичній хімії, бо утворює вуглець-азотні зв’язки, поширені в ліках. Однак реакція не працює однаково добре для кожного класу молекул. Зокрема, сполучення первинних сульфонамідів із бороновими кислотами історично давало низький вихід. Сульфонаміди — важлива родина молекул, що містяться в ліках, які використовують в онкології та лікуванні інфекційних захворювань. Якщо зробити цю реакцію надійнішою, медичні хіміки отримають ширший і практичніший спосіб створювати й досліджувати потенційно корисні молекули.
Об’єднана система поєднала взаємодоповнювальні можливості. Запити, написані науковцями, які працювали з Maria AI, використовувалися з GPT‑5.4 у спеціальному середовищі для генерування та ранжування тисяч можливих дослідницьких пропозицій. Хіміки-люди переглянули невелику частину пропозицій, які система оцінила найвище, і обрали чотири для лабораторного тестування. Потім Maria AI перетворила вибрані високорівневі плани на детальні лабораторні інструкції, провела тисячі високопродуктивних експериментів, проаналізувала сирі дані й повернула структуровані результати до GPT‑5.4.
Одна з чотирьох відібраних пропозицій, OAI-M1-03, запропонувала використовувати м’які окисники, такі як TEMPO, для покращення ефективності реакції Чена-Лема в синтезі сульфонамідів. Хіміки визнали цю пропозицію водночас несподіваною й цікавою. Ми ділимося детальними результатами OAI-M1-03 у цьому дописі блогу та в статті(відкривається у новому вікні).
Потім фінальну дослідницьку пропозицію Maria використала для створення експериментальних сіток із невеликими корекціями від людей. Найбільшою людською корекцією було уникнення диметилсульфоксиду (ДМСО) як розчинника, бо хіміки побоювалися, що він може реагувати із сильнішими окисниками, використаними для порівняння.
Увесь процес тривав три місяці: від першого запиту 4 березня до передання результатів OAI-M1-03 незалежним експертам 4 червня.
Ми описуємо цей робочий процес як майже автономний, а не повністю автономний, бо хіміки-люди все ще ухвалювали важливі рішення протягом усього процесу. Модель запропонувала ключові дослідницькі ідеї, тоді як хіміки-люди забезпечували високорівневе спрямування й оцінку, виправляли експериментальні деталі, допомагали готувати лабораторні витратні матеріали й реагенти та вручну повторювали ключові експерименти.
OAI-M1-03 визначив TEMPO як корисну добавку для досліджуваного тут сполучення Чена-Лема первинних сульфонамідів. За оптимізованих умов реакція поліпшилася у двох аспектах: середній вихід зріс, і більше комбінацій субстратів досягли практично корисного виходу.
За два цикли Maria провела загалом 10 080 реакцій — більше, ніж хімік, який щодня проводить по три реакції, виконав би за десятиліття. Такий масштаб був важливим, бо результати в хімії можуть вводити в оману, якщо їх перевіряють лише на кількох прикладах. Реакція може виглядати перспективною на одній парі вихідних матеріалів, але не спрацювати на ширшому наборі молекул. Тисячі реакцій дали змогу виявити TEMPO серед десяти протестованих окисників, побачити повторюваність ефекту в різноманітних комбінаціях і визначити його обмеження.
Після аналізу першого раунду даних система запропонувала більш сфокусований другий раунд експериментів для перевірки подальших гіпотез. Одним із корисних подальших висновків було те, що TEMPO можна замінити значно дешевшим аналогом, 4-гідрокси-TEMPO, із незначною втратою ефективності.
Результат також зберігся за межами мікролітрового формату скринінгу Maria Lab. Хіміки-люди вручну відтворили репрезентативні реакції в лабораторному масштабі й спостерігали збільшення виходу для 11 із 14 пар субстратів; для восьми пар зростання перевищило дворазове. Таке відтворення важливе, бо експерименти в дуже малому масштабі іноді можуть створювати артефакти, які зникають у більшому масштабі. Валідація в лабораторному масштабі також є звичною практикою перед публікацією дослідження в науковому журналі.

Флакони для реакцій ручної валідації в лабораторному масштабі.
Чотири зовнішні експерти з хімії розглянули препринт, що описує OAI-M1-03. Їхні оцінки підтвердили нашу про те думку, що результат є новим і вартим поширення в науковій спільноті. Попереду чекає більш ретельна перевірка: чи зможуть незалежні лабораторії відтворити результат і чи визнають хіміки його корисним для ширшого спектра молекул.
Із трьох інших пропозицій, згенерованих GPT‑5.4 і протестованих Maria протягом тримісячного періоду, OAI-M1-02 та OAI-M1-04 були експериментально підтверджені в Maria Lab, тоді як OAI-M1-01 було спростовано. Аналіз цих результатів триває.
Ця робота показує, що модель може зробити корисний внесок в органічну хімію. Вона не просто узагальнила літературу чи запропонувала одноразовий експеримент: вона висунула конкретну несподівану гіпотезу й винесла її на розгляд людей, спроєктувала експерименти, інтерпретувала експериментальні дані та спроєктувала подальші експерименти.
Це не доводить, що ШІ може самостійно вести програму хімічних досліджень від початку до кінця. Людське судження залишалося необхідним, а робочий процес залежав від спеціалізованої високопродуктивної інфраструктури. Це також не встановлює, що метод узагальнюється на інші реакції сполучення, інші класи субстратів або виробничі умови.
Оцінки виходу отримано з високопродуктивної платформи, а лабораторна валідація охопила 14 репрезентативних пар субстратів. Потрібна подальша робота, щоб охарактеризувати механізм реакції, визначити діапазон субстратів, виміряти ефективність за різних лабораторних умов і незалежно відтворити результат.
Хімічні можливості потребують обережного підходу, бо ті самі інструменти, що можуть підтримувати медицину й матеріалознавство, також можуть бути використані неналежним чином. Ми свідомо обмежили цю роботу законною проблемою медичної хімії: поліпшенням відомої реакції сполучення, яку використовують для створення молекул, подібних до лікарських. Експерименти не стосувалися токсинів, хімічної зброї чи запитів на розробку шкідливих сполук. Ці результати не слід сприймати як доказ того, що система може допомагати з такими шкідливими застосуваннями. Проєкт цього не тестував і не демонстрував.
Ми оцінюємо й пом’якшуємо нові ризики, що виникають із передових можливостей моделей, через нашу рамкову систему готовності, зокрема ризики, пов’язані з хімічною та біологічною сферами. Модель, використана в цій роботі, уже пройшла відповідні оцінювання в UK AI Security Institute, а систему було спроєктовано так, щоб вона відхиляла запити, зосереджені на шкідливих застосуваннях. Експериментальний робочий процес додав ще один рівень контролю: хіміки-люди обирали, які пропозиції потрапляють до лабораторії, переглядали експериментальні плани та зберігали контроль над фізичною інфраструктурою.
Ми вважаємо, що це відповідальний спосіб вивчати потенціал ШІ в експериментальній хімії: обирати простір задач із чіткою науковою цінністю, поєднувати запобіжники на рівні моделі з експертним наглядом і оцінювати систему через обмежені фізичні експерименти. У міру вдосконалення цих можливостей ми й надалі оцінюватимемо нові ризики, посилюватимемо запобіжники та чітко пояснюватимемо, що певний результат означає, а що ні.
Найближчі наступні кроки є науковими: протестувати ширший спектр вихідних матеріалів, дослідити, чому добавки поліпшують реакцію, окреслити, де ефект працює і де ні, та підтримати незалежне відтворення. Разом ці дослідження визначать, наскільки широко можна застосовувати метод і наскільки він корисний у практичних робочих процесах медичної хімії.
Наша довгострокова мета — зробити ШІ-системи надійними науковими партнерами, які допомагають дослідникам генерувати гіпотези, проєктувати експерименти, інтерпретувати результати й вирішувати, що тестувати далі, продовжуючи спиратися на експертне судження, надійні вимірювання та сильні запобіжники. Органічна хімія є сферою з особливо високим потенціалом впливу, бо прогрес у відкритті та виробництві малих молекул залежить від здатності надійно створювати молекули. Науковці можуть тестувати лише молекули, які здатні створити, а кращий синтез може розширити коло ідей, які вони можуть досліджувати в медицині, сільському господарстві, електроніці, енергетиці та матеріалознавстві. Цей результат є одним із ранніх прикладів цього ширшого напряму: передова модель, спеціалізовані агенти, автоматизована лабораторія та хіміки-люди працюють разом, щоб швидше проходити дослідницький цикл і отримувати результати, які наукова спільнота може оцінити, відтворити й розвинути.
Ми вдячні команді Molecule.one та незалежним хімікам, які рецензували цю роботу.