Пређите на главни садржај
OpenAI

Скоро аутономни AI хемичар побољшава изазовну реакцију у медицинској хемији

Уз модел Maria предузећа Molecule.one, модел GPT‑5.4 је пронашао изненађујући адитив који повећава приносе Чан–Ламовог спајања за преко 80% тестираних супстрата.

Рад привредног друштва OpenAI у науци покреће једноставно уверење: напредни AI може постати моћан партнер научницима, помажући им да истраже више идеја, повежу удаљене концепте, осмисле боље експерименте и убрзају открића која користе човечанству. Већ смо поделили ране примере модела који доприносе новим резултатима у математици, укључујући рад на проблему јединичног растојања, у теоријској физици, кроз нови резултат о глуонским амплитудама, и у биологији, где је GPT‑5 помогао да се смањи цена безћелијске синтезе протеина у аутоматизованој лабораторији. Такође смо представили GPT‑Rosalind, наменски модел за подршку истраживањима у природним наукама и радним токовима откривања лекова. 

Овај пројекат проширује ту путању на медицинску хемију, где се напредак не може мерити само резоновањем. Хипотеза мора да функционише у лабораторији са стварним молекулима, инструментима и експерименталним шумом. Радећи са предузећем Molecule.one(отвара се у новом прозору), повезали смо модел GPT‑5.4 са моделом Maria – агентским хемијским AI системом интегрисаним са високопропусном лабораторијом за аутономно истраживање – и дали му отворени циљ: да побољша једну од неколико важних класа реакција. Систем је генерисао истраживачке предлоге, дизајнирао и изводио експерименте, анализирао експерименталне податке и предлагао накнадне експерименте. Људи су остали укључени тако што су осмишљавали инструкције за усмеравање и оцењивање и бирали предлоге за тестирање. Такође су уносили ограничене исправке у експерименталне планове, помагали у основним лабораторијским операцијама и независно потврдили коначни резултат.

Најперспективнији предлог, OAI-M1-03, усредсредио се на тешку али корисну верзију Чан–Ламовог спајања, реакције коју хемичари користе за формирање веза угљеник-азот. Полазећи од отвореног циља побољшања Чан–Ламовог спајања за процесну хемију, GPT‑5.4 је самостално идентификовао примарне сулфонамиде као изазовну и вредну класу супстрата и предложио да благи оксиданси, укључујући TEMPO, могу побољшати реакцију. 

Током два циклуса експериментисања у организацији Maria Lab, та идеја је донела значајно побољшање. Под оптимизованим условима, измерени приноси су се побољшали за 88% тестираних боронских киселина и 83% тестираних сулфонамида. Средњи принос је порастао са 16,6% на 25,2%, а удео реакција са приносом изнад 30% повећао се са 15,6% на 37,5%. Затим су хемичари поновили репрезентативне реакције на ваги на испитном столу. Ти експерименти су потврдили резултате на микролитарској скали, показујући веће приносе за 11 од 14 парова супстрата, у већини случајева са повећањем већим од двоструког. То је важно јер су медицинским хемичарима потребне реакције које функционишу не само у микролитарским скрининг експериментима, већ и у практичним лабораторијским токовима рада који се користе током откривања лекова.

Побољшања у овој области медицинске хемије посебно су узбудљива јер је синтеза често главно уско грло у откривању лекова: научници могу да тестирају само молекуле које могу да направе или на други начин прибаве. Сулфонамидна група се јавља у лековима у широком спектру терапијских области, укључујући лекове против рака, антимикробике и диуретике, али је Чан–Ламово спајање примарних сулфонамида са боронским киселинама историјски давало ниске приносе. Учинити овај облик реакције поузданијим могло би медицинским хемичарима да пружи шири и практичнији начин да производе и истражују потенцијално корисне молекуле.

Иако је ово још рани резултат, он даје још један конкретан пример ширег правца ка којем радимо: AI системе који могу постати вредни партнери научницима у великом делу истраживачког циклуса. Модел је прегледао литературу, предложио неочекивану идеју, помогао у дизајнирању и анализи експеримената и дошао до научног налаза који су хемичари могли да процене.

Maria Lab: предузећа Molecule.one специјализована лабораторија високе пропусне моћи која је извела 10.080 реакција у оквиру OAI-M1-03

Зашто је хемијски проблем важан

Органска хемија је основа свих лекова малих молекула, као и производа у пољопривреди, електроници и науци о материјалима. Реакција је нарочито корисна када може поуздано да направи исту врсту хемијске везе у многим различитим полазним материјалима. Када реакције дају ниске приносе или превише нежељених нуспроизвода, хемичари могу морати да одустану од иначе обећавајућих молекула или да потроше значајно време на развој друге руте. Због тога је синтеза главно уско грло у откривању лекова: научници углавном могу да тестирају само молекуле које могу да направе или на други начин прибаве.

Чан–Ламово спајање је корисно у медицинској хемији јер формира везе угљеник-азот, које су честе у лековима. Међутим, реакција не функционише једнако добро за сваку класу молекула. Посебно је спајање примарних сулфонамида са боронским киселинама историјски давало ниске приносе. Сулфонамиди су важна породица молекула који се налазе у лековима који се користе у онкологији и код инфективних болести. Учинити ову реакцију поузданијом могло би медицинским хемичарима да пружи шири и практичнији начин да производе и истражују потенцијално корисне молекуле.

Повезивање модела GPT‑5.4 са моделом Maria AI и Lab

Комбиновани систем је упарио комплементарне способности. Инструкције које су написали научници који раде са моделом Maria AI коришћене су са моделом GPT‑5.4 у оквиру система за генерисање и рангирање хиљада могућих истраживачких предлога. Хемичари су прегледали мали подскуп предлога који су по систему били најбоље рангирани и одабрали четири за лабораторијско тестирање. Maria AI је затим превео одабране планове високог нивоа у детаљна лабораторијска упутства, извео хиљаде високопропусних експеримената, анализирао сирове податке и вратио структуриране резултате моделу GPT‑5.4. 

Један од четири одабрана предлога, OAI-M1-03, предложио је употребу благих оксиданаса као што је TEMPO за побољшање учинка Чан–Ламове реакције у синтези сулфонамида. Хемичарима је предлог био и изненађујућ и занимљив. Детаљне налазе из OAI-M1-03 делимо у овој објави на блогу и у раду(отвара се у новом прозору).

Затим је коначни истраживачки предлог модел Maria искористио за генерисање експерименталних мрежа, уз мање исправака људи. Највећа људска исправка била је да се избегне диметил-сулфоксид, односно DMSO, као растварач, јер су хемичари били забринути да би могао да реагује са јачим оксидансима коришћеним за поређење.

Цео процес је трајао три месеца, од прве инструкције 4. марта до дељења резултата OAI-M1-03 са независним стручњацима 4. јуна.

Овај ток рада описујемо као скоро аутономан, а не потпуно аутономан, јер су хемичари и даље доносили важне одлуке током целог процеса. Модел је предложио кључне истраживачке идеје, док су хемичари пружали усмеравање и процену на високом нивоу, исправљали експерименталне детаље, помагали у припреми лабораторијског потрошног материјала и реагенаса и ручно понављали кључне експерименте.

Шта смо открили

OAI-M1-03 је идентификовао TEMPO као користан адитив за овде проучавано Чан–Ламово спајање примарних сулфонамида. Под оптимизованим условима, реакција се побољшала на два начина: просечан принос је порастао, а више комбинација супстрата достигло је практично корисне приносе.

Током два циклуса, модел Maria је извео укупно 10.080 реакција – више него што би хемичар који сваког дана изводи три реакције урадио за деценију. Тај обим је био важан јер резултати у хемији могу бити обмањујући када се тестирају на само неколико примера. Реакција може изгледати обећавајуће на једном пару полазних материјала, али не успети на ширем скупу молекула. Хиљаде реакција омогућиле су да се TEMPO идентификује међу десет тестираних оксиданаса, да се види како се ефекат понавља у разноврсним комбинацијама и да се пронађу његова ограничења.


Након анализе прве рунде података, систем је предложио усмеренију другу рунду експеримената за тестирање накнадних хипотеза. Један користан накнадни налаз био је да се TEMPO може заменити много јефтинијим аналогом, 4-хидрокси-TEMPO, уз мали губитак учинка.

Графикон који пореди учинак TEMPO, 4-хидрокси-TEMPO, 4-оксо-TEMPO и PMP са хемијским структурама.

Резултат се одржао и изван микролитарског скрининг формата организације Maria Lab. Хемичари су ручно репродуковали репрезентативне реакције на ваги на испитном столу и уочили повећање приноса за 11 од 14 парова супстрата; за осам парова повећање је било веће од двоструког. Та репликација је важна јер експерименти у веома малом обиму понекад могу увести артефакте који нестају у већем обиму. Валидација у bench-scale обиму такође је уобичајена пре објављивања истраживања у научном часопису.

Означене стаклене реакционе бочице у обиму испитног стола валидационих експеримената предузећа Molecule.one.

Реакционе бочице из ручне валидације на ваги на испитном столу.

TEMPO побољшава формирање производа на ваги на испитном столу

Четири спољна стручњака за хемију прегледала су претпринт који описује OAI-M1-03. Њихове процене су подржале наш став да је резултат нов и вредан дељења са научном заједницом. Следи јачи тест: да ли независне лабораторије могу да репродукују резултат и да ли ће га хемичари сматрати корисним у ширем распону молекула.

Спајање високопропусног експериментисања и модерног AI-ја представља нову границу научног открића. Ова нова реакција је снажна демонстрација у којој изузетно благи услови и практичан оксиданс омогућавају лепо уопштен опсег супстрата за једну од популарнијих реакција у синтези лекова.
–Тим Сернак, ванредни професор медицинске хемије, Универзитет у Мичигену

Од остала три предлога која је GPT‑5.4 генерисао и модел Maria тестирао током тромесечног периода, OAI-M1-02 и OAI-M1-04 су експериментално доказани у организацији Maria Lab, док је OAI-M1-01 оповргнут. Анализа ових резултата је у току.

Ограничења

Овај рад показује да модел може да пружи користан допринос у органској хемији. Урадио је више од сажимања литературе или предлагања једнократног експеримента: предложио је конкретну, изненађујућу хипотезу и изнео је на људску процену, дизајнирао експерименте, протумачио експерименталне податке и дизајнирао накнадне експерименте.

То не показује да AI може самостално да води програм хемијског истраживања од почетка до краја. Људска процена је остала неопходна, а ток рада је зависио од специјализоване високопропусне инфраструктуре. Такође не утврђује да ће се метода генерализовати на друге реакције спајања, друге класе супстрата или производне услове.

Процене приноса потекле су са високопропусне платформе, а валидација испитног стола обухватила је 14 репрезентативних парова супстрата. Потребно је више рада да се окарактерише механизам реакције, дефинише опсег супстрата, измери учинак у различитим лабораторијским условима и независно репродукује резултат.

Спремност

Хемијске способности захтевају пажљив третман јер се исти алати који могу подржати медицину и науку о материјалима могу и злоупотребити. Овај рад смо намерно ограничили на легитиман проблем медицинске хемије: побољшање познате реакције спајања која се користи за прављење молекула налик лековима. Експерименти нису укључивали токсине, хемијско оружје нити захтеве за дизајнирање штетних једињења. Ове резултате не треба читати као доказ да систем може помоћи у тим штетним применама. Пројекат то није тестирао нити показао.

Процењујемо и ублажавамо новонастале ризике који произлазе из напредних могућности модела кроз свој Оквир спремности, укључујући ризике повезане са хемијским и биолошким областима. Модел коришћен у овом раду већ је прошао релевантне евалуације са Институтом Уједињеног Краљевства за безбедност вештачке интелигенције, а систем је осмишљен тако да одбија захтеве усмерене на штетне примене. Експериментални ток рада додао је још један ниво контроле: хемичари су бирали који предлози ће ући у лабораторију, прегледали експерименталне планове и задржали контролу над физичком инфраструктуром.

Сматрамо да је то одговоран начин да се проучава потенцијал AI-ја у експерименталној хемији: одабрати простор проблема са јасном научном вредношћу, упарити заштитне мере на нивоу модела са стручним надзором и проценити систем кроз ограничене физичке експерименте. Како се ове способности побољшавају, наставићемо да процењујемо новонастале ризике, јачамо заштитне мере и будемо конкретни у погледу тога шта резултат подразумева, а шта не.

Шта следи

Непосредни наредни кораци су научни: тестирати шири распон полазних материјала, истражити зашто адитиви побољшавају реакцију, мапирати где ефекат функционише а где не, и подржати независну репликацију. Заједно, ове студије ће утврдити колико широко се метода може применити и колико је корисна у практичним токовима рада медицинске хемије.

Наш дугорочнији циљ је да AI системе учинимо поузданим научним партнерима који помажу истраживачима да генеришу хипотезе, осмишљавају експерименте, тумаче резултате и одлучују шта следеће тестирати, остајући притом утемељени у стручној процени, поузданом мерењу и снажним заштитним мерама. Органска хемија је област са посебно великим утицајем јер напредак у откривању и производњи малих молекула зависи од способности да се молекули поуздано направе. Научници могу да тестирају само молекуле које могу да направе, а боља синтеза може проширити распон идеја које могу да истражују у медицини, пољопривреди, електроници, енергији и науци о материјалима. Овај резултат је један рани пример тог ширег правца: гранични модел, специјализовани агенти, аутоматизована лабораторија и хемичари који заједно раде да би се брже кретали кроз истраживачки циклус и произвели налазе које научна заједница може да процени, репродукује и надогради.

Захвални смо тиму предузећа Molecule.one и независним хемичарима који су прегледали овај рад.

Аутор

OpenAI

Autori