یک شیمیدان هوش مصنوعی تقریباً خود مختار، یک واکنش چالشبرانگیز را در شیمی دارویی بهبود میبخشد
با Molecule.oneِ ماریا، GPT‑5.4 یک افزودنی شگفت انگیز پیدا کرده است که بازده کوپلینگ Chan-Lam را برای بیش از ۸۰٪ از سوبستراهای آزمایششده افزایش میدهد.
فعالیتهای OpenAI در حوزهٔ علم از یک باور ساده انگیزه میگیرد: هوش مصنوعی پیشرفته میتواند به شریکی قدرتمند برای دانشمندان تبدیل شود و به آنها کمک کند ایدههای بیشتری را بررسی کنند، مفاهیم دور از هم را به یکدیگر پیوند دهند، آزمایشهای بهتری طراحی کنند و به کشفیاتی که به سود بشریت هستند شتاب ببخشند. ما پیشتر نمونههای اولیهای از مشارکت مدلها در دستیابی به نتایج نوین در ریاضیات، از جمله کار روی مسئله فاصله واحد، در فیزیک نظری، از طریق نتیجهای جدید درباره آمپلیتودهای گلوئون، و در زیستشناسی، که در آن GPT‑5 به کاهش هزینه تولید پروتئین بدون سلول در یک آزمایشگاه خودکار کمک کرد، به اشتراک گذاشتهایم. ما همچنین GPT‑Rosalind را معرفی کردیم، یک مدل هدفمحور برای پشتیبانی از پژوهشهای علوم زیستی و جریانهای کاری کشف دارو.
این پروژه آن مسیر را به حوزهٔ شیمی دارویی گسترش میدهد، جایی که پیشرفت را نمیتوان صرفاً با استدلال سنجید. یک فرضیه باید در آزمایشگاه با مولکولهای واقعی، ابزارهای اندازهگیری و نویز تجربی کار کند. با همکاری Molecule.one(در یک پنجره جدید باز میشود)، ما GPT‑5.4 را به Maria—یک هوش مصنوعی عاملیِ شیمی که با آزمایشگاهی با توان عملیاتی بالا برای پژوهش خودمختار یکپارچه شده است—متصل کردیم و به آن هدفی باز دادیم: بهبود یکی از چند دسته مهم از واکنشها. سیستم پیشنهادهای پژوهشی تولید کرد، آزمایشهایی را طراحی و اجراء کرد، دادههای آزمایشی را تحلیل کرد و آزمایشهای پیگیری را پیشنهاد داد. انسانها با طراحی اعلانها هدایت و ارزیابی و انتخاب پیشنهادها برای آزمایش، همچنان در چرخه حضور داشتند. آنها همچنین اصلاحات محدودی در طرحهای آزمایشی انجام دادند، در عملیات پایه آزمایشگاهی کمک کردند و نتیجه نهایی را به طور مستقل اعتبارسنجی کردند.
امید بخشترین پیشنهاد، OAI-M1-03، بر نسخهای دشوار اما مفید از جفتشدن چان–لام تمرکز داشت؛ واکنشی که شیمیدانان از آن برای تشکیل پیوندهای کربن–نیتروژن استفاده میکنند. با شروع از هدفی باز برای بهبود جفتشدن چان–لام در شیمی فرآیند، GPT‑5.4 بهطور مستقل سولفونامیدهای اولیه را بهعنوان دستهای چالشبرانگیز و باارزش از سوبستراها شناسایی کرد و پیشنهاد داد که اکسندههای ملایم، از جمله TEMPO، میتوانند واکنش را بهبود دهند.
در طول دو چرخه آزمایش در آزمایشگاه ماریا، آن ایده بهبود چشمگیری ایجاد کرد. تحت شرایط بهینهسازیشده، بازدههای اندازهگیریشده برای ۸۸٪ از اسیدهای بورونیک و ۸۳٪ از سولفونامیدهای مورد آزمایش بهبود یافت. بازده میانگین از ۱۶٫۶٪ به ۲۵٫۲٪ افزایش یافت، و سهم واکنشهایی با بازده بالاتر از ۳۰٪ از ۱۵٫۶٪ به ۳۷٫۵٪ رسید. سپس شیمیدانها واکنشهای نمونه را در مقیاس آزمایشگاهی تکرار کردند. آن آزمایشها نتایج در مقیاس میکرولیتر را تأیید کردند و نشان دادند که بازده برای ۱۱ مورد از ۱۴ جفت سوبسترا بالاتر بوده است، بهطوریکه در بیشتر موارد افزایشی بیش از دو برابر مشاهده شد. این موضوع اهمیت دارد، زیرا شیمیدانان دارویی به واکنشهایی نیاز دارند که نه تنها در آزمایشهای غربالگری در مقیاس میکرولیتر کار کنند، بلکه در گردشکارهای عملی آزمایشگاهی مورد استفاده در فرآیند کشف دارو نیز قابل استفاده باشند.
پیشرفتها در این حوزه از شیمی دارویی بهویژه هیجانانگیز هستند، زیرا سنتز اغلب یکی از گلوگاههای اصلی در کشف دارو است: دانشمندان فقط میتوانند مولکولهایی را آزمایش کنند که میتوانند بسازند یا بهنحوی دیگر به دست آورند. گروه سولفونامید در داروهایی در طیف گستردهای از حوزههای درمانی، از جمله داروهای ضدسرطان، داروهای ضد میکروبی و مدرها، دیده میشود؛ با این حال، کوپلینگ چان–لامِ سولفونامیدهای اولیه با اسیدهای بورونیک از نظر تاریخی بازدههای پایینی داشته است. قابلاعتمادتر کردن این نوع از واکنش میتواند به شیمیدانان دارویی روشی گستردهتر و عملیتر برای تولید و بررسی مولکولهای بالقوه مفید بدهد.
هرچند این هنوز نتیجهای اولیه است، نمونهای ملموس دیگر از مسیر کلیتری را ارائه میدهد که در راستای آن تلاش میکنیم: سامانههای هوش مصنوعی که بتوانند در بخش بزرگی از چرخه پژوهش به شرکای ارزشمندی برای دانشمندان تبدیل شوند. مدل ادبیات پژوهشی را مرور کرد، ایدهای غیرمنتظره پیشنهاد داد، به طراحی و تحلیل آزمایشها کمک کرد و به یافتهای علمی رسید که شیمیدانان انسانی میتوانستند آن را ارزیابی کنند.
آزمایشگاه ماریا: متعلق به Molecule.one آزمایشگاه تخصصی با توان عملیاتی بالا که ۱۰۰۸۰ واکنش را در OAI-M1-03 انجام داد
شیمی آلی زیر بنای همهٔ داروهای مولکولکوچک و همچنین محصولات حوزههای کشاورزی، الکترونیک و علم مواد را تشکیل میدهد. یک واکنش زمانی به ویژه مفید است که بتواند همان نوع پیوند شیمیایی را بهطور قابلاعتماد در طیف گستردهای از مواد آغازین مختلف ایجاد کند. وقتی واکنشها بازده پایینی دارند یا محصولات جانبی ناخواستهٔ زیادی تولید میکنند، شیمیدانان ممکن است ناچار شوند مولکولهایی را که از جهات دیگر نوید بخشاند کنار بگذارند یا زمان قابلتوجهی را صرف توسعهٔ یک مسیر سنتزی متفاوت کنند. این موضوع سنتز را به گلوگاه اصلی در کشف دارو تبدیل میکند: دانشمندان عموماً فقط میتوانند مولکولهایی را آزمایش کنند که قادرند بسازند یا بهنحوی دیگر تهیه کنند.
جفتشدگی چان–لام در شیمی دارویی مفید است، زیرا پیوندهای کربن–نیتروژن تشکیل میدهد که در داروها رایج هستند. با این حال، این واکنش برای هر دستهای از مولکولها به یک اندازه خوب عمل نمیکند. بهویژه، جفتسازی سولفونامیدهای اولیه با اسیدهای بورونیک در گذشته عموماً بازدههای پایینی به همراه داشته است. سولفونامیدها خانوادهای مهم از مولکولها هستند که در داروهای مورد استفاده در انکولوژی و بیماریهای عفونی یافت میشوند. قابلاعتمادتر کردن این واکنش میتواند روشی گستردهتر و عملیتر برای تولید و بررسی مولکولهای بالقوه مفید در اختیار شیمیدانان دارویی قرار دهد.
سامانهٔ ترکیبی قابلیتهای مکمل را در کنار هم قرار داد. اعلانهایی که دانشمندان همکار با Maria AI نوشته بودند، در یک چارچوب با GPT‑5.4 به کار رفتند تا هزاران پیشنهاد پژوهشی ممکن تولید و رتبهبندی شوند. شیمیدانان انسانی زیرمجموعهٔ کوچکی از پیشنهادها را که طبق ارزیابی سامانه بالاترین رتبه را کسب کرده بودند بررسی کردند و چهار مورد را برای آزمایش در آزمایشگاه انتخاب کردند. سپس Maria AI برنامههای سطح بالای انتخابشده را به دستورالعملهای آزمایشگاهی دقیق تبدیل کرد، هزاران آزمایش با توان عملیاتی بالا اجرا کرد، دادههای خام را تحلیل کرد و نتایج ساختاریافته را به GPT‑5.4 بازگرداند.
یکی از چهار پیشنهاد منتخب، OAI-M1-03، استفاده از اکسندههای ملایم مانند TEMPO را برای بهبود عملکرد واکنش چان-لام در سنتز سولفونامید پیشنهاد کرد. شیمی دانان این پیشنهاد را هم شگفت آور و هم جالب یافتند. ما یافتههای تفصیلی مربوط به OAI-M1-03 را در این پست وبلاگ و در مقاله(در یک پنجره جدید باز میشود) به اشتراک میگذاریم.
سپس ماریا از پیشنهاد پژوهشی نهایی برای تولید شبکههای آزمایشی استفاده کرد، همراه با اصلاحات جزئی از سوی انسانها. بزرگترین اصلاح انسانی، اجتناب از دی متیل سولفوکسید یا DMSO به عنوان حلال بود، زیرا شیمیدانان نگران بودند که این ماده بتواند با اکسیدانهای قویتری که به عنوان مقایسه استفاده میشوند، واکنش دهد.
کل فرآیند ۳ ماه زمان برد، از اولین اعلان در ۳ مارس تا بهاشتراکگذاری نتایج OAI-M1-03 با کارشناسان مستقل در ۴ ژوئن.
ما این گردشکار را تقریباً خود مختار توصیف میکنیم، نه کاملاً خود مختار، زیرا شیمیدانان انسانی همچنان در سراسر این فرآیند تصمیمهای مهمی اتخاذ میکردند. مدل ایدههای کلیدی پژوهشی را پیشنهاد کرد، در حالی که شیمیدانان انسانی هدایت و قضاوت در سطح کلان را ارائه دادند، جزئیات آزمایشی را اصلاح کردند، به آمادهسازی مواد مصرفی آزمایشگاه و معرفها کمک کردند، و آزمایشهای کلیدی را بهصورت دستی تکرار کردند.
OAI-M1-03، TEMPO را بهعنوان یک افزودنی مفید برای واکنش کوپلینگ چان-لامِ سولفونامید اولیه که در اینجا مطالعه شده است، شناسایی کرد. در شرایط بهینهسازیشده، واکنش از دو جنبه بهبود یافت: بازده متوسط افزایش پیدا کرد و ترکیبهای بیشتری از سوبستراها به بازدههای مفید از نظر عملی رسیدند.
در طول دو چرخه، ماریا در مجموع ۱۰۰۸۰ واکنش انجام داد — بیش از تعداد واکنشهایی که یک شیمیدان با انجام سه واکنش در هر روز، طی یک دهه انجام میدهد. آن مقیاس اهمیت داشت، زیرا نتایج شیمیایی وقتی فقط روی چند نمونه آزمایش شوند، میتوانند گمراهکننده باشند. ممکن است یک واکنش روی یک جفت از مواد آغازین امیدوارکننده به نظر برسد، اما در مجموعهٔ گستردهتری از مولکولها ناکام بماند. هزاران واکنش این امکان را فراهم کرد که TEMPO از میان ۱۰ اکسندهٔ آزمودهشده شناسایی شود، تکرار این اثر در ترکیبهای متنوع مشاهده شود، و محدودیتهای آن مشخص گردد.
پس از تحلیل دور نخست دادهها، سامانه دور دومِ متمرکزتری از آزمایشها را برای آزمودن فرضیههای تکمیلی پیشنهاد کرد. یکی از یافتههای بعدیِ مفید این بود که TEMPO میتواند با مشابهی بسیار ارزانتر، یعنی 4-hydroxy-TEMPO، جایگزین شود، آن هم با افت اندکی در عملکرد.
این نتیجه همچنین فراتر از قالب غربالگری در مقیاس میکرولیترِ آزمایشگاه ماریا نیز پایدار ماند. شیمیدانان انسانی واکنشهای نماینده را بهصورت دستی در مقیاس آزمایشگاهی بازتولید کردند و برای ۱۴ مورد از ۱۴ جفت زیرلایه افزایش بازده مشاهده کردند؛ برای ۸ جفت، این افزایش بیش از ۲ برابر بود. این تکرار آزمایش اهمیت دارد، زیرا آزمایشهای در مقیاس بسیار کوچک گاهی میتوانند آثار مصنوعیای ایجاد کنند که در مقیاس بزرگتر ناپدید میشوند. اعتبار سنجی در مقیاس آزمایشگاهی نیز پیش از انتشار پژوهش در یک مجلهٔ علمی مرسوم است.

ویالهای واکنش مربوط به اعتبار سنجی دستی در مقیاس آزمایشگاهی.
چهار متخصص بیرونیِ شیمی پیشچاپی را که OAI-M1-03 را توصیف میکرد بررسی کردند. ارزیابیهای آنان مؤید دیدگاه ما بود که این نتیجه بدیع است و ارزش بهاشتراکگذاری با جامعهٔ علمی را دارد. آزمون جدیتر در ادامه خواهد بود: اینکه آیا آزمایشگاههای مستقل میتوانند نتیجه را باز تولید کنند، و اینکه آیا شیمیدانان آن را در طیف گستردهتری از مولکولها مفید مییابند.
از میان سه پیشنهاد دیگر که توسط GPT‑5.4 تولید و در طول دورهٔ سهماهه توسط ماریا آزمایش شدند، OAI-M1-02 و OAI-M1-04 در آزمایشگاه ماریا بهصورت تجربی اثبات شدند، در حالی که OAI-M1-01 رد شد. تحلیل این نتایج در حال انجام است.
این کار نشان میدهد که یک مدل میتواند نقش مفیدی در شیمی آلی داشته باشد. این کار فراتر از جمعبندی ادبیات یا پیشنهاد یک آزمایش تکموردی بود: فرضیهای مشخص و غافلگیرکننده مطرح کرد و آن را برای بازبینی انسانی ارائه داد، آزمایشهایی طراحی کرد، دادههای آزمایشی را تفسیر کرد و آزمایشهای پیگیری را طراحی کرد.
این نشان نمیدهد که هوش مصنوعی میتواند بهطور مستقل یک برنامه پژوهشی شیمی را از ابتدا تا انتها اجرا کند. قضاوت انسانی همچنان ضروری بود و جریان کار به زیر ساخت تخصصی با توان عملیاتی بالا وابسته بود. همچنین ثابت نمیکند که این روش به سایر واکنشهای جفتشدن، سایر ردههای سوبسترا، یا شرایط تولید قابل تعمیم باشد.
برآوردهای بازده از یک پلتفرم با توان عملیاتی بالا به دست آمدند، و اعتبارسنجی آزمایشگاهی ۱۴ جفت سوبسترای نماینده را پوشش داد. برای مشخصهیابی سازوکار واکنش، تعریف دامنه سوبسترا، اندازهگیری عملکرد تحت شرایط آزمایشگاهی مختلف، و باز تولید مستقل نتیجه، کار بیشتری لازم است.
قابلیتهای شیمی نیازمند برخورد دقیق هستند زیرا همان ابزارهایی که میتوانند از پزشکی و علوم مواد پشتیبانی کنند، ممکن است مورد سوء استفاده قرار گیرند. ما عمداً دامنهٔ این کار را به یک مسئلهٔ مشروع در شیمی دارویی محدود کردیم: بهبود یک واکنش جفتسازی شناختهشده که برای ساخت مولکولهای دارو مانند استفاده میشود. آزمایشها شامل سموم، سلاحهای شیمیایی یا درخواستهایی برای طراحی ترکیبات مضر نبودند. این نتایج نباید بهعنوان شواهدی برداشت شود که نشان دهد سامانه میتواند در آن کاربردهای زیانبار کمک کند. این پروژه آن را آزمایش یا نشان نداد.
ما ریسکهای نوظهور ناشی از قابلیتهای پیشرفته مدل را از طریق چارچوب آمادگی خود ارزیابی و کاهش میدهیم، از جمله ریسکهای مرتبط با حوزههای شیمیایی و زیستی. مدل استفادهشده در این کار پیشتر ارزیابیهای مرتبطی را نزد مؤسسه امنیت هوش مصنوعی بریتانیا گذرانده بود، و این سیستم بهگونهای طراحی شده بود که درخواستهای متمرکز بر کاربردهای مضر را رد کند. روند کاری آزمایشگاهی لایهای دیگر از کنترل را افزود: شیمیدانان انسانی انتخاب میکردند کدام پیشنهادها برای اجراء وارد آزمایشگاه شوند، برنامههای آزمایشی را بازبینی میکردند و کنترل زیرساخت فیزیکی را در اختیار داشتند.
ما فکر میکنیم این روش مسئولانهای برای مطالعه ظرفیت هوش مصنوعی در شیمی آزمایشگاهی است: انتخاب حوزهای از مسائل با ارزش علمی روشن، همراهکردن تدابیر حفاظتی در سطح مدل با نظارت متخصصان، و ارزیابی سامانه از طریق آزمایشهای فیزیکی محدود و کنترلشده. با بهبود این قابلیتها، ما همچنان ریسکهای نوظهور را ارزیابی خواهیم کرد، تدابیر حفاظتی را تقویت خواهیم کرد و درباره اینکه یک نتیجه بر چه چیزی دلالت دارد و بر چه چیزی دلالت ندارد، صریح و مشخص خواهیم بود.
گامهای بعدیِ فوری ماهیتی علمی دارند: آزمایش طیف گستردهتری از مواد اولیه، بررسی اینکه چرا افزودنیها واکنش را بهبود میدهند، مشخص کردن اینکه این اثر در کجا کارآمد است و در کجا ناکام میماند، و پشتیبانی از تکرار مستقل. در مجموع، این مطالعات تعیین خواهند کرد که این روش تا چه حد قابلیت کاربرد گسترده دارد و تا چه اندازه در جریانهای کاری عملی در شیمی دارویی مفید است.
هدف بلند مدتتر ما این است که سامانههای هوش مصنوعی را به شرکای علمی قابل اتکایی تبدیل کنیم که به پژوهشگران در تولید فرضیهها، طراحی آزمایشها، تفسیر نتایج و تصمیمگیری درباره اینکه در گام بعدی چه چیزی را بیازمایند کمک میکنند، در حالی که همچنان مبتنی بر قضاوت تخصصی، اندازه گیری قابل اعتماد و تدابیر حفاظتی قوی باقی میمانند. شیمی آلی حوزهای با اثرگذاری بسیار بالا است، زیرا پیشرفت در کشف و تولید مولکولهای کوچک به توانایی ساخت قابلاعتماد مولکولها وابسته است. دانشمندان فقط میتوانند مولکولهایی را آزمایش کنند که قادر به ساختنشان هستند، و سنتز بهتر میتواند دامنهٔ ایدههایی را که میتوانند در حوزههای پزشکی، کشاورزی، الکترونیک، انرژی و علم مواد بررسی کنند، گسترش دهد. این نتیجه یکی از نمونههای اولیه آن جهتگیری گستردهتر است: یک مدل پیشرو، عاملهای تخصصی، یک آزمایشگاه خودکار، و شیمیدانان انسانی که با هم کار میکنند تا در چرخه پژوهش سریعتر پیش بروند و یافتههایی تولید کنند که جامعه علمی بتواند آنها را ارزیابی، بازتولید، و بر پایه آنها کارهای بعدی را بنا کند.
ما از تیم Molecule.one و شیمیدانان مستقلی که این کار را بازبینی کردند سپاسگزاریم.