۲۷ خرداد ۱۴۰۵

یک شیمی‌دان هوش مصنوعی تقریباً خود مختار، یک واکنش چالش‌برانگیز را در شیمی دارویی بهبود می‌بخشد

با Molecule.oneِ ماریا، GPT‑5.4 یک افزودنی شگفت انگیز پیدا کرده است که بازده کوپلینگ Chan-Lam را برای بیش از ۸۰٪ از سوبستراهای آزمایش‌شده افزایش می‌دهد.

مقاله را مطالعه کنید زنجیره خلاصه شده تفکر را بخوانید

فعالیت‌های OpenAI در حوزهٔ علم از یک باور ساده انگیزه می‌گیرد: هوش مصنوعی پیشرفته می‌تواند به شریکی قدرتمند برای دانشمندان تبدیل شود و به آن‌ها کمک کند ایده‌های بیشتری را بررسی کنند، مفاهیم دور از هم را به یکدیگر پیوند دهند، آزمایش‌های بهتری طراحی کنند و به کشفیاتی که به سود بشریت هستند شتاب ببخشند. ما پیش‌تر نمونه‌های اولیه‌ای از مشارکت مدل‌ها در دستیابی به نتایج نوین در ریاضیات، از جمله کار روی مسئله فاصله واحد⁠، در فیزیک نظری، از طریق نتیجه‌ای جدید درباره آمپلیتودهای گلوئون⁠، و در زیست‌شناسی، که در آن GPT‑5 به کاهش هزینه تولید پروتئین بدون سلول⁠ در یک آزمایشگاه خودکار کمک کرد، به اشتراک گذاشته‌ایم. ما همچنین GPT‑Rosalind⁠ را معرفی کردیم، یک مدل هدف‌محور برای پشتیبانی از پژوهش‌های علوم زیستی و جریان‌های کاری کشف دارو.

این پروژه آن مسیر را به حوزهٔ شیمی دارویی گسترش می‌دهد، جایی که پیشرفت را نمی‌توان صرفاً با استدلال سنجید. یک فرضیه باید در آزمایشگاه با مولکول‌های واقعی، ابزارهای اندازه‌گیری و نویز تجربی کار کند. با همکاری Molecule.one⁠(در یک پنجره جدید باز می‌شود)، ما GPT‑5.4 را به Maria—یک هوش مصنوعی عاملیِ شیمی که با آزمایشگاهی با توان عملیاتی بالا برای پژوهش خودمختار یکپارچه شده است—متصل کردیم و به آن هدفی باز دادیم: بهبود یکی از چند دسته مهم از واکنش‌ها. سیستم پیشنهادهای پژوهشی تولید کرد، آزمایش‌هایی را طراحی و اجراء کرد، داده‌های آزمایشی را تحلیل کرد و آزمایش‌های پیگیری را پیشنهاد داد. انسان‌ها با طراحی اعلان‌ها هدایت و ارزیابی و انتخاب پیشنهادها برای آزمایش، همچنان در چرخه حضور داشتند. آن‌ها همچنین اصلاحات محدودی در طرح‌های آزمایشی انجام دادند، در عملیات پایه آزمایشگاهی کمک کردند و نتیجه نهایی را به طور مستقل اعتبارسنجی کردند.

امید بخش‌ترین پیشنهاد، OAI-M1-03، بر نسخه‌ای دشوار اما مفید از جفت‌شدن چان–لام تمرکز داشت؛ واکنشی که شیمیدانان از آن برای تشکیل پیوندهای کربن–نیتروژن استفاده می‌کنند. با شروع از هدفی باز برای بهبود جفت‌شدن چان–لام در شیمی فرآیند، GPT‑5.4 به‌طور مستقل سولفونامیدهای اولیه را به‌عنوان دسته‌ای چالش‌برانگیز و باارزش از سوبستراها شناسایی کرد و پیشنهاد داد که اکسنده‌های ملایم، از جمله TEMPO، می‌توانند واکنش را بهبود دهند.

در طول دو چرخه آزمایش در آزمایشگاه ماریا، آن ایده بهبود چشمگیری ایجاد کرد. تحت شرایط بهینه‌سازی‌شده، بازده‌های اندازه‌گیری‌شده برای ۸۸٪ از اسیدهای بورونیک و ۸۳٪ از سولفونامیدهای مورد آزمایش بهبود یافت. بازده میانگین از ۱۶٫۶٪ به ۲۵٫۲٪ افزایش یافت، و سهم واکنش‌هایی با بازده بالاتر از ۳۰٪ از ۱۵٫۶٪ به ۳۷٫۵٪ رسید. سپس شیمی‌دان‌ها واکنش‌های نمونه را در مقیاس آزمایشگاهی تکرار کردند. آن آزمایش‌ها نتایج در مقیاس میکرولیتر را تأیید کردند و نشان دادند که بازده برای ۱۱ مورد از ۱۴ جفت سوبسترا بالاتر بوده است، به‌طوری‌که در بیشتر موارد افزایشی بیش از دو برابر مشاهده شد. این موضوع اهمیت دارد، زیرا شیمی‌دانان دارویی به واکنش‌هایی نیاز دارند که نه تنها در آزمایش‌های غربالگری در مقیاس میکرولیتر کار کنند، بلکه در گردش‌کارهای عملی آزمایشگاهی مورد استفاده در فرآیند کشف دارو نیز قابل استفاده باشند.

پیشرفت‌ها در این حوزه از شیمی دارویی به‌ویژه هیجان‌انگیز هستند، زیرا سنتز اغلب یکی از گلوگاه‌های اصلی در کشف دارو است: دانشمندان فقط می‌توانند مولکول‌هایی را آزمایش کنند که می‌توانند بسازند یا به‌نحوی دیگر به دست آورند. گروه سولفونامید در داروهایی در طیف گسترده‌ای از حوزه‌های درمانی، از جمله داروهای ضدسرطان، داروهای ضد میکروبی و مدرها، دیده می‌شود؛ با این حال، کوپلینگ چان–لامِ سولفونامیدهای اولیه با اسیدهای بورونیک از نظر تاریخی بازده‌های پایینی داشته است. قابل‌اعتمادتر کردن این نوع از واکنش می‌تواند به شیمی‌دانان دارویی روشی گسترده‌تر و عملی‌تر برای تولید و بررسی مولکول‌های بالقوه مفید بدهد.

هرچند این هنوز نتیجه‌ای اولیه است، نمونه‌ای ملموس دیگر از مسیر کلی‌تری را ارائه می‌دهد که در راستای آن تلاش می‌کنیم: سامانه‌های هوش مصنوعی که بتوانند در بخش بزرگی از چرخه پژوهش به شرکای ارزشمندی برای دانشمندان تبدیل شوند. مدل ادبیات پژوهشی را مرور کرد، ایده‌ای غیرمنتظره پیشنهاد داد، به طراحی و تحلیل آزمایش‌ها کمک کرد و به یافته‌ای علمی رسید که شیمی‌دانان انسانی می‌توانستند آن را ارزیابی کنند.

آزمایشگاه ماریا: متعلق به Molecule.one آزمایشگاه تخصصی با توان عملیاتی بالا که ۱۰۰۸۰ واکنش را در OAI-M1-03 انجام داد

چرا مسئلهٔ شیمی مهم است

شیمی آلی زیر بنای همهٔ داروهای مولکول‌کوچک و همچنین محصولات حوزه‌های کشاورزی، الکترونیک و علم مواد را تشکیل می‌دهد. یک واکنش زمانی به ویژه مفید است که بتواند همان نوع پیوند شیمیایی را به‌طور قابل‌اعتماد در طیف گسترده‌ای از مواد آغازین مختلف ایجاد کند. وقتی واکنش‌ها بازده پایینی دارند یا محصولات جانبی ناخواستهٔ زیادی تولید می‌کنند، شیمی‌دانان ممکن است ناچار شوند مولکول‌هایی را که از جهات دیگر نوید بخش‌اند کنار بگذارند یا زمان قابل‌توجهی را صرف توسعهٔ یک مسیر سنتزی متفاوت کنند. این موضوع سنتز را به گلوگاه اصلی در کشف دارو تبدیل می‌کند: دانشمندان عموماً فقط می‌توانند مولکول‌هایی را آزمایش کنند که قادرند بسازند یا به‌نحوی دیگر تهیه کنند.

جفت‌شدگی چان–لام در شیمی دارویی مفید است، زیرا پیوندهای کربن–نیتروژن تشکیل می‌دهد که در داروها رایج هستند. با این حال، این واکنش برای هر دسته‌ای از مولکول‌ها به یک اندازه خوب عمل نمی‌کند. به‌ویژه، جفت‌سازی سولفونامیدهای اولیه با اسیدهای بورونیک در گذشته عموماً بازده‌های پایینی به همراه داشته است. سولفونامیدها خانواده‌ای مهم از مولکول‌ها هستند که در داروهای مورد استفاده در انکولوژی و بیماری‌های عفونی یافت می‌شوند. قابل‌اعتمادتر کردن این واکنش می‌تواند روشی گسترده‌تر و عملی‌تر برای تولید و بررسی مولکول‌های بالقوه مفید در اختیار شیمی‌دانان دارویی قرار دهد.

اتصال GPT‑5.4 به Maria AI و Lab

سامانهٔ ترکیبی قابلیت‌های مکمل را در کنار هم قرار داد. اعلان‌هایی که دانشمندان همکار با Maria AI نوشته بودند، در یک چارچوب با GPT‑5.4 به کار رفتند تا هزاران پیشنهاد پژوهشی ممکن تولید و رتبه‌بندی شوند. شیمی‌دانان انسانی زیرمجموعهٔ کوچکی از پیشنهادها را که طبق ارزیابی سامانه بالاترین رتبه را کسب کرده بودند بررسی کردند و چهار مورد را برای آزمایش در آزمایشگاه انتخاب کردند. سپس Maria AI برنامه‌های سطح بالای انتخاب‌شده را به دستورالعمل‌های آزمایشگاهی دقیق تبدیل کرد، هزاران آزمایش با توان عملیاتی بالا اجرا کرد، داده‌های خام را تحلیل کرد و نتایج ساختاریافته را به GPT‑5.4 بازگرداند.

یکی از چهار پیشنهاد منتخب، OAI-M1-03، استفاده از اکسنده‌های ملایم مانند TEMPO را برای بهبود عملکرد واکنش چان-لام در سنتز سولفونامید پیشنهاد کرد. شیمی دانان این پیشنهاد را هم شگفت آور و هم جالب یافتند. ما یافته‌های تفصیلی مربوط به OAI-M1-03 را در این پست وبلاگ و در مقاله⁠(در یک پنجره جدید باز می‌شود) به اشتراک می‌گذاریم. ما همچنین زنجیره تفکر باز نویسی شدهٔ مدل⁠(در یک پنجره جدید باز می‌شود) را برای OAI-M1-03 به اشتراک می‌گذاریم.

سپس ماریا از پیشنهاد پژوهشی نهایی برای تولید شبکه‌های آزمایشی استفاده کرد، همراه با اصلاحات جزئی از سوی انسان‌ها. بزرگترین اصلاح انسانی، اجتناب از دی متیل سولفوکسید یا DMSO به عنوان حلال بود، زیرا شیمیدانان نگران بودند که این ماده بتواند با اکسیدان‌های قوی‌تری که به عنوان مقایسه استفاده می‌شوند، واکنش دهد.

کل فرآیند ۳ ماه زمان برد، از اولین اعلان در ۳ مارس تا به‌اشتراک‌گذاری نتایج OAI-M1-03 با کارشناسان مستقل در ۴ ژوئن.

ما این گردش‌کار را تقریباً خود مختار توصیف می‌کنیم، نه کاملاً خود مختار، زیرا شیمی‌دانان انسانی همچنان در سراسر این فرآیند تصمیم‌های مهمی اتخاذ می‌کردند. مدل ایده‌های کلیدی پژوهشی را پیشنهاد کرد، در حالی که شیمی‌دانان انسانی هدایت و قضاوت در سطح کلان را ارائه دادند، جزئیات آزمایشی را اصلاح کردند، به آماده‌سازی مواد مصرفی آزمایشگاه و معرف‌ها کمک کردند، و آزمایش‌های کلیدی را به‌صورت دستی تکرار کردند.

آنچه یافتیم

OAI-M1-03، TEMPO را به‌عنوان یک افزودنی مفید برای واکنش کوپلینگ چان-لامِ سولفونامید اولیه که در اینجا مطالعه شده است، شناسایی کرد. در شرایط بهینه‌سازی‌شده، واکنش از دو جنبه بهبود یافت: بازده متوسط افزایش پیدا کرد و ترکیب‌های بیشتری از سوبستراها به بازده‌های مفید از نظر عملی رسیدند.

در طول دو چرخه، ماریا در مجموع ۱۰۰۸۰ واکنش انجام داد — بیش از تعداد واکنش‌هایی که یک شیمی‌دان با انجام سه واکنش در هر روز، طی یک دهه انجام می‌دهد. آن مقیاس اهمیت داشت، زیرا نتایج شیمیایی وقتی فقط روی چند نمونه آزمایش شوند، می‌توانند گمراه‌کننده باشند. ممکن است یک واکنش روی یک جفت از مواد آغازین امیدوارکننده به نظر برسد، اما در مجموعهٔ گسترده‌تری از مولکول‌ها ناکام بماند. هزاران واکنش این امکان را فراهم کرد که TEMPO از میان ۱۰ اکسندهٔ آزموده‌شده شناسایی شود، تکرار این اثر در ترکیب‌های متنوع مشاهده شود، و محدودیت‌های آن مشخص گردد.

پس از تحلیل دور نخست داده‌ها، سامانه دور دومِ متمرکزتری از آزمایش‌ها را برای آزمودن فرضیه‌های تکمیلی پیشنهاد کرد. یکی از یافته‌های بعدیِ مفید این بود که TEMPO می‌تواند با مشابهی بسیار ارزان‌تر، یعنی 4-hydroxy-TEMPO، جایگزین شود، آن هم با افت اندکی در عملکرد.

نمودار مقایسهٔ عملکرد TEMPO، 4-hydroxy-TEMPO، 4-oxo-TEMPO و PMP به‌همراه ساختارهای شیمیایی.

این نتیجه همچنین فراتر از قالب غربالگری در مقیاس میکرولیترِ آزمایشگاه ماریا نیز پایدار ماند. شیمی‌دانان انسانی واکنش‌های نماینده را به‌صورت دستی در مقیاس آزمایشگاهی بازتولید کردند و برای ۱۴ مورد از ۱۴ جفت زیرلایه افزایش بازده مشاهده کردند؛ برای ۸ جفت، این افزایش بیش از ۲ برابر بود. این تکرار آزمایش اهمیت دارد، زیرا آزمایش‌های در مقیاس بسیار کوچک گاهی می‌توانند آثار مصنوعی‌ای ایجاد کنند که در مقیاس بزرگ‌تر ناپدید می‌شوند. اعتبار سنجی در مقیاس آزمایشگاهی نیز پیش از انتشار پژوهش در یک مجلهٔ علمی مرسوم است.

ویال‌های واکنش شیشه‌ای برچسب‌گذاری‌شده از آزمایش‌های اعتبارسنجی در مقیاس آزمایشگاهی Molecule.one.

ویال‌های واکنش مربوط به اعتبار سنجی دستی در مقیاس آزمایشگاهی.

TEMPO تشکیل محصول را در مقیاس آزمایشگاهی بهبود می‌بخشد

چهار متخصص بیرونیِ شیمی پیش‌چاپی را که OAI-M1-03 را توصیف می‌کرد بررسی کردند. ارزیابی‌های آنان مؤید دیدگاه ما بود که این نتیجه بدیع است و ارزش به‌اشتراک‌گذاری با جامعهٔ علمی را دارد. آزمون جدی‌تر در ادامه خواهد بود: اینکه آیا آزمایشگاه‌های مستقل می‌توانند نتیجه را باز تولید کنند، و اینکه آیا شیمی‌دانان آن را در طیف گسترده‌تری از مولکول‌ها مفید می‌یابند.

“ادغام آزمایش‌های با توان عملیاتی بالا و هوش مصنوعی مدرن، نمایانگر پیشروی نوینی در کشف‌های علمی است. این واکنش جدید نمونه‌ای قدرتمند است که در آن شرایط بسیار ملایم و یک اکسندهٔ عملی، دامنهٔ گسترده‌ای از زیرلایه‌ها را برای یکی از واکنش‌های محبوب‌تر در سنتز دارو فراهم می‌کند.”

—تیم سرناک، دانشیار شیمی دارویی، دانشگاه میشیگان

از میان سه پیشنهاد دیگر که توسط GPT‑5.4 تولید و در طول دورهٔ سه‌ماهه توسط ماریا آزمایش شدند، OAI-M1-02 و OAI-M1-04 در آزمایشگاه ماریا به‌صورت تجربی اثبات شدند، در حالی که OAI-M1-01 رد شد. تحلیل این نتایج در حال انجام است.

محدودیت‌ها

این کار نشان می‌دهد که یک مدل می‌تواند نقش مفیدی در شیمی آلی داشته باشد. این کار فراتر از جمع‌بندی ادبیات یا پیشنهاد یک آزمایش تک‌موردی بود: فرضیه‌ای مشخص و غافلگیرکننده مطرح کرد و آن را برای بازبینی انسانی ارائه داد، آزمایش‌هایی طراحی کرد، داده‌های آزمایشی را تفسیر کرد و آزمایش‌های پیگیری را طراحی کرد.

این نشان نمی‌دهد که هوش مصنوعی می‌تواند به‌طور مستقل یک برنامه پژوهشی شیمی را از ابتدا تا انتها اجرا کند. قضاوت انسانی همچنان ضروری بود و جریان کار به زیر ساخت تخصصی با توان عملیاتی بالا وابسته بود. همچنین ثابت نمی‌کند که این روش به سایر واکنش‌های جفت‌شدن، سایر رده‌های سوبسترا، یا شرایط تولید قابل تعمیم باشد.

برآوردهای بازده از یک پلتفرم با توان عملیاتی بالا به دست آمدند، و اعتبارسنجی آزمایشگاهی ۱۴ جفت سوبسترای نماینده را پوشش داد. برای مشخصه‌یابی سازوکار واکنش، تعریف دامنه سوبسترا، اندازه‌گیری عملکرد تحت شرایط آزمایشگاهی مختلف، و باز تولید مستقل نتیجه، کار بیشتری لازم است.

آمادگی

قابلیت‌های شیمی نیازمند برخورد دقیق هستند زیرا همان ابزارهایی که می‌توانند از پزشکی و علوم مواد پشتیبانی کنند، ممکن است مورد سوء استفاده قرار گیرند. ما عمداً دامنهٔ این کار را به یک مسئلهٔ مشروع در شیمی دارویی محدود کردیم: بهبود یک واکنش جفت‌سازی شناخته‌شده که برای ساخت مولکول‌های دارو مانند استفاده می‌شود. آزمایش‌ها شامل سموم، سلاح‌های شیمیایی یا درخواست‌هایی برای طراحی ترکیبات مضر نبودند. این نتایج نباید به‌عنوان شواهدی برداشت شود که نشان دهد سامانه می‌تواند در آن کاربردهای زیان‌بار کمک کند. این پروژه آن را آزمایش یا نشان نداد.

ما ریسک‌های نوظهور ناشی از قابلیت‌های پیشرفته مدل را از طریق چارچوب آمادگی⁠ خود ارزیابی و کاهش می‌دهیم، از جمله ریسک‌های مرتبط با حوزه‌های شیمیایی و زیستی. مدل استفاده‌شده در این کار پیش‌تر ارزیابی‌های مرتبطی را نزد مؤسسه امنیت هوش مصنوعی بریتانیا گذرانده بود، و این سیستم به‌گونه‌ای طراحی شده بود که درخواست‌های متمرکز بر کاربردهای مضر را رد کند. روند کاری آزمایشگاهی لایه‌ای دیگر از کنترل را افزود: شیمی‌دانان انسانی انتخاب می‌کردند کدام پیشنهادها برای اجراء وارد آزمایشگاه شوند، برنامه‌های آزمایشی را بازبینی می‌کردند و کنترل زیرساخت فیزیکی را در اختیار داشتند.

ما فکر می‌کنیم این روش مسئولانه‌ای برای مطالعه ظرفیت هوش مصنوعی در شیمی آزمایشگاهی است: انتخاب حوزه‌ای از مسائل با ارزش علمی روشن، همراه‌کردن تدابیر حفاظتی در سطح مدل با نظارت متخصصان، و ارزیابی سامانه از طریق آزمایش‌های فیزیکی محدود و کنترل‌شده. با بهبود این قابلیت‌ها، ما همچنان ریسک‌های نوظهور را ارزیابی خواهیم کرد، تدابیر حفاظتی را تقویت خواهیم کرد و درباره اینکه یک نتیجه بر چه چیزی دلالت دارد و بر چه چیزی دلالت ندارد، صریح و مشخص خواهیم بود.

سپس چه می‌شود

گام‌های بعدیِ فوری ماهیتی علمی دارند: آزمایش طیف گسترده‌تری از مواد اولیه، بررسی اینکه چرا افزودنی‌ها واکنش را بهبود می‌دهند، مشخص کردن اینکه این اثر در کجا کارآمد است و در کجا ناکام می‌ماند، و پشتیبانی از تکرار مستقل. در مجموع، این مطالعات تعیین خواهند کرد که این روش تا چه حد قابلیت کاربرد گسترده دارد و تا چه اندازه در جریان‌های کاری عملی در شیمی دارویی مفید است.

هدف بلند مدت‌تر ما این است که سامانه‌های هوش مصنوعی را به شرکای علمی قابل اتکایی تبدیل کنیم که به پژوهشگران در تولید فرضیه‌ها، طراحی آزمایش‌ها، تفسیر نتایج و تصمیم‌گیری درباره اینکه در گام بعدی چه چیزی را بیازمایند کمک می‌کنند، در حالی که همچنان مبتنی بر قضاوت تخصصی، اندازه گیری قابل اعتماد و تدابیر حفاظتی قوی باقی می‌مانند. شیمی آلی حوزه‌ای با اثرگذاری بسیار بالا است، زیرا پیشرفت در کشف و تولید مولکول‌های کوچک به توانایی ساخت قابل‌اعتماد مولکول‌ها وابسته است. دانشمندان فقط می‌توانند مولکول‌هایی را آزمایش کنند که قادر به ساختنشان هستند، و سنتز بهتر می‌تواند دامنهٔ ایده‌هایی را که می‌توانند در حوزه‌های پزشکی، کشاورزی، الکترونیک، انرژی و علم مواد بررسی کنند، گسترش دهد. این نتیجه یکی از نمونه‌های اولیه آن جهت‌گیری گسترده‌تر است: یک مدل پیشرو، عامل‌های تخصصی، یک آزمایشگاه خودکار، و شیمی‌دانان انسانی که با هم کار می‌کنند تا در چرخه پژوهش سریع‌تر پیش بروند و یافته‌هایی تولید کنند که جامعه علمی بتواند آن‌ها را ارزیابی، بازتولید، و بر پایه آن‌ها کارهای بعدی را بنا کند.

ما از تیم Molecule.one و شیمی‌دانان مستقلی که این کار را بازبینی کردند سپاسگزاریم.

۲۰۲۶

نویسنده

OpenAI