Ahli kimia AI yang hampir otonom meningkatkan reaksi sulit dalam kimia medisinal
Dengan agen Molecule.one Maria, GPT‑5.4 menemukan aditif yang mengejutkan yang meningkatkan rendemen Kopling Chan-Lam untuk lebih dari 80% substrat yang diuji.
Pekerjaan OpenAI dalam sains dimotivasi oleh keyakinan sederhana: AI canggih dapat menjadi mitra yang kuat bagi ilmuwan, membantu mereka mengeksplorasi lebih banyak gagasan, menghubungkan konsep yang berjauhan, merancang eksperimen yang lebih baik, dan mempercepat penemuan yang bermanfaat bagi umat manusia. Kami telah membagikan contoh awal tentang model yang berkontribusi pada hasil baru dalam matematika, termasuk pekerjaan tentang masalah jarak satuan, dalam fisika teoretis, melalui hasil baru tentang amplitudo gluon, dan dalam biologi, di mana GPT‑5 membantu menurunkan biaya sintesis protein bebas sel di laboratorium otomatis. Kami juga memperkenalkan GPT‑Rosalind, model yang dirancang khusus untuk mendukung penelitian ilmu hayati dan alur kerja penemuan obat.
Proyek ini memperluas arah tersebut ke bidang kimia medisinal, di mana kemajuan tidak dapat diukur hanya dengan penalaran. Sebuah hipotesis harus dapat terbukti di laboratorium dengan molekul, instrumen, dan noise eksperimen nyata. Dengan bekerja mengunakan Molecule.one(terbuka di jendela baru), kami menghubungkan GPT‑5.4 ke Maria—AI agen kimia yang terintegrasi dengan laboratorium throughput tinggi untuk penelitian otonom—dan memberinya tujuan terbuka: meningkatkan salah satu dari beberapa kelas reaksi penting. Sistem menghasilkan proposal penelitian, merancang dan menjalankan eksperimen, menganalisis data eksperimen, serta mengusulkan eksperimen tindak lanjut. Manusia tetap dilibatkan dalam proses dengan merancang prompt pengarah dan prompt penilaian, serta memilih proposal untuk diuji. Mereka juga melakukan koreksi terbatas pada rencana eksperimen, membantu kegiatan operasional laboratorium dasar, dan secara mandiri memvalidasi hasil akhir.
Proposal yang paling menjanjikan, OAI-M1-03, berfokus pada varian kopling Chan–Lam yang sulit tetapi berguna, yaitu reaksi yang digunakan ahli kimia untuk membentuk ikatan karbon–nitrogen. Berawal dari tujuan terbuka untuk meningkatkan kopling Chan–Lam bagi kimia proses, GPT‑5.4 secara independen mengidentifikasi sulfonamida primer sebagai kelas substrat yang menantang dan bernilai tinggi, serta menyarankan bahwa oksidator ringan, termasuk TEMPO, dapat meningkatkan reaksi tersebut.
Selama dua siklus eksperimen di Maria Lab, gagasan tersebut menghasilkan peningkatan yang signifikan. Dalam kondisi yang dioptimalkan, rendemen terukur meningkat untuk 88% asam boronat dan 83% sulfonamida yang diuji. Rendemen rata-rata meningkat dari 16,6% menjadi 25,2%, dan proporsi reaksi dengan rendemen di atas 30% meningkat dari 15,6% menjadi 37,5%. Para ahli kimia manusia kemudian mengulangi reaksi-reaksi representatif pada skala bangku laboratorium. Eksperimen tersebut mengonfirmasi hasil pada skala mikroliter, menunjukkan rendemen yang lebih tinggi untuk 11 dari 14 pasangan substrat, dengan peningkatan lebih dari dua kali lipat dalam sebagian besar kasus. Hal itu penting karena ahli kimia medisinal membutuhkan reaksi yang tidak hanya berhasil dalam eksperimen penyaringan berskala mikroliter, tetapi juga dalam alur kerja laboratorium praktis yang digunakan selama penemuan obat.
Kemajuan di bidang kimia medisinal ini sangat menarik karena sintesis sering kali menjadi hambatan utama dalam penemuan obat: para ilmuwan hanya dapat menguji molekul yang dapat mereka buat atau peroleh. Gugus sulfonamida terdapat dalam obat-obatan di berbagai bidang terapi, termasuk obat antikanker, antimikroba, dan diuretik, namun reaksi kopling Chan–Lam antara sulfonamida primer dan asam boronat secara historis menghasilkan rendemen yang rendah. Membuat bentuk reaksi ini lebih andal dapat memberi ahli kimia medisinal cara yang lebih luas dan lebih praktis untuk menghasilkan dan mengeksplorasi molekul-molekul yang berpotensi berguna.
Meskipun ini masih merupakan hasil awal, hal ini memberikan contoh konkret lain dari arah yang lebih luas yang sedang kami tuju: sistem AI yang dapat menjadi mitra berharga bagi para ilmuwan di sebagian besar siklus penelitian. Model meninjau literatur, mengusulkan gagasan yang tak terduga, membantu merancang dan menganalisis eksperimen, serta sampai pada temuan ilmiah yang dapat dievaluasi oleh ahli kimia manusia.
Laboratorium Maria: milik Molecule.one laboratorium khusus dengan throughput tinggi yang menjalankan 10.080 reaksi dalam OAI-M1-03
Kimia organik menjadi dasar bagi semua obat bermolekul kecil, serta produk-produk di bidang pertanian, elektronik, dan ilmu material. Suatu reaksi sangat berguna ketika reaksi tersebut dapat membentuk jenis ikatan kimia yang sama secara andal pada banyak bahan awal yang berbeda. Jika reaksi menghasilkan rendemen rendah atau terlalu banyak produk sampingan yang tidak diinginkan, ahli kimia mungkin harus meninggalkan molekul yang sebenarnya menjanjikan atau menghabiskan banyak waktu untuk mengembangkan rute sintesis lain. Hal ini menjadikan sintesis sebagai hambatan utama dalam penemuan obat: para ilmuwan umumnya hanya dapat menguji molekul yang dapat mereka buat atau peroleh dengan cara lain.
Kopling Chan–Lam berguna dalam kimia medisinal karena membentuk ikatan karbon-nitrogen, yang umum ditemukan dalam obat-obatan. Namun, reaksi tersebut tidak berjalan sama baiknya untuk setiap kelas molekul. Secara khusus, kopling sulfonamida primer dengan asam boron secara historis menghasilkan rendemen yang rendah. Sulfonamida merupakan kelompok molekul penting yang ditemukan dalam obat-obatan yang digunakan di bidang onkologi dan penyakit infeksi. Dengan membuat reaksi ini lebih andal, ahli kimia medisinal mendapatkan cara yang lebih luas dan lebih praktis untuk menghasilkan serta mengeksplorasi molekul yang berpotensi bermanfaat.
Sistem gabungan tersebut memadukan kemampuan yang saling melengkapi. Prompt yang ditulis oleh para ilmuwan yang bekerja dengan Maria AI digunakan bersama GPT‑5.4 dalam sebuah kerangka kerja untuk menghasilkan dan memberi peringkat pada ribuan kemungkinan proposal penelitian. Para ahli kimia manusia meninjau sebagian kecil proposal yang mendapat peringkat tertinggi menurut sistem tersebut dan memilih empat di antaranya untuk pengujian laboratorium. Maria AI kemudian menerjemahkan rencana tingkat tinggi yang dipilih menjadi instruksi lab terperinci, menjalankan ribuan eksperimen dengan throughput tinggi, menganalisis data mentah, dan mengembalikan hasil terstruktur ke GPT‑5.4.
Salah satu dari empat proposal yang dipilih, OAI-M1-03, mengusulkan penggunaan oksidator ringan seperti TEMPO untuk meningkatkan kinerja reaksi Chan-Lam dalam sintesis sulfonamida. Para ahli kimia menilai usulan itu mengejutkan sekaligus menarik. Kami membagikan temuan terperinci dari OAI-M1-03 dalam postingan blog ini dan dalam makalah(terbuka di jendela baru).
Proposal penelitian akhir kemudian digunakan oleh Maria untuk menghasilkan grid eksperimental, dengan sedikit koreksi oleh manusia. Koreksi manusia terbesar adalah menghindari penggunaan dimetil sulfoksida, atau DMSO, sebagai pelarut karena para ahli kimia khawatir zat tersebut dapat bereaksi dengan oksidator yang lebih kuat yang digunakan sebagai pembanding.
Keseluruhan proses berlangsung selama tiga bulan, dari prompt pertama pada 4 Maret hingga membagikan hasil OAI-M1-03 kepada para pakar independen pada 4 Juni.
Kami menggambarkan alur kerja ini sebagai hampir otonom, bukan sepenuhnya otonom, karena ahli kimia manusia masih membuat keputusan penting sepanjang proses tersebut. Model mengusulkan gagasan penelitian utama, sementara ahli kimia manusia memberikan arahan tingkat tinggi dan penilaian, mengoreksi detail eksperimental, membantu menyiapkan bahan habis pakai laboratorium dan reagen, serta mengulangi eksperimen utama secara manual.
OAI-M1-03 mengidentifikasi TEMPO sebagai aditif yang berguna untuk kopling Chan-Lam sulfonamida primer yang dikaji di sini. Dalam kondisi yang dioptimalkan, reaksi meningkat dalam dua hal: rendemen rata-rata naik, dan lebih banyak kombinasi substrat mencapai rendemen yang berguna secara praktis.
Selama dua siklus, Maria menjalankan total 10.080 reaksi – lebih banyak daripada yang akan dijalankan oleh seorang ahli kimia yang menjalankan tiga reaksi setiap hari selama satu dekade. Skala tersebut penting karena hasil eksperimen kimia dapat menyesatkan jika hanya diuji pada beberapa contoh. Suatu reaksi dapat terlihat menjanjikan pada satu pasangan bahan awal, tetapi gagal pada kumpulan molekul yang lebih luas. Ribuan reaksi memungkinkan identifikasi TEMPO di antara sepuluh oksidan yang diuji, mengamati efek tersebut berulang di berbagai kombinasi, dan menemukan keterbatasannya.
Setelah menganalisis data putaran pertama, sistem mengusulkan putaran kedua eksperimen yang lebih terfokus untuk menguji hipotesis lanjutan. Salah satu temuan lanjutan yang berguna adalah bahwa TEMPO dapat digantikan oleh analog yang jauh lebih murah, 4-hidroksi-TEMPO, dengan hanya sedikit penurunan kinerja.
Hasilnya juga tetap terbukti konsisten di luar format skrining skala mikroliter Maria Lab. Para ahli kimia manusia mereproduksi reaksi-reaksi representatif secara manual pada skala laboratorium dan mengamati peningkatan rendemen pada 11 dari 14 pasangan substrat; untuk delapan pasangan, peningkatannya lebih dari dua kali lipat. Replikasi itu penting karena eksperimen berskala sangat kecil terkadang dapat menimbulkan artefak yang hilang pada skala yang lebih besar. Validasi skala laboratorium juga lazim dilakukan sebelum penelitian dipublikasikan dalam jurnal ilmiah.

Vial reaksi dari validasi skala bangku manual.
Empat pakar kimia eksternal meninjau pracetak yang mendeskripsikan OAI-M1-03. Penilaian mereka mendukung pandangan kami bahwa hasil tersebut baru dan layak dibagikan kepada komunitas ilmiah. Ujian yang lebih berat akan datang berikutnya: apakah laboratorium independen dapat mereproduksi hasil tersebut, dan apakah para ahli kimia menganggapnya berguna untuk rentang molekul yang lebih luas.
Dari tiga proposal lainnya yang dihasilkan oleh GPT‑5.4 dan diuji oleh Maria selama periode tiga bulan, OAI-M1-02 dan OAI-M1-04 terbukti secara eksperimental di Maria Lab, sedangkan OAI-M1-01 terbukti salah. Analisis terhadap hasil ini sedang berlangsung.
Penelitian ini menunjukkan bahwa sebuah model dapat memberikan kontribusi yang bermanfaat dalam kimia organik. Hal itu tidak hanya merangkum literatur atau menyarankan eksperimen sekali saja: hal itu mengusulkan hipotesis spesifik yang mengejutkan dan menyajikannya untuk ditinjau manusia, merancang eksperimen, menafsirkan data eksperimen, serta merancang eksperimen tindak lanjut.
Hal itu tidak menunjukkan bahwa AI dapat secara mandiri menjalankan program penelitian kimia dari awal hingga akhir. Penilaian manusia tetap esensial, dan alur kerja bergantung pada infrastruktur khusus dengan throughput tinggi. Hal ini juga tidak membuktikan bahwa metode tersebut akan berlaku umum untuk reaksi kopling lainnya, kelas substrat lain, atau kondisi manufaktur.
Estimasi rendemen berasal dari platform throughput tinggi, dan validasi di meja kerja mencakup 14 pasangan substrat representatif. Diperlukan lebih banyak pekerjaan untuk mengarakterisasi mekanisme reaksi, menentukan cakupan substrat, mengukur kinerja dalam berbagai kondisi laboratorium, dan mereproduksi hasil tersebut secara independen.
Kemampuan di bidang kimia perlu ditangani dengan hati-hati karena alat yang sama yang dapat mendukung kedokteran dan ilmu material juga dapat disalahgunakan. Kami secara sengaja membatasi cakupan pekerjaan ini pada masalah kimia medisinal yang sah: meningkatkan reaksi kopling yang sudah dikenal dan digunakan untuk membuat molekul mirip obat. Eksperimen tersebut tidak melibatkan toksin, senjata kimia, atau permintaan untuk merancang senyawa berbahaya. Hasil ini tidak boleh ditafsirkan sebagai bukti bahwa sistem dapat membantu penerapan berbahaya tersebut. Proyek tersebut tidak menguji atau menunjukkan hal itu.
Kami menilai dan memitigasi risiko yang muncul dari kemampuan model tingkat lanjut melalui Kerangka Kerja Kesiapan kami, termasuk risiko yang terkait dengan domain kimia dan biologi. Model yang digunakan dalam pekerjaan ini telah menjalani evaluasi relevan bersama AI Security Institute Inggris, dan sistem dirancang untuk menolak permintaan yang berfokus pada aplikasi berbahaya. Alur kerja eksperimental tersebut menambahkan lapisan kontrol tambahan: ahli kimia manusia memilih proposal mana yang masuk ke laboratorium, meninjau rencana eksperimental, dan tetap memegang kendali atas infrastruktur fisik.
Kami berpendapat bahwa ini adalah cara yang bertanggung jawab untuk mempelajari potensi AI dalam kimia eksperimental: memilih ruang masalah dengan nilai ilmiah yang jelas, memasangkan pengamanan pada tingkat model dengan pengawasan pakar, dan mengevaluasi sistem melalui eksperimen fisik yang dibatasi. Seiring meningkatnya kemampuan ini, kami akan terus menilai risiko yang muncul, memperkuat langkah-langkah pengamanan, dan menjelaskan secara spesifik apa yang dapat dan tidak dapat disimpulkan dari suatu hasil.
Langkah-langkah berikutnya yang segera perlu dilakukan bersifat ilmiah: menguji rentang bahan awal yang lebih luas, menyelidiki mengapa aditif meningkatkan reaksi, memetakan di mana efek tersebut berhasil dan gagal, serta mendukung replikasi independen. Bersama-sama, studi-studi ini akan menentukan seberapa luas metode tersebut dapat diterapkan dan seberapa berguna metode itu dalam alur kerja kimia medisinal praktis.
Tujuan jangka panjang kami adalah menjadikan sistem AI sebagai mitra ilmiah yang andal, yang membantu para peneliti merumuskan hipotesis, merancang eksperimen, menafsirkan hasil, dan memutuskan apa yang akan diuji selanjutnya, dengan tetap berlandaskan penilaian ahli, pengukuran yang andal, dan mekanisme pengamanan yang kuat. Kimia organik merupakan bidang dengan dampak yang sangat besar karena kemajuan dalam penemuan dan manufaktur molekul kecil bergantung pada kemampuan untuk mensintesis molekul secara andal. Para ilmuwan hanya dapat menguji molekul yang dapat mereka buat, dan sintesis yang lebih baik dapat memperluas cakupan ide yang dapat mereka eksplorasi di bidang kedokteran, pertanian, elektronik, energi, dan ilmu material. Hasil ini merupakan salah satu contoh awal dari arah yang lebih luas tersebut: model terdepan, agen terspesialisasi, laboratorium terotomatisasi, dan ahli kimia manusia yang bekerja bersama untuk bergerak lebih cepat melalui siklus penelitian serta menghasilkan temuan yang dapat dievaluasi, direproduksi, dan dikembangkan lebih lanjut oleh komunitas ilmiah.
Kami berterima kasih kepada tim Molecule.one dan kepada para ahli kimia independen yang telah meninjau pekerjaan ini.