Neredeyse otonom bir yapay zeka kimyageri, tıbbi kimyadaki zorlu bir reaksiyonu iyileştiriyor.
Molecule.one'ın Maria sistemiyle birlikte GPT‑5.4, test edilen substratların %80'inden fazlasında Chan-Lam Eşleşmesi verimlerini artıran şaşırtıcı bir katkı maddesi buldu.
OpenAI'ın bilim alanındaki çalışmaları basit bir inanca dayanıyor: Gelişmiş yapay zeka, bilim insanları için güçlü bir ortak haline gelebilir; daha fazla fikri keşfetmelerine, uzak kavramlar arasında bağlantı kurmalarına, daha iyi deneyler tasarlamalarına ve insanlığa fayda sağlayan keşifleri hızlandırmalarına yardımcı olabilir. Modellerin yeni sonuçlara katkıda bulunduğu ilk örnekleri daha önce paylaşmıştık: matematikte birim uzaklık problemi üzerine çalışmalar, teorik fizikte gluon genliklerine dair yeni bir sonuç ve biyolojide GPT‑5'in otomatik bir laboratuvarda hücresiz protein sentezi maliyetini düşürmeye yardımcı olması gibi. Ayrıca yaşam bilimleri araştırmalarını ve ilaç keşfi iş akışlarını desteklemek için özel olarak geliştirilen GPT‑Rosalind modelini de tanıttık.
Bu proje, bu yaklaşımı tıbbi kimya alanına taşıyor; burada ilerleme yalnızca akıl yürütmeyle ölçülemez. Bir hipotezin gerçek moleküller, cihazlar ve deneysel belirsizlikler içeren laboratuvar ortamında da işe yaraması gerekir. Molecule.one(yeni bir pencerede açılır) ile birlikte, GPT‑5.4'ü otonom araştırma için yüksek verimli bir laboratuvarla entegre edilmiş ajan tabanlı kimya yapay zekası Maria'ya bağladık ve ona açık uçlu bir hedef verdik: önemli reaksiyon sınıflarından birini iyileştirmek. Sistem, araştırma önerileri oluşturdu, deneyler tasarlayıp yürüttü, deneysel verileri analiz etti ve takip deneyleri önerdi. İnsanlar ise yönlendirme ve değerlendirme promptları tasarlayarak, test edilecek önerileri seçerek, deney planlarında sınırlı düzeltmeler yaparak, temel laboratuvar operasyonlarına destek vererek ve nihai sonucu bağımsız olarak doğrulayarak sürecin içinde yer aldı.
En umut verici öneri olan OAI-M1-03, kimyagerlerin karbon-azot bağları oluşturmak için kullandığı Chan-Lam eşleşmesinin zor ama faydalı bir versiyonuna odaklandı. GPT‑5.4, proses kimyasında Chan-Lam eşleşmesini iyileştirme gibi açık uçlu bir hedeften yola çıkarak birincil sülfonamidleri zorlu ve yüksek değerli bir substrat sınıfı olarak bağımsız biçimde belirledi ve TEMPO dahil hafif oksitleyicilerin reaksiyonu iyileştirebileceğini önerdi.
Maria Lab'de yürütülen iki deney döngüsü boyunca bu fikir anlamlı bir iyileşme sağladı. Optimize edilmiş koşullar altında, test edilen boronik asitlerin %88'inde ve sülfonamidlerin %83'ünde ölçülen verimler arttı. Ortalama verim %16,6'dan %25,2'ye yükseldi; %30'un üzerinde verim veren reaksiyonların oranı ise %15,6'dan %37,5'e çıktı. Kimyagerler daha sonra temsili reaksiyonları laboratuvar ölçeğinde tekrarladı. Bu deneyler, mikrolitre ölçeğindeki sonuçları doğrulayarak 14 substrat çiftinin 11'inde daha yüksek verim ve çoğu durumda iki kattan fazla artış olduğunu gösterdi. Bu önemlidir, çünkü ilaç kimyagerlerinin yalnızca mikrolitre ölçekli tarama deneylerinde değil, ilaç keşfi sırasında kullanılan pratik laboratuvar iş akışlarında da işe yarayan reaksiyonlara ihtiyacı vardır.
Tıbbi kimyanın bu alanındaki gelişmeler özellikle heyecan vericidir; çünkü sentez, ilaç keşfinde çoğu zaman önemli bir darboğaz oluşturur: bilim insanları yalnızca yapabildikleri veya başka yollarla elde edebildikleri molekülleri test edebilir. Sülfonamid grubu, antikanser ilaçlar, antimikrobiyaller ve diüretikler dahil olmak üzere çok çeşitli terapötik alanlarda bulunan ilaçlarda yer alır; ancak primer sülfonamidlerin boronik asitlerle Chan-Lam reaksiyonu tarihsel olarak düşük verim sağlamıştır. Reaksiyonun bu biçimini daha güvenilir hale getirmek, ilaç kimyagerlerine potansiyel olarak yararlı molekülleri üretmek ve keşfetmek için daha geniş ve daha pratik bir yol sağlayabilir.
Bu halen erken bir sonuç olsa da, üzerinde çalıştığımız daha geniş yönelimin bir başka somut örneğini sunuyor: araştırma döngüsünün büyük bölümünde bilim insanları için değerli ortaklar haline gelebilen yapay zeka sistemleri. Model, literatürü inceledi, beklenmedik bir fikir önerdi, deneylerin tasarlanıp analiz edilmesine yardımcı oldu ve insan kimyagerlerin değerlendirebileceği bilimsel bir bulguya ulaştı.
Maria Lab: Molecule.one'ın OAI-M1-03 kapsamında 10.080 reaksiyon yürüten özel yüksek verimli laboratuvarı
Organik kimya, tüm küçük moleküllü ilaçların yanı sıra tarım, elektronik ve malzeme bilimi ürünlerinin de temelini oluşturur. Bir reaksiyon özellikle çok sayıda farklı başlangıç maddesinde aynı tür kimyasal bağı güvenilir şekilde oluşturabildiğinde yararlıdır. Reaksiyonlar düşük verim sağladığında veya çok fazla istenmeyen yan ürün oluşturduğunda, kimyagerler umut vadeden moleküllerden vazgeçmek ya da farklı bir sentez yolu geliştirmek için önemli zaman harcayabilir. Bu durum, sentezi ilaç keşfinde önemli bir darboğaz haline getirir: bilim insanları genellikle yalnızca sentezleyebildikleri ya da başka bir şekilde temin edebildikleri molekülleri test edebilir.
Chan-Lam eşleşmesi, ilaç kimyasında yararlıdır çünkü ilaçlarda yaygın olarak bulunan karbon-azot bağlarını oluşturur. Ancak bu tepkime, her molekül sınıfı için aynı derecede iyi sonuç vermez. Özellikle birincil sülfonamidlerin boronik asitlerle kenetlenmesi tarihsel olarak düşük verimlerle sonuçlanmıştır. Sülfonamidler, onkoloji ve enfeksiyon hastalıklarında kullanılan ilaçların önemli bir molekül ailesidir. Bu reaksiyonun daha güvenilir hale getirilmesi, ilaç kimyagerlerine potansiyel olarak faydalı molekülleri üretmek ve keşfetmek için daha geniş ve pratik bir yol sağlayabilir.
Birleşik sistem, birbirini tamamlayan yetenekleri bir araya getirdi. Maria AI ile çalışan bilim insanları tarafından yazılan prompt, GPT‑5.4 ile birlikte binlerce olası araştırma önerisi oluşturmak ve sıralamak için bir çalışma ortamında kullanıldı. Kimyagerler, sisteme göre en üst sıralarda yer alan önerilerin küçük bir alt kümesini inceledi ve laboratuvar testleri için dördünü seçti. Maria AI, ardından seçilen üst düzey planları ayrıntılı laboratuvar talimatlarına dönüştürdü, binlerce yüksek işlem kapasiteli deney gerçekleştirdi, ham verileri analiz etti ve yapılandırılmış sonuçları GPT‑5.4'e geri gönderdi.
Seçilen dört öneriden biri olan OAI-M1-03, sülfonamid sentezi için Chan–Lam reaksiyonunun performansını artırmak amacıyla TEMPO gibi hafif oksitleyicilerin kullanılmasını önerdi. Kimyagerler bu öneriyi hem şaşırtıcı hem de ilginç buldu. OAI-M1-03'e ilişkin ayrıntılı bulguları bu blog yazısında ve makalede(yeni bir pencerede açılır) paylaşıyoruz.
Nihai araştırma önerisi, insan eliyle yapılan küçük düzeltmelerle birlikte Maria tarafından deneysel ızgaralar oluşturmak için kullanıldı. İnsanlar tarafından yapılan en büyük düzeltme, dimetil sülfoksitin (DMSO) çözücü olarak kullanılmamasına yönelikti; çünkü kimyagerler, DMSO'nun karşılaştırma için kullanılan daha güçlü oksitleyicilerle reaksiyona girebileceğinden endişe ediyordu.
Tüm süreç, 4 Mart'taki ilk prompttan OAI-M1-03 sonuçlarının 4 Haziran'da bağımsız uzmanlarla paylaşılmasına kadar üç ay sürdü.
Bu iş akışını tam otonom değil, neredeyse otonom olarak tanımlıyoruz; çünkü insan kimyagerler süreç boyunca önemli kararlar almaya devam etti. Model temel araştırma fikirlerini önerirken, insan kimyagerler üst düzey yönlendirme ve değerlendirme sağladı, deneysel ayrıntıları düzeltti, laboratuvar sarf malzemeleri ve reaktiflerin hazırlanmasına yardımcı oldu ve kilit deneyleri elle tekrarladı.
OAI-M1-03, burada incelenen birincil sülfonamid Chan-Lam eşleşmesi için TEMPO'yu yararlı bir katkı maddesi olarak tanımladı. Optimize edilmiş koşullar altında reaksiyon iki açıdan iyileşti: ortalama verim arttı ve daha fazla substrat kombinasyonu pratikte işe yarar verimlere ulaştı.
Maria iki döngüde toplam 10.080 reaksiyon gerçekleştirdi. Bu, her gün üç reaksiyon yürüten bir kimyagerin on yılda yürüteceğinden daha fazla. Bu ölçek önemliydi çünkü kimya sonuçları yalnızca birkaç örnek üzerinde test edildiğinde yanıltıcı olabilir. Bir reaksiyon, bir başlangıç maddesi çifti üzerinde umut verici görünebilirken daha geniş bir molekül setinde başarısız olabilir. Binlerce reaksiyon, test edilen on oksitleyici arasından TEMPO'yu belirlemeyi, etkisinin farklı kombinasyonlarda tekrarlandığını görmeyi ve sınırlamalarını ortaya koymayı mümkün kıldı.
İlk veri turunu analiz ettikten sonra sistem, devam niteliğindeki hipotezleri test etmek için daha odaklı ikinci bir deney turu önerdi. Devam niteliğindeki yararlı bir bulgu, TEMPO'nun performansta çok az kayıpla çok daha ucuz bir analog olan 4-hidroksi-TEMPO ile değiştirilebilmesiydi.
Sonuç, Maria Lab'in mikrolitre ölçeğindeki tarama formatının ötesinde de geçerliliğini korudu. İnsan kimyagerler, temsili reaksiyonları laboratuvar ölçeğinde manuel olarak yeniden gerçekleştirdi ve 14 substrat çiftinin 11'inde verim artışı gözlemledi; sekiz çiftte artış iki kattan fazlaydı. Bu tekrarlama önemlidir çünkü çok küçük ölçekli deneyler bazen daha büyük ölçekte ortadan kaybolan yanıltıcı izler oluşturabilir. Araştırma, bilimsel bir dergide yayınlanmadan önce laboratuvar ölçeğinde doğrulama da yaygındır.

Manuel laboratuvar ölçeğinde yapılan doğrulamadaki reaksiyon şişeleri.
Dışarıdan dört kimya uzmanı, OAI-M1-03'ü açıklayan ön baskıyı inceledi. Bu uzmanların değerlendirmeleri, sonucun yeni ve bilim camiasıyla paylaşmaya değer olduğu yönündeki görüşümüzü destekledi. Asıl sınav bundan sonra gelecek: bağımsız laboratuvarların sonucu yeniden üretebilip üretemeyeceği, kimyagerlerin de bunu daha geniş bir molekül yelpazesinde yararlı bulup bulmayacağı.
GPT‑5.4 tarafından oluşturulan ve üç aylık dönem boyunca Maria tarafından test edilen diğer üç öneriden OAI-M1-02 ve OAI-M1-04, Maria Lab'de deneysel olarak kanıtlanırken OAI-M1-01 çürütüldü. Bu sonuçların analizi devam ediyor.
Bu çalışma, bir modelin organik kimyada yararlı katkı sağlayabileceğini gösteriyor. Literatürü özetlemekten ya da tek seferlik bir deney önermekten fazlasını yaptı; belirli ve şaşırtıcı bir hipotez ortaya attı, bunu insan incelemesine sundu, deneyler tasarlayıp deneysel verileri yorumladı ve takip deneyleri tasarladı.
Bu, yapay zekanın bir kimya araştırma programını baştan sona bağımsız olarak yürütebileceğini göstermez. İnsan muhakemesi vazgeçilmez olmaya devam etti ve iş akışı, özelleşmiş yüksek işlem kapasiteli altyapıya bağlıydı. Ayrıca, yöntemin diğer eşleşme reaksiyonlarına, diğer substrat sınıflarına veya üretim koşullarına genellenebileceğini de ortaya koymaz.
Verim tahminleri yüksek verimlilikte bir platformdan elde edilip, laboratuvar doğrulaması 14 temsili substrat çiftini kapsadı. Reaksiyon mekanizmasını karakterize etmek, substrat kapsamını tanımlamak, farklı laboratuvar koşulları altında performansı ölçmek ve sonucu bağımsız olarak yeniden üretmek için daha fazla çalışmaya gerekiyor.
Kimya yetenekleri dikkatli biçimde ele alınmalıdır; çünkü tıp ve malzeme bilimini destekleyebilen aynı araçlar kötüye de kullanılabilir. Bu çalışmanın kapsamını bilinçli olarak meşru bir tıbbi kimya problemiyle sınırladık: ilaç benzeri moleküller üretmek için kullanılan, bilinen bir eşleşme reaksiyonunu iyileştirmek. Deneyler toksinleri, kimyasal silahları veya zararlı bileşikler tasarlama taleplerini içermiyordu. Bu sonuçlar, sistemin söz konusu zararlı uygulamalara yardımcı olabileceğinin kanıtı olarak yorumlanmamalıdır. Proje bunu test etmedi veya göstermedi.
Gelişmiş model yeteneklerinden kaynaklanan yeni riskleri, kimyasal ve biyolojik alanlarla ilgili riskler dahil olmak üzere Risklere Hazırlık Çerçevemiz kapsamında değerlendirip azaltıyoruz. Bu çalışmada kullanılan model, Birleşik Krallık AI Security Institute ile ilgili değerlendirmelerden zaten geçmişti ve sistem zararlı uygulamalara odaklanan istekleri reddedecek şekilde tasarlanmıştı. Deneysel iş akışı da ek bir kontrol katmanı sağladı: İnsan kimyagerler hangi önerilerin laboratuvara gireceğini seçti, deney planlarını inceledi ve fiziksel altyapının kontrolünü ellerinde tuttu.
Bunun, yapay zekanın deneysel kimyadaki potansiyelini incelemenin sorumlu yolu olduğunu düşünüyoruz: Bilimsel değeri açık bir problem alanı seçmek, model düzeyindeki koruma önlemlerini uzman gözetimiyle birleştirmek ve sistemi sınırları belirlenmiş fiziksel deneylerle değerlendirmek. Bu yetenekler geliştikçe, ortaya çıkan riskleri değerlendirmeyi, koruma tedbirlerini güçlendirmeyi ve bir sonucun neyi gösterip neyi göstermediği konusunda açık olmayı sürdüreceğiz.
Bir sonraki adımlar doğrudan bilimsel nitelikte: daha geniş bir başlangıç maddesi yelpazesini test etmek, katkı maddelerinin reaksiyonu neden iyileştirdiğini araştırmak, etkinin nerede işe yarayıp nerede başarısız olduğunu ortaya koymak ve bağımsız tekrar çalışmalarını desteklemek. Bu çalışmalar, yöntemin ne kadar geniş kapsamda uygulanabileceğini ve pratik tıbbi kimya iş akışlarında ne kadar yararlı olduğunu birlikte belirleyecektir.
Daha uzun vadeli hedefimiz, yapay zeka sistemlerini uzman değerlendirmesine, güvenilir ölçüme ve güçlü güvenlik önlemlerine dayanmaya devam ederken araştırmacıların hipotezler üretmesine, deneyler tasarlamasına, sonuçları yorumlamasına ve bir sonraki adımda neyi test edeceklerine karar vermesine yardımcı olan güvenilir bilimsel ortaklar haline getirmektir. Organik kimya, özellikle yüksek etki potansiyeline sahip bir alandır, çünkü küçük molekül keşfi ve üretimindeki ilerleme, molekülleri güvenilir biçimde üretebilmeye bağlıdır. Bilim insanları yalnızca sentezleyebildiği molekülleri test edebilir; daha iyi sentez yöntemleri ise tıp, tarım, elektronik, enerji ve malzeme bilimi alanlarında keşfedebilecekleri fikirlerin kapsamını genişletebilir. Bu sonuç, daha geniş kapsamlı bu yönelimin erken örneklerinden biridir: en üst seviye model, uzmanlaşmış ajanlar, otomatik laboratuvar ve insan kimyagerler birlikte çalışarak araştırma döngüsünde daha hızlı ilerler ve bilim camiasının değerlendirebileceği, yeniden üretebileceği ve üzerine inşa edebileceği bulgular üretir.
Molecule.one ekibine ve bu çalışmayı inceleyen bağımsız kimyagerlere minnettarız.