Un chimist IA aproape autonom îmbunătățește o reacție dificilă în chimia medicinală
Cu Maria al Molecule.one, GPT‑5.4 a identificat un aditiv surprinzător care crește randamentele cuplării Chan-Lam pentru peste 80% dintre substraturile testate.
Activitatea OpenAI în domeniul științei este motivată de o convingere simplă: IA avansată poate deveni un partener puternic pentru oamenii de știință, ajutându-i să exploreze mai multe idei, să conecteze concepte îndepărtate, să conceapă experimente mai bune și să accelereze descoperiri care aduc beneficii omenirii. Am împărtășit deja exemple timpurii de modele care contribuie la rezultate noi în matematică, inclusiv lucrări privind problema distanței unitare, în fizica teoretică, printr-un rezultat nou privind amplitudinile gluonilor, și în biologie, unde GPT‑5 a ajutat la reducerea costului sintezei proteice fără celule într-un laborator automatizat. Am introdus, de asemenea, GPT‑Rosalind, un model special conceput pentru a susține fluxurile de lucru pentru cercetarea în științele vieții și descoperirea de medicamente.
Acest proiect extinde această traiectorie în chimia medicinală, unde progresul nu poate fi măsurat doar prin raționament. O ipoteză trebuie să funcționeze în laborator cu molecule reale, instrumente și zgomot experimental. Lucrând cu Molecule.one(se deschide într-o fereastră nouă), am conectat GPT‑5.4 la Maria — o IA de chimie agentică integrată cu un laborator de mare randament pentru cercetare autonomă — și i-am dat un scop deschis: să îmbunătățească una dintre mai multe clase importante de reacții. Sistemul a generat propuneri de cercetare, a conceput și a derulat experimente, a analizat date experimentale și a propus experimente de urmărire. Oamenii au continuat să participe la proces prin elaborarea de solicitări privind orientarea și evaluarea, precum și prin selectarea propunerilor care urmau să fie testate. De asemenea, au efectuat corecții limitate ale planurilor experimentale, au ajutat la operațiuni de laborator de bază și au validat în mod independent rezultatul final.
Cea mai promițătoare propunere, OAI-M1-03, s-a concentrat pe o versiune dificilă, dar utilă, a cuplării Chan–Lam, o reacție pe care chimiștii o folosesc pentru a forma legături carbon-azot. Pornind de la obiectivul deschis de a îmbunătăți cuplarea Chan–Lam pentru chimia de proces, GPT‑5.4 a identificat în mod independent sulfonamidele primare drept o clasă de substraturi dificilă și cu valoare ridicată și a sugerat că oxidanții slabi, inclusiv TEMPO, ar putea îmbunătăți reacția.
Pe parcursul a două cicluri de experimentare în cadrul Maria Lab, acea idee a generat o îmbunătățire semnificativă. În condițiile optimizate, randamentele măsurate s-au îmbunătățit pentru 88% dintre acizii boronici testați și pentru 83% dintre sulfonamidele testate. Randamentul mediu a crescut de la 16,6% la 25,2%, iar proporția reacțiilor cu randament de peste 30% a crescut de la 15,6% la 37,5%. Chimiștii umani au repetat apoi reacțiile reprezentative la scară de laborator. Aceste experimente au confirmat rezultatele la scară de microlitri, indicând randamente mai mari pentru 11 din cele 14 perechi de substraturi, cu o creștere de peste două ori în majoritatea cazurilor. Acest lucru este important deoarece chimiștii medicinali vor reacții care să funcționeze nu doar în experimentele de screening la scară de microlitri, ci și în fluxurile de lucru practice din laborator utilizate în procesul de descoperire a medicamentelor.
Îmbunătățirile din acest domeniu al chimiei medicinale sunt deosebit de interesante, deoarece sinteza reprezintă adesea un blocaj major în descoperirea de medicamente: oamenii de știință pot testa doar moleculele pe care le pot sintetiza sau obține în alt mod. Gruparea sulfonamidă apare în medicamente într-o gamă largă de domenii terapeutice, inclusiv medicamente anticancerigene, antimicrobiene și diuretice, însă cuplarea Chan-Lam a sulfonamidelor primare cu acizii boronici a oferit, în mod tradițional, randamente scăzute. Îmbunătățirea fiabilității acestei forme a reacției le-ar putea oferi chimiștilor medicinali o modalitate mai amplă și mai practică de a produce și explora molecule potențial utile.
Deși este vorba încă de un rezultat preliminar, acesta oferă un alt exemplu concret al direcției generale spre care ne îndreptăm: sisteme de IA care pot deveni parteneri valoroși pentru oamenii de știință pe parcursul unei mari părți din ciclul de cercetare. Modelul a analizat literatura de specialitate, a propus o idee neașteptată, a ajutat la proiectarea și analiza experimentelor și a ajuns la o descoperire științifică pe care chimiștii umani o puteau evalua.
Maria Lab: Molecule.one's este un laborator specializat de mare randament care a efectuat 10 080 de reacții în cadrul OAI-M1-03
Chimia organică fundamentază toate medicamentele cu molecule mici, precum și produsele din agricultură, electronică și știința materialelor. O reacție este utilă în special atunci când poate crea același tip de legătură chimică în mod fiabil între mai multe materii prime diferite. Atunci când reacțiile generează randamente scăzute sau prea multe produse secundare nedorite, chimiștii pot fi nevoiți să renunțe la molecule care, în alte condiții, ar fi promițătoare sau să dedice mult timp dezvoltării unei căi alternative. Din acest motiv, sinteza reprezintă un blocaj major în descoperirea medicamentelor: oamenii de știință pot, în general, testa doar moleculele pe care le pot produce sau obține în alt mod.
Cuplarea Chan-Lam este utilă în chimia medicinală deoarece formează legături carbon-azot, care sunt frecvente în medicamente. Cu toate acestea, reacția nu funcționează la fel de bine pentru fiecare clasă de molecule. Cuplarea sulfonamilor primari cu acizii boronici a dus, de-a lungul timpului, la obținerea unor randamente scăzute. Sulfonamidele reprezintă o familie importantă de molecule prezente în medicamentele utilizate în oncologie și în tratamentul bolilor infecțioase. Creșterea fiabilității acestei reacții le-ar putea oferi specialiștilor în chimie medicinală o modalitate mai amplă și mai practică de a produce și investiga molecule potențial utile.
Sistemul combinat a asociat capabilități complementare. Solicitările scrise de oamenii de știință care lucrează cu Maria AI au fost utilizate cu GPT‑5.4 într-un cadru de testare pentru a genera și ierarhiza mii de potențiale propuneri de cercetare. Chimiștii umani au analizat subsetul restrâns de propuneri care s-au clasat cel mai sus conform sistemului și au selectat patru pentru teste de laborator. Maria AI a tradus apoi planurile de nivel înalt selectate în instrucțiuni detaliate de laborator, a derulat mii de experimente cu randament ridicat, a analizat datele brute și a returnat rezultate structurate către GPT‑5.4.
Una dintre cele patru propuneri selectate, OAI-M1-03, a sugerat utilizarea unor oxidanți slabi, precum TEMPO, pentru a îmbunătăți performanța reacției Chan-Lam în sinteza sulfonamidelor. Chimiștilor li s-a părut sugestia atât surprinzătoare, cât și interesantă. Împărtășim constatările detaliate din OAI-M1-03 în această postare pe blog și în articol(se deschide într-o fereastră nouă).
Propunerea finală de cercetare a fost apoi utilizată de Maria pentru a genera grile experimentale, cu corecții minore efectuate de oameni. Cea mai importantă corecție efectuată de oameni a fost evitarea utilizării dimetilsulfoxidului (DMSO) ca solvent, deoarece chimiștii se temeau că acesta ar putea reacționa cu oxidanții mai puternici folosiți ca termeni de comparație.
Întregul proces a durat trei luni, de la prima solicitare din 4 martie până la comunicarea rezultatelor OAI-M1-03 către experți independenți pe 4 iunie.
Descriem acest flux de lucru ca fiind aproape autonom, nu complet autonom, deoarece chimiștii umani au continuat să ia decizii importante pe tot parcursul procesului. Modelul a propus ideile-cheie de cercetare, în timp ce chimiștii umani au oferit îndrumare strategică și judecată de ansamblu, au corectat detaliile experimentale, au ajutat la pregătirea consumabilelor și reactivilor de laborator și au repetat manual experimentele-cheie.
OAI-M1-03 a identificat TEMPO ca fiind un aditiv util pentru reacția de cuplare primară Chan-Lam cu sulfonamide, studiată în prezentul articol. În condiții optimizate, reacția s-a îmbunătățit în două moduri: randamentul mediu a crescut, iar mai multe combinații de substraturi au atins randamente utile din punct de vedere practic.
Pe parcursul a două cicluri, Maria a efectuat în total 10.080 de reacții – mai multe decât ar efectua într-un deceniu un chimist care realizează trei reacții în fiecare zi. Această amploare a fost importantă deoarece rezultatele analizelor chimice pot fi înșelătoare atunci când se bazează doar pe câteva eșantioane. O reacție poate părea promițătoare pe o pereche de materii prime, dar poate eșua pe un set mai larg de molecule. Mii de reacții au permis identificarea TEMPO printre cei zece oxidanți testați, observarea repetării efectului în diverse combinații și identificarea limitelor sale.
După analizarea primei runde de date, sistemul a propus o a doua rundă de experimente, mai țintită, pentru a testa ipoteze ulterioare. O constatare ulterioară utilă a fost că TEMPO putea fi înlocuit cu un analog mult mai ieftin, 4-hydroxy-TEMPO, cu o pierdere redusă de performanță.
Rezultatul s-a menținut și dincolo de formatul de screening la scară de microlitri al Maria Lab. Chimiștii umani au reprodus manual reacții reprezentative la scară de laborator și au observat o creștere a randamentului pentru 11 din cele 14 perechi de substraturi; în cazul a opt perechi, creșterea a fost de peste două ori mai mare. Această replicare este importantă deoarece experimentele la scară foarte mică pot introduce uneori artefacte care dispar la o scară mai mare. De asemenea, validarea la scară de laborator este o practică obișnuită înainte ca cercetarea să fie publicată într-o revistă științifică.

Flacoane de reacție provenite din validarea manuală la scară de laborator.
Patru experți externi în chimie au analizat versiunea preliminară a articolului care descrie OAI-M1-03. Evaluările lor ne-au confirmat opinia că rezultatul era inovator și merita să fie împărtășit comunității științifice. Urmează testul mai riguros: dacă laboratoarele independente pot reproduce rezultatul și dacă chimiștii îl consideră util pentru o gamă mai largă de molecule.
Dintre celelalte trei propuneri generate de GPT‑5.4 și testate de Maria pe parcursul perioadei de trei luni, OAI-M1-02 și OAI-M1-04 au fost demonstrate experimental în Maria Lab, în timp ce OAI-M1-01 a fost infirmată. Analiza acestor rezultate este în curs de desfășurare.
Acest articol arată că un model poate aduce o contribuție utilă în chimia organică. Nu s-a limitat la simpla sinteză a literaturii de specialitate sau la sugerarea unui experiment izolat: a propus o ipoteză specifică și surprinzătoare, pe care a supus-o analizei oamenilor de știință, a conceput experimente, a interpretat datele experimentale și a elaborat experimente ulterioare.
Acest lucru nu demonstrează că IA poate derula independent un program de cercetare în chimie de la început până la sfârșit. Judecata umană a rămas esențială, iar fluxul de lucru a depins de o infrastructură specializată cu randament ridicat. De asemenea, nu demonstrează că metoda va putea fi generalizată la alte reacții de cuplare, alte clase de substraturi sau condiții de fabricație.
Estimările randamentului au provenit de la o platformă de mare randament, iar validarea în laborator a cuprins 14 perechi reprezentative de substraturi. Sunt necesare eforturi suplimentare pentru a caracteriza mecanismul de reacție, a defini gama de substraturi, a măsura performanța în diferite condiții de laborator și a reproduce rezultatul în mod independent.
Capacitățile din domeniul chimiei necesită o abordare prudentă, deoarece aceleași instrumente care pot sprijini medicina și știința materialelor ar putea fi, de asemenea, utilizate în mod abuziv. Am limitat în mod deliberat domeniul de aplicare al acestui proiect la o problemă legitimă din domeniul chimiei medicinale: îmbunătățirea unei reacții de cuplare cunoscute, utilizată pentru sinteza moleculelor cu proprietăți farmacologice. Experimentele nu au implicat toxine, arme chimice sau solicitări de proiectare a unor compuși nocivi. Aceste rezultate nu trebuie interpretate ca o dovadă că sistemul poate fi de ajutor în cazul acestor cazuri de utilizare dăunătoare. Proiectul nu a testat și nici nu a demonstrat acest lucru.
Evaluăm și atenuăm riscurile emergente generate de capacitățile avansate ale modelelor prin intermediul Cadrului de pregătire, inclusiv riscurile legate de domeniile chimice și biologice. Modelul utilizat în acest articol fusese deja supus unor evaluări relevante împreună cu Institutul pentru Securitate IA din Regatul Unit, iar sistemul a fost conceput să refuze cereile axate pe aplicații dăunătoare. Fluxul de lucru experimental a adăugat un nivel de control în plus: chimiștii umani au selectat ce propuneri au ajuns în laborator, au revizuit planurile experimentale și au păstrat controlul asupra infrastructurii fizice.
Considerăm că aceasta este modalitatea responsabilă de a studia potențialul IA în chimia experimentală: alegerea unei probleme cu o valoare științifică clară, combinarea măsurilor de siguranță la nivel de model cu supravegherea unor experți și evaluarea sistemului prin experimente fizice supuse unor constrângeri. Pe măsură ce aceste capacități se îmbunătățesc, vom continua să evaluăm riscurile emergente, să consolidăm măsurile de protecție și să precizăm clar ce implică și ce nu implică un rezultat.
Următorii pași imediați sunt de natură științifică: testarea unei game mai largi de materii prime, investigarea motivului pentru care aditivii îmbunătățesc reacția, identificarea situațiilor în care efectul funcționează și a celor în care nu funcționează, precum și sprijinirea replicării independente a experimentului. Împreună, aceste studii vor determina cât de larg poate fi aplicată metoda și cât de utilă este în fluxurile de lucru practice din chimia medicinală.
Obiectivul nostru pe termen mai lung este să facem ca sistemele de IA să devină parteneri științifici de încredere care ajută cercetătorii să genereze ipoteze, să proiecteze experimente, să interpreteze rezultate și să decidă ce să testeze în continuare, rămânând în același timp ancorate în judecata experților, în măsurători fiabile și în măsuri de protecție solide. Chimia organică este un domeniu cu un impact deosebit, deoarece progresul în descoperirea și producția de molecule mici depinde de capacitatea de a sintetiza molecule în mod fiabil. Oamenii de știință pot testa doar moleculele pe care le pot produce, iar o sinteză mai bună poate extinde gama de idei pe care le pot explora în medicină, agricultură, electronică, energie și știința materialelor. Acest rezultat este unul dintre primele exemple ale acestei direcții mai ample: un model de vârf, agenți specializați, un laborator automatizat și chimiști umani care colaborează pentru a parcurge mai rapid ciclul de cercetare și a genera rezultate pe care comunitatea științifică le poate evalua, reproduce și pe care se poate baza în continuare.
Le mulțumim echipei Molecule.one și chimiștilor independenți care au evaluat acest articol.