17. juni 2026

En næsten autonom AI-kemiker forbedrer en udfordrende reaktion i medicinalkemi

Med Molecule.ones Maria fandt GPT‑5.4 et overraskende additiv, der øgede udbytterne af Chan-Lam-kobling for over 80 % af de testede substrater.

Læs artiklen Læs den forkortede tankerække

OpenAIs arbejde inden for videnskab er motiveret af en enkel overbevisning: Avanceret AI kan blive en stærk partner for forskere og hjælpe dem med at udforske flere idéer, forbinde fjerntliggende begreber, designe bedre eksperimenter og fremskynde opdagelser, der gavner menneskeheden. Vi har allerede delt tidlige eksempler på modeller, der bidrager til nye resultater i matematik, herunder arbejde med enhedsafstandsproblemet⁠, i teoretisk fysik gennem et nyt resultat om gluonamplituder⁠ og i biologi, hvor GPT‑5 hjalp med at sænke omkostningerne ved cellefri proteinsyntese⁠ i et automatiseret laboratorium. Vi introducerede også GPT‑Rosalind⁠, en specialbygget model til at understøtte forskning i biovidenskab og arbejdsgange for lægemiddeludvikling.

Dette projekt fører denne udviklingslinje videre ind i medicinalkemi, hvor fremskridt ikke kan måles ved ræsonnering alene. En hypotese skal fungere i laboratoriet med virkelige molekyler, instrumenter og eksperimentel støj. I samarbejde med Molecule.one⁠(åbner i et nyt vindue) forbandt vi GPT‑5.4 med Maria, som er en agentbaseret kemi-AI integreret med et laboratorium med højt gennemløb til autonom forskning, og gav den et åbent mål: at forbedre en af flere vigtige reaktionsklasser. Systemet genererede forskningsforslag, designede og udførte eksperimenter, analyserede eksperimentelle data og foreslog opfølgende eksperimenter. Mennesker forblev en del af processen ved at udforme styrings- og bedømmelsesprompts og udvælge forslag, der skulle testes. De foretog også begrænsede rettelser af forsøgsplaner, assisterede med grundlæggende laboratoriedrift og validerede selvstændigt det endelige resultat.

Det mest lovende forslag, OAI-M1-03, fokuserede på en vanskelig, men nyttig version af Chan–Lam-kobling, en reaktion som kemikere bruger til at danne kulstof-kvælstof-bindinger. Med udgangspunkt i det åbne mål om at forbedre Chan–Lam-kobling til proceskemi identificerede GPT‑5.4 selvstændigt primære sulfonamider som en udfordrende substratklasse med høj værdi og foreslog, at milde oxidanter, herunder TEMPO, kunne forbedre reaktionen.

På tværs af to eksperimentcyklusser i Maria Lab førte den idé til en betydelig forbedring. Under de optimerede betingelser blev de målte udbytter forbedret for 88 % af de testede boronsyrer og 83 % af de testede sulfonamider. Det gennemsnitlige udbytte steg fra 16,6 % til 25,2 %, og andelen af reaktioner med over 30 % udbytte steg fra 15,6 % til 37,5 %. Menneskelige kemikere gentog derefter repræsentative reaktioner i laboratorie-skala. Disse eksperimenter bekræftede resultaterne i mikroliterskala og viste højere udbytter for 11 af 14 substratpar, med en mere end fordobling i de fleste tilfælde. Det er vigtigt, fordi medicinalkemikere har brug for reaktioner, der ikke kun fungerer i screeningeksperimenter i mikroliterskala, men også i praktiske laboratoriearbejdsgange, der bruges under lægemiddeludvikling.

Forbedringer på dette område af medicinalkemi er særligt spændende, fordi syntese ofte er en stor flaskehals i lægemiddeludvikling: Forskere kan kun teste de molekyler, de kan fremstille eller på anden måde skaffe. Sulfonamidgruppen optræder i lægemidler på tværs af en bred vifte af terapeutiske områder, herunder kræftlægemidler, antimikrobielle midler og diuretika, men Chan–Lam-koblingen af primære sulfonamider med boronsyrer har historisk givet lave udbytter. At gøre denne form for reaktionen mere pålidelig kan give medicinalkemikere en bredere og mere praktisk måde at fremstille og udforske potentielt nyttige molekyler på.

Selvom dette stadig er et tidligt resultat, giver det endnu et konkret eksempel på den bredere retning, vi arbejder hen imod: AI-systemer, der kan blive værdifulde partnere for forskere i store dele af forskningscyklussen. Modellen gennemgik litteraturen, foreslog en uventet idé, hjalp med at designe og analysere eksperimenter og nåede frem til et videnskabeligt fund, som menneskelige kemikere kunne evaluere.

Maria Lab: Molecule.one's specialiseret laboratorium med højt gennemløb, der kørte 10.080 reaktioner i OAI-M1-03

Hvorfor kemiproblemet er vigtigt

Organisk kemi ligger til grund for alle småmolekylære lægemidler samt produkter inden for landbrug, elektronik og materialevidenskab. En reaktion er særligt nyttig, når den pålideligt kan skabe den samme type kemiske binding på tværs af mange forskellige udgangsmaterialer. Når reaktioner giver lave udbytter eller for mange uønskede biprodukter, kan kemikere være nødt til at opgive ellers lovende molekyler eller bruge betydelig tid på at udvikle en anden rute. Det gør syntese til en stor flaskehals i lægemiddeludvikling: Forskere kan generelt kun teste de molekyler, de kan fremstille eller på anden måde skaffe.

Chan–Lam-kobling er nyttig i medicinalkemi, fordi den danner kulstof-kvælstof-bindinger, som er almindelige i lægemidler. Reaktionen fungerer dog ikke lige godt for alle molekyleklasser. Især har kobling af primære sulfonamider med boronsyrer historisk givet lave udbytter. Sulfonamider er en vigtig familie af molekyler, der findes i lægemidler anvendt i onkologi og infektionssygdomme. At gøre denne reaktion mere pålidelig kan give medicinalkemikere en bredere og mere praktisk måde at fremstille og udforske potentielt nyttige molekyler på.

Tilkobling af GPT‑5.4 til Maria AI og Lab

Det kombinerede system forenede komplementære kapaciteter. Prompts skrevet af forskere, der arbejdede med Maria AI, blev brugt med GPT‑5.4 i en ramme til at generere og rangordne tusindvis af mulige forskningsforslag. Menneskelige kemikere gennemgik den lille delmængde af forslag, som systemet rangerede højest, og udvalgte fire til laboratorietest. Maria AI omsatte derefter udvalgte planer på højt niveau til detaljerede laboratorieinstruktioner, kørte tusindvis af højgennemløbseksperimenter, analyserede de rå data og returnerede strukturerede resultater til GPT‑5.4.

Et af de fire udvalgte forslag, OAI-M1-03, foreslog at bruge milde oxidationsmidler såsom TEMPO til at forbedre Chan-Lam-reaktionens ydeevne ved sulfonamidsyntese. Kemikere fandt forslaget både overraskende og interessant. Vi deler de detaljerede resultater fra OAI-M1-03 i dette blogindlæg og i artiklen⁠(åbner i et nyt vindue). Vi deler også den omskrevne tankerække-model for OAI-M1-03⁠(åbner i et nyt vindue).

Det endelige forskningsforslag blev derefter brugt af Maria til at generere eksperimentelle gitre, med små rettelser fra mennesker. Den største menneskelige rettelse var at undgå dimethylsulfoxid, eller DMSO, som opløsningsmiddel, fordi kemikerne var bekymrede for, at det kunne reagere med de stærkere oxidanter, der blev brugt som sammenligninger.

Hele processen tog tre måneder, fra den første prompt den 4. marts til delingen af OAI-M1-03-resultaterne med uafhængige eksperter den 4. juni.

Vi beskriver denne arbejdsgang som næsten autonom, ikke fuldt autonom, fordi menneskelige kemikere stadig traf vigtige beslutninger gennem hele processen. Modellen foreslog de centrale forskningsidéer, mens menneskelige kemikere leverede styring og vurdering på højt niveau, rettede eksperimentelle detaljer, hjalp med at forberede laboratorieforbrugsvarer og reagenser og gentog centrale eksperimenter i hånden.

Hvad vi fandt

OAI-M1-03 identificerede TEMPO som et nyttigt additiv til den primære sulfonamid-Chan-Lam-kobling, der er undersøgt her. Under de optimerede betingelser blev reaktionen forbedret på to måder: Det gennemsnitlige udbytte steg, og flere substratkombinationer nåede praktisk nyttige udbytter.

På tværs af to cyklusser kørte Maria i alt 10.080 reaktioner – mere end en kemiker, der kørte tre reaktioner hver dag, ville køre på et årti. Den skala var vigtig, fordi kemiresultater kan være vildledende, når de kun testes på få eksempler. En reaktion kan se lovende ud på ét par udgangsmaterialer, men fejle på tværs af et bredere sæt molekyler. Tusindvis af reaktioner gjorde det muligt at identificere TEMPO blandt ti testede oxidanter, se effekten gentage sig på tværs af forskellige kombinationer og finde dens begrænsninger.

Efter at have analyseret den første datarunde foreslog systemet en mere fokuseret anden runde af eksperimenter for at teste opfølgende hypoteser. Et nyttigt opfølgende fund var, at TEMPO kunne erstattes af en langt billigere analog, 4-hydroxy-TEMPO, med kun lille tab af ydeevne.

Diagram, der sammenligner ydeevnen for TEMPO, 4-hydroxy-TEMPO, 4-oxo-TEMPO og PMP med kemiske strukturer.

Resultatet holdt også ud over Maria Labs screeningsformat i mikroliterskala. Menneskelige kemikere reproducerede repræsentative reaktioner manuelt i laboratorieskala og observerede en stigning i udbytte for 11 af 14 substratpar; for otte par var stigningen større end tofold. Den replikation er vigtig, fordi eksperimenter i meget lille skala nogle gange kan introducere artefakter, der forsvinder i større skala. Validering i laboratorie-skala er også sædvanlig, før forskning offentliggøres i et videnskabeligt tidsskrift.

Mærkede reaktionshætteglas fra Molecule.ones valideringseksperimenter i laboratorie-skala.

Reaktionshætteglas fra den manuelle validering i laboratorieskala.

TEMPO forbedrer produktdannelse i laboratorie-skala

Fire eksterne kemieksperter gennemgik preprintet, der beskriver OAI-M1-03. Deres vurderinger understøttede vores opfattelse af, at resultatet var nyt og værd at dele med det videnskabelige samfund. Den stærkere test kommer nu: om uafhængige laboratorier kan reproducere resultatet, og om kemikere finder det nyttigt på tværs af et bredere udvalg af molekyler.

“Sammenlægningen af højgennemløbseksperimentering og moderne AI repræsenterer en ny frontlinje for videnskabelig opdagelse. Denne nye reaktion er en stærk demonstration, hvor usædvanligt milde betingelser og en praktisk oxidant muliggør et fint og generelt substratomfang for en af de mere populære reaktioner i lægemiddelsyntese.”

—Tim Cernak, lektor i medicinalkemi, University of Michigan

Af de tre andre forslag, der blev genereret af GPT‑5.4 og testet af Maria i løbet af tremånedersperioden, blev OAI-M1-02 og OAI-M1-04 eksperimentelt bevist i Maria Lab, mens OAI-M1-01 blev modbevist. Analysen af disse resultater er i gang.

Begrænsninger

Dette arbejde viser, at en model kan yde et nyttigt bidrag i organisk kemi. Den gjorde mere end at opsummere litteraturen eller foreslå et enkeltstående eksperiment: Den foreslog en specifik, overraskende hypotese og bragte den frem til menneskelig gennemgang, designede eksperimenter, fortolkede eksperimentelle data og designede opfølgende eksperimenter.

Det viser ikke, at AI selvstændigt kan drive et kemisk forskningsprogram fra start til slut. Menneskelig dømmekraft forblev afgørende, og arbejdsgangen afhang af specialiseret højgennemløbsinfrastruktur. Det fastslår heller ikke, at metoden kan generaliseres til andre koblingsreaktioner, andre substratklasser eller produktionsbetingelser.

Udbytteestimaterne kom fra en højgennemløbsplatform, og bench-valideringen omfattede 14 repræsentative substratpar. Der er behov for mere arbejde for at karakterisere reaktionsmekanismen, definere substratomfanget, måle ydeevnen under forskellige laboratoriebetingelser og reproducere resultatet uafhængigt.

Beredskab

Kemi-kapaciteter kræver omhyggelig behandling, fordi de samme værktøjer, der kan understøtte medicin og materialevidenskab, også kan misbruges. Vi afgrænsede bevidst dette arbejde til et legitimt medicinalkemisk problem: at forbedre en kendt koblingsreaktion, der bruges til at fremstille lægemiddellignende molekyler. Eksperimenterne involverede ikke toksiner, kemiske våben eller anmodninger om at designe skadelige forbindelser. Disse resultater bør ikke læses som bevis for, at systemet kan hjælpe med sådanne skadelige anvendelser. Projektet testede eller demonstrerede ikke det.

Vi vurderer og afbøder nye risici fra avancerede modelfunktioner gennem vores Preparedness Framework⁠, herunder risici relateret til kemiske og biologiske domæner. Den model, der blev anvendt i dette arbejde, havde allerede gennemgået relevante evalueringer hos UK AI Security Institute, og systemet var designet til at afvise anmodninger, der fokuserede på skadelige anvendelser. Den eksperimentelle arbejdsgang tilføjede endnu et kontrolniveau: kemikere udvalgte, hvilke forslag der blev ført videre til laboratoriet, gennemgik eksperimentelle planer og bevarede kontrollen over den fysiske infrastruktur.

Vi mener, at dette er den ansvarlige måde at studere AI's potentiale i eksperimentel kemi på: Vælg et problemområde med klar videnskabelig værdi, kombiner sikkerhedsforanstaltninger på modelniveau med ekspertovervågning, og evaluer systemet gennem afgrænsede fysiske eksperimenter. Efterhånden som disse kapaciteter forbedres, vil vi fortsætte med at vurdere nye risici, styrke sikkerhedsforanstaltninger og være specifikke om, hvad et resultat indebærer og ikke indebærer.

Hvad bliver det næste

De umiddelbare næste skridt er videnskabelige: Test et bredere udvalg af udgangsmaterialer, undersøg hvorfor additiverne forbedrer reaktionen, kortlæg hvor effekten virker og fejler, og understøt uafhængig replikation. Tilsammen vil disse studier afgøre, hvor bredt metoden kan anvendes, og hvor nyttig den er i praktiske arbejdsgange inden for medicinalkemi.

Vores langsigtede mål er at gøre AI-systemer til pålidelige videnskabelige partnere, der hjælper forskere med at generere hypoteser, designe eksperimenter, fortolke resultater og beslutte, hvad der skal testes som det næste, samtidig med at de forbliver forankret i ekspertvurdering, pålidelig måling og stærke sikkerhedsforanstaltninger. Organisk kemi er et område med særligt stor løftestangseffekt, fordi fremskridt i opdagelse og fremstilling af små molekyler afhænger af, at man kan fremstille molekyler pålideligt. Forskere kan kun teste molekyler, de kan fremstille, og bedre syntese kan udvide det udvalg af idéer, de kan udforske på tværs af medicin, landbrug, elektronik, energi og materialevidenskab. Dette resultat er et tidligt eksempel på den bredere retning: en frontier-model, specialiserede agenter, et automatiseret laboratorium og menneskelige kemikere, der arbejder sammen om at bevæge sig hurtigere gennem forskningscyklussen og producere fund, som det videnskabelige samfund kan evaluere, reproducere og bygge videre på.

Vi er taknemmelige over for Molecule.one-teamet og de uafhængige kemikere, der gennemgik dette arbejde.

2026

Skrevet af

OpenAI