Gå direkt till huvudinnehåll
OpenAI

5 februari 2026

ForskningPublikation

GPT‑5 sänker kostnaden för cellfri proteinsyntes.

I samarbete med Ginkgo Bioworks skapade vi ett AI-drivet autonomt laboratorium och uppnådde en minskning på 40 % av kostnaden för proteinproduktion.

Laddar …

Vi har sett AI:s snabba framsteg inom områden som matematik och fysik, där idéer ofta kan utvärderas utan att påverka den fysiska världen. Med biologi är det annorlunda. Framsteg sker i labbet, där forskare utför experiment som kräver tid och pengar.

Det är på väg att förändras. Banbrytande modeller kan nu ansluta direkt till laboratorieautomation, föreslå experiment, köra dem i stor skala, lära sig av resultaten och bestämma vad som ska göras härnäst. Inom stora delar av livsvetenskapen utgör iteration en flaskhals, och autonoma laboratorier är byggda för att eliminera den begränsningen.

I tidigare arbete visade vi att GPT‑5 kunde förbättra våtlabbprotokoll genom experiment i en sluten återkopplingsslinga. Här visar vi att samma tillvägagångssätt kan minska kostnaden för proteinproduktion.

Vi samarbetade med Ginkgo Bioworks(öppnas i ett nytt fönster) för att koppla GPT‑5 till ett molnlaboratorium – ett automatiserat våtlabb som fjärrstyrs via programvara där robotar utför experiment och returnerar data. Den här konfigurationen med labb och slinga användes för att optimera en allmänt använd biologisk process: cellfri proteinsyntes (CFPS). Under sex omgångar av experiment med sluten återkoppling testade systemet fler än 36 000 unika CFPS-reaktionssammansättningar på 580 automatiserade plattor. Efter att ha fått tillgång till en dator, en webbläsare och relevanta artiklar genomförde GPT‑5 tre experimentomgångar för att etablera en ny SOTA-nivå inom CFPS vilket resulterade i en minskning på 40 % av proteinproduktionskostnaden (och en förbättring på 57 % av reagenskostnaden), inklusive nya reaktionssammansättningar som är mer robusta mot reaktionsförhållanden vanliga i autonoma laboratorier.

Varför cellfri proteinsyntes är viktig

Cellfri proteinsyntes (CFPS) är en metod för att producera proteiner utan att odla levande celler. Istället för att införa DNA i celler och vänta på att de ska producera ett protein, driver CFPS-proteinproduktionen i en kontrollerad blandning. Det gör det till ett praktiskt verktyg för snabb prototyputveckling och testning, eftersom forskare kan utföra många experiment snabbt och mäta resultaten samma dag.

Proteiner utgör en betydande del av vad modern biologi erbjuder. Många viktiga läkemedel baseras på proteiner. Många diagnostik- och forskningsanalyser är beroende av proteiner. I industriella miljöer fungerar proteiner som enzymer som gör kemiska processer renare och mer effektiva. Proteiner finns till och med i ditt tvättmedel. När det blir snabbare och billigare att producera proteiner kan forskare oftast testa fler idéer tidigare och minska kostnaden för att omvandla tidig forskning till något som människor kan dra nytta av varje dag.

CFPS är redan användbart för den typen av iteration. Flaskhalsen är att det är svårt att optimera och blir kostsamt i stor skala.

Cellfri proteinsyntes är svår att optimera och dyr

Cellfri proteinsyntes kräver komplexa, samverkande ingredienser: en DNA-mall som kodar proteinet som ska tillverkas, celllysat (soppan av cellmaskineri från cellernas insida) och ett stort antal biokemiska komponenter, från energikällor till salter. Det är otroligt svårt att resonera kring systemet som en helhet, och många(öppnas i ett nytt fönster) tidigare(öppnas i ett nytt fönster) studier(öppnas i ett nytt fönster) har tillämpat olika typer av maskininlärning för att minska kostnaderna för proteinproduktion.

Standardformuleringar för cellfri proteinsyntes (CFPS) och kommersiella kit har ofta priser som utgår från människans arbetstakt. Autonoma laboratorier kan utföra tusentals reaktioner på den tid det tar för ett mänskligt team att utföra ett dussintal. På den skalan blir kostnaden för reagenser den begränsande faktorn.

CFPS är också svårt att optimera endast med intuition. Det är en blandning av många interagerande komponenter. Små förändringar kan ha betydelse, men effekternas riktning är inte alltid tydlig, och de bästa kombinationerna kan vara svåra att hitta utan att genomföra många experiment. Tidigare metoder har minskat kostnaderna, men framstegen tenderar att vara gradvisa eftersom det är arbetsintensivt att utforska området noggrant.

Koppla GPT‑5 till ett robotlaboratorium

Vi kombinerade GPT‑5 med Ginkgo Bioworks molnlaboratorium för att skapa ett slutet, autonomt system för optimering av cellfri proteinsyntes (CFPS).

GPT‑5 designade experimentomgångar. Labbet genomförde dem. Resultaten matades tillbaka till modellen. Modellen använde den datan för att föreslå nästa omgång. Vi upprepade den cykeln sex gånger.

Diagram med titeln ”AI-drivet autonomt laboratorium.” GPT-5 utför dataanalys, biokemiskt resonemang och hypotesgenerering och skickar experimentupplägg till Reconfigurable Automation Carts (RAC), som utför fysiska experiment, automatiserar vätskehantering, inkuberar prover och mäter fluorescens. RAC returnerar experimentdata och mätvärden till GPT-5, vilket skapar en sluten återkopplingsslinga.

GPT‑5 utformade experimentserier i ett standardformat för 384-wellplattor och körde dem i Ginkgo Bioworks molnlaboratorium. När experimenten var avslutade skickade molnlaboratoriet tillbaka data till GPT‑5, där modellen analyserade resultaten, genererade nya hypoteser och utformade nästa omgång experiment.

För att hålla loopen förankrad i vad ett autonomt laboratorium kan göra, lade vi till strikt programmatisk validering innan något experiment utfördes. Den valideringen säkerställde att AI-designade experiment kunde utföras fysiskt på automationsplattformen. Det förhindrade ”pappersexperiment” som verkar rimliga i text men inte kan genomföras i ett robotiserat arbetsflöde.

Under hela körningen utförde systemet över 36 000 CFPS-reaktioner på 580 automatiserade plattor. Denna skala är viktig eftersom det är den som gör att mönster kan framträda. Inom biologi är enskilda experiment osäkra. Kapacitet och iteration är hur du skiljer signal från slumpmässigt brus. När GPT‑5 hade tillgång till den relevanta artikeln och verktygen krävdes det tre experimentomgångar och två månader för att etablera en ny standard: 40 % lägre kostnad för proteinproduktion jämfört med den bästa tidigare baslinjen(öppnas i ett nytt fönster).

Ginkgo Bioworks omkonfigurerbara automationsvagnar. Kredit: Ginkgo Bioworks

Vad vi lärde oss

Vi upptäckte att förbättringarna kom från att identifiera kombinationer som fungerar bra tillsammans och som håller vid hög kapacitet i automatisering.

Vi upptäckte att GPT‑5 identifierade reaktionssammansättningar till låg kostnad som människor inte hade testat tidigare i denna konfiguration. Cellfri proteinsyntes (CFPS) har studerats i flera år, men utrymmet för möjliga blandningar är fortfarande stort. När du snabbt kan föreslå och utföra tusentals kombinationer kan du hitta användbara områden som är lätta att missa med ett manuellt arbetsflöde.

Vi fann också att kapacitetsexperiment i plattformat ofta skiljer sig från manuella experiment. Syresättningen kan vara lägre i kapacitetsreaktionsformat. Blandning och geometri kan skilja sig åt. De flesta CFPS-reaktioner producerar betydligt mer protein i provrör än i mikrotiterplattor, eftersom större skalor vanligtvis innebär mer syretillgång och bättre blandning. Faktum är att för plattbaserade reaktioner vid låg volym föreslog GPT‑5 många reaktioner som presterade bättre än de tidigare bästa direkt efter att ha fått tillgång till en dator för dataanalys och en webbläsare för att söka efter relevanta artiklar. Sammantaget föreslog GPT‑5 många reagenskombinationer som presterade väl under kapacitetsbegränsningar, inklusive många som är mer robusta i syrefattiga förhållanden vanliga i automatiserade laboratoriemiljöer.

Dessutom upptäckte vi att små förändringar i buffring, energiregenereringskomponenter och polyaminer hade en oproportionerligt stor påverkan i förhållande till deras kostnad. Det här är inte alltid de första parametrarna som folk väljer, men vid hög kapacitet blir de testbara hypoteser snarare än bakgrundsantaganden.

Till slut var det själva kostnadsstrukturen som avgjorde vad som var viktigt. I CFPS domineras nu kostnaderna av lysat och DNA. Det innebär att avkastning är den mest effektiva strategin. Om du kan öka proteinutbytet per enhet av dyr indata, gör du betydande framsteg med kostnaderna redan innan du söker marginella besparingar på andra håll.

Autonom laboratorieiteration minskar kostnaderna samtidigt som proteinutbytet ökar

Under sex omgångar av autonomt experimenterande förbättrade systemet successivt cellfri proteinsyntes, vilket sänkte kostnaderna och ökade proteinutbytet. Resultaten visas som reaktionskostnad jämfört med proteintiter för varje omgång, där de bästa avvägningarna bildar en gräns. Större punkter markerar den lägsta kostnaden per gram som uppnåtts i varje omgång, och stjärn-/prickreferensen anger det tidigare SOTA-riktmärket i 384-wellplattor (Olsen et al., 2025). En närmare titt på de senare omgångarna belyser de slutliga vinsterna, och en sammanfattning per omgång visar att den bästa kostnaden per gram minskar med tiden.

Begränsningar

Dessa resultat demonstrerades på ett protein, sfGFP, och ett cellfritt proteinsyntessystem (CFPS). Generalisering till andra proteiner och andra CFPS-system måste fortfarande påvisas.

Syresättning och reaktionsgeometri kan starkt påverka utbyten, och dessa faktorer kan variera i olika skalor. Vissa förbättringar kan vara känsliga för dessa förhållanden, och att förstå dessa känsligheter är en del av vad som kommer härnäst.

Mänsklig övervakning krävdes för förbättringar av protokoll och hantering av reagenser. Systemet kan utforma och tolka experiment, men laboratoriearbete innebär fortfarande praktiska detaljer som kräver erfarna operatörer.

Vad händer härnäst?

Vi planerar att använda lab-in-the-loop-optimering på andra biologiska arbetsflöden där snabbare iteration kan leda till framsteg. Vi ser autonoma labb som ett komplement till modeller. Modeller kan generera designförslag, men i slutändan kräver biologin fortfarande testning och iteration. Att sluta cirkeln mellan skapande och experimenterande är hur du omvandlar lovande idéer till fungerande resultat.

När vi arbetar för att på ett säkert och ansvarsfullt sätt påskynda den vetenskapliga utvecklingen, strävar vi också efter att utvärdera och minska riskerna, särskilt de som rör biosäkerhet. Dessa resultat visar att modeller kan resonera i våtlabbet för att förbättra protokoll och kan ha konsekvenser för biosäkerheten som vi bedömer och mildrar genom vårt förberedelseramverk⁠. Vi är engagerade i att bygga nödvändiga och nyanserade skyddsåtgärder på modell- och systemnivå för att minska dessa risker, samt att utveckla utvärderingar för att följa upp nuvarande nivåer.

Vi tackar våra partner på Ginkgo Bioworks och de team som hjälpte till att utforma, driva och stödja det automatiserade molnlaboratoriet bakom detta arbete.

Författare

OpenAI