Hopp til hovedinnhold
OpenAI

5. februar 2026

ResearchPublikasjon

GPT‑5 reduserer kostnadene for cellefri proteinsyntese

Vi opprettet et KI-drevet autonomt laboratorium i samarbeid med Ginkgo Bioworks, og oppnådde en 40 % reduksjon i kostnadene for proteinproduksjon.

Laster inn …

Vi har observert rask fremgang fra KI innen felt som matematikk og fysikk, der ideer ofte kan evalueres uten å berøre den fysiske verden. Biologi er annerledes. Fremskritt skjer i laboratoriet, der forskere utfører eksperimenter som krever tid og penger.

Det begynner å forandre seg. Grensemodeller kan nå koble direkte til laboratorieautomatisering, foreslå eksperimenter, kjøre dem i stor skala, lære av resultatene og avgjøre hva som må gjøres videre. Iterasjon er flaskehalsen i store deler av livsvitenskap, og autonome laboratorier er konstruert for å eliminere denne begrensningen.

I tidligere arbeid viste vi at GPT‑5 kunne forbedre våtlabprotokoller gjennom eksperimentering i en lukket sløyfe. Her viser vi at den samme tilnærmingen kan redusere kostnadene for proteinproduksjon.

Vi samarbeidet med Ginkgo Bioworks(åpnes i et nytt vindu) for å koble GPT‑5 til et skylaboratorium – et automatisert våtlaboratorium som drives eksternt via programvare, der roboter utfører eksperimenter og returnerer data – og brukte denne konfigurasjonen med laboratorier i sløyfe til å optimalisere en mye brukt biologisk prosess: cellefri proteinsyntese (CFPS). Gjennom seks runder med eksperimentering i lukket sløyfe testet systemet mer enn 36 000 unike CFPS-reaksjonssammensetninger på tvers av 580 automatiserte plater. Etter å ha fått tilgang til en datamaskin, en nettleser og relevante artikler, brukte GPT‑5 tre runder med eksperimentering til å etablere en ny toppmoderne standard innen CFPS med lave kostnader, og oppnådde en reduksjon på 40 % i kostnadene for proteinproduksjon (samt en forbedring på 57 % i kostnadene for reagenser), inkludert nye reaksjonssammensetninger som er mer robuste mot reaksjonsbetingelser som er vanlige i autonome laboratorier.

Hvorfor cellefri proteinsyntese er viktig

Cellefri proteinsyntese (CFPS) er en metode for å produsere proteiner uten å dyrke levende celler. I stedet for å sette DNA inn i celler og vente på at de skal produsere et protein, driver CFPS proteinproduksjon i en kontrollert blanding. Det gjør det til et praktisk verktøy for rask prototyping og testing, siden forskere kan utføre mange eksperimenter raskt og måle resultater samme dag.

Proteiner er en stor del av det som leveres av moderne teknologi. Mange viktige medisiner er basert på proteiner. Mange diagnostiske vurderinger og forskningsanalyser er avhengige av proteiner. I industrimiljøer fungerer proteiner som enzymer som gjør kjemiske prosesser renere og mer effektive. Proteiner finnes til og med i vaskemiddelet ditt. Når proteinproduksjon blir raskere og billigere, kan forskere vanligvis teste flere ideer tidligere og redusere kostnadene ved å gjøre tidlig forskning om til noe som folk kan dra nytte av i hverdagen.

CFPS er allerede nyttig for den typen iterasjon. Flaskehalsen er at det er vanskelig å optimalisere, og at det blir kostbart i stor skala.

Cellefri proteinsyntese er vanskelig å optimalisere og kostbar

Cellefri proteinsyntese krever komplekse, samhandlende ingredienser: DNA-malen som koder proteinet som skal produseres, cellelysatet (stoffet av cellulært maskineri fra innsiden av celler) og et stort antall biokjemiske komponenter som spenner fra energikilder til salter. Det er utrolig vanskelig å resonnere om systemet som en helhet, og mange(åpnes i et nytt vindu) tidligere(åpnes i et nytt vindu) studier(åpnes i et nytt vindu) har brukt ulike typer maskinlæring for å redusere kostnadene for proteinproduksjon.

Standard formuleringer for cellefri proteinsyntese (CFPS) og kommersielle sett er ofte priset for arbeid i et tempo tilpasset mennesker. Autonome laboratorier kan utføre tusenvis av reaksjoner på samme tid som et team av mennesker kanskje kunne utført et par dusin. I denne skalaen blir kostnaden for reagenser en begrensende faktor.

CFPS er også vanskelig å optimalisere utelukkende ved intuisjon. Det er en blanding av mange samhandlende komponenter. Små endringer kan ha stor betydning, men retningen på effekten er ikke alltid åpenbar, og de beste kombinasjonene kan være vanskelige å finne uten å kjøre mange eksperimenter. Tidligere tilnærminger har redusert kostnadene, men fremdriften har en tendens til å være trinnvis fordi en grundig utforskning av området er arbeidskrevende.

Koble GPT‑5 til et robotlaboratorium

Vi koblet GPT‑5 med Ginkgo Bioworks’ skylaboratorium for å danne et autonomt system i en lukket sløyfe for å optimalisere cellefri proteinsyntese (CFPS).

GPT‑5 utviklet grupper av eksperimenter. Laboratoriet utførte dem. Resultatene ble matet tilbake til modellen. Modellen brukte dataene til å foreslå neste runde. Vi gjentok denne syklusen seks ganger.

Diagram med tittelen «AI-driven autonomous lab.» GPT-5 utfører dataanalyse, biokjemisk resonnering og hypotesegenerering, og sender eksperimentelle design til Reconfigurable Automation Carts (RAC-er), som utfører fysiske eksperimenter, automatiserer væskehåndtering, inkuberer prøver og måler fluorescens. RAC-er returnerer eksperimentelle data og målinger til GPT-5, og danner en lukket tilbakemeldingssløyfe.

GPT‑5 utformet serier med eksperimenter i et standard 384-brønnsplateformat, og kjørte dem på Ginkgo Bioworks’ skylaboratorium. Når eksperimentene var fullført, sendte skylaboratoriet dataene tilbake til GPT‑5, der modellen analyserte resultatene, genererte nye hypoteser og planla neste runde med eksperimenter.

For å holde sløyfen forankret i det et autonomt laboratorium kan gjøre, la vi til streng programmatisk validering før et eksperiment ble kjørt. Denne valideringen sørget for at KI-utviklede eksperimenter kunne utføres fysisk på automatiseringsplattformen. Det forhindret «papireksperimenter» som virker logiske i tekst, men som ikke kan utføres i en robotisert arbeidsflyt.

Systemet utførte mer enn 36 000 CFPS-reaksjoner på tvers av 580 automatiserte plater gjennom hele kjøringen. Denne skalaen er viktig fordi det er denne som gjør det mulig å oppdage mønstre. Enkeltstående biologiske eksperimenter kan skape støy. Gjennomstrømming og iterasjon må brukes for å skille signal fra tilfeldig støy. Når GPT‑5 fikk tilgang til den relevante artikkelen og verktøyene, tok det tre runder med eksperimentering og to måneder å etablere en ny toppmoderne standard: 40 % lavere kostnad for proteinproduksjon sammenlignet med beste tidligere referanse(åpnes i et nytt vindu).

Ginkgo Bioworks’ rekonfigurerbare automasjonsvogner. Kreditering: Ginkgo Bioworks

Dette har vi lært

Vi oppdaget at forbedringene skyldtes identifisering av kombinasjoner som fungerer godt sammen og tåler høy automatisering av gjennomstrømming.

Vi oppdaget at GPT‑5 identifiserte reaksjonssammensetninger med en lav kostnad som mennesker ikke tidligere hadde testet i denne konfigurasjonen. Cellefri proteinsyntese (CFPS) har blitt studert i mange år, men mulighetene for blandinger er fortsatt mange. Når du raskt kan foreslå og utføre tusenvis av kombinasjoner, kan du finne fungerende områder som enkelt kan overses i en manuell arbeidsflyt.

Vi oppdaget også at platebaserte eksperimenter med høy gjennomstrømming ofte skiller seg fra manuelle benkeksperimenter. Oksygenering kan være lavere i reaksjonsformater med høy gjennomstrømming. Blanding og geometri kan være forskjellige. De fleste CFPS-reaksjoner produserer mye mer protein i reagensrør enn i mikrotiterplater, fordi større skalaer generelt gir mer oksygentilgjengelighet og bedre blanding. For platebaserte reaksjoner ved lavt volum, foreslo GPT‑5 faktisk mange reaksjoner som presterte bedre enn den tidligere beste umiddelbart etter å ha fått tilgang til en datamaskin for dataanalyse og en nettleser for å søke etter relevante artikler. Generelt foreslo GPT‑5 mange reagenskombinasjoner som fungerte godt under høye gjennomstrømmingsbegrensninger, inkludert mange som er mer robuste i forhold med lite oksygen som er vanlige i automatiserte laboratoriemiljøer.

I tillegg oppdaget vi at små endringer i buffering, energigjenvinningskomponenter og polyaminer hadde en uforholdsmessig stor effekt i forhold til kostnadene. Disse er ikke alltid de første parameterne folk bruker, men ved høy gjennomstrømming blir de hypoteser som kan testes, snarere enn bakgrunnsantakelser.

Til slutt var det kostnadsstrukturen som bestemte hva som var viktig. I CFPS styres kostnadene nå av lysat og DNA. Det betyr at utbytte er den mest innflytelsesrike strategien. Hvis du kan øke proteinutbyttet per enhet av kostbare inndata, gjør du betydelig fremgang på kostnadene selv før du prøver å identifisere marginale besparelser andre steder.

Autonom laboratorieiterasjon reduserer kostnader samtidig som proteinutbyttet økes

Gjennom seks runder med autonom eksperimentering forbedret systemet jevnt og trutt cellefri proteinsyntese, og reduserte kostnadene samtidig som proteinutbyttet økte. Resultatene vises som reaksjonskostnad sammenlignet med proteintiter for hver runde, der de beste avveiningene danner en grense. Større punkter markerer den laveste kostnaden per gram oppnådd i hver runde, og stjerne-/prikkreferansen angir den tidligere toppmoderne referanseverdien i 384-brønnsplater (Olsen et al., 2025). En nærmere titt på de senere rundene fremhever de endelige gevinstene, og et rundebasert sammendrag viser at den beste kostnaden per gram reduseres over tid.

Begrensninger

Disse resultatene ble vist på ett protein, sfGFP, og ett cellefritt proteinsyntesesystem (CFPS). Generalisering til andre proteiner og andre CFPS-systemer må fortsatt demonstreres.

Oksygenering og reaksjonsgeometri kan i stor grad påvirke utbyttet, og disse faktorene kan variere på tvers av skalaer. Visse forbedringer kan være følsomme for disse betingelsene, og å forstå disse følsomhetene er en del av det som kommer.

Menneskelig tilsyn var nødvendig for å forbedre protokoller og håndtere reagenser. Systemet kan utforme og tolke eksperimenter, men laboratoriearbeid innebærer fortsatt praktiske detaljer som krever erfarne operatører.

Hva skjer videre?

Vi planlegger å anvende optimalisering med sløyfesystemet for laboratorier på andre biologiske arbeidsflyter der raskere iterasjon kan åpne for fremskritt. Vi ser autonome laboratorier som komplementære til modeller. Modeller kan generere design, men til syvende og sist krever biologi fortsatt testing og iterasjon. Ved å lukke sløyfen mellom generering og eksperimentering, kan du gjøre lovende ideer om til fungerende resultater.

Når vi jobber for å akselerere vitenskapelig fremgang på en trygg og ansvarlig måte, ønsker vi også å evaluere og redusere risikoer, spesielt de som er knyttet til biosikkerhet. Disse resultatene viser at modeller kan resonnere i våtlaben for å forbedre protokoller, og kan ha implikasjoner for biosikkerhet som vi vurderer og reduserer gjennom Preparedness Framework⁠. Vi er forpliktet til å bygge⁠ nødvendige og nyanserte sikkerhetstiltak på modell- og systemnivå for å redusere disse risikoene, samt utvikle evalueringer for å spore nåværende nivåer.

Vi er takknemlige for partnere våre hos Ginkgo Bioworks og teamene som hjalp til med å utvikle, drive og støtte det automatiserte skylaboratoriet bak dette arbeidet.

Forfatter

OpenAI