GPT‑5 smanjuje troškove sinteze proteina bez ćelija
Saradnjom s kompanijom Ginkgo Bioworks, kreirali smo autonomni laboratorij vođen umjetnom inteligencijom i postigli smanjenje troškova proizvodnje proteina za 40%.
Vidjeli smo brz napredak umjetne inteligencije u oblastima kao što su matematika i fizika, gdje se ideje često mogu procijeniti bez dodirivanja fizičkog svijeta. Biologija je drugačija. Napredak prolazi kroz laboratorij, gdje naučnici provode eksperimente koji zahtijevaju vrijeme i novac.
To se počinje mijenjati. Granični modeli sada se mogu direktno povezati s laboratorijskom automatizacijom, predlagati eksperimente, provoditi ih u velikom obimu, učiti iz rezultata i odlučiti šta će sljedeće uraditi. U velikom dijelu nauka o životu, usko grlo je iteracija, a autonomne laboratorije su izgrađene da uklone to ograničenje.
U ranijem radu pokazali smo da je GPT‑5 mogao poboljšati protokole mokrog laboratorija kroz eksperimentisanje u zatvorenoj petlji. Ovdje pokazujemo da isti pristup može smanjiti troškove proizvodnje proteina.
Saradnja s Ginkgo Bioworks(otvara se u novom prozoru) omogućila nam je povezivanje GPT‑5 s cloud laboratorijem—automatiziranim mokrim laboratorijem kojim se upravlja na daljinu putem softvera, gdje roboti izvode eksperimente i vraćaju podatke—i korištenje te postavke s laboratorijem u petlji za optimizaciju široko korištenog biološkog procesa: sinteze proteina bez ćelija (CFPS). Tokom šest rundi eksperimentisanja u zatvorenom krugu, sistem je testirao više od 36.000 jedinstvenih CFPS reakcijskih kompozicija na 580 automatizovanih ploča. Nakon što je omogućen pristup računaru, web pregledniku i relevantnim radovima, GPT‑5 je kroz tri runde eksperimentisanja uspio uspostaviti novi standard u niskobudžetnom CFPS-u, smanjujući troškove proizvodnje proteina za 40% (i poboljšavajući troškove reagensa za 57%), uključujući nove sastave reakcija koji su otporniji na uslove reakcije uobičajene u autonomnim laboratorijama.
Sinteza proteina bez ćelija (CFPS) je metoda proizvodnje proteina bez potrebe za uzgojem živih ćelija. Umjesto da se DNK unosi u ćelije i čeka da one proizvedu protein, CFPS pokreće mašineriju za proizvodnju proteina u kontroliranoj smjesi. To ga čini praktičnim alatom za brzo prototipiranje i testiranje, jer naučnici mogu brzo provoditi mnoge eksperimente i mjeriti rezultate istog dana.
Proteini su značajan dio onoga što moderna biologija pruža. Mnogi važni lijekovi su zasnovani na proteinima. Mnogi dijagnostički i istraživački testovi zavise od proteina. U industrijskim okruženjima, proteini djeluju kao enzimi koji čine hemijske procese čišćim i efikasnijim. Proteini se čak nalaze i u tvom deterdžentu za veš. Kada proizvodnja proteina postane brža i jeftinija, naučnici obično mogu testirati više ideja ranije i smanjiti troškove pretvaranja ranih istraživanja u nešto od čega ljudi mogu svakodnevno imati koristi.
CFPS je već koristan za takvu vrstu iteracije. Usko grlo je to što je nezgodno optimizirati i postaje skupo u velikim razmjerima.
Sinteza proteina bez ćelija zahtijeva složene, međusobno povezane sastojke: DNK šablon koji kodira protein koji treba biti proizveden, ćelijski lizat (supa ćelijske mašinerije iz unutrašnjosti ćelija) i veliki broj biohemijskih komponenti, od izvora energije do soli. Nevjerovatno je teško rezonovati o sistemu kao cjelini, a mnoge(otvara se u novom prozoru) prethodne(otvara se u novom prozoru) studije(otvara se u novom prozoru) su primijenile različite vrste mašinskog učenja kako bi smanjile troškove proizvodnje proteina.
Standardne formulacije sinteze proteina bez ćelija (CFPS) i komercijalni kompleti često su cjenovno prilagođeni za rad tempom čovjeka. Autonomne laboratorije mogu izvesti hiljade reakcija u vremenu u kojem bi ljudski tim mogao izvesti desetak. Na toj skali, trošak reagensa postaje ograničavajući faktor.
CFPS je također teško optimizirati samo na osnovu intuicije. To je smjesa mnogih međusobno djelujućih komponenti. Male promjene mogu biti važne, ali smjer učinka nije uvijek očigledan, a najbolje kombinacije može biti teško pronaći bez provođenja mnogih eksperimenata. Prethodni pristupi su smanjili troškove, ali napredak obično bude postepen jer je temeljito istraživanje prostora zahtjevno.
Spojili smo GPT‑5 s cloud laboratorijem kompanije Ginkgo Bioworks kako bismo formirali autonomni sistem zatvorene petlje za optimizaciju sinteze proteina bez ćelija (CFPS).
GPT‑5 je dizajnirao serije eksperimenata. Laboratorija ih je sprovela. Rezultati su vraćeni modelu. Model je koristio te podatke kako bi predložio sljedeću rundu. Ponovili smo taj ciklus šest puta.

GPT‑5 je dizajnirao serije eksperimenata u standardnom formatu ploče sa 384 jažice i izveo ih u cloud laboratoriju kompanije Ginkgo Bioworks. Nakon što su eksperimenti završili, laboratorija u oblaku je poslala podatke nazad u GPT‑5, gdje je model analizirao rezultate, generisao nove hipoteze i osmislio sljedeći krug eksperimenata.
Da bismo petlju držali utemeljenom u onome što autonomna laboratorija može uraditi, dodali smo strogu programsku validaciju prije nego što je bilo koji eksperiment pokrenut. Ta validacija je osigurala da su eksperimenti koje je dizajnirao AI bili fizički izvedivi na platformi za automatizaciju. Spriječilo je „eksperimente na papiru“ koji izgledaju uvjerljivo u tekstu, ali se ne mogu provesti u robotskom toku rada.
Tokom cijelog izvođenja, sistem je izvršio više od 36.000 CFPS reakcija na 580 automatiziranih ploča. Ova skala je važna jer omogućava da se obrasci pojave. U biologiji, pojedinačni eksperimenti su bučni. Protok i iteracija su način na koji se razdvaja signal od nasumičnog šuma. Kada je GPT‑5 dobio pristup relevantnom radu i alatima, bile su potrebne tri runde eksperimentisanja i dva mjeseca da se uspostavi novo stanje tehnike: 40% niži trošak proizvodnje proteina u poređenju s najboljom prethodnom osnovom(otvara se u novom prozoru).
Ginkgo Bioworksova rekonfigurabilna automatizacijska kolica. Zasluge: Ginkgo Bioworks
Otkrili smo da su poboljšanja proizašla iz identifikacije kombinacija koje dobro funkcionišu zajedno i koje se održavaju u stvarnostima automatizacije visokog protoka.
Otkrili smo da je GPT‑5 identificirao jeftine reakcijske kompozicije koje ljudi ranije nisu testirali u ovoj konfiguraciji. Sinteza proteina bez ćelija (CFPS) se proučava već godinama, ali prostor mogućih mješavina je još uvijek velik. Kada možete brzo predložiti i izvršiti hiljade kombinacija, možete pronaći funkcionalna područja koja je lako propustiti uz ručni tok rada.
Također smo otkrili da se eksperimenti visokog protoka, koji se izvode na pločama, često razlikuju od ručnih eksperimenata na laboratorijskom stolu. Oksigenacija može biti niža u formatima reakcija visokog protoka. Miješanje i geometrija mogu biti različiti. Većina CFPS reakcija proizvodi znatno više proteina u epruvetama nego u mikrotitarskim pločama, jer veće količine obično omogućavaju bolju dostupnost kisika i bolje miješanje. Zapravo, za reakcije na pločama pri malim volumenima, GPT‑5 je predložio mnoge reakcije koje su odmah nadmašile prethodne najbolje nakon što je dobio pristup računaru za analizu podataka i web pretraživaču za traženje relevantnih radova. Sveukupno, GPT‑5 je predložio mnoge kombinacije reagensa koje su se dobro pokazale pod ograničenjima visokog protoka, uključujući mnoge koje su robusnije u uslovima niske koncentracije kisika, što je uobičajeno u automatiziranim laboratorijskim okruženjima.
Osim toga, otkrili smo da su male promjene u puferiranju, komponentama za regeneraciju energije i poliaminima imale nesrazmjerno velik utjecaj u odnosu na njihov trošak. Ovo nisu uvijek prvi parametri za kojima ljudi posežu, ali pri visokom protoku postaju provjerljive hipoteze, a ne pretpostavke u pozadini.
Na kraju, sama struktura troškova oblikovala je ono što je bilo važno. U CFPS-u, troškovima sada dominiraju lizat i DNK. To znači da je yield strategija s najvećim učinkom. Ako možete povećati proizvodnju proteina po jedinici skupog unosa, postižete značajan napredak u smanjenju troškova čak i prije nego što počnete tražiti marginalne uštede na drugim mjestima.
Kroz šest rundi autonomnog eksperimentisanja, sistem je kontinuirano unapređivao sintezu proteina bez ćelija, smanjujući troškove dok je istovremeno povećavao prinos proteina. Rezultati su prikazani kao trošak reakcije u odnosu na titar proteina za svaki krug, pri čemu najbolji kompromisi formiraju granicu. Veće tačke označavaju najniži trošak po gramu postignut u svakoj rundi, a referenca sa zvjezdicom/tačkicama označava prethodno vrhunsko mjerilo u pločama sa 384 jažice (Olsen et al., 2025.) Detaljniji pregled kasnijih rundi ističe konačne dobitke, a sažetak po rundama pokazuje da se najbolji trošak po gramu smanjuje s vremenom.
Ovi rezultati su prikazani na jednom proteinu, sfGFP, i jednom sistemu za sintezu proteina bez ćelija (CFPS). Generalizaciju na druge proteine i druge CFPS sisteme još treba pokazati.
Oksigenacija i geometrija reakcije mogu snažno uticati na prinose, a ovi faktori mogu varirati u zavisnosti od razmjera. Neka poboljšanja mogu biti osjetljiva na ove uvjete, a razumijevanje tih osjetljivosti je dio onoga što slijedi.
Ljudski nadzor bio je potreban za unapređenje protokola i rukovanje reagensima. Sistem može dizajnirati i interpretirati eksperimente, ali laboratorijski rad i dalje uključuje praktične detalje koji zahtijevaju iskusne operatere.
Planiramo primijeniti optimizaciju laboratorija u petlji na druge biološke tokove rada gdje brža iteracija može omogućiti napredak. Autonomne laboratorije vidimo kao komplementarne modelima. Modeli mogu generirati dizajne, ali na kraju biologija i dalje zahtijeva testiranje i iteraciju. Zatvaranje kruga između generisanja i eksperimentisanja je način na koji obećavajuće ideje pretvarate u rezultate koji rade.
Dok radimo na ubrzanju naučnog napretka na siguran i odgovoran način, takođe nastojimo procijeniti i smanjiti rizike, posebno one povezane sa biosigurnošću. Ovi rezultati pokazuju da modeli mogu rezonovati u mokrom laboratoriju kako bi poboljšali protokole, i mogu imati implikacije za biobezbjednost koje procjenjujemo i ublažavamo kroz naš Okvir pripravnosti. Posvećeni smo izgradnji potrebnih i nijansiranih zaštitnih mjera na nivou modela i sistema kako bismo smanjili ove rizike, kao i razvoju evaluacija za praćenje trenutnih nivoa.
Zahvalni smo našim partnerima u Ginkgo Bioworks i timovima koji su pomogli u dizajniranju, vođenju i podršci automatiziranog laboratorija u oblaku koji stoji iza ovog rada.


