GPT‑5 znižuje náklady na syntézu proteínov bez buniek.
V spolupráci so spoločnosťou Ginkgo Bioworks sme vytvorili laboratórium poháňané umelou inteligenciou a dosiahli sme 40 % zníženie nákladov na produkciu proteínov.
Zaznamenali sme rýchly pokrok v oblasti umelej inteligencie v oblastiach ako matematika a fyzika, kde sa myšlienky často dajú vyhodnotiť bez dotyku s fyzickým svetom. Biológia je iná. Pokrok sa uskutočňuje v laboratóriu, kde vedci vykonávajú experimenty, ktoré vyžadujú čas a peniaze.
To sa začína meniť. Prelomové modely sa teraz môžu priamo pripojiť k laboratórnej automatizácii, navrhovať experimenty, vykonávať ich vo veľkom rozsahu, učiť sa z výsledkov a rozhodovať, čo robiť ďalej. V biologických vedách je úzkym miestom vo veľkej miere iterácia a autonómne laboratóriá sú vytvorené tak, aby toto obmedzenie odstránili.
V predchádzajúcej práci sme ukázali, že GPT‑5 dokáže zlepšiť protokoly mokrého laboratória prostredníctvom experimentovania v uzavretej slučke. Ukazujeme, že rovnaký prístup môže znížiť náklady na výrobu proteínov.
Nadviazali sme spoluprácu so spoločnosťou Ginkgo Bioworks(otvorí sa v novom okne) s cieľom prepojiť GPT‑5 s cloudovým laboratóriom – automatizovaným mokrým laboratóriom ovládaným na diaľku prostredníctvom softvéru, v ktorom roboty vykonávajú experimenty a vracajú údaje – a toto usporiadanie so zapojením laboratória do cyklu sme využili na optimalizáciu široko používaného biologického procesu: bezbunkovej syntézy proteínov (CFPS). Počas šiestich kôl experimentovania v uzavretej slučke systém otestoval viac ako 36000 jedinečných zložení reakcií CFPS na 580 automatizovaných platniach. Po poskytnutí prístupu k počítaču, webovému prehliadaču a relevantným dokumentom, GPT‑5 absolvoval tri kolá experimentovania, aby dosiahol nový stav techniky v nízkonákladovom CFPS, dosahujúc 40 % zníženie nákladov na produkciu proteínov (a 57 % zlepšenie nákladov na reagencie), vrátane nových zložení reakcií, ktoré sú odolnejšie voči reakčným podmienkam bežným v autonómnych laboratóriách.
Bez-bunková syntéza proteínov (CFPS) je metóda výroby proteínov bez potreby pestovania živých buniek. Namiesto vkladania DNA do buniek a čakania, kým vyprodukujú proteín, CFPS spúšťa mechanizmus tvorby proteínov v kontrolovanom prostredí. To z neho robí praktický nástroj na rýchle prototypovanie a testovanie, pretože vedci môžu vykonať mnoho experimentov rýchlo a zmerať výsledky v ten istý deň.
Proteíny sú významnou súčasťou toho, čo moderná biológia prináša. Mnohé dôležité lieky sú založené na proteínoch. Mnohé diagnostické a výskumné testy sú závislé od proteínov. V priemyselných prostrediach pôsobia proteíny ako enzýmy, ktoré zefektívňujú a čistia chemické procesy. Proteíny sa dokonca nachádzajú aj v tvojom pracom prostriedku. Keď sa produkcia proteínov stane rýchlejšou a lacnejšou, vedci môžu zvyčajne skôr otestovať viac nápadov a znížiť náklady na premenu počiatočného výskumu na niečo, z čoho môžu ľudia mať úžitok každý deň.
CFPS je užitočný pre tento druh iterácie. Problém je v tom, že optimalizácia je zložitá a vo veľkom meradle sa stáva drahou.
Bezbunková syntéza proteínov si vyžaduje komplexné, vzájomne pôsobiace zložky: DNA templát kódujúci proteín, ktorý sa má vytvoriť, bunkový lyzát, teda zmes bunkového aparátu z vnútra buniek, a veľké množstvo biochemických zložiek od zdrojov energie až po soli. Uvažovať o systéme ako celku je mimoriadne náročné a mnohé(otvorí sa v novom okne) predchádzajúce(otvorí sa v novom okne) štúdie(otvorí sa v novom okne) použili rôzne typy strojového učenia na zníženie nákladov na produkciu proteínov.
Štandardné formulácie syntézy proteínov bez buniek (CFPS) a komerčné súpravy sú často nacenené na prácu v tempe človeka. Autonómne laboratóriá dokážu vykonať tisíce reakcií v čase, za ktorý by ľudský tím zvládol len desiatky. V takom rozsahu sa náklady na reagencie stávajú obmedzujúcim faktorom.
CFPS je tiež ťažké optimalizovať iba na základe intuície. Je to zmes mnohých vzájomne pôsobiacich komponentov. Malé zmeny môžu byť dôležité, ale smer účinku nie je vždy zrejmý, a najlepšie kombinácie môže byť ťažké nájsť bez vykonania mnohých experimentov. Predchádzajúce prístupy znížili náklady, ale pokrok býva postupný, pretože dôkladné preskúmanie priestoru je pracovne náročné.
Spojili sme GPT‑5 s cloudovým laboratóriom spoločnosti Ginkgo Bioworks, aby sme vytvorili autonómny systém s uzavretou slučkou na optimalizáciu bezbunkovej syntézy proteínov (CFPS).
GPT‑5 navrhol série experimentov. Laboratórium ich vykonalo. Výsledky boli vrátené späť do modelu. Model použil tieto údaje na návrh ďalšieho kola. Cyklus sme zopakovali šesťkrát.

GPT‑5 navrhol série experimentov v štandardnom formáte 384-jamkovej platne a vykonal ich v cloudovom laboratóriu Ginkgo Bioworks. Po skončení experimentov cloudové laboratórium odoslalo údaje späť do GPT‑5, kde model analyzoval výsledky, generoval nové hypotézy a navrhoval ďalšie kolo experimentov.
Aby sme udržali slučku ukotvenú v tom, čo môže autonómne laboratórium dosiahnuť, pridali sme prísnu programovú validáciu pred spustením akéhokoľvek experimentu. Toto overenie potvrdilo, že experimenty navrhnuté umelou inteligenciou boli fyzicky realizovateľné na automatizačnej platforme. Zabránilo to „papierovým experimentom“, ktoré v texte vyzerajú vierohodne, ale nedajú sa realizovať v robotickom pracovnom postupe.
Počas celého cyklu systém vykonal viac ako 36 000 reakcií CFPS na 580 automatizovaných platniach. Tento rozsah je dôležitý, pretože umožňuje vznik vzorov. V biológii sú jednotlivé experimenty často nepresné. Priepustnosť a iterácia sú spôsob, ako oddeľujete signál od náhodného šumu. Keď mal GPT‑5 prístup k príslušnému článku a nástrojom, stačili tri kolá experimentovania a dva mesiace na dosiahnutie nového špičkového výsledku: o 40 % nižších nákladov na produkciu proteínov v porovnaní s najlepšou predchádzajúcou referenčnou hodnotou(otvorí sa v novom okne).
Rekonfigurovateľné automatizačné vozíky spoločnosti Ginkgo Bioworks. Zdroj: Ginkgo Bioworks
Zistili sme, že zlepšenia pochádzajú z identifikácie kombinácií, ktoré spolu dobre fungujú a ktoré obstáli v realite automatizácie s vysokou priepustnosťou.
Zistili sme, že GPT‑5 identifikoval nízkonákladové reakčné zloženia, ktoré ľudia v tejto konfigurácii predtým netestovali. Bez-bunková syntéza proteínov (CFPS) sa skúma už roky, ale priestor možných zmesí je stále rozsiahly. Keď dokážete rýchlo navrhnúť a vykonať tisíce kombinácií, môžete nájsť použiteľné oblasti, ktoré sa pri manuálnom pracovnom postupe ľahko prehliadnu.
Zistili sme tiež, že experimenty s vysokou priepustnosťou na platniach sa často líšia od manuálnych experimentov na laboratórnom stole. Okysličenie môže byť nižšie vo formátoch reakcií s vysokou priepustnosťou. Miešanie a geometria môžu byť odlišné. Väčšina reakcií CFPS produkuje v skúmavkách oveľa viac bielkovín ako v mikrotitračných platniach, pretože väčšie objemy vo všeobecnosti znamenajú lepšiu dostupnosť kyslíka a lepšie miešanie. V skutočnosti, pri reakciách na báze platní s nízkym objemom, GPT‑5 navrhol mnoho reakcií, ktoré okamžite prekonali predchádzajúce najlepšie výsledky po získaní prístupu k počítaču na analýzu údajov a k webovému prehliadaču na vyhľadávanie relevantných článkov. Celkovo GPT‑5 navrhol mnoho kombinácií reagencií, ktoré si viedli dobre pri obmedzeniach vysokej priepustnosti, vrátane mnohých, ktoré sú robustnejšie v podmienkach s nízkym obsahom kyslíka, bežných v automatizovaných laboratórnych prostrediach.
Okrem toho sme zistili, že malé zmeny v pufrovaní, komponentoch regenerácie energie a polyamínoch mali neprimerane veľký vplyv v porovnaní s ich nákladmi. Nie sú to vždy prvé parametre, po ktorých ľudia siahnu, ale pri vysokej priepustnosti sa z nich stávajú testovateľné hypotézy namiesto predpokladov vo východiskách.
Napokon samotná štruktúra nákladov ovplyvnila to, čo bolo dôležité. V CFPS teraz dominujú náklady na lyzát a DNA. To znamená, že výnos je stratégia s najväčším pákovým účinkom. Ak dokážeš zvýšiť produkciu bielkovín na jednotku drahého vstupu, dosiahneš významný pokrok v znižovaní nákladov ešte predtým, než sa pustíš do hľadania okrajových úspor inde.
Počas šiestich kôl autonómneho experimentovania systém postupne zlepšoval bezbunkovú syntézu proteínov, čím znižoval náklady a zvyšoval výťažok proteínov. Výsledky sú zobrazené ako náklady na reakciu v porovnaní s titrom proteínu pre každé kolo, pričom najlepšie kompromisy tvoria prelomovú hranicu. Väčšie body označujú najnižšie dosiahnuté náklady na gram v každom kole a hviezdičková/bodkovaná referencia označuje predchádzajúci špičkový referenčný test v 384-jamkových platniach (Olsen a kol., 2025). Podrobnejší pohľad na neskoršie kolá zvýrazňuje konečné prírastky, a súhrn po jednotlivých kolách ukazuje, že najlepšia cena za gram sa postupne znižuje.
Tieto výsledky boli demonštrované na jednom proteíne, sfGFP, a jednom systéme bezbunkovej syntézy proteínov (CFPS). Zovšeobecnenie na iné proteíny a iné systémy CFPS ešte stále treba preukázať.
Okysličovanie a geometria reakcie môžu výrazne ovplyvniť výťažky, a tieto faktory sa môžu líšiť v rôznych mierkach. Niektoré vylepšenia môžu byť citlivé na tieto podmienky a pochopenie týchto citlivostí je súčasťou toho, čo nasleduje.
Na vylepšenia protokolu a manipuláciu s reagenciami bol potrebný ľudský dohľad. Systém môže navrhovať a interpretovať experimenty, ale laboratórna práca stále zahŕňa praktické detaily, ktoré si vyžadujú skúsených operátorov.
Plánujeme aplikovať optimalizáciu lab-in-the-loop na ďalšie biologické pracovné postupy, kde rýchlejšia iterácia môže odomknúť pokrok. Autonómne laboratóriá vnímame ako doplnok k modelom. Modely môžu generovať návrhy, ale nakoniec biológia stále vyžaduje testovanie a iteráciu. Uzatváranie slučky medzi generovaním a experimentovaním je spôsob, ako premeníš sľubné nápady na fungujúce výsledky.
Keď pracujeme na bezpečnom a zodpovednom urýchľovaní vedeckého pokroku, zároveň sa snažíme hodnotiť a znižovať riziká, najmä tie, ktoré súvisia s biologickou bezpečnosťou. Tieto výsledky ukazujú, že modely dokážu uvažovať v mokrom laboratóriu na zlepšenie protokolov a môžu mať dôsledky pre biologickú bezpečnosť, ktoré posudzujeme a zmierňujeme prostredníctvom nášho Rámca pripravenosti. Sme odhodlaní vytvárať potrebné a jemne vyladené ochranné opatrenia na úrovni modelu a systému, aby sme znížili tieto riziká, a tiež vyvíjať hodnotenia na sledovanie aktuálnych úrovní.
Sme vďační našim partnerom v spoločnosti Ginkgo Bioworks a tímom, ktoré pomohli navrhnúť, prevádzkovať a podporovať automatizované cloudové laboratórium, ktoré stojí za touto prácou.


