5. februar 2026

GPT‑5 znižuje stroške brezcelične sinteze beljakovin

V sodelovanju s podjetjem Ginkgo Bioworks smo ustvarili avtonomni laboratorij, ki ga poganja umetna inteligenca, in dosegli 40-% znižanje stroškov proizvodnje beljakovin.

Preberite dokument

Nalaganje …

Opazili smo silovit napredek umetne inteligence na področjih, kot sta matematika in fizika, kjer je mogoče zamisli pogosto ovrednotiti, ne da bi se sploh dotaknili fizičnega sveta. Biologija je drugačna. Napredek poteka skozi laboratorije, kjer znanstveniki izvajajo poskuse, ki zahtevajo čas in denar.

To se začenja spreminjati. Prelomni modeli se lahko zdaj neposredno povežejo z laboratorijsko avtomatizacijo, predlagajo poskuse, jih izvajajo v velikem obsegu, se učijo iz rezultatov in se odločajo o nadaljnjih korakih. Ozko grlo v velikem delu bioloških znanosti predstavljajo ponovitve, avtonomni laboratoriji pa so zasnovani za odpravo te omejitve.

V prejšnjem delu smo pokazali, da bi lahko model GPT‑5 izboljšal protokole v mokrem laboratoriju z izvajanjem poskusov v zaprti zanki. Na tem primeru pokažemo, da lahko z enakim pristopom zmanjšamo stroške proizvodnje beljakovin.

V sodelovanju s podjetjem Ginkgo Bioworks⁠(odpre se v novem oknu) smo model GPT‑5 povezali z laboratorijem v oblaku –avtomatiziranim mokrim laboratorijem, ki se na daljavo upravlja prek programske opreme, kjer roboti izvajajo poskuse in vračajo podatke – in to laboratorijsko postavitev uporabili za optimizacijo široko razširjenega biološkega procesa: brezcelične sinteze beljakovin (CFPS). V šestih krogih poskusov v zaprti zanki je sistem preizkusil več kot 36.000 edinstvenih sestav reakcij CFPS na 580 avtomatiziranih ploščah. Potem ko je model GPT‑5 dobil dostop do računalnika, spletnega brskalnika in ustreznih dokumentov, je potreboval tri kroge poskusov, da je vzpostavil novo najsodobnejšo raven pri nizkocenovnem procesu CFPS, pri čemer je dosegel 40-% znižanje stroškov proizvodnje beljakovin (in 57-% izboljšanje stroškov reagentov), vključno z novimi sestavami reakcij, ki so bolj odporne na reakcijske pogoje, značilne za avtonomne laboratorije.

Zakaj je brezcelična sinteza beljakovin pomembna

Brezcelična sinteza beljakovin (CFPS) je metoda izdelave beljakovin brez potrebe po gojenju živih celic. Namesto da bi DNK vnesli v celice in čakali, da proizvedejo beljakovino, proces CFPS poganja mehanizem za izdelavo beljakovin v nadzorovani mešanici. To je praktično orodje za hitro izdelavo prototipov in preizkušanje, saj lahko znanstveniki hitro izvedejo številne poskuse in rezultate izmerijo že isti dan.

Beljakovine so pomemben del prispevka sodobne biologije. Številna pomembna zdravila temeljijo na beljakovinah. Številni diagnostične in raziskovalne preiskave so odvisne od beljakovin. V industrijskih okoljih beljakovine delujejo kot encimi, ki omogočajo čistejše in učinkovitejše kemijske procese. Beljakovine najdemo celo v vašem detergentu za perilo. Ko proizvodnja beljakovin postane hitrejša in cenejša, lahko znanstveniki običajno prej preizkusijo več zamisli in zmanjšajo stroške, da se zgodnje raziskave preoblikujejo v nekaj, od česar imajo ljudje lahko vsakodnevno korist.

Proces CFPS je že uporaben za takšno vrsto ponovitev poskusov. Ozko grlo je v tem, da je optimizacijo težko izvesti in postane draga pri večjem obsegu.

Brezcelično sintezo beljakovin je težko optimizirati in je draga

Brezcelična sinteza beljakovin zahteva kompleksne, medsebojno delujoče sestavine: DNK-predlogo, ki vsebuje kodo beljakovine za izdelavo, celični lizat (juho celičnega mehanizma iz notranjosti celic) in veliko število biokemičnih komponent, ki segajo od virov energije do soli. Izjemno težko je razmišljati o sistemu kot celoti in številne⁠(odpre se v novem oknu) predhodne⁠(odpre se v novem oknu) študije⁠(odpre se v novem oknu) so uporabile različne vrste strojnega učenja za zmanjšanje stroškov proizvodnje beljakovin.

Standardne sestave za brezcelično sintezo beljakovin (CFPS) in komercialni kompleti imajo ceno pogosto določeno za delo s človeškim tempom. Avtonomni laboratoriji lahko izvedejo na tisoče reakcij v času, v katerem bi jih človeška ekipa morda lahko izvedla le več deset. Pri takšnem obsegu postanejo stroški reagentov omejitveni dejavnik.

Proces CFPS je prav tako težko optimizirati zgolj z intuicijo. Gre za mešanico številnih medsebojno delujočih komponent. Majhne spremembe lahko veliko pomenijo, vendar smer učinka ni vedno očitna, in najboljše kombinacije je težko najti brez izvedbe številnih poskusov. Prejšnji pristopi so sicer zmanjšali stroške, vendar je napredek običajno postopen, ker je temeljito raziskovanje tega področja delovno intenzivno.

Povezovanje modela GPT‑5 z robotskim laboratorijem

Model GPT‑5 smo povezali z laboratorijem v oblaku podjetja Ginkgo Bioworks, da bi oblikovali avtonomni sistem zaprte zanke za optimizacijo brezcelične sinteze beljakovin (CFPS).

GPT‑5 je zasnoval serije poskusov. Laboratorij jih je izvedel. Rezultati so bili nato vrnjeni modelu. Model je uporabil te podatke za predlaganje naslednjega kroga. Ta cikel smo ponovili šestkrat.

Diagram z naslovom »Avtonomni laboratorij, ki ga poganja umetna inteligenca«. GPT-5 izvaja analizo podatkov, biokemijsko logično sklepanje in generiranje hipotez ter pošilja eksperimentalne načrte v avtomatizacijske mehanizme Reconfigurable Automation Carts (RAC), ki izvajajo fizične poskuse, avtomatizirajo ravnanje s tekočinami, inkubirajo vzorce in merijo fluorescenco. Mehanizmi RAC vračajo eksperimentalne podatke in metrike nazaj v GPT-5, s čimer tvorijo zaprto povratno zanko. — GPT‑5 je zasnoval serije poskusov v standardnem formatu plošče s 384 jamicami in jih izvedel v laboratoriju v oblaku podjetja Ginkgo Bioworks. Ko so bili poskusi končani, je laboratorij v oblaku poslal podatke nazaj v model GPT‑5, ki je nato analiziral rezultate, ustvaril nove hipoteze in zasnoval naslednji krog poskusov.

Da bi zanka ostala znotraj okvirov zmogljivosti avtonomnega laboratorija, smo dodali strogo programsko validacijo pred izvedbo katerega koli poskusa. Ta validacija je zagotovila, da so bili poskusi, ki jih je zasnovala umetna inteligenca, fizično izvedljivi na avtomatizacijski platformi. Preprečila je »eksperimente na papirju«, ki so v besedilu sicer videti izvedljivi, vendar pa jih v robotskem delovnem toku ni mogoče izvesti.

V celoti je sistem izvedel več kot 36.000 reakcij CFPS na 580 avtomatiziranih ploščah. Ta obseg je pomemben, ker omogoča pojavljanje vzorcev. V biologiji posamezni poskusi vsebujejo šum. Prepustnost in ponovitve (iteracija) sta načina za razločevanje signala od naključnega šuma. Ko je imel model GPT‑5 dostop do ustreznega članka in orodij, so bili potrebni trije krogi poskusov in dva meseca, da je vzpostavil nov standard: za 40 % nižji stroški proizvodnje beljakovin v primerjavi z najboljšo prejšnjo izhodiščno vrednostjo⁠(odpre se v novem oknu).

Rekonfigurabilni avtomatizacijski mehanizmi podjetja Ginkgo Bioworks. Avtor: Ginkgo Bioworks

Česa smo se naučili

Ugotovili smo, da izboljšave izhajajo iz prepoznavanja kombinacij, ki dobro delujejo skupaj in obveljajo v realnosti avtomatizacije z visoko prepustnostjo.

Ugotovili smo, da je model GPT‑5 identificiral nizkocenovne reakcijske sestave, ki jih ljudje v tej konfiguraciji še niso preizkusili. Brezcelično sintezo beljakovin (CFPS) se proučuje že vrsto let, vendar je nabor možnih mešanic še vedno obsežen. Ko lahko hitro predlagate in izvedete na tisoče kombinacij, lahko najdete uporabna območja, ki jih pri ročnem delovnem procesu ni težko spregledati.

Ugotovili smo tudi, da se poskusi z visoko prepustnostjo, ki temeljijo na ploščah, pogosto razlikujejo od ročno izvedenih poskusov na laboratorijskem pultu. Oksigenacija je lahko nižja pri reakcijah z visoko prepustnostjo. Mešanje in geometrija se lahko razlikujeta. Večina reakcij CFPS v epruvetah proizvede veliko več beljakovin kot na mikrotitrskih ploščah, ker večji obsegi na splošno omogočajo večjo razpoložljivost kisika in boljše mešanje. Pravzaprav je model GPT‑5 pri reakcijah na ploščah z majhnim volumnom predlagal številne reakcije, ki so prekosile prejšnje najboljše dosežke takoj po tem, ko je pridobil dostop do računalnika za analizo podatkov in spletnega brskalnika za iskanje ustreznih člankov. Na splošno je model GPT‑5 predlagal številne kombinacije reagentov, ki so se dobro obnesle pri omejitvah visoke prepustnosti, vključno s številnimi, ki so robustnejše v pogojih z nizko vsebnostjo kisika, kar je pogosto v avtomatiziranih laboratorijskih okoljih.

Poleg tega smo ugotovili, da so majhne spremembe v pufriranju, komponentah za regeneracijo energije in poliaminih imele nesorazmerno velik vpliv glede na njihove stroške. To niso vedno prvi parametri, po katerih ljudje posežejo, vendar pri visoki prepustnosti postanejo ti parametri preverljive hipoteze namesto predpostavk v ozadju.

Na koncu se je na podlagi same stroškovne strukture izoblikovalo tisto, kar je bilo pomembno. V procesu CFPS prevladujoči delež stroškov predstavljata lizat in DNK. To pomeni, da izplen predstavlja strategijo z največjim vplivom. Če lahko povečate proizvodnjo beljakovin na enoto dragega vložka, dosežete pomemben napredek pri stroških, še preden se lotite iskanja obrobnih prihrankov drugje.

Izvajanje ponovitev poskusov v avtonomnem laboratoriju znižuje stroške in povečuje izplen beljakovin

Skozi šest krogov avtonomnega eksperimentiranja je sistem postopoma izboljšal brezcelično sintezo beljakovin, znižal stroške in povečal izplen beljakovin. Rezultati so prikazani kot strošek reakcije v primerjavi s titrom beljakovin za posamezni krog, pri čemer najboljši kompromisi tvorijo mejo. Večje točke označujejo najnižji doseženi strošek na gram v posameznem krogu, zvezdica/črtkana referenca pa označuje prejšnje najsodobnejše referenčno merilo pri 384-jamičnih ploščah (Olsen in dr., 2025). Ob podrobnejšem pregledu poznejših krogov se izpostavijo končne pridobitve, povzetek po posameznih krogih pa pokaže, da se najboljša cena na gram sčasoma zmanjšuje.

Omejitve

Ti rezultati so bili prikazani na eni beljakovini, sfGFP, in v enem sistemu brezcelične sinteze beljakovin (CFPS). Posploševanje na druge beljakovine in druge sisteme CFPS je še vedno treba dokazati.

Oksigenacija in geometrija reakcije lahko močno vplivata na izplene, ti dejavniki pa se lahko razlikujejo na različnih ravneh. Nekatere izboljšave so morda občutljive na te pogoje in razumevanje teh občutljivosti je del tega, kar sledi.

Za izboljšave protokolov in ravnanje z reagenti je bil potreben človeški nadzor. Sistem lahko načrtuje in interpretira poskuse, vendar laboratorijsko delo še vedno vključuje praktične podrobnosti, ki zahtevajo izkušene operaterje.

Kaj naprej

Načrtujemo, da bomo optimizacijo z vključitvijo laboratorija v zanko uporabili tudi pri drugih bioloških delovnih tokovih, kjer lahko hitrejše izvajanje ponovitev omogoči napredek. Avtonomne laboratorije vidimo kot dopolnilo modelom. Modeli sicer lahko ustvarijo zasnove, vendar sta pri biologiji navsezadnje še vedno potrebna preizkušanje in ponavljanje. Zapiranje zanke med generiranjem in izvajanjem poskusov je način za preoblikovanje obetavnih zamisli v delujoče rezultate.

Medtem ko si prizadevamo pospešiti znanstveni napredek na varen in odgovoren način, si prav tako prizadevamo oceniti in zmanjšati tveganja, zlasti tista, povezana z biološko varnostjo. Ti rezultati kažejo, da modeli lahko razmišljajo v mokrem laboratoriju v smislu izboljšanja protokolov in lahko imajo posledice za biološko varnost, ki jih ocenjujemo in zmanjšujemo z našim Okvirom pripravljenosti⁠. Zavezani smo izgradnji potrebnih in prefinjenih varovalnih mehanizmov na ravni modela in sistema, da zmanjšamo ta tveganja, ter razvoju vrednotenj za spremljanje trenutnih ravni.

Hvaležni smo svojim partnerjem pri podjetju Ginkgo Bioworks in ekipam, ki so pomagale zasnovati, izvajati in podpirati avtomatizirani laboratorij v oblaku, na katerem temelji to delo.

Avtor

OpenAI

Berite naprej

Prikaži vse

GPT-Red: Odklepanje samoizboljšav za robustnost

Varnost15. jul. 2026

Ločevanje signala od šuma pri evalvacijah kodiranja

Raziskave8. jul. 2026

Predstavljamo GeneBench-Pro

Raziskave30. jun. 2026