Lumaktaw sa pangunahing content
OpenAI

Nababawasan ng GPT‑5 ang gastos sa cell-free protein synthesis

Sa pakikipagtulungan sa Ginkgo Bioworks, lumikha kami ng awtonomong laboratoryo na pinagagana ng AI, at nagkaroon ng 40% kabawasan sa gastos sa produksyon ng protina.

Naglo-load…

Nakita namin ang mabilis na pag-usad mula sa AI sa mga larangan tulad ng matematika at pisika, kung saan madalas na masusuri ang mga ideya nang hindi hinahawakan ang pisikal na mundo. Iba ang Biyolohiya. Dumadaan ang pag-usad sa laboratoryo, kung saan ang mga siyentipiko ay nagsasagawa ng mga eksperimento na tumatagal ng oras at nangangailangan ng pera.

Nagsisimula nang magbago iyon. Makakakonekta na ang mga frontier na modelo nang direkta sa awtomasyon ng lab, magmungkahi ng mga eksperimento, patakbuhin ang mga ito sa malakihang saklaw, matuto mula sa mga resulta, at magpasya kung ano ang susunod na gagawin. Sa malaking bahagi ng agham-buhay, ang balakid ay ang pag-uulit, at ang mga awtonomong lab ay binuo upang alisin ang hadlang na iyon.

Sa naunang gawain, ipinakita namin na maaaring mapahusay ng GPT‑5 ang mga protocol sa wet-lab sa pamamagitan ng closed-loop na eksperimento. Dito, ipinapakita namin na ang parehong pamamaraan ay maaaring magpababa ng gastos sa produksyon ng protina.

Nakipagtulungan kami sa Ginkgo Bioworks(magbubukas sa bagong window) para ikonekta ang GPT‑5 sa cloud na laboratoryo—isang awtomatikong wet lab na pinapatakbo nang remote sa pamamagitan ng software, kung saan ang mga robot ang nagsasagawa ng mga eksperimento at nagbabalik ng data—at ginamit ang setup na lab-in-the-loop na iyon para i-optimize ang malawakang ginagamit na prosesong biyolohikal: cell-free protein synthesis (CFPS). Sa loob ng mahigit anim na round ng closed-loop na pag-eeksperimento, sinubok ng system ang mahigit 36,000 natatanging komposisyon ng reaksyon ng CFPS sa 580 automated plate. Matapos mabigyan ng access sa computer, isang web browser, at access sa mga kaugnay na papel, kinailangan ng GPT‑5 ng tatlong yugto ng eksperimento para magtatag ng bagong antas ng kasanayan sa murang CFPS, na nagresulta sa 40% na pagbawas sa gastos sa produksyon ng protina (at 57% na pagbuti sa gastos ng mga reagent), kabilang ang mga bagong komposisyon ng reaksyon na mas matibay sa mga kondisyon ng reaksyon na karaniwan sa mga awtonomong laboratoryo.

Bakit mahalaga ang cell-free protein synthesis

Ang cell-free protein synthesis (CFPS) ay isang paraan upang makagawa ng mga protina nang hindi kailangang gumawa ng mga buhay na selula. Sa halip na ilagay ang DNA sa mga selula at maghintay na makagawa ang mga ito ng protina, pinapatakbo ng CFPS ang makinarya sa paggawa ng protina sa isang kontroladong halo. Ginagawa itong praktikal na kasangkapan para sa mabilis na pag-prototype at pagsusuri dahil maaaring magsagawa ang mga siyentipiko ng maraming eksperimento nang mabilis at sukatin ang mga resulta sa parehong araw.

Malaking bahagi ang naihahatid na protina ng modernong biyolohiya. Maraming mahahalagang gamot ang nakabatay sa mga protina. Maraming diagnostic at assay sa pananaliksik ang umaasa sa mga protina. Sa mga industriyal na kapaligiran, ang mga protina ay nagsisilbing mga enzyme na nagpapalinis at nagpapahusay sa mga prosesong kemikal. May mga protina pa nga na matatagpuan sa iyong sabong panlaba. Kapag mas mabilis at mas mura ang produksyon ng protina, karaniwang mas maaga nang nasusubukan ng mga siyentipiko ang mas maraming ideya, at nababawasan ang gastos sa paglipat ng maagang pananaliksik tungo sa bagay na mapapakinabangan ng mga tao araw-araw.

Kapaki-pakinabang na ang CFPS para sa ganoong uri ng pag-uulit. Ang hadlang nga lang ay mahirap i-optimize at nagiging magastos kapag lumalaki ang saklaw.

Mahirap i-optimize at magastos ang cell-free protein synthesis

Ang cell-free protein synthesis ay nangangailangan ng mga kumplikado at magkakaugnay na sangkap: ang DNA template na nag-e-encode ng protinang gagawin, ang cell lysate (ang “sabaw” ng makinaryang pang-selula mula sa loob ng mga selula), at ang malaking bilang ng mga biyokemikal na bahagi mula sa mga pinagkukunan ng enerhiya hanggang sa mga asin. Napakahirap pangatuwiranan ang system sa kabuuan, at maraming(magbubukas sa bagong window) naunang(magbubukas sa bagong window) pag-aaral(magbubukas sa bagong window) ang naglapat ng iba’t ibang uri ng machine learning para mabawasan ang gastos sa produksyon ng protina.

Ang mga karaniwang pormulasyon ng cell-free protein synthesis (CFPS) at mga komersyal na kit ay kadalasang may presyong nakatakda para sa bilis ng trabaho ng tao. Kayang magpatakbo ng awtonomong lab ng libo-libong reaksyon sa katumbas na oras na makakapagpatakbo ang team ng mga tao ng ilang dosena. Sa antas na iyon, ang gastos ng mga reagent ang nagiging salik na naglilimita.

Mahirap ding i-optimize ang CFPS gamit lamang ang intuwisyon. Isa itong halo ng maraming nagkakaugnayang sangkap. Mahalaga ang maliliit na pagbabago, ngunit hindi laging halata ang direksyon ng epekto, at maaaring mahirap hanapin ang pinakamahuhusay na kombinasyon nang hindi nagsasagawa ng maraming eksperimento. Nakapagpababa ang mga naunang pamamaraan ng mga gastos, ngunit ang progreso ay kadalasang paunti-unti dahil masinsinang paggawa ang kinakailangan upang masusing masiyasat ang aspektong iyon.

Pagkonekta ng GPT‑5 sa laboratoryo ng robot

Ipinares namin ang GPT‑5 sa cloud na laboratoryo ng Ginkgo Bioworks upang makabuo ng isang closed-loop na awtonomong sistema para sa pag-optimize ng cell-free protein synthesis (CFPS).

Nagdisenyo ang GPT‑5 ng mga batch ng eksperimento. Isinagawa ito ng laboratoryo. Ibinigay muli ang mga resulta sa modelo. Ginamit ng modelo ang data na iyon upang imungkahi ang susunod na round. Inulit namin ang siklo na iyon nang anim na beses.

Diagram na may pamagat na “Awtonomong lab na pinagagana ng AI.” Nagsasagawa ang GPT-5 ng pagsusuri sa data, pangangatuwirang biyokemikal, at pagbuo ng hypothesis, at nagpapadala ng mga disenyo ng eksperimento sa Reconfigurable Automation Carts (RACs), na nagsasagawa ng mga pisikal na eksperimento, nag-a-automate ng paghawak ng likido, nagpapainkubate ng mga sample, at sumusukat ng fluorescence. Ibinabalik ng mga RAC ang eksperimental na data at mga sukatan pabalik sa GPT-5, na bumubuo ng saradong feedback loop.

Nagdisenyo ang GPT‑5 ng grupo ng eksperimento sa isang karaniwang 384-well plate format, at pinatakbo ang mga ito sa cloud na laboratory ng Ginkgo Bioworks. Kapag natapos na ang mga eksperimento, ibinalik ng cloud na laboratory ang data sa GPT‑5, kung saan sinuri ng modelo ang mga resulta, bumuo ng mga bagong hypothesis, at nagdisenyo ng susunod na yugto ng mga eksperimento.

Upang manatiling nakabatay ang loop sa kung ano ang magagawa ng isang awtonomong lab, nagdagdag kami ng mahigpit na programmatic na pagpapatunay bago tumakbo ang anumang eksperimento. Ipinatupad ng pagpapatunay na iyon na ang mga eksperimentong dinisenyo ng AI ay pisikal na maisasagawa sa platform ng awtomasyon. Napigilan nito ang mga “eksperimento sa papel” na mukhang kapani-paniwala sa teksto ngunit hindi maisasagawa sa isang robotikong daloy ng trabaho.

Sa kabuuang run, nagsagawa ang system ng higit sa 36,000 CFPS na reaksiyon sa mahigit 580 na automated plate. Mahalaga ang sukat na ito dahil ito ang nagpapahintulot sa mga pattern na lumitaw. Sa biology, ang mga solong eksperimento ay may maraming ingay. Ang throughput at pag-ulit ang paraan para maihiwalay mo ang signal mula sa random na ingay. Kapag nagkaroon na ang GPT‑5 ng access sa kaugnay na papel at mga tool, kinailangan nito ng tatlong yugto ng eksperimento at dalawang buwan para magtakda ng bagong pamantayan: 40% na mas mababang gastos sa produksyon ng protina kumpara sa pinakamahusay na naunang batayan(magbubukas sa bagong window).

Mga muling narere-configure na cart ng awtomasyon ng Ginkgo Bioworks. Credit: Ginkgo Bioworks

Ang aming natutunan

Nalaman namin na ang mga pagpapahusay ay nagmula sa pagtukoy ng mga kombinasyong mahusay na gumagana nang magkakasama at nananatiling matatag sa mga realidad ng high-throughput na awtomasyon.

Natuklasan namin na natukoy ng GPT‑5 ang mga murang komposisyon ng reaksyon na hindi pa nasusubukan ng mga tao sa ganitong pagsasaayos. Ang cell-free protein synthesis (CFPS) ay pinag-aralan na sa loob ng maraming taon, ngunit malawak pa rin ang saklaw ng mga posibleng halo. Kapag kaya mong magmungkahi at magsagawa ng libo-libong kombinasyon nang mabilis, makakahanap ka ng mga magagamit na rehiyon na madaling makaligtaan sa manu-manong daloy ng trabaho.

Natuklasan din namin na ang mga high-throughput, plate-based na eksperimento ay kadalasang naiiba sa mga manual, bench-top na eksperimento. Maaaring mas mababa ang oxygenation sa mga format ng reaksyon na may mataas na throughput. Maaaring magkaiba ang paghahalo at heomtriya. Karamihan sa mga reaksyon ng CFPS ay gumagawa ng mas maraming protina sa mga test tube kaysa sa mga microtiter plate, dahil ang mas malalaking sukat ay karaniwang may mas maraming available na oxygen at mas mahusay na paghahalo. Sa katunayan, para sa mga kaunting reaksyon na nakabatay sa plate, iminungkahi ng GPT‑5 ang maraming reaksyon na mas mahusay ang pagganap kaysa sa naunang pinakamahusay kaagad pagkatapos makakuha ng access sa computer para sa pagsusuri ng data at web browser para maghanap ng mga kaugnay na papel. Sa kabuuan, nagmungkahi ang GPT‑5 ng maraming kombinasyon ng reagent na mahusay ang pagganap sa ilalim ng mga limintasyon ng mataas na throughput, kabilang ang marami na mas matatag sa mga kundisyong mababa ang oxygen na karaniwan sa mga awtomatikong setting ng laboratoryo.

Bukod dito, natuklasan namin na ang maliliit na pagbabago sa pag-buffer, mga bahagi ng muling paggawa ng enerhiya, at mga polyamine ay nagkaroon ng malalaking epekto kumpara sa kanilang gastos. Ang mga ito ay hindi palaging unang mga parametro na gustong matugunan ng mga tao ngunit sa mataas na throughput, nagiging mga nasusubok na hypothesis ang mga ito sa halip na mga palagay sa background.

Sa wakas, ang mismong istraktura ng gastos ang humubog sa kung ano ang mahalaga. Sa CFPS, nangunguna nga ang lysate at DNA sa mga gastusin. Ibig sabihin, ang pag-ani ang estratehiyang may pinakamataas na bentaha. Kung mapapataas mo ang output ng protina kada yunit ng mahal na input, magiging makabuluhan ang paggastos kahit bago mo pa habulin ang mga marginal na pagtitipid sa ibang bahagi.

Binabawasan ng awtomatikong pag-ulit sa lab ang gastos habang pinapataas ang pag-ani ng protina

Sa anim na yugto ng awtonomong pag-eeksperimento, unti-unting pinahusay ng sistema ang cell-free protein synthesis, na nagpapaba sa mga gastos habang pinapataas ang ani ng protina. Ipinapakita ang mga resulta bilang gastos sa reaksyon kumpara sa protein titer para sa bawat round, kung saan ang pinakamahusay na mga kapalit ay bumubuo ng frontier. Ang mas malalaking puntos ay nagmamarka ng pinakamababang halaga kada gramo na nakamit sa bawat round, at ang may-bituin/may-tuldok na reperensya ay nagpapahiwatig ng naunang makabagong pamantayan sa 384-well plates (Olsen et al., 2025). Binibigyang-diin ng mas masusing pag-oobserba sa mga huling round ang mga panghuling pag-ani at ipinapakita ng buod ng bawat round ang pinakamahusay na halaga kada gramo na bumababa sa pagdaan ng panahon.

Mga limitasyon

Ipinakita ang mga resultang ito sa isang protina, sfGFP, at isang sistema ng cell-free protein synthis (CFPS). Kailangan pang ipakita ang paglalapat sa iba pang mga protina at iba pang mga sistema ng CFPS.

Maaaring malaki ang epekto ng oxygenation at heometriya ng reaksyon sa mga pag-ani, at maaaring mag-iba ang mga salik na ito sa iba't ibang sukat. Maaaring sensitibo ang ilang pagpapabuti sa mga kundisyong ito, at ang pag-unawa sa mga sensitibidad na iyon ay bahagi ng susunod na hakbang.

Kinakailangan ang pangangasiwa ng tao para sa mga pagpapabuti ng protokol at paghawak ng reagent. Kayang magdisenyo at mag-interpret ng sistema ng mga eksperimento, ngunit ang gawain sa laboratoryo ay may kasamang mga praktikal na detalye na nangangailangan pa rin ng mga bihasang operator.

Ano ang susunod

Plano naming ilapat ang lab-in-the-loop na pag-optimize sa iba pang mga biyolohikal na daloy ng trabaho kung saan ang mas mabilis na pag-uulit ay maaaring maging daan sa progreso. Tinitingnan namin ang mga awtonomong laboratoryo bilang pandagdag sa mga modelo. Makakabuo ang mga modelo ng mga disenyo, ngunit sa huli, nangangailangan pa rin ang biyolohiya ng pagsubok at pag-uulit. Ang pagsasara ng loop sa pagitan ng pagbuo at eksperimento ay ang paraan upang maging gumaganang mga resulta ang mga ideyang may potensyal.

Habang nagtatrabaho kami para mapabilis ang pag-unlad ng siyensiya nang ligtas at responsable, hinahangad din naming suriin at bawasan ang mga panganib, lalo na ang mga nauugnay sa biosecurity. Ipinapakita ng mga resultang ito na ang mga modelo ay maaaring mangatuwiran sa wet lab upang mapabuti ang mga protokol, at maaaring magkaroon ng mga implikasyon para sa biosecurity na aming tinatasa at pinapaliit sa pamamagitan ng aming Preparedness Framework⁠. Kami ay nakatuon sa pagbuo ng kinakailangan at masalimuot na mga pag-iingat sa antas ng modelo at sistema upang mabawasan ang mga panganib na ito, pati na rin bumuo ng mga pagsusuri upang subaybayan ang kasalukuyang mga antas.

Kami ay nagpapasalamat sa aming mga katuwang sa Ginkgo Bioworks at sa mga team na tumulong sa pagdisenyo, pagpapatakbo, at pagsuporta sa automated na cloud na laboratoryo na nasa likod ng gawaing ito.

May-akda

OpenAI