Pāriet uz galveno saturu
OpenAI

2026. gada 5. februāris

IzpētePublikācija

GPT‑5 samazina bezšūnu proteīnu sintēzes izmaksas

Sadarbojoties ar Ginkgo Bioworks, mēs izveidojām ar mākslīgo intelektu vadītu autonomu laboratoriju un panācām 40 % samazinājumu proteīnu ražošanas izmaksās.

Notiek ielāde…

Mēs esam redzējuši strauju progresu mākslīgā intelekta jomā tādās disciplīnās kā matemātika un fizika, kur idejas bieži var novērtēt, nesaskaroties ar fizisko pasauli. Bioloģija ir citāda. Progresu veicina laboratorija, kur zinātnieki veic eksperimentus, kas prasa laiku un naudu.

Tas sāk mainīties. Robežšķirtnes modeļi tagad var tieši savienoties ar laboratorijas automatizāciju, ierosināt eksperimentus, veikt tos plašā mērogā, mācīties no rezultātiem un izlemt, ko darīt tālāk. Lielā daļā dzīvības zinātņu galvenais šķērslis ir iterācija, un autonomās laboratorijas ir izveidotas, lai novērstu šo ierobežojumu.

Iepriekšējā darbā mēs parādījām, ka GPT‑5 var uzlabot mitrās laboratorijas protokolus, izmantojot slēgtā cikla eksperimentēšanu. Šeit mēs parādām, ka tā pati pieeja var samazināt proteīnu ražošanas izmaksas.

Mēs sadarbojamies ar Ginkgo Bioworks(atveras jaunā logā), lai savienotu GPT‑5 ar mākoņlaboratoriju – automatizētu mitro laboratoriju, ko attālināti vada ar programmatūras palīdzību, un kur roboti veic eksperimentus un atgriež datus – un izmantojām šo pieeju ar laboratoriju integrētā ciklā, lai optimizētu plaši izmantotu bioloģisko procesu: bezšūnu proteīnu sintēzi (CFPS). Sešu slēgtā cikla eksperimentu kārtu laikā sistēma pārbaudīja vairāk nekā 36 000 unikālu CFPS reakciju sastāvu 580 automatizētās platēs. Pēc tam, kad GPT‑5 tika nodrošināta piekļuve datoram, tīmekļa pārlūkprogrammai un attiecīgajiem dokumentiem, GPT‑5 veica trīs eksperimentu kārtas, lai izveidotu jaunu mūsdienīgāko risinājumu zemu izmaksu CFPS jomā, panākot 40 % proteīnu ražošanas izmaksu samazinājumu (un 57 % uzlabojumu reaģentu izmaksu ziņā), tostarp jaunus reakciju sastāvus, kas ir noturīgāki pret reakcijas apstākļiem, kas ir izplatīti autonomajās laboratorijās.

Kāpēc bezšūnu proteīnu sintēze ir nozīmīga

Bezšūnu proteīnu sintēze (CFPS) ir metode, kā sintezēt proteīnus, neizmantojot dzīvas šūnas. Tā vietā, lai ievietotu DNS šūnās un gaidītu, līdz tās ražo proteīnu, CFPS darbina proteīnu veidošanas mehānismu kontrolētā maisījumā. Tas padara to par praktisku rīku ātrai prototipēšanai un testēšanai, jo zinātnieki var ātri veikt daudz eksperimentu un izmērīt rezultātus tajā pašā dienā.

Proteīni ir liela daļa no tā, ko nodrošina mūsdienu bioloģija. Daudzas nozīmīgas zāles ir balstītas uz proteīniem. Daudzas diagnostikas un pētniecības analīzes ir atkarīgas no proteīniem. Rūpnieciskajā vidē proteīni darbojas kā enzīmi, kas padara ķīmiskos procesus tīrākus un efektīvākus. Proteīni ir atrodamas pat tavā veļas mazgāšanas līdzeklī. Kad proteīnu ražošana kļūst ātrāka un lētāka, zinātnieki parasti var ātrāk pārbaudīt vairāk ideju un samazināt izmaksas, kas saistītas ar agrīno pētījumu pārvēršanu par kaut ko tādu, no kā cilvēki var gūt labumu ikdienā.

CFPS jau tagad ir noderīga šāda veida iterācijām. Trūkums ir tas, ka to ir sarežģīti optimizēt, un tā kļūst dārga, ja tiek izmantots lielāks mērogs.

Bezšūnu proteīnu sintēzi ir grūti optimizēt, un tā ir dārga

Bezšūnu proteīnu sintēzei ir nepieciešamas sarežģītas, savstarpēji mijiedarbojošās sastāvdaļas: DNS veidne, kas kodē izgatavojamo proteīnu, šūnu lizāts (šūnu iekšienē esošās šūnu mašinērijas “zupa”), un liels skaits bioķīmisko komponentu, sākot no enerģijas avotiem līdz sāļiem. Ir neticami grūti spriest par sistēmu kopumā, un daudzi(atveras jaunā logā) iepriekšējie(atveras jaunā logā) pētījumi(atveras jaunā logā) ir izmantojuši dažādus mašīnmācīšanās veidus, lai samazinātu proteīnu ražošanas izmaksas.

Standarta bezšūnu proteīnu sintēzes (CFPS) formulējumi un komerciālie komplekti bieži ir izcenoti darbam cilvēka tempā. Autonomās laboratorijas var veikt tūkstošiem reakciju laikā, kurā cilvēku komanda varētu veikt tikai dažus desmitus. Šādā mērogā reaģentu izmaksas kļūst par ierobežojošo faktoru.

CFPS arī ir grūti optimizēt tikai ar intuīciju. Tas ir daudzu savstarpēji mijiedarbojošos komponentu sajaukums. Nelielas izmaiņas var būt nozīmīgas, taču ietekmes virziens ne vienmēr ir acīmredzams, un labākās kombinācijas var būt grūti atrast, neveicot daudz eksperimentu. Iepriekšējās pieejas ir samazinājušas izmaksas, taču progress mēdz būt neliels, jo rūpīga iespēju izpēte ir darbietilpīga.

GPT‑5 savienošana ar robotizētu laboratoriju

Mēs savienojām GPT‑5 ar Ginkgo Bioworks mākoņlaboratoriju, lai izveidotu slēgtas cilpas autonomu sistēmu bezšūnu proteīnu sintēzes (CFPS) optimizēšanai.

GPT‑5 izstrādāja eksperimentu partijas. Laboratorija tos izpildīja. Rezultāti tika atgriezti modelim. Modelis izmantoja šos datus, lai ierosinātu nākamo kārtu. Mēs atkārtojām šo ciklu sešas reizes.

Diagramma ar nosaukumu “Ar mākslīgo intelektu vadīta autonoma laboratorija”. GPT-5 veic datu analīzi, bioķīmisko spriešanu un hipotēžu ģenerēšanu un nosūta eksperimentālus projektus uz pārkonfigurējamiem automatizācijas moduļiem (RAC), kas izpilda fiziskos eksperimentus, automatizē šķidrumu apstrādi, inkubē paraugus un mēra fluorescenci. RAC atgriež eksperimentālos datus un rādītājus atpakaļ GPT-5, veidojot slēgtu atgriezeniskās saites cilpu.

GPT‑5 izstrādāja eksperimentu sērijas standarta 384 iedobju plates formātā un veica tās Ginkgo Bioworks mākoņlaboratorijā. Kad eksperimenti bija pabeigti, mākoņlaboratorija nosūtīja datus atpakaļ GPT‑5, un modelis analizēja rezultātus, ģenerēja jaunas hipotēzes un izstrādāja nākamo eksperimentu kārtu.

Lai nodrošinātu, ka cikls ir balstīts uz to, ko autonoma laboratorija var paveikt, mēs pievienojām stingru programmatisko validāciju pirms jebkura eksperimenta uzsākšanas. Šī validācija nodrošināja, ka mākslīgā intelekta izstrādātie eksperimenti bija fiziski izpildāmi uz automatizācijas platformas. Tas novērsa “papīra eksperimentus”, kas tekstā šķiet ticami, bet kurus nevar izpildīt robotizētā darbplūsmā.

Visā izpildes ciklā sistēma veica vairāk nekā 36 000 CFPS reakciju 580 automatizētās plāksnēs. Šim mērogam ir nozīme, jo tas ļauj parādīties likumsakarībām. Bioloģijā atsevišķi eksperimenti ir trokšņaini. Caurlaidspēja un iterācijas ir veids, kā atšķirt signālu no nejauša trokšņa. Kad GPT‑5 ieguva piekļuvi attiecīgajam rakstam un rīkiem, bija nepieciešamas trīs eksperimentu kārtas un divi mēneši, lai izveidotu jaunu mūsdienīgāko standartu: par 40 % zemākas proteīnu ražošanas izmaksas salīdzinājumā ar labāko iepriekšējo bāzes līmeni(atveras jaunā logā).

Ginkgo Bioworks pārkonfigurējamie automatizācijas moduļi. Avots: Ginkgo Bioworks

Ko mēs uzzinājām

Mēs atklājām, ka uzlabojumus nodrošināja tādu kombināciju noteikšana, kas labi darbojas kopā un ir piemērotas augstas veiktspējas automatizācijas reālajiem apstākļiem.

Mēs atklājām, ka GPT‑5 identificēja zemu izmaksu reakciju sastāvus, kurus cilvēki iepriekš nebija pārbaudījuši šādā konfigurācijā. Bezšūnu proteīnu sintēze (CFPS) ir pētīta gadiem ilgi, taču iespējamo maisījumu klāsts joprojām ir plašs. Ja tu vari ātri piedāvāt un izpildīt tūkstošiem kombināciju, tu vari atrast dzīvotspējīgus reģionus, kurus manuālā darbplūsmā ir viegli nepamanīt.

Mēs arī konstatējām, ka augstas caurlaidības, uz plāksnēm balstīti eksperimenti bieži atšķiras no manuāliem, uz laboratorijas galda veiktiem eksperimentiem. Augstas caurlaidības reakciju formātos skābekļa saturs var būt mazāks. Sajaukšana un ģeometrija var būt atšķirīgas. Lielākā daļa CFPS reakciju mēģenēs rada daudz vairāk proteīna nekā mikrotitra plāksnēs, jo lielāki mērogi parasti nodrošina lielāku skābekļa pieejamību un labāku sajaukšanos. Patiesībā GPT‑5 ierosināja daudzas reakcijas, kas bija labākas par iepriekšējām labākajām reakcijām, uzreiz pēc tam, kad tika nodrošināta piekļuve datoram datu analīzei un tīmekļa pārlūkprogrammai, lai meklētu attiecīgos dokumentus. Kopumā GPT‑5 ierosināja daudzas reaģentu kombinācijas, kas labi darbojās augstas caurlaidības apstākļos, tostarp daudzas no tām ir izturīgākas automātiskās laboratorijās bieži sastopamajos apstākļos ar zemu skābekļa saturu.

Turklāt mēs konstatējām, ka nelielas izmaiņas bufervielās, enerģijas reģenerācijas komponentos un poliamīnos ir ļoti nozīmīgas, salīdzinot ar to izmaksām. Tie ne vienmēr ir pirmie parametri, pēc kuriem cilvēki ķeras, taču, ja ir liela caurlaidība, tie kļūst par pārbaudāmām hipotēzēm, nevis fona pieņēmumiem.

Visbeidzot, pati izmaksu struktūra noteica, kas bija svarīgi. CFPS gadījumā izmaksas pašlaik galvenokārt nosaka lizāts un DNS. Tas nozīmē, ka iznākuma palielināšana ir visefektīvākā stratēģija. Ja var palielināt proteīnu ražību uz vienu dārgu izejvielu vienību, tiek panākts ievērojams progress izmaksu ziņā, pat pirms meklētas iespējas ietaupīt citur.

Autonoma laboratorijas iterācija samazina izmaksas un palielina proteīna ieguvi

Sešu autonomo eksperimentu kārtu laikā sistēma pakāpeniski uzlaboja bezšūnu proteīnu sintēzi, samazinot izmaksas un vienlaikus palielinot proteīnu ražu. Rezultāti tiek attēloti kā reakcijas izmaksas pret proteīna titru katrā kārtā, un labākie kompromisi veido robežšķirtni. Lielāki punkti norāda uz zemākajām izmaksām uz gramu, kas sasniegtas katrā kārtā, un zvaigžņu/punktētā atsauce norāda uz iepriekšējo nozares līmeņa etalonu 384 iedobju platēs (Olsen et al., 2025). Tuvāks ieskats vēlākajās kārtās izceļ galīgos ieguvumus, un kopsavilkums pa kārtām parāda, ka labākās izmaksas par gramu ar laiku samazinās.

Ierobežojumi.

Šie rezultāti tika demonstrēti ar vienu proteīnu, sfGFP, un vienu bezšūnu olbaltumvielu sintēzes (CFPS) sistēmu. Vispārināšana uz citiem proteīniem un citām CFPS sistēmām vēl ir jāpierāda.

Skābekļa piegāde un reakcijas ģeometrija var būtiski ietekmēt iznākumu, un šie faktori var atšķirties dažādos mērogos. Daži uzlabojumi var būt jutīgi pret šiem nosacījumiem, un šo jutīgumu izpratne ir daļa no tā, kas sekos.

Protokola uzlabojumiem un reaģentu apstrādei bija nepieciešama cilvēku uzraudzība. Sistēma spēj izstrādāt un interpretēt eksperimentus, taču laboratorijas darbs joprojām ietver praktiskas detaļas, kurām nepieciešami pieredzējuši operatori.

Kas būs tālāk?

Mēs plānojam piemērot laboratorijas cikla optimizāciju citām bioloģijas darbplūsmām, kur ātrāka iterācija var veicināt progresu. Mēs redzam autonomās laboratorijas kā modeļus papildinošas. Modeļi var ģenerēt projektus, taču galu galā bioloģijai joprojām ir nepieciešama testēšana un iterācija. Noslēdzot cilpu starp ģenerēšanu un eksperimentēšanu, ir iespējams daudzsološas idejas pārvērst praktiskos rezultātos.

Strādājot pie zinātniskā progresa paātrināšanas droši un atbildīgi, mēs arī cenšamies novērtēt un samazināt riskus, īpaši tos, kas saistīti ar bioloģisko drošību. Šie rezultāti parāda, ka modeļi var veikt spriešanu mitrajā laboratorijā, lai uzlabotu protokolus, un tiem var būt ietekme uz bioloģisko drošību, ko mēs novērtējam un stiprinām, izmantojot savu Sagatavotības satvaru⁠. Mēs esam apņēmušies izveidot nepieciešamos un niansētos aizsardzības pasākumus modeļa un sistēmas līmenī, lai samazinātu šos riskus, kā arī izstrādāt novērtējumus, lai izsekotu pašreizējos līmeņus.

Mēs esam pateicīgi saviem partneriem uzņēmumā Ginkgo Bioworks un komandām, kas palīdzēja izstrādāt, darbināt un atbalstīt automatizēto mākoņlaboratoriju, kas ir šī darba pamatā.

Autors

OpenAI