GPT‑5 смањује трошкове синтезе протеина без ћелија
Радећи са компанијом Ginkgo Bioworks, направили смо аутономну лабораторију вођену вештачком интелигенцијом и постигли смањење трошкова производње протеина за 40%.
Видели смо брз напредак вештачке интелигенције у областима као што су математика и физика, где се идеје често могу проценити без додиривања физичког света. Биологија је другачија. Напредак се одвија кроз лабораторију, где научници спроводе експерименте који захтевају време и новац.
То почиње да се мења. Гранични модели сада могу директно да се повежу са лабораторијском аутоматизацијом, предложе експерименте, покрену их у великом обиму, уче из резултата и одлуче шта да раде даље. У великом делу наука о животу, уско грло је итерација, а аутономне лабораторије су изграђене да уклоне то ограничење.
У ранијем раду, показали смо да је GPT‑5 могао да побољша протоколе у мокрој лабораторији кроз експериментисање у затвореној петљи. Овде показујемо да исти приступ може да смањи трошкове производње протеина.
Успоставили смо партнерство са Ginkgo Bioworks(отвара се у новом прозору) како бисмо повезали GPT‑5 са лабораторијом у облаку – аутоматизованом експерименталном лабораторијом којом се на даљину управља путем софтвера, где роботи изводе експерименте и враћају податке – и користили смо тај „lab-in-the-loop“ приступ за оптимизацију широко коришћеног биолошког процеса: синтеза протеина без ћелија (CFPS). Током више од шест рунди експериментисања у затвореној петљи, систем је тестирао више од 36.000 јединствених CFPS реакционих композиција на 580 аутоматизованих плоча. Након што су му обезбеђени приступ рачунару, веб-прегледачу и приступ релевантним радовима, GPT‑5 је кроз три рунде експериментисања успео да успостави нови најсавременији резултат у нискобуџетном CFPS-у, постигавши смањење трошкова производње протеина за 40% (и побољшање трошкова реагенаса за 57%), укључујући нове саставе реакција који су робуснији на реакционе услове уобичајене у аутономним лабораторијама.
Синтеза протеина без ћелија (CFPS) је начин да се протеини производе без узгајања живих ћелија. Уместо да се ДНК уноси у ћелије и чека да оне произведу протеин, CFPS покреће машинерију за производњу протеина у контролисаној мешавини. То га чини практичним алатом за брзо прототипирање и тестирање, јер научници могу брзо да спроведу многе експерименте и измере резултате истог дана.
Протеини су велики део онога што савремена биологија пружа. Многи важни лекови су засновани на протеинима. Многи дијагностички и истраживачки тестови зависе од протеина. У индустријским окружењима, протеини делују као ензими који чине хемијске процесе чистијим и ефикаснијим. Протеини се налазе чак и у вашем детерџенту за веш. Када производња протеина постане бржа и јефтинија, научници обично могу раније да тестирају више идеја и да смање трошкове претварања раних истраживања у нешто од чега људи могу да имају користи сваког дана.
CFPS је већ користан за ту врсту итерације. Уско грло се огледа у томе што је тешко оптимизовати и постаје скупо у великом обиму.
Синтеза протеина без ћелија захтева сложене, међусобно интерактивне састојке: ДНК шаблон који кодира протеин који треба да се произведе, ћелијски лизат (супа ћелијске машинерије из унутрашњости ћелија) и велики број биохемијских компоненти, од извора енергије до соли. Невероватно је тешко размишљати о систему као целини, и многе(отвара се у новом прозору) претходне(отвара се у новом прозору) студије(отвара се у новом прозору) су примениле различите врсте машинског учења како би смањиле трошкове производње протеина.
Стандардне формулације за синтезу протеина без ћелија (CFPS) и комерцијални комплети често су ценовно прилагођени раду темпом који одговара људима. Аутономне лабораторије могу да изведу хиљаде реакција за време у ком би људски тим могао да изведе десетине. На тој скали, трошак реагенаса постаје ограничавајући фактор.
CFPS је такође тешко оптимизовати само на основу интуиције. То је мешавина многих компоненти које су у интеракцији. Мале промене могу бити важне, али смер утицаја није увек очигледан, а најбоље комбинације може бити тешко пронаћи без спровођења великог броја експеримената. Претходни приступи су смањили трошкове, али напредак обично бива постепен јер је темељно истраживање простора радно интензивно.
Упарили смо GPT‑5 са cloud лабораторијом компаније Ginkgo Bioworks како бисмо формирали аутономни систем затворене петље за оптимизацију синтезе протеина без ћелија (CFPS).
GPT‑5 је осмислио серије експеримената. Лабораторија их је извршила. Резултати су враћени моделу. Модел је користио те податке да предложи следећу рунду. Поновили смо тај циклус шест пута.

GPT‑5 је осмислио серије експеримената у стандардном формату плоче са 384 бунарчића и извео их у cloud лабораторији компаније Ginkgo Bioworks. Када су експерименти завршени, лабораторија у облаку је вратила податке у GPT‑5, где је модел анализирао исходе, генерисао нове хипотезе и осмислио следећу рунду експеримената.
Да бисмо петљу држали утемељеном у ономе што аутономна лабораторија може да уради, додали смо строгу програмску валидацију пре него што је било који експеримент покренут. Та валидација је обезбедила да експерименти које је осмислила вештачка интелигенција буду физички изводљиви на платформи за аутоматизацију. То је спречило „папирне експерименте” који у тексту делују уверљиво, али не могу да се спроведу у роботизованом току рада.
Током целокупног извођења, систем је извршио више од 36.000 CFPS реакција на 580 аутоматизованих плоча. Овај обим је важан јер управо он омогућава да се обрасци појаве. У биологији појединачни експерименти су подложни шуму. Пропусна моћ и итерација су оно што вам омогућава да разликујете сигнал од случајног шума. Када је GPT‑5 добио приступ релевантном раду и алатима, биле су потребне три рунде експериментисања и два месеца да се успостави нови најбољи резултат: 40% нижи трошак производње протеина у поређењу са најбољом претходном базном линијом(отвара се у новом прозору).
Ginkgo Bioworks-ова аутоматизована колица која се могу конфигурисати. Заслуге: Ginkgo Bioworks
Утврдили смо да су побољшања произашла из идентификовања комбинација које добро функционишу заједно и које се одржавају у реалним условима аутоматизације високе пропусне моћи.
Утврдили смо да је GPT‑5 идентификовао нискобуџетне реакционе композиције које људи раније нису тестирали у овој конфигурацији. Синтеза протеина без ћелија (CFPS) проучава се годинама, али простор за могуће комбинације и даље је велики. Када можете брзо да предложите и извршите хиљаде комбинација, можете да пронађете употребљиве области које је лако превидети уз ручни ток рада.
Такође смо утврдили да се експерименти високе пропусне моћи, засновани на плочама, често разликују од ручних експеримената на лабораторијској клупи. Оксигенација може бити нижа у форматима реакција са високом пропусном моћи. Мешање и геометрија могу да буду различити. Већина CFPS реакција производи много више протеина у епруветама него у микротитарским плочама, јер веће скале генерално долазе са већом доступношћу кисеоника и бољим мешањем. Заправо, за реакције засноване на плочама при малом обиму, GPT‑5 је предложио многе реакције које су надмашиле претходно најбоље одмах након што је добио приступ рачунару за анализу података и веб-прегледачу за претрагу релевантних радова . У целини, GPT‑5 је предложио многе комбинације реагенса које су се добро показале под ограничењима високе пропусне моћи, укључујући и многе које су робусније у условима ниског нивоа кисеоника, уобичајеним у аутоматизованим лабораторијским окружењима.
Поред тога, утврдили смо да су мале промене у пуферисању, компонентама за регенерацију енергије и полиаминима имале несразмерно велики утицај у односу на њихов трошак. Ово нису увек први параметри за којима људи посежу, али при високој пропусној моћи, они постају проверљиве хипотезе, а не позадинске претпоставке.
Коначно, сама структура трошкова обликовала је оно што је било важно. У CFPS-у трошкови сада углавном потичу од лизата и ДНК. То значи да је принос стратегија са највећим ефектом. Ако можете да повећате производњу протеина по јединици скупог улаза, остварујете значајан напредак у трошковима чак и пре него што кренете да тражите маргиналне уштеде на другим местима.
Кроз шест рунди аутономног експериментисања, систем је постепено побољшавао синтезу протеина без ћелија, смањујући трошкове и истовремено повећавајући принос протеина. Резултати су приказани као трошак реакције у односу на титар протеина за сваку рунду, при чему најбољи компромиси формирају границу. Веће тачке означавају најнижи трошак по граму постигнут у свакој рунди, а звезда / тачкаста референца указује на претходни најсавременији референтни резултат у плочама са 384 бунарчића (Олсен и др., 2025). Детаљнији преглед каснијих рунди истиче коначне добитке, а сажетак по рундама приказује најбоље смањење трошкова по граму током времена.
Ови резултати су демонстрирани на једном протеину, sfGFP, и једном систему за синтезу протеина без ћелија (CFPS). Генерализација на друге протеине и друге CFPS системе још увек треба да се покаже.
Оксигенација и геометрија реакције могу снажно утицати на приносе, а ови фактори могу да варирају у зависности од скале. Нека побољшања могу бити осетљива на ове услове, а разумевање тих осетљивости је део онога што следи.
Био је потребан људски надзор ради побољшања протокола и руковања реагенсима. Систем може да осмишљава и тумачи експерименте, али лабораторијски рад и даље подразумева практичне детаље који захтевају искусне оператере.
Планирамо да применимо оптимизацију „lab-in-the-loop“ на друге биолошке токове рада где бржа итерација може да омогући напредак. Аутономне лабораторије видимо као допуну моделима. Модели могу да генеришу дизајне, али на крају биологија и даље захтева тестирање и итерацију. Затварање круга између генерисања и експериментисања је начин на који обећавајуће идеје претварате у резултате који функционишу.
Док радимо на томе да убрзамо научни напредак на безбедан и одговоран начин, такође настојимо да проценимо и смањимо ризике, посебно оне повезане са биолошком безбедношћу. Ови резултати показују да модели могу да резонују у мокрој лабораторији како би унапредили протоколе и могу имати импликације по биолошку безбедност које процењујемо и ублажавамо кроз свој Оквир спремности. Посвећени смо изградњи неопходних и нијансираних заштитних мера на нивоу модела и система како бисмо смањили ове ризике, као и развоју процена за праћење тренутних нивоа.
Захвални смо својим партнерима у компанији Ginkgo Bioworks и тимовима који су помогли да се осмисли, покрене и подржи аутоматизована лабораторија у облаку која стоји иза овог рада.


