Прескокни до главната содржина
OpenAI

5 февруари 2026 г.

ИстражувањеОбјава

GPT‑5 ги намалува трошоците за синтеза на протеини без клетки.

Работејќи со Ginkgo Bioworks, создадовме автономна лабораторија со вештачка интелигенција и постигнавме намалување од 40 % на трошоците за производство на протеини.

Се вчитува...

Видовме брз напредок од вештачката интелигенција во области како математика и физика, каде што идеите често можат да се оценат без да се допре физичкиот свет. Биологијата е поинаква. Напредокот се одвива низ лабораторијата, каде што научниците изведуваат експерименти кои бараат време и пари.

Тоа почнува да се менува. Граничните модели сега можат директно да се поврзат со лабораториска автоматизација, да предлагаат експерименти, да ги извршуваат на голем обем, да учат од резултатите и да одлучат што да прават следно. Во многу од животните науки, тесно грло е повторувањето, а автономните лаборатории се создадени за да го отстранат тоа ограничување.

Во претходна работа, покажавме дека GPT‑5 може да ги подобри протоколите за влажна лабораторија преку експериментирање во затворен циклус. Тука покажуваме дека истиот пристап може да ги намали трошоците за производство на протеини.

Соработувавме со Ginkgo Bioworks(се отвора во нов прозорец) за да го поврземе GPT‑5 со лабораторија во облак - автоматизирана влажна лабораторија што се управува од далечина преку софтвер, каде што роботите изведуваат експерименти и враќаат податоци - и ја искористивме таа поставеност со лабораторија во циклус за да оптимизираме широко користен биолошки процес: синтеза на протеини без клетки (CFPS). Во текот на шест рунди на експериментирање со затворен циклус, системот тестираше повеќе од 36.000 уникатни состави на CFPS реакции на 580 автоматизирани плочи. Откако му беше обезбеден пристап до компјутер, веб-прелистувач и релевантни трудови, на GPT‑5 му беа потребни три рунди експериментирање да воспостави ново најсовремено ниво во нискобуџетен CFPS, постигнувајќи 40 % намалување на трошоците за производство на протеини (и 57 % подобрување на трошоците за реагенси), вклучувајќи нови состави на реакции што се поотпорни на условите на реакција вообичаени во автономни лаборатории.

Зошто синтезата на протеини без клетки е важна

Синтеза на протеини без клетки (CFPS) е метод за создавање протеини без потреба од одгледување живи клетки. Наместо да се внесува ДНК во клетки и да се чека тие да произведат протеин, CFPS го активира механизмот за создавање протеини во контролирана смеса. Тоа ја прави практична алатка за брзо прототипирање и тестирање, бидејќи научниците можат да извршат многу експерименти брзо и да ги измерaт резултатите истиот ден.

Протеините се значаен дел од она што го нуди современата биологија. Многу важни лекови се засноваат на протеини. Многу дијагностички и истражувачки анализи зависат од протеините. Во индустриски средини, протеините функционираат како ензими кои ги прават хемиските процеси почисти и поефикасни. Протеините се наоѓаат дури и во твојот детергент за перење. Кога производството на протеини станува побрзо и поевтино, научниците обично можат да тестираат повеќе идеи порано и да ги намалат трошоците за претворање на раните истражувања во нешто од кое луѓето можат да имаат корист секој ден.

CFPS веќе е корисен за таков вид итерација. Тесното грло е што е тешко да се оптимизира и станува скапо на големи размери.

Синтезата на протеини без клетки е тешко да се оптимизира и е скапа

Синтезата на протеини без клетки бара сложени, меѓусебно интерактивни состојки: шаблонот на ДНК што го кодира протеинот што треба да се произведе, клеточниот лизат (смесата од клеточна машинерија од внатрешноста на клетките), и голем број биохемиски компоненти кои се движат од извори на енергија до соли. Неверојатно е тешко да се расудува за системот како целина, и многу(се отвора во нов прозорец) претходни(се отвора во нов прозорец) студии(се отвора во нов прозорец) примениле различни видови машинско учење за да ги намалат трошоците за производство на протеини.

Стандардните формулации за синтеза на протеини без клетки (CFPS) и комерцијалните комплети често се ценовно прилагодени за работа со човечко темпо. Автономните лаборатории можат да извршат илјадници реакции во времето кога човечки тим би извршил само десетици. При тој обем, трошоците за реагенсите стануваат ограничувачки фактор.

CFPS исто така е тешко да се оптимизира само со интуиција. Тоа е мешавина од многу компоненти кои меѓусебно комуницираат. Малите промени можат да бидат значајни, но насоката на ефектот не е секогаш очигледна, а најдобрите комбинации може да биде тешко да се пронајдат без да се извршат многу експерименти. Претходните пристапи ги намалија трошоците, но напредокот обично е растечки бидејќи темелното истражување на просторот бара многу труд.

Поврзување на GPT‑5 со роботска лабораторија

Го споивме GPT‑5 со лабораторијата во облак на Ginkgo Bioworks за да создадеме автономен систем со затворен циклус за оптимизација на синтеза на протеини без клетки (CFPS).

GPT‑5 дизајнираше серии на експерименти. Лабораторијата ги изврши задачите. Резултатите беа вратени во моделот. Моделот ги искористи тие податоци за да ја предложи следната рунда. Го повторивме тој циклус шест пати.

Дијаграм насловен „Лабораторија управувана од вештачка интелигенција“. GPT-5 врши анализа на податоци, биохемиско расудување и генерирање хипотези, испраќајќи експериментални дизајни до Reconfigurable Automation Carts (RACs), кои изведуваат физички експерименти, автоматизираат ракување со течности, инкубираат примероци и мерат флуоресценција. RACs враќаат експериментални податоци и метрики до GPT-5, создавајќи затворен повратен циклус.

GPT‑5 дизајнираше серии експерименти во стандарден формат на плоча со 384 бунари и ги изведе во лабораторијата во облак на Ginkgo Bioworks. Откако завршија експериментите, лабораторијата во облак ги испрати податоците назад до GPT‑5, каде моделот ги анализираше резултатите, генерираше нови хипотези и ја дизајнираше следната рунда експерименти.

За да го задржиме циклусот фокусиран на можностите на автономната лабораторија, воведовме строга програмска валидација пред да започне каков било експеримент. Таа валидација потврди дека експериментите дизајнирани со вештачка интелигенција беа физички изводливи на платформата за автоматизација. Тоа спречи „експерименти на хартија“ кои изгледаат веродостојно на текст, но не можат да се изведат во роботски работен тек.

Во текот на целото извршување, системот изврши повеќе од 36.000 CFPS реакции на 580 автоматизирани плочи. Овој обем е важен затоа што таа овозможува да се појават шеми. Во биологијата, поединечните експерименти се подложни на варијации. Капацитетот и итерацијата се начини на кои го одвојувате сигналот од случајниот шум. Откако GPT‑5 доби пристап до релевантниот труд и алатки, беа потребни три рунди експериментирање и два месеци за да се воспостави нов најсовремен стандард: 40 % пониски трошоци за производство на протеини во споредба со најдобрата претходна основна линија(се отвора во нов прозорец).

Реконфигурирачки колички за автоматизација на Ginkgo Bioworks. Извор: Ginkgo Bioworks

Што научивме

Откривме дека подобрувањата произлегоа од идентификување комбинации што добро функционираат заедно и што се одржуваат во реалностите на автоматизацијата со висок капацитет.

Откривме дека GPT‑5 идентификуваше нискобуџетни реакциски состави кои луѓето претходно не ги тестирале во оваа конфигурација. Синтеза на протеини без клетки (CFPS) се проучува со години, но просторот на можни мешавини сè уште е голем. Кога можеш брзо да предложиш и извршиш илјадници комбинации, можеш да пронајдеш функционални области што лесно се пропуштаат со рачен работен процес.

Исто така, откривме дека експериментите со висок капацитет, базирани на плочи, често се разликуваат од рачните експерименти на лабораториска маса. Оксигенацијата може да биде пониска во формати на реакции со висок капацитет. Мешањето и геометријата можат да се разликуваат. Повеќето реакции на CFPS произведуваат многу повеќе протеин во епрувети отколку во микротитарни плочи, бидејќи поголемите размери обично овозможуваат поголема достапност на кислород и подобро мешање. Всушност, за реакции на плочи со мал волумен, GPT‑5 предложи многу реакции кои ги надминаа претходните најдобри веднаш штом доби пристап до компјутер за анализа на податоци и веб-прелистувач за пребарување на релевантни трудови. Севкупно, GPT‑5 предложи многу комбинации на реагенси кои се покажаа добро под ограничувања на висок капацитет, вклучувајќи многу кои се поотпорни во услови на низок кислород, што се чести во автоматизирани лабораториски средини.

Покрај тоа, откривме дека малите промени во баферирањето, компонентите за обновување на енергијата и полиамините имаа значително поголемо влијание во однос на нивната цена. Овие не се секогаш првите параметри по кои луѓето посегнуваат, но при висок капацитет, тие стануваат проверливи хипотези наместо претпоставки во заднина.

Конечно, самата структура на трошоците го обликуваше она што е важно. Во CFPS, трошоците сега се доминирани од лизатот и од ДНК. Тоа значи дека приносот е стратегија со најголем ефект. Ако можеш да го зголемиш производството на протеини по единица скап влез, постигнуваш значителен напредок во намалувањето на трошоците уште пред да бараш маргинални заштеди на друго место.

Автономната лабораториска итерација ги намалува трошоците и го зголемува приносот на протеини

Низ шест рунди на автономно експериментирање, системот постојано ја подобруваше синтезата на протеини без клетки, намалувајќи ги трошоците и зголемувајќи го приносот на протеини. Резултатите се прикажани како трошок на реакција наспроти титар на протеин за секој круг, при што најдобрите компромиси формираат граница. Поголемите точки ја означуваат најниската цена по грам постигната во секоја рунда, а ѕвездестата/точкастата референца го означува претходниот врвен репер во 384-бунарни плочи (Olsen et al., 2025). Подетален поглед на подоцнежните рунди ги истакнува конечните добивки, а резиме по рунда покажува дека најдобрата цена по грам се намалува со текот на времето.

Ограничувања

Овие резултати беа демонстрирани на еден протеин, sfGFP, и еден систем за синтеза на протеини без клетки (CFPS). Генерализацијата на други протеини и други CFPS системи сè уште треба да се покаже.

Оксигенацијата и геометријата на реакцијата можат значително да влијаат на приносите, а овие фактори можат да варираат во зависност од обемот. Некои подобрувања можат да бидат чувствителни на овие услови, а разбирањето на тие чувствителности е дел од она што следува.

Беше потребен човечки надзор за подобрување на протоколот и ракување со реагенсите. Системот може да дизајнира и интерпретира експерименти, но лабораториската работа сè уште вклучува практични детали кои бараат искусни оператори.

Што е следно

Планираме да примениме оптимизација „лабораторија во циклусот“ на други биолошки работни текови каде побрзата итерација може да овозможи напредок. Ние ги гледаме автономните лаборатории како комплементарни на моделите. Моделите можат да генерираат дизајни, но на крајот биологијата сè уште бара тестирање и повторување. Затворањето на јазот меѓу создавањето и експериментирањето е начинот на кој ги претвораш ветувачките идеи во успешни резултати.

Додека работиме на безбедно и одговорно забрзување на научниот напредок, исто така се стремиме да ги оцениме и намалиме ризиците, особено оние поврзани со биосигурност. Овие резултати покажуваат дека моделите можат да расудуваат во влажната лабораторија за да ги подобрат протоколите и можат да имаат импликации за биосигурноста, кои ги оценуваме и ублажуваме преку нашата Рамка за подготвеност⁠. Посветени сме на изградба на неопходни и нијансирани заштитни мерки на ниво на модел и систем за да ги намалиме овие ризици, како и на развој на евалуации за следење на тековните нивоа.

Благодарни сме на нашите партнери од Ginkgo Bioworks и на тимовите кои помогнаа во дизајнирањето, спроведувањето и поддршката на автоматизираната лабораторија во облак што стои зад оваа работа.

Автор

OpenAI