Преминаване към основното съдържание
OpenAI

5 февруари 2026 г.

ПроучванеПубликация

GPT‑5 намалява разходите за безклетъчен синтез на протеини

Работейки с Ginkgo Bioworks, създадохме автономна лаборатория, задвижвана от изкуствен интелект, и постигнахме 40% намаление на разходите за производство на протеини.

Зареждане…

Наблюдаваме бърз напредък на ИИ в области като математиката и физиката, където идеите често могат да бъдат оценени, без да се докосва физическият свят. Биологията е различна. Напредъкът минава през лабораторията, където учените извършват експерименти, които изискват време и средства.

Това започва да се променя. Авангардните модели вече могат да бъдат свързани директно с лабораторната автоматизация, да предлагат експерименти, да ги изпълняват в мащаб, да се учат от резултатите и да решават какво да правят след това. В много от науките за живота, предизвикателството е итерацията, а автономните лаборатории са създадени, за да премахнат това ограничение.

В предишна работа показахме, че GPT‑5 може да подобри протоколите за мокра лаборатория чрез експериментиране в затворен цикъл. Тук показваме, че същият подход може да намали разходите за производство на протеини.

Партнирахме си с Ginkgo Bioworks(отваря се в нов прозорец), за да свържем GPT‑5 с облачна лаборатория – автоматизирана мокра лаборатория, управлявана дистанционно чрез софтуер, където роботи изпълняват експерименти и връщат данни – и използвахме тази лаборатория в цикъл, за да оптимизираме широко използван биологичен процес: безклетъчен синтез на протеини. В рамките на шест кръга на експериментиране със затворен цикъл, системата тества над 36 000 уникални състава на реакции на безклетъчен синтез на протеини върху 580 автоматизирани плаки. След като беше предоставен достъп до компютър, уеб браузър и съответните документи, GPT‑5 проведе три кръга експерименти, за да проведе нискобюджетен синтез от най-висок клас, постигайки 40% намаление на разходите за производство на протеини (и 57% подобрение в разходите за реагенти), включително нови реакционни състави, които са по-устойчиви на условията на реакция, често срещани в автономни лаборатории.

Значението на безклетъчния синтез на протеини

Безклетъчният синтез на протеини е метод за създаване на протеини без необходимост от отглеждане на живи клетки. Вместо да се вкарва ДНК в клетки и да се изчаква те да произведат протеин, синтезът задвижва механизма за синтез на протеини в контролирана смес. Това го прави практичен похват за бързо прототипиране и тестване, тъй като учените могат да провеждат много експерименти бързо и да измерват резултатите още в същия ден.

Протеините са в основата на много от продуктите на съвременната биология. Множество важни лекарства са на базата на протеини. Много диагностични и изследователски анализи зависят от протеини. В индустриални условия протеините действат като ензими, които правят химичните процеси по-чисти и по-ефективни. Протеини се съдържат дори в перилния Ви препарат. Когато производството на протеини стане по-бързо и по-евтино, учените обикновено могат да тестват повече идеи по-рано и да намалят разходите за превръщане на ранните изследвания в нещо, от което хората могат да се възползват всеки ден.

Безклетъчният синтез на протеини вече е полезен за този вид итерации. Слабото звено е, че е сложен за оптимизиране и скъп за прилагане в мащаб.

Синтезът на протеини без клетки е труден за оптимизиране и скъп

Безклетъчният синтез на протеини изисква сложни и взаимодействащи съставки: ДНК шаблонът, който кодира протеина за производство, клетъчният лизат (супа от клетъчната механика вътре в клетките) и множество биохимични компоненти, вариращи от енергийни източници до соли. Изключително трудно е да се разсъждава върху системата като цяло и много(отваря се в нов прозорец) предишни(отваря се в нов прозорец) проучвания(отваря се в нов прозорец) са прилагали различни видове машинно обучение, за да намалят разходите за производство на протеини.

Стандартните формулировки за безклетъчен синтез на протеини и търговските комплекти често са с цени, съобразени с човешкото темпо на работа. Автономните лаборатории могат да извършат хиляди реакции за времето, за което един човешки екип би извършил десетки. При този мащаб разходите за реагенти стават ограничание.

Безклетъчният синтез на протеини също така е труден за оптимизиране само чрез интуиция. Той е комбинация от много взаимодействащи компоненти. Малките промени могат да имат значение, но ефектът не винаги е очевиден, а най-добрите комбинации могат да бъдат трудни за откриване без провеждането на множество експерименти. Предишните подходи намалиха разходите, но напредъкът обикновено е постепенен, защото задълбоченото изследване в тази сфера е трудоемко.

Свързване на GPT‑5 към роботизирана лаборатория

Свързахме GPT‑5 с облачната лаборатория на Ginkgo Bioworks, за да създадем автономна система със затворен цикъл за оптимизация на безклетъчния синтез на протеини.

GPT‑5 проектира серии от експерименти. Лабораторията ги изпълни. Резултатите бяха върнати обратно към модела. Моделът използва тези данни, за да предложи следващия етап. Повторихме този цикъл шест пъти.

Диаграма, озаглавена „Лаборатория, задвижвана от ИИ“. GPT-5 извършва анализ на данни, биохимично структурирано анализиране и генериране на хипотези, като изпраща експериментални проекти към преконфигурируеми автоматизирани колички (RACs), които изпълняват физически експерименти, автоматизират обработката на течности, инкубират проби и измерват флуоресценция. Преконфигурируемите автоматизирани колички връщат експериментални данни и метрики обратно към GPT-5, формирайки затворен цикъл на обратна връзка.

GPT‑5 проектира партиди експерименти в стандартен формат на 384-ямкова плака и ги изпълни в облачната лаборатория на Ginkgo Bioworks. След като експериментите приключиха, облачната лаборатория изпрати данните обратно към GPT‑5, където моделът анализира резултатите, генерира нови хипотези и проектира следващия кръг от експерименти.

За да остане цикълът в съответствие с възможностите на една автономна лаборатория, добавихме строга програмна проверка преди провеждането на всеки експеримент. Тази валидация гарантираше, че експериментите, проектирани от изкуствен интелект, са физически изпълними на платформата за автоматизация. Това предотврати теоретични експерименти, които изглеждат правдоподобни на хартия, но не могат да бъдат изпълнени в роботизиран работен процес.

В рамките на целия цикъл системата изпълни повече от 36 000 реакции CFPS върху 580 автоматизирани плаки. Този мащаб е важен, защото именно той позволява да се появят модели. В биологията отделните експерименти са с висок шум. Производителността и итерацията са начинът да отделите сигнала от случайния шум. След като GPT‑5 получи достъп до съответната статия и инструменти, бяха необходими три кръга експерименти и два месеца, за да се установи нов стандарт от най-висок клас: 40% по-ниска цена за производство на протеин в сравнение с най-добрата предишна базова стойност(отваря се в нов прозорец).

Преконфигурируеми автоматизирани колички на Ginkgo Bioworks. Авторско право: Ginkgo Bioworks

Какво научихме

Установихме, че подобренията произтичат от идентифицирането на комбинации, които работят добре заедно и се запазват в условията на автоматизация с висока производителност.

Установихме, че GPT‑5 идентифицира нискобюджетни състави за реакции, които хората досега не бяха тествали в тази конфигурация. Безклетъчният синтез на протеини се изследва от години, но обхватът на възможните смеси все още е значителен. Когато бързо предлагате и изпълнявате хиляди комбинации, можете да откриете работещи области, които лесно се пропускат при ръчен работен процес.

Установихме също, че експериментите с висока производителност, базирани на микроплаки, често се различават от ръчните експерименти на лабораторната маса. Окисляването може да бъде по-ниско при формати на реакции с висока производителност. Смесването и геометрията могат да се различават. Повечето безклетъчни реакции на синтез произвеждат значително повече протеин в епруветки, отколкото в микротитърни плаки, тъй като по-големите мащаби обикновено осигуряват повече кислород и по-добро смесване. Всъщност, за реакции на плаки с малък обем, GPT‑5 предложи много реакции, които надминаха предишния най-добър резултат веднага след като получи достъп до компютър за анализ на данни и уеб браузър за търсене на съответните статии. Като цяло GPT‑5 предложи много комбинации от реагенти, които се представиха добре при ограничения за високопроизводителност, включително много, които са по-устойчиви при условия на ниско съдържание на кислород, често срещани в автоматизирани лабораторни среди.

Освен това установихме, че малки промени в буферирането, компонентите за възстановяване на енергия и полиамините оказаха значително въздействие спрямо тяхната цена. Това не винаги са първите параметри, към които хората посягат, но при висока производителност те се превръщат в проверими хипотези, а не във фонови предположения.

Не на последно място, самата структура на разходите оформи това, което беше от значение. В безклетъчния синтез разходите вече се определят основно от лизат и ДНК. Това означава, че добивът е стратегията с най-голямо въздействие. Ако можете да увеличите добива на протеин на единица скъп ресурс, постигате значителен напредък в разходите още преди да търсите допълнителни спестявания другаде.

Автономна лабораторна итерация намалява разходите, като същевременно увеличава добива на протеин

В продължение на шест кръга автономни експерименти, системата последователно подобряваше безклетъчния синтез на протеини, намалявайки разходите и увеличавайки добива на протеин. Резултатите са показани като разход за реакция спрямо титър на протеина за всеки кръг, като най-добрите компромиси формират авангарден резултат. По-големите точки отбелязват най-ниската цена на грам, постигната във всеки кръг, а звездичката/пунктираната референция показва предишния еталон от най-високо ниво в 384-ямкови плаки (Olsen и сътр., 2025 г.). По-внимателният поглед към по-късните кръгове подчертава крайните печалби, а обобщение за всеки кръг показва как най-добрата цена на грам спада с времето.

Ограничения

Тези резултати бяха демонстрирани върху един протеин – sfGFP – и една система за безклетъчен синтез на протеини. Обобщението за други протеини и други безклетъчни системи все още не е доказано.

Окисляването и геометрията на реакцията могат силно да влияят на добивите, като тези фактори могат да се променят при различни мащаби. Някои подобрения може да са чувствителни към тези условия, а разбирането на тези чувствителности е част от следващите стъпки.

За подобрения на протокола и работа с реагенти беше необходим човешки надзор. Системата може да проектира и интерпретира експерименти, но лабораторната работа все още включва практически детайли, които изискват опитни оператори.

Какво следва

Планираме да приложим оптимизация с лаборатория в цикъла към други биологични процеси, където по-бързата итерация може да отключи напредък. Ние виждаме автономните лаборатории като допълващи моделите. Моделите могат да проектират, но в крайна сметка биологията все още изисква тестване и итерация. Затварянето на цикъла между генерирането и експериментирането е начинът, по който да превърнете обещаващите идеи в работещи резултати.

Докато работим за ускоряване на научния прогрес безопасно и отговорно, също така се стремим да оценяваме и намаляваме рисковете, особено тези, свързани с биосигурността. Тези резултати показват, че моделите могат да разсъждават в мократа лаборатория, за да подобрят протоколите, и може да имат последици за биосигурността, които оценяваме и смекчаваме чрез нашата рамка за готовност. Ние сме ангажирани с изграждането на необходимите и детайлни предпазни мерки на ниво модел и система, за да намалим тези рискове, както и да разработим оценки за проследяване на текущите нива.

Благодарни сме на нашите партньори от Ginkgo Bioworks и на екипите, които помогнаха за проектирането, управлението и поддръжката на автоматизираната облачна лаборатория, стояща зад тази работа.

Автор

OpenAI