Перейти до основного вмісту
OpenAI

GPT‑5 знизив вартість безклітинного синтезу білків

У співпраці з Ginkgo Bioworks ми створили автономну лабораторію на базі ШІ та досягли зниження вартості синтезу білка на 40%.

Завантаження…

Ми вже спостерігали швидкий прогрес ШІ в таких галузях, як математика та фізика — де ідеї часто можна оцінювати без взаємодії з фізичним світом. Біологія відрізняється від таких наук. Тут прогрес має проходити через лабораторії, в яких вчені проводять експерименти, що потребують витрат часу та коштів.

Але цей принцип роботи починає змінюватися. Сьогодні передові моделі можуть безпосередньо підключатися до лабораторного обладнання, пропонувати експерименти, проводити їх у великому масштабі, вчитися на результатах та приймати рішення щодо подальших дій. У багатьох галузях біології проблеми починаються в процесі повторень (ітерацій); для усунення цього обмеження створюються автономні лабораторії.

У попередніх дослідженнях ми показали, що GPT‑5 може оптимізувати протоколи практичних експериментів шляхом їх проведення в замкнутому циклі. У цій роботі було підтверджено, що той самий підхід допоможе знизити вартість синтезу білка.

У рамках співпраці з Ginkgo Bioworks(відкривається у новому вікні) ми підключили GPT‑5 до хмарної лабораторії — автоматизованої практичної лабораторії, що керується віддалено через програмне забезпечення, де роботи виконують експерименти та повертають дані, — і використали замкнуту схему lab-in-the-loop для оптимізації обширного біологічного процесу: безклітинного синтезу білку (CFPS). За шість етапів експериментів із замкнутим циклом система протестувала понад 36 000 унікальних складів реакцій CFPS на 580 автоматизованих планшетах. Після того як GPT‑5 надали доступ до комп’ютера, веб-браузеру і відповідним матеріалам, йому знадобилося три етапи експериментів, щоб встановити новий стандарт у сфері низьковитратного CFPS, домігшись зниження вартості синтезу білка на 40% (і зниження витрат на реагенти на 57%), зокрема розробивши нові склади реакцій, які є більш стійкими до умов, поширених в автономних лабораторіях.

Чим важливий безклітинний синтез білка

Безклітинний синтез білка (CFPS) — це спосіб отримання білків без необхідності вирощування живих клітин. Замість того, щоб вводити ДНК у клітини і чекати, поки вони синтезують білок, CFPS запускає білоксинтезуючий механізм у контрольованій суміші. Це робить його практичним інструментом для швидкого прототипування та тестування: таким чином вчені можуть швидко проводити безліч експериментів та аналізувати отримані результати того ж дня.

Білки є значною частиною того, що пропонує сучасна біологія. Багато важливих ліків створено на основі білків. Безліч діагностичних та дослідницьких аналізів залежать від білків. У промислових умовах білки виконують роль ферментів, які роблять хімічні процеси чистішими та ефективнішими. Білки можна знайти навіть у пральному порошку. Зробивши синтез білка швидше та дешевше, вчені можуть раніше перевіряти більше ідей та знижувати вартість трансформації ранніх досліджень у щось, від чого люди можуть отримувати користь щодня.

Для цього і було розроблено CFPS. Основна його складність полягає в тому, що оптимізація цього процесу складна, а при масштабуванні його вартість зростає в рази.

Безклітинний синтез білка — витратний процес, який досить складно оптимізувати

Безклітинний синтез білка вимагає складних, взаємодіючих інгредієнтів: ДНК-матриці, що кодує білок, який необхідно синтезувати, клітинного лізату (суміші з клітинних механізмів зсередини клітин) та великої кількості біохімічних компонентів, починаючи від джерел енергії та закінчуючи солями. Надзвичайно складно міркувати про систему загалом; багато(відкривається у новому вікні) попередніх(відкривається у новому вікні) досліджень(відкривається у новому вікні) застосовували різні типи машинного навчання зниження вартості синтезу білка.

Ціна стандартних складів для безклітинного синтезу білка (CFPS) та комерційних наборів часто передбачає роботу у природному темпі. Автономні лабораторії можуть проводити тисячі реакцій за час, за який команда людей могла б провести лише десятки. За такого масштабу вартість реагентів стає обмежуючим чинником.

CFPS також важко оптимізувати, покладаючись лише на інтуїцію. Цей процес — комбінація безлічі взаємодіючих компонентів. Невеликі зміни можуть мати значення, але напрямок ефекту не завжди очевидний, і кращі поєднання важко знайти без проведення безлічі експериментів. Попередні підходи вже дозволили знизити витрати, проте прогрес, як правило, продовжує поступовий рух: ретельне дослідження сфери потребує значних трудовитрат.

Підключення GPT‑5 до роботизованої лабораторії

Ми об'єднали GPT‑5 із хмарною лабораторією Ginkgo Bioworks, створивши замкнуту автономну систему для оптимізації безклітинного синтезу білка (CFPS).

GPT‑5 розробив серію експериментів. Лабораторія провела їх. Результати були передані в модель. Модель використала ці дані, щоб запропонувати наступний етап. Цикл було повторено шість разів.

Схема із заголовком «Автономна лабораторія на базі ШІ». GPT-5 виконує аналіз даних, біохімічні міркування та генерацію гіпотез, відправляючи експериментальні проекти на реконфігуровані автоматизовані стійки (RAC), які проводять фізичні експерименти, автоматизують обробку рідин, інкубують зразки та вимірюють флуоресценцію. RAC повертають експериментальні дані та метрики в GPT-5, формуючи замкнутий цикл зворотного зв'язку.

GPT‑5 розробив пакети експериментів у стандартному форматі для планшетів на 384 лунки та провів їх у хмарній лабораторії Ginkgo Bioworks. Після завершення експериментів хмарна лабораторія передала дані назад до GPT‑5: модель проаналізувала результати, сформулювала нові гіпотези та розробила наступний етап експериментів.

Щоб цикл залишався прив'язаним до можливостей автономної лабораторії, ми додали сувору програмну перевірку перед запуском будь-якого експерименту. Ця перевірка гарантувала, що експерименти, розроблені ШІ, могли бути фізично виконані на автоматизованій платформі. Це запобігало проведенню «експериментів на папері», які виглядали правдоподібно лише в теорії, але насправді не могли бути виконані в роботизованому робочому процесі.

За весь цикл система виконала понад 36 000 реакцій CFPS на 580 автоматизованих планшетах. Саме такий масштаб дозволяє виділити чіткі патерни. У біології окремі експерименти можуть давати викривлені результати. Відокремити сигнал від випадкового інформаційного шуму дозволяє швидкість обробки даних та ітерації. Щойно GPT‑5 отримав доступ до відповідної статті та інструментів, знадобилося три етапи експериментів і два місяці, щоб встановити нову еталонну вартість синтезу білка — на 40% нижче порівняно з найкращим попереднім базовим рівнем(відкривається у новому вікні).

Автоматизовані стійки компанії Ginkgo Bioworks, що реконфігуруються. Фото: Ginkgo Bioworks

Що ми дізналися

Ми з'ясували, що оптимізація стала результатом виявлення поєднань, які добре працюють разом та зберігають ефективність в умовах автоматизації з високою пропускною здатністю.

Ми виявили, що GPT‑5 знайшов недорогі реакційні склади, які раніше не тестувалися у цій конфігурації людьми. Безклітинний синтез білка (CFPS) вивчається вже багато років, але діапазон можливих сумішей, як і раніше, залишається великим. Маючи можливість швидко пропонувати та реалізовувати тисячі комбінацій, ви можете знаходити вдалі робочі варіанти, які легко упустити під час перевірки вручну.

Ми також з'ясували, що результати експериментів з високою пропускною здатністю на планшетах часто відрізняються від лабораторних ручних експериментів. Оксигенація може бути нижчою у реакціях з високою пропускною здатністю. Змішування та геометрія можуть бути різними. Більшість реакцій CFPS дозволяють синтезувати значно більше білка в пробірках, ніж у мікротитрувальних планшетах, оскільки на більших масштабах зазвичай є більше кисню і забезпечується краще перемішування. Для реакцій на планшетах при малому обсязі GPT‑5 запропонував безліч реакцій, результати яких перевершили попередні найкращі результати відразу після отримання доступу до комп'ютера для аналізу даних та веб-браузеру для пошуку релевантних статей. В цілому GPT‑5 запропонував безліч комбінацій реагентів, які добре працювали в умовах високої пропускної здатності, включаючи ті, які виявилися стійкішими в умовах низького вмісту кисню, характерних для автоматизованих лабораторій.

Крім того, ми виявили, що невеликі зміни в буферизації, компонентах регенерації енергії та поліамінів мають непропорційно великий вплив у порівнянні з їх вартістю. Це не завжди перші параметри, до яких звертаються люди, але при високій пропускній здатності вони стають гіпотезами, що перевіряються, а не вихідними припущеннями.

Зрештою, сама структура витрат визначила, що має значення. У CFPS витрати тепер переважно визначаються вартістю лізату й ДНК. Це означає, що стратегією з найбільшим важелем впливу є об'єм синтезу. Якщо збільшити вихід білка на одиницю дорогого ресурсу, можна досягти значного прогресу у зниженні витрат ще до того, як ви почнете шукати незначну економію в інших місцях.

Проведення ітерацій в автономних лабораторіях знижує витрати, одночасно збільшуючи вихід білка

Протягом шести етапів автономних експериментів система послідовно покращувала безклітинний синтез білка, знижуючи витрати та збільшуючи вихід білка. Результати представлені як вартість реакції у порівнянні з титром білка для кожного етапу, при цьому найкращі компроміси утворюють межу. Більші точки позначають найменшу вартість за грам, досягнуту на кожному етапі, а зірочка/пунктирна позначка вказує на попередній еталонний показник планшетів на 384 лунки (Olsen et al., 2025). Детальніший аналіз пізніших етапів підкреслює остаточні досягнення, а зведення по етапах показує, що найкраща вартість за грам згодом зменшується.

Обмеження

Ці результати були продемонстровані на одному білку, sfGFP, та одній системі безклітинного синтезу білка (CFPS). Для узагальнення результатів з іншими білками та системами CFPS потрібне проведення подальших досліджень.

Оксигенація і геометрія реакції можуть суттєво впливати на вихід, і ці фактори можуть змінюватись у різних масштабах. Деякі вдосконалення можуть бути чутливі до цих умов, і розуміння цих чутливих аспектів є частиною того, що буде далі.

Для оптимізації протоколу та поводження з реагентами був потрібен нагляд людини. Система може розробити дизайн та інтерпретувати експерименти, але лабораторна робота, як і раніше, включає практичні деталі, що вимагають втручання досвідчених операторів.

Попереду чекають нові можливості

Ми плануємо застосовувати оптимізацію «lab-in-the-loop» до інших біологічних робочих процесів, де більш швидкі ітерації можуть прискорити прогрес. Ми розглядаємо автономні лабораторії як додаток до моделей. Моделі можуть генерувати проєкти, але зрештою біологія все одно вимагає тестування та ітерації. Замкнувши коло між генерацією та експериментами, ми перетворюємо перспективні ідеї на робочі результати.

Працюючи над прискоренням наукового прогресу безпечно та відповідально, ми також прагнемо оцінювати та зменшувати ризики, особливо ті, що стосуються біобезпеки. Ці результати показують, що моделі можуть міркувати в умовах практичних експериментів для вдосконалення протоколів, що може мати важливі наслідки для біобезпеки, які ми оцінюємо та пом’якшуємо через нашу програму готовності⁠. Ми зобов'язуємося створювати⁠ необхідні, специфічні засоби захисту на рівні моделі та системи, щоб зменшити ці ризики, а також розробляти оцінки для відстеження поточних рівнів.

Ми вдячні нашим партнерам у Ginkgo Bioworks та командам, які допомогли спроєктувати, запустити та підтримувати автоматизовану хмарну лабораторію, що лежить в основі цієї роботи.

Автор

OpenAI