Измерение способности ИИ ускорять биологические исследования в мокрой лаборатории (wet lab)
GPT‑5 предложила новые улучшения лабораторного протокола, увеличив эффективность протокола молекулярного клонирования в 79 раз.

Ускорение научного прогресса — один из самых ценных способов, которыми ИИ может приносить пользу человечеству. С GPT‑5 мы начинаем видеть первые признаки этого — и не только в том, что модель помогает исследователям быстрее ориентироваться в научной литературе, но и в том, что поддерживает новые формы научного мышления: находит неожиданные связи, предлагает стратегии доказательства или выдвигает правдоподобные механизмы, которые эксперты могут оценить и проверить.
Пока самый заметный прогресс был в математике, теоретической физике и теоретической информатике, где идеи можно строго проверять без физических экспериментов. В биологии все иначе: большинство прорывов зависят от выполнения экспериментов, итераций и эмпирической проверки в лаборатории.
Чтобы понять, как передовые модели ведут себя в таких условиях, мы вместе с Red Queen Bio — стартапом в области биобезопасности — разработали систему оценки, которая проверяет, как модель предлагает идеи, анализирует их и итеративно дорабатывает в экспериментальной лаборатории. Мы собрали простую экспериментальную систему молекулярной биологии и попросили GPT‑5 оптимизировать протокол молекулярного клонирования, чтобы повысить эффективность.
За несколько раундов экспериментов модель GPT‑5 предложила новый механизм, который повысил эффективность клонирования в 79 раз. Клонирование — базовый инструмент молекулярной биологии. Эффективность методов клонирования критична для создания больших и сложных библиотек, которые лежат в основе инженерии белков(открывается в новом окне) (protein engineering), генетических скринингов(открывается в новом окне) (genetic screens) и инженерии штаммов организмов(открывается в новом окне) (organismal strain engineering). Этот проект дает представление о том, как ИИ может работать бок о бок с биологами и ускорять исследования. Улучшение экспериментальных методик поможет ученым двигаться быстрее, снижать затраты и превращать открытия в реальный эффект.
Поскольку прогресс в биологических рассуждениях связан с последствиями для биобезопасности, мы проводили работу в строго контролируемых условиях — использовали безопасную экспериментальную систему, ограничили масштаб задачи и оценивали поведение модели, чтобы уточнять наши оценки рисков и разрабатывать меры защиты на уровне модели и системы, как описано в нашей Программе готовности(открывается в новом окне) (Preparedness Framework).
В этой установке модель GPT‑5 автономно рассуждала о протоколе клонирования, предлагала изменения и, получая данные новых экспериментов, выдвигала новые улучшения. Единственное вмешательство человека — ученые выполняли измененный протокол и загружали экспериментальные данные.
За несколько раундов модель GPT‑5 оптимизировала процедуру клонирования, повысив эффективность более чем в 79 раз — то есть при фиксированном количестве входной ДНК мы получили в 79 раз больше клонов, подтвержденных секвенированием, чем по базовому протоколу. Особенно важно, что модель добавила два фермента, образующие новый механизм: рекомбиназу RecA из E. coli и белок gp32 — одноцепочечный ДНК‑связывающий белок гена 32 фага T4. Работая вместе, gp32 выпрямляет и распутывает свободные концы ДНК, а RecA затем направляет каждую цепь к правильной паре.
Первичный скрининг и повторные эксперименты показали, что лучшими протоколами стали RecA‑Assisted Pair‑and‑Finish HiFi Assembly (RAPF) и Transformation 7 (T7) — соответственно для стадии сборки и для стадии трансформации. И сборка RAPF, и трансформация T7 по отдельности повышали эффективность клонирования относительно базового протокола HiFi: в 2,6 и 36 раз соответственно; в сочетании они дали аддитивный прирост в 79 раз. Все клоны подтвердили секвенированием. (Погрешности: SD по n=3 независимым валидационным экспериментам).
Хотя это только начало, результаты обнадеживают. Улучшения специфичны для нашей конкретной схемы клонирования в этой модельной системе и все еще требуют, чтобы ученые настраивали и проводили протоколы. Тем не менее эксперименты показывают, что ИИ‑системы могут заметно помогать в реальной лабораторной работе и со временем способны ускорять работу ученых.
Важно, что цикл «ИИ‑лаборатория» выполнялся с фиксированным промптом и без вмешательства человека. Такая обвязка помогла выявить способность модели предлагать действительно новые изменения протокола без подсказок со стороны человека, но при этом зафиксировала систему в режиме исследования и ограничила ее способность максимально развивать найденные идеи. Более удачный динамический баланс между поиском нового (exploration) и доводкой найденного (exploitation), вероятно, дал бы еще больший выигрыш — и в ферментативной части, и в части трансформации остается много пространства для доработки. Мы ожидаем, что прогресс в планировании и рассуждениях о горизонте задач повысит способность простых фиксированных промптов поддерживать и открытие чего-то нового, и последующую оптимизацию.
Реакция сборки по Гибсону(открывается в новом окне) (Gibson assembly) стала одним из основных методов клонирования с момента изобретения в 2009 году и широко используется в молекулярной биологии. Сборка по Гибсону позволяет «склеивать» фрагменты ДНК: концы кратковременно денатурируются, после чего совпадающие последовательности соединяются в одну молекулу. Одно из главных преимуществ сборки по Гибсону — простота: все происходит в одной пробирке при одной температуре. Эти ограничения естественным образом оставляют пространство для улучшений. Кроме того, следующие свойства делают этот метод удобным для оценки способности ИИ‑моделей улучшать методики экспериментальной лаборатории:
- Четко определенный метод с контролируемыми компонентами — в отличие от клеточной системы
- Имеет понятную целевую функцию оптимизации: трансформируемая кольцевая ДНК, полученная из фиксированного количества линейной входной ДНК
- Относительно быстрый цикл экспериментов (1–2 дня)
- Многомерное пространство дизайна, где улучшение требует механистических рассуждений: оптимальные буферы, реагенты и температуры взаимозависимы
В качестве отправной точки мы взяли сборку HiFi(открывается в новом окне) (HiFi assembly) — фирменную ферментную систему New England Biolabs на основе сборки по Гибсону. Мы сняли ограничения на одношаговость и изотермичность — и проверяли, сможет ли ИИ выдвигать новые идеи, учиться на результатах экспериментов и находить улучшения протокола.В частности, мы проводили реакцию клонирования из двух фрагментов, используя ген зеленого флуоресцентного белка (GFP) и широко применяемую плазмиду pUC19 — стандартный «носитель» ДНК для переноса генов в бактерии, чтобы их можно было копировать. Цель — увеличить число успешных колоний.
Мы оптимизировали реакцию клонирования, введя эволюционный подход к итерации по предложениям, чтобы модель могла учиться «онлайн» на результатах прошлых экспериментов. В каждом раунде модель GPT‑5 предлагала пакет из 8–10 разных реакций; варианты переносились на последующие раунды, если для них требовались нестандартные реагенты, которых не было под рукой в лаборатории. Затем ученые выполняли реакции и на первичном скрининге измеряли число колоний относительно базовой сборки HiFi по Гибсону. Лучшие результаты предыдущего раунда затем подавались на вход следующему. Важно, что промпты были стандартизированы, и кроме уточняющих вопросов мы не вмешивались — это позволило отнести новые механистические инсайты непосредственно к ИИ, а не к подсказкам человека.
Мы повторно протестировали восемь лучших реакций из всей серии оптимизации на более широком диапазоне разведений ДНК и обнаружили, что у многих эффект оказался меньше, чем в первичном скрининге; в итоге самым сильным подтвержденным кандидатом стала реакция из 5‑го раунда, которая воспроизвела исходную эффективность. Многие из наиболее успешных реакций относились к семейству «ligase-polish», которое, похоже, особенно чувствительно к небольшим вариациям состояния компетентных клеток и/или обращения с ДНК после реакции. Поскольку в этих реакциях был короткий этап HiFi, мы предполагаем, что многие продукты реакции попадают в E. coli лишь с одним лигированным стыком, а второй держится за счет отжига; дальнейшее восстановление обеспечивают клеточные системы репарации ДНК. Это создает высокую вариативность и «джекпот‑динамику»: даже если в большинстве случаев варианты этой реакции не выигрывают, один сильный выброс может протащить все семейство в следующие раунды.
Поскольку реакция клонирования механистически сложна, мы оптимизировали ее итеративно по раундам; параллельно мы оптимизировали процедуру трансформации одним разовым («one‑shot») раундом: модель предложила много независимых изменений, и мы выбрали лучший вариант.
Первичные скрининги оптимизации двухэтапного процесса клонирования: ферментативная сборка и трансформация. (Слева) Итеративная оптимизация ферментативной сборки за пять раундов (всего 44 реакции). Начиная с базовой сборки HiFi, GPT‑5 предлагала по 8–10 вариантов протокола сборки в каждом раунде; данные лучших результатов использовались в следующих промптах. В каждом раунде показана лучшая реакция на данный момент (включая предыдущие раунды). (Справа) Разовая оптимизация условий трансформации — тестирование 13 разных протоколов. В обоих скринингах данные — одиночные измерения (n=1) для каждого условия; отдельная валидация с повторами выполнялась только для лучших кандидатов.
Используя стандартизированные промпты без участия человека, GPT‑5 повысила сквозную эффективность клонирования в 79 раз; результат подтвердили экспериментальными повторами.
Примечательно, что модель предложила новую ферментативную процедуру, которую назвала RecA‑Assisted Pair‑and‑Finish HiFi Assembly (RAPF‑HiFi): она добавляет в реакцию два новых белка — рекомбиназу RecA из E. coli и одноцепочечный ДНК‑связывающий белок гена 32 фага T4 (gp32). Кроме того, модель целенаправленно изменила температуру и длительность инкубации, а также тайминг добавления ферментов: она предложила добавлять RecA и gp32 после начального HiFi‑этапа при 50°C, дать этим белкам поработать при 37°C, а затем вернуться к 50°C, чтобы завершить сборку. В совокупности эти изменения повысили эффективность более чем в 2,5 раза. Важно отметить: это начальный уровень эффективности — без итеративной оптимизации условий и тайминга реакции.
В части трансформации самым эффективным изменением оказалось неожиданно простое действие: осадить клетки (прокрутить их в центрифуге, чтобы они собрались на дне пробирки), удалить половину исходного объема и ресуспендировать клетки перед добавлением ДНК — все при 4°C. Хотя химически компетентные клетки высокой эффективности обычно считают хрупкими, они хорошо перенесли концентрацию, а рост числа молекулярных столкновений заметно повысил эффективность трансформации (>30‑кратный прирост в финальной валидации).

Экзонуклеаза T5 создает 3′‑нависающие концы, а gp32 стабилизирует их, подавляя вторичную структуру. Затем RecA внедряется с 3′‑концов, вытесняет gp32 и способствует поиску гомологии и отжигу. Нагрев до 50 °C удаляет оба белка, после чего полимераза заполняет разрывы, а лигаза сшивает ДНК.
Сборка по Гибсону работает так: фрагментам ДНК создают совпадающие «липкие» концы, чтобы они могли найти друг друга и соединиться. В реакции используются два фермента (полимераза и лигаза), чтобы «запаять» соединенные фрагменты. В RAPF‑HiFi добавили два белка, чтобы лучше работал шаг спаривания по гомологии. Первый — gp32 — работает как расческа: выпрямляет и распутывает свободные концы ДНК. Второй — RecA — работает как проводник: ищет правильную пару для каждой цепи и стягивает совпадающие фрагменты вместе. При повышении температуры оба «помощника» сходят с ДНК, и обычные ферменты по Гибсону завершают реакцию.
В итоге мы предполагаем, что рост эффективности обеспечивается следующим механизмом:
- gp32 покрывает неотожженные хвосты одноцепочечной ДНК (ssDNA), устраняя вторичную структуру
- RecA, обычно подавляемая структурой, внедряется с 3’‑концов и вытесняет филамент gp32
- Поиск гомологии ssDNA:ssDNA(открывается в новом окне), который обеспечивает RecA, запускает отжиг
- Возврат к 50°C вытесняет и филаменты RecA, и филаменты gp32, позволяя полимеразе и лигазе завершить реакцию.
Чтобы проверить, работают ли новые ферменты, и исключить, что улучшение вызвано только изменением температурных шагов или буферов, мы протестировали RAPF‑HiFi без RecA и без обоих белков — RecA и gp32. В обоих вариантах эффективность снизилась относительно RAPF‑HiFi, что говорит о необходимости обоих белков для механизма действия RAPF‑HiFi.
Чтобы проверить базовый механизм, мы отдельно добавляли в реакцию два новых фермента: RecA и gp32. Мы показали, что каждый из них по отдельности снижает эффективность по сравнению с базовым HiFi. Вместе они превосходят базовый уровень: эффективность выросла в 2,6 раза. (Погрешности: стандартное отклонение (SD) по n=3 независимым экспериментам)
Появление RAPF‑HiFi показывает, что GPT‑5 способна к сложным многомерным рассуждениям:
- RecA подавляется структурой ДНК(открывается в новом окне), и примечательно, что модель одновременно внесла два синергичных изменения: добавила RecA и дополнила ее gp32, чтобы убрать вторичную структуру ДНК.
- Естественный партнер RecA у E. coli — одноцепочечный ДНК‑связывающий белок SSB у E. coli (single-stranded binding protein). SSB выполняет схожую роль с gp32 во время репликации генома, рекомбинации и репарации. Однако SSB у E. coli сам по себе не отсоединяется от ДНК достаточно быстро, чтобы обеспечить рост филамента RecA; in vivo нуклеацию RecA на филаменте SSB стимулирует комплекс RecFOR(открывается в новом окне). SSB связывается как стабильный тетрамер с крайне низкими скоростями диссоциации(открывается в новом окне). В отличие от него, филамент gp32 более динамичен(открывается в новом окне), что позволяет RecA вытеснять его.
Насколько нам известно, RecA и gp32 ранее не использовались вместе функциональным образом в методах молекулярной биологии. Как и во многих новых методиках молекулярной биологии, базовые биохимические активности были изучены и раньше, но именно их применение как практического, обобщаемого метода и является прорывом.
Например, взаимодействие RecA и gp32 изучали в механистических in vitro реконституционных экспериментах: в исследованиях формирования D‑петли было показано, что gp32(открывается в новом окне) усиливает активность RecA. gp32 использовали вместе с его естественным партнером‑рекомбиназой T4 UvsX и фактором загрузки рекомбиназы uvsY в амплификации с рекомбиназой и полимеразой (RPA(открывается в новом окне). Хотя в описании патента на RPA(открывается в новом окне) говорится, что эффективные реакции RPA демонстрировались с использованием RecA из E. coli в гетерологичной системе с ослабленным (то есть инженерным, не дикого типа) белком gp32, это утверждение фигурирует лишь вскользь в некоторых патентных публикациях и, насколько нам известно, не подтверждено опубликованными данными и не стало устойчивой RecA‑основанной системой RPA. Один метод клонирования под названием SLiCE(открывается в новом окне) использует цельноклеточный экстракт из E. coli, содержащий систему рекомбинации λ Red; белок Red beta может выполнять двойную роль — и ДНК‑связывающего белка, и рекомбиназы (хотя мы явно запретили использовать клеточные экстракты в промпте). В другой работе Ferrin & Camerini-Otero(открывается в новом окне) использовали один лишь RecA, чтобы избирательно захватывать молекулы ДНК по совпадающим последовательностям. Отдельно, gp32 использовали как добавку(открывается в новом окне) в процессе амплификации ДНК — ПЦР (PCR) — чтобы уменьшить вторичную структуру. Показано, что амплификация NABSA(открывается в новом окне) усиливается и RecA, и gp32; при этом каждый из белков мог усиливать реакцию по отдельности, а синергии не выявили. В целом улучшения базовых реакций сборки ДНК по типу Гибсона встречаются редко; самый заметный пример — термостабильный ДНК‑связывающий белок (ET SSB), который повышает эффективность сборки примерно в 2,5 раза(открывается в новом окне).
Для большинства применений мы не ожидаем, что RAPF‑HiFi сможет конкурировать с простотой и надежностью клонирования HiFi/Gibson. Тем не менее появление механистически отличающегося пути сборки заслуживает внимания: GPT‑5 пришла к решению, которое сочетает непривычный набор рекомбинационных белков и динамику реакции. Базовый механизм может оказаться модульным: его компоненты можно будет переиспользовать или комбинировать в других молекулярных процессах. Мы продолжаем исследовать дальнейшие улучшения RAPF‑HiFi. Температуры реакции и длительность этапов можно настроить так, чтобы сбалансировать активность RecA и gp32 с риском чрезмерного «переваривания» экзонуклеазой; также предстоит оптимизировать количество обоих белков. GPT‑5 также предложила гиперактивный вариант RecA, который мы сейчас очищаем.
Что касается протокола трансформации, успешные условия оптимизации охватывали набор добавок и температурных воздействий, призванных повысить эффективность теплового шока для коммерческих компетентных клеток 10-beta(открывается в новом окне) (10-beta competent cells). Из 13 разовых трансформаций, сгенерированных ИИ, самым эффективным оказалось изменение Transformation 7 (T7): клетки осаждали, убирали половину исходного объема и ресуспендировали перед добавлением ДНК — все при 4°C. Химически компетентные клетки высокой эффективности обычно считают хрупкими, поэтому такие манипуляции, как правило, избегают. Тем не менее клетки хорошо перенесли концентрацию. Совместный эффект — больше ДНК на клетку и менее ингибирующий буфер, обеспечивший более резкий тепловой шок, — дал существенный рост эффективности трансформации (>30‑кратный).
Этот протокол трансформации новый, хотя ранее описывали концептуально похожий подход(открывается в новом окне), где клетки концентрируют на более раннем этапе. Важно, что метод, разработанный здесь GPT‑5, совместим с готовыми коммерческими химически компетентными клетками: он устраняет необходимость готовить клетки самостоятельно и при этом превосходит заявленный выигрыш эффективности в похожем подходе на сопоставимых штаммах.
Чтобы повысить пропускную способность этой модельной экспериментальной системы, Robot on Rails и Red Queen Bio совместно разработали роботизированную систему, которая принимает протокол клонирования на естественном языке и выполняет его в экспериментальной лаборатории.
Система объединяет три компонента: 1) языковую модель «человек‑робот» (LLM), которая переводит обычный английский в действия робота; 2) систему компьютерного зрения, которая в реальном времени распознает лабораторную посуду и определяет её положение; 3) планировщик траекторий робота, который определяет, как выполнять каждое действие безопасно и точно. В результате получился гибкий универсальный лабораторный робот, который дополнительно оптимизировали под варианты протокола клонирования по Гибсону.
Мы проверили, сможет ли автономный робот выполнить полный эксперимент по клонированию, запустив одновременно два протокола: стандартный метод HiFi и R8 — лучший протокол с изменениями от ИИ из первого раунда оптимизации.Мы сравнили работу робота с экспериментами, выполненными людьми, на каждом этапе. Робот успешно справился с процессом трансформации, который включает разноплановые физические операции: перенос и смешивание жидкостей, перемещение пробирок с образцами, контролируемый нагрев клеток и рассев клеток на питательные чашки. При прямом сравнении с трансформациями, выполненными людьми, робот дал данные сопоставимого качества и аналогичные улучшения относительно базы, что показывает ранний потенциал автоматизации и ускорения оптимизации биологических экспериментов.
Хотя относительные изменения (fold‑change) в роботизированных и ручных экспериментах были схожи, абсолютное число колоний у робота оказалось примерно в десять раз ниже, чем при ручном выполнении. Это указывает на зоны для улучшений — точность дозирования жидкостей, калибровку температурного контроля и воспроизведение нюансов ручных техник работы с клетками.
И стандартный метод HiFi (база), и улучшенный метод R8 выполняли как исследователи, так и автономный робот; эффективность трансформации нормировали на соответствующие контрольные HiFi‑значения (принятые за 1,0). Ручное выполнение R8 дало улучшение в 2,39 раза; роботизированное выполнение R8 — в 2,13 раза (89 % от результата человека), что показывает сопоставимое ранжирование протоколов несмотря на более низкие абсолютные выходы.
Мы считаем, что эти эксперименты дают снимок того, как будет выглядеть наука, ускоряемая ИИ: модели будут непрерывно учиться и взаимодействовать с реальным миром. Хотя мы исключили участие человека, чтобы «чисто» измерить возможности модели, нас особенно вдохновляет, как ИИ может помогать ученым проектировать эксперименты и способствовать научным прорывам.
Стремясь ускорять научный прогресс безопасно и ответственно, мы также оцениваем и снижаем риски — особенно связанные с биобезопасностью. Результаты этих оценок показывают, что модели способны рассуждать в экспериментальной лаборатории и улучшать протоколы; это может иметь последствия для биобезопасности, как описано в нашей Программе готовности(открывается в новом окне). Мы привержены созданию необходимых и тонко настроенных мер защиты на уровне модели и системы, чтобы снижать эти риски, а также разрабатывать оценки для отслеживания текущего уровня.


