16 декабря 2025 г.

Измерение способности ИИ ускорять биологические исследования в мокрой лаборатории (wet lab)

GPT‑5 предложила новые улучшения лабораторного протокола, увеличив эффективность протокола молекулярного клонирования в 79 раз.

Коллажная графика с мягкими градиентами синего и оранжевого, схемой сборки ДНК и крупной надписью «Биологические исследования» под заголовком «OpenAI for Science».

Загрузка…

Ускорение научного прогресса — один из самых ценных способов, которыми ИИ может приносить пользу человечеству. С GPT‑5 мы начинаем видеть первые признаки⁠ этого — и не только в том, что модель помогает исследователям быстрее ориентироваться в научной литературе, но и в том, что поддерживает новые формы научного мышления: находит неожиданные связи, предлагает стратегии доказательства или выдвигает правдоподобные механизмы, которые эксперты могут оценить и проверить.

Пока самый заметный прогресс был в математике, теоретической физике и теоретической информатике, где идеи можно строго проверять без физических экспериментов. В биологии все иначе: большинство прорывов зависят от выполнения экспериментов, итераций и эмпирической проверки в лаборатории.

Чтобы понять, как передовые модели ведут себя в таких условиях, мы вместе с Red Queen Bio — стартапом в области биобезопасности — разработали систему оценки, которая проверяет, как модель предлагает идеи, анализирует их и итеративно дорабатывает в экспериментальной лаборатории. Мы собрали простую экспериментальную систему молекулярной биологии и попросили GPT‑5 оптимизировать протокол молекулярного клонирования, чтобы повысить эффективность.

За несколько раундов экспериментов модель GPT‑5 предложила новый механизм, который повысил эффективность клонирования в 79 раз. Клонирование — базовый инструмент молекулярной биологии. Эффективность методов клонирования критична для создания больших и сложных библиотек, которые лежат в основе инженерии белков⁠(открывается в новом окне) (protein engineering), генетических скринингов⁠(открывается в новом окне) (genetic screens) и инженерии штаммов организмов⁠(открывается в новом окне) (organismal strain engineering). Этот проект дает представление о том, как ИИ может работать бок о бок с биологами и ускорять исследования. Улучшение экспериментальных методик поможет ученым двигаться быстрее, снижать затраты и превращать открытия в реальный эффект.

Поскольку прогресс в биологических рассуждениях связан с последствиями для биобезопасности, мы проводили работу в строго контролируемых условиях — использовали безопасную экспериментальную систему, ограничили масштаб задачи и оценивали поведение модели, чтобы уточнять наши оценки рисков и разрабатывать меры защиты на уровне модели и системы, как описано в нашей Программе готовности⁠(открывается в новом окне) (Preparedness Framework).

Результаты экспериментов

В этой установке модель GPT‑5 автономно рассуждала о протоколе клонирования, предлагала изменения и, получая данные новых экспериментов, выдвигала новые улучшения. Единственное вмешательство человека — ученые выполняли измененный протокол и загружали экспериментальные данные.

За несколько раундов модель GPT‑5 оптимизировала процедуру клонирования, повысив эффективность более чем в 79 раз — то есть при фиксированном количестве входной ДНК мы получили в 79 раз больше клонов, подтвержденных секвенированием, чем по базовому протоколу. Особенно важно, что модель добавила два фермента, образующие новый механизм: рекомбиназу RecA из E. coli и белок gp32 — одноцепочечный ДНК‑связывающий белок гена 32 фага T4. Работая вместе, gp32 выпрямляет и распутывает свободные концы ДНК, а RecA затем направляет каждую цепь к правильной паре.

Первичный скрининг и повторные эксперименты показали, что лучшими протоколами стали RecA‑Assisted Pair‑and‑Finish HiFi Assembly (RAPF) и Transformation 7 (T7) — соответственно для стадии сборки и для стадии трансформации. И сборка RAPF, и трансформация T7 по отдельности повышали эффективность клонирования относительно базового протокола HiFi: в 2,6 и 36 раз соответственно; в сочетании они дали аддитивный прирост в 79 раз. Все клоны подтвердили секвенированием. (Погрешности: SD по n=3 независимым валидационным экспериментам).

Хотя это только начало, результаты обнадеживают. Улучшения специфичны для нашей конкретной схемы клонирования в этой модельной системе и все еще требуют, чтобы ученые настраивали и проводили протоколы. Тем не менее эксперименты показывают, что ИИ‑системы могут заметно помогать в реальной лабораторной работе и со временем способны ускорять работу ученых.

Важно, что цикл «ИИ‑лаборатория» выполнялся с фиксированным промптом и без вмешательства человека. Такая обвязка помогла выявить способность модели предлагать действительно новые изменения протокола без подсказок со стороны человека, но при этом зафиксировала систему в режиме исследования и ограничила ее способность максимально развивать найденные идеи. Более удачный динамический баланс между поиском нового (exploration) и доводкой найденного (exploitation), вероятно, дал бы еще больший выигрыш — и в ферментативной части, и в части трансформации остается много пространства для доработки. Мы ожидаем, что прогресс в планировании и рассуждениях о горизонте задач повысит способность простых фиксированных промптов поддерживать и открытие чего-то нового, и последующую оптимизацию.

Эволюционный фреймворк для оптимизации протоколов в реальном мире

Реакция сборки по Гибсону⁠(открывается в новом окне) (Gibson assembly) стала одним из основных методов клонирования с момента изобретения в 2009 году и широко используется в молекулярной биологии. Сборка по Гибсону позволяет «склеивать» фрагменты ДНК: концы кратковременно денатурируются, после чего совпадающие последовательности соединяются в одну молекулу. Одно из главных преимуществ сборки по Гибсону — простота: все происходит в одной пробирке при одной температуре. Эти ограничения естественным образом оставляют пространство для улучшений. Кроме того, следующие свойства делают этот метод удобным для оценки способности ИИ‑моделей улучшать методики экспериментальной лаборатории:

Четко определенный метод с контролируемыми компонентами — в отличие от клеточной системы
Имеет понятную целевую функцию оптимизации: трансформируемая кольцевая ДНК, полученная из фиксированного количества линейной входной ДНК
Относительно быстрый цикл экспериментов (1–2 дня)
Многомерное пространство дизайна, где улучшение требует механистических рассуждений: оптимальные буферы, реагенты и температуры взаимозависимы

В качестве отправной точки мы взяли сборку HiFi⁠(открывается в новом окне) (HiFi assembly) — фирменную ферментную систему New England Biolabs на основе сборки по Гибсону. Мы сняли ограничения на одношаговость и изотермичность — и проверяли, сможет ли ИИ выдвигать новые идеи, учиться на результатах экспериментов и находить улучшения протокола.В частности, мы проводили реакцию клонирования из двух фрагментов, используя ген зеленого флуоресцентного белка (GFP) и широко применяемую плазмиду pUC19 — стандартный «носитель» ДНК для переноса генов в бактерии, чтобы их можно было копировать. Цель — увеличить число успешных колоний.

Мы оптимизировали реакцию клонирования, введя эволюционный подход к итерации по предложениям, чтобы модель могла учиться «онлайн» на результатах прошлых экспериментов. В каждом раунде модель GPT‑5 предлагала пакет из 8–10 разных реакций; варианты переносились на последующие раунды, если для них требовались нестандартные реагенты, которых не было под рукой в лаборатории. Затем ученые выполняли реакции и на первичном скрининге измеряли число колоний относительно базовой сборки HiFi по Гибсону. Лучшие результаты предыдущего раунда затем подавались на вход следующему. Важно, что промпты были стандартизированы, и кроме уточняющих вопросов мы не вмешивались — это позволило отнести новые механистические инсайты непосредственно к ИИ, а не к подсказкам человека.

Мы повторно протестировали восемь лучших реакций из всей серии оптимизации на более широком диапазоне разведений ДНК и обнаружили, что у многих эффект оказался меньше, чем в первичном скрининге; в итоге самым сильным подтвержденным кандидатом стала реакция из 5‑го раунда, которая воспроизвела исходную эффективность. Многие из наиболее успешных реакций относились к семейству «ligase-polish», которое, похоже, особенно чувствительно к небольшим вариациям состояния компетентных клеток и/или обращения с ДНК после реакции. Поскольку в этих реакциях был короткий этап HiFi, мы предполагаем, что многие продукты реакции попадают в E. coli лишь с одним лигированным стыком, а второй держится за счет отжига; дальнейшее восстановление обеспечивают клеточные системы репарации ДНК. Это создает высокую вариативность и «джекпот‑динамику»: даже если в большинстве случаев варианты этой реакции не выигрывают, один сильный выброс может протащить все семейство в следующие раунды.

Поскольку реакция клонирования механистически сложна, мы оптимизировали ее итеративно по раундам; параллельно мы оптимизировали процедуру трансформации одним разовым («one‑shot») раундом: модель предложила много независимых изменений, и мы выбрали лучший вариант.

Первичные скрининги оптимизации двухэтапного процесса клонирования: ферментативная сборка и трансформация. (Слева) Итеративная оптимизация ферментативной сборки за пять раундов (всего 44 реакции). Начиная с базовой сборки HiFi, GPT‑5 предлагала по 8–10 вариантов протокола сборки в каждом раунде; данные лучших результатов использовались в следующих промптах. В каждом раунде показана лучшая реакция на данный момент (включая предыдущие раунды). (Справа) Разовая оптимизация условий трансформации — тестирование 13 разных протоколов. В обоих скринингах данные — одиночные измерения (n=1) для каждого условия; отдельная валидация с повторами выполнялась только для лучших кандидатов.

Используя стандартизированные промпты без участия человека, GPT‑5 повысила сквозную эффективность клонирования в 79 раз; результат подтвердили экспериментальными повторами.

Примечательно, что модель предложила новую ферментативную процедуру, которую назвала RecA‑Assisted Pair‑and‑Finish HiFi Assembly (RAPF‑HiFi): она добавляет в реакцию два новых белка — рекомбиназу RecA из E. coli и одноцепочечный ДНК‑связывающий белок гена 32 фага T4 (gp32). Кроме того, модель целенаправленно изменила температуру и длительность инкубации, а также тайминг добавления ферментов: она предложила добавлять RecA и gp32 после начального HiFi‑этапа при 50°C, дать этим белкам поработать при 37°C, а затем вернуться к 50°C, чтобы завершить сборку. В совокупности эти изменения повысили эффективность более чем в 2,5 раза. Важно отметить: это начальный уровень эффективности — без итеративной оптимизации условий и тайминга реакции.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

В части трансформации самым эффективным изменением оказалось неожиданно простое действие: осадить клетки (прокрутить их в центрифуге, чтобы они собрались на дне пробирки), удалить половину исходного объема и ресуспендировать клетки перед добавлением ДНК — все при 4°C. Хотя химически компетентные клетки высокой эффективности обычно считают хрупкими, они хорошо перенесли концентрацию, а рост числа молекулярных столкновений заметно повысил эффективность трансформации (>30‑кратный прирост в финальной валидации).

Новое улучшение для клонирования на основе гомологии

Схема этапов сборки ДНК HiFi по схеме RecA‑assisted pair‑and‑finish с пометками стадий, где последовательно действуют экзонуклеаза T5, gp32, RecA, полимераза и лигаза на цепях ДНК.

Экзонуклеаза T5 создает 3′‑нависающие концы, а gp32 стабилизирует их, подавляя вторичную структуру. Затем RecA внедряется с 3′‑концов, вытесняет gp32 и способствует поиску гомологии и отжигу. Нагрев до 50 °C удаляет оба белка, после чего полимераза заполняет разрывы, а лигаза сшивает ДНК.

Сборка по Гибсону работает так: фрагментам ДНК создают совпадающие «липкие» концы, чтобы они могли найти друг друга и соединиться. В реакции используются два фермента (полимераза и лигаза), чтобы «запаять» соединенные фрагменты. В RAPF‑HiFi добавили два белка, чтобы лучше работал шаг спаривания по гомологии. Первый — gp32 — работает как расческа: выпрямляет и распутывает свободные концы ДНК. Второй — RecA — работает как проводник: ищет правильную пару для каждой цепи и стягивает совпадающие фрагменты вместе. При повышении температуры оба «помощника» сходят с ДНК, и обычные ферменты по Гибсону завершают реакцию.

В итоге мы предполагаем, что рост эффективности обеспечивается следующим механизмом:

gp32 покрывает неотожженные хвосты одноцепочечной ДНК (ssDNA), устраняя вторичную структуру
RecA, обычно подавляемая структурой, внедряется с 3’‑концов и вытесняет филамент gp32
Поиск гомологии ssDNA:ssDNA⁠(открывается в новом окне), который обеспечивает RecA, запускает отжиг
Возврат к 50°C вытесняет и филаменты RecA, и филаменты gp32, позволяя полимеразе и лигазе завершить реакцию.

Чтобы проверить, работают ли новые ферменты, и исключить, что улучшение вызвано только изменением температурных шагов или буферов, мы протестировали RAPF‑HiFi без RecA и без обоих белков — RecA и gp32. В обоих вариантах эффективность снизилась относительно RAPF‑HiFi, что говорит о необходимости обоих белков для механизма действия RAPF‑HiFi.

Чтобы проверить базовый механизм, мы отдельно добавляли в реакцию два новых фермента: RecA и gp32. Мы показали, что каждый из них по отдельности снижает эффективность по сравнению с базовым HiFi. Вместе они превосходят базовый уровень: эффективность выросла в 2,6 раза. (Погрешности: стандартное отклонение (SD) по n=3 независимым экспериментам)

Появление RAPF‑HiFi показывает, что GPT‑5 способна к сложным многомерным рассуждениям:

RecA подавляется структурой ДНК⁠(открывается в новом окне), и примечательно, что модель одновременно внесла два синергичных изменения: добавила RecA и дополнила ее gp32, чтобы убрать вторичную структуру ДНК.
Естественный партнер RecA у E. coli — одноцепочечный ДНК‑связывающий белок SSB у E. coli (single-stranded binding protein). SSB выполняет схожую роль с gp32 во время репликации генома, рекомбинации и репарации. Однако SSB у E. coli сам по себе не отсоединяется от ДНК достаточно быстро, чтобы обеспечить рост филамента RecA; in vivo нуклеацию RecA на филаменте SSB стимулирует комплекс RecFOR⁠(открывается в новом окне). SSB связывается как стабильный тетрамер с крайне низкими скоростями диссоциации⁠(открывается в новом окне). В отличие от него, филамент gp32 более динамичен⁠(открывается в новом окне), что позволяет RecA вытеснять его.

Насколько нам известно, RecA и gp32 ранее не использовались вместе функциональным образом в методах молекулярной биологии. Как и во многих новых методиках молекулярной биологии, базовые биохимические активности были изучены и раньше, но именно их применение как практического, обобщаемого метода и является прорывом.

Например, взаимодействие RecA и gp32 изучали в механистических in vitro реконституционных экспериментах: в исследованиях формирования D‑петли было показано, что gp32⁠(открывается в новом окне) усиливает активность RecA. gp32 использовали вместе с его естественным партнером‑рекомбиназой T4 UvsX и фактором загрузки рекомбиназы uvsY в амплификации с рекомбиназой и полимеразой (RPA⁠(открывается в новом окне). Хотя в описании патента на RPA⁠(открывается в новом окне) говорится, что эффективные реакции RPA демонстрировались с использованием RecA из E. coli в гетерологичной системе с ослабленным (то есть инженерным, не дикого типа) белком gp32, это утверждение фигурирует лишь вскользь в некоторых патентных публикациях и, насколько нам известно, не подтверждено опубликованными данными и не стало устойчивой RecA‑основанной системой RPA. Один метод клонирования под названием SLiCE⁠(открывается в новом окне) использует цельноклеточный экстракт из E. coli, содержащий систему рекомбинации λ Red; белок Red beta может выполнять двойную роль — и ДНК‑связывающего белка, и рекомбиназы (хотя мы явно запретили использовать клеточные экстракты в промпте). В другой работе Ferrin & Camerini-Otero⁠(открывается в новом окне) использовали один лишь RecA, чтобы избирательно захватывать молекулы ДНК по совпадающим последовательностям. Отдельно, gp32 использовали как добавку⁠(открывается в новом окне) в процессе амплификации ДНК — ПЦР (PCR) — чтобы уменьшить вторичную структуру. Показано, что амплификация NABSA⁠(открывается в новом окне) усиливается и RecA, и gp32; при этом каждый из белков мог усиливать реакцию по отдельности, а синергии не выявили. В целом улучшения базовых реакций сборки ДНК по типу Гибсона встречаются редко; самый заметный пример — термостабильный ДНК‑связывающий белок (ET SSB), который повышает эффективность сборки примерно в 2,5 раза⁠(открывается в новом окне).

Для большинства применений мы не ожидаем, что RAPF‑HiFi сможет конкурировать с простотой и надежностью клонирования HiFi/Gibson. Тем не менее появление механистически отличающегося пути сборки заслуживает внимания: GPT‑5 пришла к решению, которое сочетает непривычный набор рекомбинационных белков и динамику реакции. Базовый механизм может оказаться модульным: его компоненты можно будет переиспользовать или комбинировать в других молекулярных процессах. Мы продолжаем исследовать дальнейшие улучшения RAPF‑HiFi. Температуры реакции и длительность этапов можно настроить так, чтобы сбалансировать активность RecA и gp32 с риском чрезмерного «переваривания» экзонуклеазой; также предстоит оптимизировать количество обоих белков. GPT‑5 также предложила гиперактивный вариант RecA, который мы сейчас очищаем.

Что касается протокола трансформации, успешные условия оптимизации охватывали набор добавок и температурных воздействий, призванных повысить эффективность теплового шока для коммерческих компетентных клеток 10-beta⁠(открывается в новом окне) (10-beta competent cells). Из 13 разовых трансформаций, сгенерированных ИИ, самым эффективным оказалось изменение Transformation 7 (T7): клетки осаждали, убирали половину исходного объема и ресуспендировали перед добавлением ДНК — все при 4°C. Химически компетентные клетки высокой эффективности обычно считают хрупкими, поэтому такие манипуляции, как правило, избегают. Тем не менее клетки хорошо перенесли концентрацию. Совместный эффект — больше ДНК на клетку и менее ингибирующий буфер, обеспечивший более резкий тепловой шок, — дал существенный рост эффективности трансформации (>30‑кратный).

Этот протокол трансформации новый, хотя ранее описывали концептуально похожий подход⁠(открывается в новом окне), где клетки концентрируют на более раннем этапе. Важно, что метод, разработанный здесь GPT‑5, совместим с готовыми коммерческими химически компетентными клетками: он устраняет необходимость готовить клетки самостоятельно и при этом превосходит заявленный выигрыш эффективности в похожем подходе на сопоставимых штаммах.

Роботизированная система

Чтобы повысить пропускную способность этой модельной экспериментальной системы, Robot on Rails и Red Queen Bio совместно разработали роботизированную систему, которая принимает протокол клонирования на естественном языке и выполняет его в экспериментальной лаборатории.

Система объединяет три компонента: 1) языковую модель «человек‑робот» (LLM), которая переводит обычный английский в действия робота; 2) систему компьютерного зрения, которая в реальном времени распознает лабораторную посуду и определяет её положение; 3) планировщик траекторий робота, который определяет, как выполнять каждое действие безопасно и точно. В результате получился гибкий универсальный лабораторный робот, который дополнительно оптимизировали под варианты протокола клонирования по Гибсону.

Мы проверили, сможет ли автономный робот выполнить полный эксперимент по клонированию, запустив одновременно два протокола: стандартный метод HiFi и R8 — лучший протокол с изменениями от ИИ из первого раунда оптимизации.Мы сравнили работу робота с экспериментами, выполненными людьми, на каждом этапе. Робот успешно справился с процессом трансформации, который включает разноплановые физические операции: перенос и смешивание жидкостей, перемещение пробирок с образцами, контролируемый нагрев клеток и рассев клеток на питательные чашки. При прямом сравнении с трансформациями, выполненными людьми, робот дал данные сопоставимого качества и аналогичные улучшения относительно базы, что показывает ранний потенциал автоматизации и ускорения оптимизации биологических экспериментов.

Хотя относительные изменения (fold‑change) в роботизированных и ручных экспериментах были схожи, абсолютное число колоний у робота оказалось примерно в десять раз ниже, чем при ручном выполнении. Это указывает на зоны для улучшений — точность дозирования жидкостей, калибровку температурного контроля и воспроизведение нюансов ручных техник работы с клетками.

И стандартный метод HiFi (база), и улучшенный метод R8 выполняли как исследователи, так и автономный робот; эффективность трансформации нормировали на соответствующие контрольные HiFi‑значения (принятые за 1,0). Ручное выполнение R8 дало улучшение в 2,39 раза; роботизированное выполнение R8 — в 2,13 раза (89 % от результата человека), что показывает сопоставимое ранжирование протоколов несмотря на более низкие абсолютные выходы.

Будущее

Мы считаем, что эти эксперименты дают снимок того, как будет выглядеть наука, ускоряемая ИИ: модели будут непрерывно учиться и взаимодействовать с реальным миром. Хотя мы исключили участие человека, чтобы «чисто» измерить возможности модели, нас особенно вдохновляет, как ИИ может помогать ученым⁠ проектировать эксперименты и способствовать научным прорывам.

Стремясь ускорять научный прогресс безопасно и ответственно, мы также оцениваем и снижаем риски — особенно связанные с биобезопасностью. Результаты этих оценок показывают, что модели способны рассуждать в экспериментальной лаборатории и улучшать протоколы; это может иметь последствия для биобезопасности, как описано в нашей Программе готовности⁠(открывается в новом окне). Мы привержены созданию⁠ необходимых и тонко настроенных мер защиты на уровне модели и системы, чтобы снижать эти риски, а также разрабатывать оценки для отслеживания текущего уровня.

Авторы

Читать далее

Просмотреть все

Scientific computing agentic AI card image (1x1)

Scientific computing in the age of agentic AI

Публикация28 июл. 2026 г.

GPT-Red: самоулучшение ради устойчивости

Безопасность15 июл. 2026 г.

Отделяя сигнал от шума в оценках кода

Исследования8 июл. 2026 г.