Вимірювання здатності ШІ прискорювати біологічні дослідження у практичних умовах
GPT‑5 вдосконалив протокол проведення практичних експериментів, оптимізувавши ефективність протоколу молекулярного клонування у 79 разів.

Прискорення наукового прогресу є одним з найцінніших способів, якими ШІ може принести користь людству. Із GPT‑5 ми починаємо бачити перші ознаки цього — не лише в допомозі дослідникам швидше просуватися в аналізі наукової літератури, але й у підтримці нових форм наукового мислення, таких як виявлення несподіваних зв'язків, пропонування стратегій доведення або пропонування правдоподібних механізмів, які експерти можуть оцінити та перевірити.
Прогрес на сьогоднішній день найбільш помітний у таких галузях, як математика, теоретична фізика та теоретична інформатика, де ідеї можуть бути ретельно перевірені без фізичних експериментів. У цьому сенсі біологія має свої відмінності, адже більшість досягнень біологічних наук залежать від проведення експериментів, повторень та емпіричної перевірки в лабораторії.
Щоб допомогти зрозуміти, як поводяться передові моделі в таких умовах, ми співпрацювали з Red Queen Bio, стартапом у сфері біобезпеки, щоб створити методику оцінки, яка перевіряє, як модель пропонує, аналізує та взаємодіє з ідеями в умовах практичних експериментів. Ми створили просту експериментальну систему для молекулярної біології та залучили GPT‑5 для оптимізації протоколу молекулярного клонування з метою підвищення ефективності.
Протягом кількох раундів експериментів GPT‑5 запровадив новий механізм, що підвищив ефективність клонування у 79 разів. Клонування є основним інструментом молекулярної біології. Ефективність методів клонування є критично важливою для створення великих, складних бібліотек, які є центральними для інженерії білків(відкривається у новому вікні), генетичних скринінгів(відкривається у новому вікні) та інженерії штамів організмів(відкривається у новому вікні). Цей проєкт пропонує уявлення про те, як штучний інтелект може працювати пліч-о-пліч з біологами, щоб прискорити дослідження. Покращення експериментальних методів допоможе дослідникам швидше просуватися в роботі, знижувати витрати та перетворювати відкриття на реальну практичну цінність.
Оскільки досягнення в галузі біологічного мислення мають наслідки для біобезпеки, ми проводили цю роботу в суворо контрольованих умовах — використовуючи безпечну експериментальну систему, обмежуючи обсяг завдання та оцінюючи поведінку моделі, щоб формувати наші оцінки ризиків біобезпеки та вести розробку засобів захисту на рівні моделі та системи, як зазначено в нашій програмі готовності(відкривається у новому вікні).
У цій конфігурації GPT‑5 автономно міркував про протокол клонування, пропонував модифікації та включав дані з нових експериментів, щоб запропонувати додаткові покращення. Єдиним втручанням людини було те, що вчені виконували модифікований протокол і передавали експериментальні дані.
Протягом кількох раундів GPT‑5 оптимізував процедуру клонування, щоб підвищити ефективність більш ніж у 79 разів — це означає, що для фіксованої кількості уведення ДНК ми отримали в 79 разів більше клонів, перевірених на послідовність, ніж за базовим протоколом. Найважливіше те, що він представив два ферменти, що складають новий механізм: рекомбіназу RecA з E. coli та одноланцюговий ДНК-зв'язуючий білок гена 32 фага Т4 (gp32). Працюючи в тандемі, gp32 згладжує та розплутує вільні кінці ДНК, а RecA потім спрямовує кожен ланцюг до правильного збігу.
Первинний скринінг та вторинні експерименти визначили RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) та Transformation 7 (T7) як провідні ферментативні та трансформаційні протоколи відповідно. Як RAPF-асемблювання, так і T7-трансформація незалежно покращили ефективність клонування відносно базового протоколу клонування HiFi-реакції у 2,6 рази та 36 разів відповідно, а в поєднанні забезпечили адитивне покращення продуктивності у 79 разів. Усі клони були підтверджені шляхом секвенування. (Похибки: стандартне відхилення (СВ) для n=3 незалежних валідаційних експериментів).
Хоча це лише початок, ці результати є обнадійливими. Покращення є специфічними для нашої конкретної системи клонування, що використовується в нашій моделі, і все ще вимагають участі людських науковців для налаштування та виконання протоколів. Проте ці експерименти демонструють, що системи штучного інтелекту можуть суттєво допомагати в реальній лабораторній роботі та можуть прискорити роботу науковців у майбутньому.
Примітно, що цикл ШІ-лабораторії був запущений з фіксованими запитами без втручання людини. Це риштування допомогло виявити здатність моделі пропонувати справді нові зміни в протоколі незалежно від людського керівництва, але також обмежило систему на етапі дослідження та зменшило її здатність максимізувати ефективність нововідкритих ідей. Кращий динамічний баланс між дослідженням і використанням, ймовірно, принесе більші вигоди, оскільки як ензиматичні, так і трансформаційні покращення мають значний потенціал для вдосконалення. Ми очікуємо, що прогрес у плануванні та міркуваннях щодо горизонту завдань покращить здатність простих фіксованих запитів підтримувати як відкриття, так і подальшу оптимізацію.
Реакція збірки Гібсона(відкривається у новому вікні) є основним методом клонування з моменту її винаходу у 2009 році, з широким впровадженням у молекулярній біології. Метод Гібсона дозволяє молекулярним біологам «склеювати» фрагменти ДНК, короткочасно розплавляючи їхні кінці, щоб відповідні послідовності могли бути з'єднані в одну молекулу. Однією з головних привабливостей збірки Гібсона є її простота: усе відбувається в одній пробірці за однієї температури. Ці обмеження природно залишають простір для вдосконалення. Крім того, наступні властивості роблять його добре підходящим для оцінки здатностей моделей ШІ покращувати методи проведення практичних експериментів:
- Чітка визначеність із контрольованими компонентами, на відміну від клітинної системи
- Наявність чіткої функції оптимізації: трансформоване циркуляризоване ДНК, створене з фіксованої кількості лінійних ДНК-уведень
- Відносно швидкі цикли експериментів (1–2 дні)
- Багатовимірний простір дизайну, що вимагає механістичного міркування для покращення: оптимальні буфери, реагенти та температури є взаємозалежними
Ми використовували HiFi assembly(відкривається у новому вікні), запатентовану систему ферментів, розроблену компанією New England Biolabs на основі збірки Гібсона, як відправну точку для оптимізації. Ми дослідили, чи може ШІ впроваджувати інновації та навчатися на основі експериментального зворотного зв'язку після усунення обмежень щодо однокрокової та ізотермічної складової, і таким чином визначити покращення протоколу в цьому сценарії.
Зокрема, ми виконали реакцію клонування з двох частин, використовуючи ген зеленого флуоресцентного білка (GFP) та широко використовуваний плазмід pUC19, стандартний «вектор» ДНК, що використовується для перенесення генів у бактерії, щоб їх можна було копіювати. Метою було збільшити кількість успішно створених колоній.
Ми оптимізували реакцію клонування, впровадивши еволюційну структуру для ітерації пропозицій, що дозволяє моделі навчатися «онлайн» із попередніх експериментів. У кожному раунді GPT‑5 пропонував партію з 8–10 різних реакцій, причому реакції переносилися на пізніші раунди, якщо вони вимагали спеціальних реагентів, яких лабораторія не мала в наявності. Потім науковці проводили реакції та вимірювали кількість колоній відносно базової збірки HiFi Gibson на початковому етапі. Найкращі дані з попереднього раунду потім передавалися в раунд далі. Важливо, що стандартизація підказок відбувалася без людського введення, окрім уточнюючих запитань, що дозволяє нам приписувати нові механістичні уявлення безпосередньо ШІ, а не людському керівництву.
Ми повторно протестували вісім найкращих реакцій з повної серії оптимізації, використовуючи ширший діапазон розведень ДНК, і виявили, що багато з них показали менші ефекти, ніж у початковому скринінгу; врешті-решт, найсильнішим підтвердженим кандидатом виявилася реакція з п'ятого раунду, яка відтворила свою початкову ефективність. Багато високопродуктивних зразків потрапили до родини ligase-polish, яка виявляється особливо чутливою до невеликих варіацій у стані компетентних клітин та/або обробки ДНК після реакції. Оскільки ці реакції використовували короткий крок HiFi, ми припускаємо, що багато продуктів, ймовірно, потрапляють у E. coli з лише одним запечатаним з'єднанням, а інше утримується за рахунок ренатурації, залишаючи подальше відновлення на клітинні шляхи відновлення. Це створює високу варіативність і динаміку «джекпоту»: навіть якщо більшість варіантів цієї реакції не перевершують, один сильний виняток може перенести сімейство в наступні раунди.
Поки ми зосереджувалися на оптимізації реакції клонування протягом кількох раундів через її механістичну складність, ми паралельно оптимізували процедуру трансформації, використовуючи один «разовий» раунд, де модель запропонувала багато незалежних змін, а ми обрали реакцію з найкращими результатами.
Початкові екрани оптимізації двоетапного робочого процесу клонування: ферментативна збірка та трансформація. (Ліворуч) Ітераційна оптимізація ферментативної збірки протягом п'яти раундів (усього 44 реакції). Починаючи з базового рівня складання HiFi, GPT‑5 запропонував 8–10 варіантів протоколу складання за раунд; дані про найкращі результати були включені в наступні запити. На кожному раунді ми відображаємо найкращу реакцію на даний момент (включно з попередніми раундами). (Праворуч) Одноразова оптимізація умов трансформації з тестуванням 13 різних протоколів. Для обох екранів оптимізації дані представляють одиничні вимірювання (n=1) для кожної умови; повторна валідація була проведена окремо для найкращих кандидатів.
Використовуючи стандартизовані запити без людського втручання, GPT5 покращив ефективність клонування від початку до кінця у 79 разів, що підтверджено в експериментальних повтореннях.
Зокрема, модель запропонувала нову ензиматичну процедуру, яку назвала RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), що додає до реакції два нових білки: рекомбіназу RecA з E. coli та білок, що зв'язує однониткову ДНК, гена 32 фага T4 (gp32). Крім того, модель здійснила навмисні зміни в температурі та часі інкубації, а також у часі додавання ферментів: вона запропонувала додати RecA та gp32 після початкової реакції HiFi при 50°C, дозволивши цим білкам працювати при 37°C, а потім повернутися назад до 50°C для завершення збірки. Разом ці нові модифікації підвищили ефективність більш ніж у 2,5 рази. Слід зазначити, що це є початковою продуктивністю без ітеративної оптимізації умов реакції та часу.
З боку трансформації найбільш ефективна модифікація виявилася несподівано простою: осадження клітин (їх центрифугування, щоб вони зібралися на дні пробірки), вилучення половини поданого об'єму та ресуспензія клітин перед додаванням ДНК, і все це при 4°C. Хоча високоефективні хімічно компетентні клітини зазвичай вважаються крихкими, ці клітини добре переносили концентрацію, а збільшення молекулярних зіткнень значно підвищило ефективність трансформації (більше ніж у 30 разів на фінальній валідації).

Екзонуклеаза T5 створює 3′-виступи, які gp32 стабілізує, пригнічуючи вторинну структуру. Потім RecA вторгається з 3′ кінців, витісняючи gp32 та сприяючи пошуку гомології та ренатурації. Нагрівання до 50°C вилучає обидва білки, що дозволяє заповнення прогалин полімеразою та лігування.
Збірка Гібсона працює, надаючи фрагментам ДНК відповідні «липкі» кінці, щоб вони могли знайти один одного і з'єднатися. Реакція використовує два різні ферменти (полімеразу та лігазу) для запечатування з'єднаних частин. У RAPF-HiFi було введено два білки, щоб покращити етап зіставлення. Перший, gp32, діє як гребінець, що розгладжує та розплутує вільні кінці ДНК. Другий, RecA, діє як провідник, що шукає правильний відповідник для кожного ланцюга та з'єднує відповідні частини разом. Вища температура змушує обидва допоміжники від'єднатися від ДНК, дозволяючи звичайним ферментам Гібсона завершити реакцію.
Загалом, ми припускаємо, що покращена продуктивність опосередковується через наступний механізм:
- Gp32 покриває невідпалені однониткові хвости ДНК (ssDNA), вилучаючи вторинну структуру
- RecA, зазвичай інгібований структурою, вторгається з 3' кінця і витісняє філамент gp32
- RecA здійснює пошук гомології ssDNA:ssDNA(відкривається у новому вікні), сприяючи ренатурації
- Повернення до 50°C витісняє як нитки recA, так і gp32, дозволяючи полімеразі та лігазі завершити реакцію.
Щоб перевірити, чи є нові ферменти функціональними, і виключити можливість того, що покращення продуктивності обумовлене лише змінами в термічних етапах або буферах, ми протестували продуктивність RAPF-HiFi без RecA, а також без RecA і gp32. Ефективність обох реакцій була знижена відносно RAPF-HiFi, що свідчить про те, що обидва білки необхідні для механізму дії RAPF-HiFi.
Щоб протестувати основний механізм, ми виділяємо два нові ферменти в реакції: RecA і gp32. Ми демонструємо, що будь-який із цих факторів окремо знижує ефективність порівняно з базовим рівнем HiFi. Разом вони перевершують базовий рівень із підвищенням ефективності у 2,6 рази. (Похибки: стандартне відхилення (СВ) для n=3 незалежних експериментів)
Розробка RAPF-HiFi свідчить про те, що GPT‑5 здатний на складне, багатовимірне міркування:
- RecA інгібується структурою ДНК(відкривається у новому вікні), і варто зазначити, що модель ввела одразу дві синергічні модифікації: додати RecA і доповнити його gp32 для вилучення вторинної структури ДНК.
- Природним партнером E. coli RecA є одноланцюговий зв'язуючий білок E. coli (SSB). SSB виконує подібну роль до gp32 під час реплікації, рекомбінації та відновлення геному. Однак SSB E. coli не відпадає від ДНК достатньо швидко для росту філамента RecA, причому комплекс RecFOR сприяє нуклеації RecA на філаментах SSB in vivo(відкривається у новому вікні). SSB зв'язується як стабільний тетрамер з надзвичайно повільними швидкостями дисоціації(відкривається у новому вікні). На відміну від цього, ланцюг gp32 є більш динамічним(відкривається у новому вікні), що дозволяє витісняти RecA.
Наскільки нам відомо, RecA та gp32 не використовуються спільно у методах молекулярної біології. Як і у випадку з багатьма новими методами молекулярної біології, основні біохімічні процеси вже були вивчені, але їх використання як практичного, узагальнюючого методу є прогресом.
Наприклад, взаємодію RecA та gp32 вивчали в механістичних in vitro реконституційних тестах: у дослідженнях формування D-петлі було показано, що gp32(відкривається у новому вікні) здатний підвищувати активність RecA. Gp32 використовувався разом зі своїм природним партнером T4 рекомбіназою UvsX і фактором завантаження рекомбінази uvsY у ампліфікації рекомбіназної полімеризації (RPA)(відкривається у новому вікні). Хоча специфікація патенту RPA стверджує(відкривається у новому вікні), що ефективні реакції RPA були продемонстровані з використанням RecA E. coli в гетерологічній системі з порушеним (тобто, інженерним, не диким) білком gp32, це твердження з'являється лише як відступ у деяких патентних розкриттях і, наскільки нам відомо, не було підтверджено опублікованими даними або прийнято як надійну систему RPA на основі RecA. Один із методів клонування, що називається SLiCE(відкривається у новому вікні), використовує цільний клітинний екстракт з E. coli, що містить систему рекомбінації λ Red, де Red beta може виконувати подвійну роль як білок, що зв'язує ДНК, так і рекомбіназа (хоча ми чітко заборонили використання клітинних екстрактів у нашому запиті). В іншому випадку Ferrin & Camerini-Otero(відкривається у новому вікні) використовували лише RecA для вибіркового захоплення молекул ДНК на основі відповідних послідовностей. Окремо, gp32 використовувався як добавка(відкривається у новому вікні) у процесі ампліфікації ДНК, що називається PCR, для зменшення вторинної структури. Було показано, що ампліфікація NASBA(відкривається у новому вікні) підсилюється як RecA, так і gp32, хоча кожен з них міг підсилювати реакцію окремо, і синергії не було виявлено. Загалом, повідомлення про покращення основних реакцій складання ДНК за методом Гібсона були рідкісними, з найпомітнішим прикладом — термостабільним білком, що зв'язує ДНК (ET SSB), який покращує ефективність збірки приблизно у 2,5 рази(відкривається у новому вікні).
У більшості випадків ми не очікуємо, що RAPF-HiFi зможе конкурувати з простотою та надійністю клонування HiFi/Gibson. Однак поява механістично відмінного шляху складання заслуговує на увагу: GPT‑5 дійшов до рішення, яке включає незвичне поєднання рекомбінаційних білків і динаміки реакцій. Базовий механізм може виявитися модульним, що надасть компоненти, які можна перепрофілювати або поєднувати в інших молекулярних робочих процесах. Ми також продовжуємо досліджувати можливості вдосконалення RAPF-HiFi. Температури реакцій та тривалість етапів можуть бути налаштовані для балансування активності RecA та gp32 проти надмірного переварювання екзонуклеазою, а кількість обох білків ще потребує оптимізації. GPT‑5 також запропонував гіперактивний варіант RecA, який ми наразі аналізуємо.
Щодо протоколу трансформації, успішні умови оптимізації охоплювали ряд добавок і теплових пертурбацій, призначених для підвищення ефективності термічного шоку комерційних 10-бета-версія компетентних клітин(відкривається у новому вікні). Із 13 протестованих одноразових перетворень, створених ШІ, найефективнішою модифікацією було Transformation 7 (T7), яке осаджувало клітини, вилучало половину поданого об'єму та ресуспендувало клітини перед додаванням ДНК, все це при 4°C. Клітини з високою ефективністю хімічної компетентності зазвичай вважаються крихкими, тому таких етапів обробки зазвичай уникають. Проте клітини добре переносили концентрацію. Поєднані ефекти збільшення експозиції ДНК на клітину та зменшення інгібуючого буфера, що призвели до різкішого теплового шоку, забезпечили значне збільшення ефективності трансформації (більше ніж у 30 разів).
Цей протокол трансформації є новим, хоча концептуально подібний підхід(відкривається у новому вікні), де клітини концентрувалися на більш ранньому етапі, уже був описаний. Зокрема, метод, розроблений тут GPT‑5, сумісний з готовими до використання хімічно компетентними клітинами, що усуває потребу у підготовці клітин у лабораторії, перевищуючи при цьому повідомлені показники ефективності подібного підходу на порівнянних штамах клітин.
Для підвищення пропускної здатності цієї експериментальної моделі Robot on Rails та Red Queen Bio співпрацювали для створення роботизованої системи, яка приймає протокол клонування природною мовою та виконує його в лабораторії.
Система поєднує три компоненти: 1) LLM для перетворення звичайної англійської мови у дії робота; 2) система візуалізації, яка в реальному часі ідентифікує та локалізує лабораторне обладнання; та 3) планувальник траєкторії робота, що визначає, як безпечно та точно виконати кожну дію. Результат — гнучкий, універсальний лабораторний робот, який було додатково оптимізовано для варіантів протоколу клонування Гібсона.
Ми перевірили, чи може автономний робот виконати повний експеримент з клонування, запустивши два протоколи одночасно: стандартний метод HiFi та R8, найефективніший протокол, модифікований штучним інтелектом, з першого раунду оптимізації.
Ми порівняли роботу робота з експериментами, виконаними людьми на кожному етапі. Робот успішно впорався з процесом трансформації, який вимагав різноманітних фізичних операцій: передавання та змішування рідин, переміщення пробірок, контрольованого нагрівання клітин і розподілу клітин на поживні пластини. Порівняно безпосередньо з перетвореннями, виконаними людьми, робот створив дані подібної якості з еквівалентними покращеннями над базовим рівнем, що демонструє ранній потенціал для автоматизації та прискорення оптимізації біологічних експериментів.
Хоча зміни кратності між експериментами з роботом і людиною були схожими, абсолютні підрахунки колоній від робота були приблизно в десять разів нижчими, ніж при ручному виконанні, що вказує на наявність областей для покращення — точність обробки рідини, калібрування контролю температури та відтворення нюансів ручних технік обробки клітин.
Як стандартний метод HiFi (базовий), так і вдосконалений метод R8 були виконані дослідниками-людьми та автономним роботом, причому ефективність трансформації нормалізована до відповідних базових контролів HiFi (встановлених на 1,0). Виконання R8 людиною показало покращення в 2,39 рази; виконання R8 роботом досягло покращення в 2,13 рази (89% від продуктивності людини), що демонструє порівнянний рейтинг протоколу, незважаючи на нижчі абсолютні результати.
Ми вважаємо, що ці експерименти пропонують уявлення про те, як виглядатиме майбутня наука, прискорена штучним інтелектом: моделі, що постійно навчаються та взаємодіють з реальним світом. Хоча наші експерименти виключали втручання людини суто для вимірювання можливостей моделі, ми особливо раді тому, що ШІ допомагає вченим-людям розробляти експерименти та робити свій внесок у прориви в дослідженнях.
Працюючи над прискоренням наукового прогресу безпечно та відповідально, ми також прагнемо оцінювати та зменшувати ризики, особливо ті, що стосуються біобезпеки. Ці результати оцінювання показують, що моделі можуть аргументувати в умовах практичних експериментів для оптимізації протоколів, і можуть мати наслідки для біобезпеки, як описано в нашій програмі готовності(відкривається у новому вікні). Ми зобов'язуємося створювати необхідні, специфічні засоби захисту на рівні моделі та системи, щоб зменшити ці ризики, а також розробляти оцінки для відстеження поточних рівнів.


