16 декември 2025 г.

Мерење на способноста на вештачката интелигенција да го забрза биолошкото истражување во влажна лабораторија

GPT‑5 креира нови подобрувања на протоколите за влажна лабораторија, оптимизирајќи ја ефикасноста на протоколот за молекуларно клонирање за 79 пати.

Графика во стил на колаж со меки сино-портокалови градиенти, дијаграм за склопување на ДНК и задебелен текст што гласи „Биолошко истражување“, означено под „OpenAI за наука“.

Се вчитува...

Забрзувањето на научниот напредок е еден од највредните начини на кои вештачката интелигенција може да му користи на човештвото. Со GPT‑5, почнуваме да гледаме рани знаци⁠ на ова—не само во помагањето на истражувачите да се движат побрзо низ научната литература, туку и во поддршката на нови форми на научно расудување, како што се откривање на неочекувани врски, предлагање стратегии за докажување или сугерирање на веродостојни механизми кои експертите можат да ги оценат и тестираат.

Досегашниот напредок е највидлив во области како што се математиката, теоретската физика и теоретската компјутерска наука, каде што идеите можат ригорозно да се проверуваат без физички експерименти. Биологијата е различна: повеќето напредоци зависат од експериментално извршување, итерација и емпириска валидација во лабораторијата.

За да помогнеме во разбирањето како се однесуваат најсовремените модели во овие услови, работевме со Red Queen Bio, стартап за биосигурност, за да изградиме рамка за евалуација која тестира како моделот предлага, анализира и итерира идеи во влажната лабораторија. Поставивме едноставен експериментален систем за молекуларна биологија и го натеравме GPT‑5 да го оптимизира протоколот за молекуларно клонирање за ефикасност.

Преку повеќе кругови на експериментирање, GPT‑5 воведе нов механизам кој ја подобри ефикасноста на клонирање за 79 пати. Клонирањето е основна алатка во молекуларната биологија. Ефикасноста на методите за клонирање е критична за креирање на големи, комплексни збирки кои се во центарот на протеинското инженерство⁠(се отвора во нов прозорец), генетските скрининзи⁠(се отвора во нов прозорец), и инженерството на соеви на организми⁠(се отвора во нов прозорец). Овој проект нуди увид во тоа како вештачката интелигенција може да работи рамо до рамо со биолозите за да го забрза истражувањето. Подобрувањето на експерименталните методи ќе им помогне на истражувачите да се движат побрзо, да ги намалат трошоците и да ги претворат откритијата во реално влијание.

Бидејќи напредокот во биолошкото размислување носи импликации за биосигурноста, го спроведовме ова во строго контролирано опкружување—користејќи безопасен експериментален систем, ограничувајќи го обемот на задачата и оценувајќи го однесувањето на моделот за да направиме информирани проценки на ризикот за биосигурност и развојот на заштитни мерки на ниво на модел и систем, како што е наведено во нашата Рамка за подготвеност⁠(се отвора во нов прозорец).

Експериментални резултати

Во оваа поставеност, GPT‑5 автономно расудуваше за протоколот за клонирање, предложи модификации и вклучи податоци од нови експерименти за да предложи дополнителни подобрувања. Единствената човечка интервенција беше научниците да го спроведат модифицираниот протокол и да ги постават експерименталните податоци.

Во текот на повеќе рунди, GPT‑5 ја оптимизираше процедурата за клонирање за да ја подобри ефикасноста за повеќе од 79 пати—што значи дека за фиксна количина на внесување на ДНК, добивме 79 пати повеќе секвенциски потврдени клонови отколку со основниот протокол. Најзабележително, воведе два ензими кои претставуваат нов механизам: рекомбиназата RecA од E. coli, и фагот T4 ген 32 протеин за врзување на едноверижна ДНК (gp32). Работејќи во тандем, gp32 ги измазнува и расплетува лабавите краеви на ДНК, а потоа RecA го води секој ланец до неговиот точен пар.

Првичниот скрининг и секундарните експерименти ги идентификуваа RecA-помогнатото „спарување и завршување“ на HiFi склопот (RAPF) и Трансформација 7 (T7) како најдобри ензимски и трансформациски протоколи, соодветно. И RAPF склопувањето и T7 трансформацијата независно ја подобрија ефикасноста на клонирањето во однос на основниот HiFi протокол за клонирање, за 2,6 пати и 36 пати соодветно; а кога се комбинираат, обезбедуваат адитивно подобрување на перформансите од 79 пати. Сите клонови беа потврдени со секвенционирање. (Грешки: SD на n=3 независни валидациони експерименти).

Иако е рано, овие резултати се охрабрувачки. Подобрувањата се специфични за нашата посебна поставеност за клонирање што се користи во нашиот систем на модел и сè уште бараат човечки научници кои ќе ги постават и извршат протоколите. Меѓутоа, овие експерименти покажуваат дека системите на вештачка интелигенција можат значајно да помогнат во реалната лабораториска работа и можеби ќе го забрзаат работењето на научниците во иднина.

Забележително е што циклусот на лабораторијата со вештачка интелигенција беше извршен со фиксни инструкции и без човечка интервенција. Ова помогна да се открие капацитетот на моделот да предлага навистина нови промени во протоколите независно од човечкото водство, но исто така го заклучи системот во истражување и го ограничено неговиот капацитет да ја максимизира изведбата на новооткриените идеи. Подобра динамична рамнотежа помеѓу истражувањето и експлоатацијата веројатно би донела поголеми придобивки, бидејќи и ензимските и трансформациските подобрувања имаат значителен простор за усовршување. Очекуваме напредокот во планирањето и длабокото расудување во задачи да ја подобри способноста на едноставните фиксни промптови да поддржуваат и откривање и последователна оптимизација.

Еволутивна рамка за оптимизирање на протоколи од реалниот свет

Реакцијата Gibson assembly⁠(се отвора во нов прозорец) е примарен метод за клонирање уште од неговото измислување во 2009 година, со широко распространето усвојување во молекуларната биологија. Gibson assembly им овозможува на молекуларните биолози да „залепат“ парчиња ДНК заедно со кратко топење на нивните краеви, така што соодветните секвенци можат да се спојат во една молекула. Една од главните привлечности на Gibson assembly е неговата едноставност: сè се случува во една епрувета на една температура. Тие ограничувања природно оставаат простор за подобрување. Освен тоа, следниве својства го прават погоден за оценување на способностите на моделите на вештачка интелигенција со цел подобрување на техники во влажна лабораторија:

Добро дефиниран со контролирани компоненти, за разлика од систем базиран на клетки
Јасна функција за оптимизација: трансформирачка циркуларизирана ДНК направена од фиксна количина на линеарни ДНК внесувања
Релативно брзи експериментални циклуси (1-2 дена)
Дизајнерски простор со висока димензионалност кој бара механистичко расудување за подобрување: оптималните бафери, реагенси и температури се меѓусебно зависни

Ние користевме HiFi assembly⁠(се отвора во нов прозорец), сопствен ензимски систем развиен од New England Biolabs и базиран на Gibson assembly, како почетна точка за оптимизација. Истраживме дали вештачката интелигенција може да иновира и да учи од експериментални повратни информации откако ќе се отстранат ограничувањата на еднократниот чекор и изотермалните ограничувања, и на тој начин да идентификува подобрувања на протоколот во оваа ситуација.

Специфично, извшриме реакција на клонирање од две компоненти користејќи ген за зелен флуоресцентен протеин (GFP) и широко користениот плазмид pUC19, стандардно ДНК „возило“ кое се користи за пренос на гени во бактерија за да можат да се копираат. Целта беше да се зголеми бројот на успешни колонии.

Ја оптимизиравме реакцијата на клонирање со воведување на еволутивна рамка за итерација на предлозите, овозможувајќи му на моделот да учи „онлајн“ од своите претходни експерименти. Во секој круг, GPT‑5 предложи серија од 8-10 различни реакции, при што реакциите беа префрлени во подоцнежни кругови ако бараа специјални реагенси кои лабораторијата не ги имаше веднаш на располагање. Потоа, научниците ги извршија реакциите и го измерија бројот на колонии во однос на основната HiFi Gibson склопка во почетниот скрининг. Најдобрите податоци од претходниот круг потоа беа внесени во следната рунда. Важно е што стандардизацијата на промптот беше извршена без човечко внесување освен за прашања за појаснување, што ни овозможува да ги припишеме новите механистички увиди директно на вештачката интелигенција, а не на човечкото водство.

Повторно ги тестиравме осумте најдобри реакции од целосната серија на оптимизација користејќи поширок опсег на разредувања на ДНК и откривме дека многу од нив покажаа помали ефекти отколку во почетниот скрининг; на крајот, најсилниот валидаран кандидат беше реакција од петтата рунда која го репродуцираше својот оригинален перформанс. Многу од кои се очекуваше високи перформанси се најдоа во семејството ligase-polish, кое изгледа особено чувствително на мали варијации во состојбата на компетентните клетки и/или ракувањето со ДНК по реакцијата. Бидејќи овие реакции користеа краток HiFi чекор, претпоставуваме дека многу производи веројатно влегуваат во E. coli со само еден запечатен спој, а другиот е задржан со анелирање, оставајќи го понатамошното спасување на клеточните патишта за поправка. Ова креира висока варијанса и „џекпот“ динамика: дури и ако повеќето од времето варијантите на оваа реакција не се подобри, еден силен отстапувач може да ја пренесе фамилијата во следните рунди.

Додека се фокусиравме на оптимизирање на реакцијата на клонирање низ рундите поради нејзината механистичка сложеност, паралелно ја оптимизиравме процедурата за трансформација користејќи една „еднократна“ рунда каде моделот предложи многу независни промени, и ја избравме реакцијата со најдобри перформанси.

Почетни оптимизациски скрининзи на двостепениот процес на клонирање: ензимско склопување и трансформација. (Лево) Итеративна оптимизација на ензимска склопка преку пет рунди (вкупно 44 реакции). Почнувајќи од основната линија за склопување на HiFi, GPT‑5 предложи 8-10 варијанти на протоколи за склопување по рунда; податоците од најуспешните резултати беа вклучени во следните промпти. Во секој круг, ја прикажуваме најдобро изведената реакција досега (вклучувајќи ги и претходните кругови). (Десно) Еднократна оптимизација на условите за трансформација со тестирање на 13 различни протоколи. За двата скрининзи за оптимизација, податоците претставуваат единечни мерења (n=1) по услов; реплицираната валидација беше извршена одделно за најдобрите кандидати.

Користејќи стандардизирани промпти без човечко внесување, GPT5 ја подобри ефикасноста на клонирање од почеток до крај за 79 пати, потврдено преку експериментални репликати.

Забележително, моделот предложи нов ензимски процес, кој го нарече RecA-помогнато „спарување и завршување“ на HiFi склопување (RAPF-HiFi), кој додава два нови протеини во реакцијата: рекомбиназата RecA од E. coli и фагот T4 ген 32 протеин за врзување на едноверижна ДНК (gp32). Понатаму, моделот направи намерни модификации на температурата и времето на инкубација, како и времето на додавање на ензимите: предложи додавање на RecA и gp32 по почетната HiFi реакција на 50 °C, дозволувајќи овие протеини да работат на 37 °C, а потоа враќање назад на 50 °C за да се заврши склопувањето. Заедно, овие нови измени ја зголемија ефикасноста повеќе од 2,5 пати. Треба да се напомене дека ова ги претставува почетните перформанси без итеративна оптимизација на условите за реакција и времето.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

На страната на трансформацијата, најефективната модификација се покажа неочекувано едноставна: пелетирање на клетките (вртење во центрифуга за да се соберат на дното на епруветата), отстранување половина од дадениот волумен и ресуспендирање на клетките пред додавање на ДНК, сето тоа на 4 °C. Иако хемиски компетентните клетки со висока ефикасност обично се сметаат за кревки, клетките добро ја толерираа концентрацијата и зголемените молекуларни судири значително ја зголемија ефикасноста на трансформацијата (повеќе од 30 пати на финалната валидација).

Нов пристап за подобрување на клонирање базирано на хомологија

Дијаграм што ги прикажува чекорите на RecA-помогнато „спарување и завршување“ на HiFi ДНК составување, со означени фази за T5 ексонуклеаза, GP32, RecA, полимераза и лигаза кои последователно дејствуваат на ДНК нишките.

T5 ексонуклеазата креира 3′ превисоци кои gp32 ги стабилизира со потиснување на секундарната структура. Потоа RecA навлегува од 3′ краевите, преместувајќи го gp32 и поттикнувајќи пребарување на хомологија и анелирање. Загревањето на 50 °C ги отстранува и двата протеина, овозможувајќи пополнување на празнината со полимераза и лигација.

Гибсоновото склопување функционира така што на деловите од ДНК им дава „лепливи“ краеви за да можат да се најдат и да се спојат. Реакцијата користи два различни ензими (полимераза и лигаза) за да ги запечати споените делови. Во RAPF-HiFi, воведовме два протеини за да го подобриме чекорот на совпаѓање. Првиот, gp32, делува како чешел што ги мазни и разврзува лабавите краеви на ДНК. Вториот, RecA, делува како водич што бара точен партнер за секоја нишка и ги поврзува соодветните делови. Поголема температура предизвикува двата помошници да се одвојат од ДНК, овозможувајќи нормалните Гибсон ензими да ја завршат реакцијата.

Како резиме, претпоставуваме дека подобрените перформанси се посредувани преку следниов механизам:

Gp32 обложува неанелирани едноверижни ДНК (ssDNA) опашки, отстранувајќи секундарна структура
RecA, кој обично е инхибиран од структурата, навлегува од 3' и го истиснува gp32 филаментот
RecA посредува пребарување на хомологија на ssDNA:ssDNA⁠(се отвора во нов прозорец), поттикнувајќи анелирање
Враќањето на 50 °C ги дислоцира и recA и gp32 филаментите, овозможувајќи полимеразата и лигазата да ја завршат реакцијата.

За да се тестира дали новите ензими се функционални и да се исклучи можноста дека подобрувањето на перформансите е предизвикано само од промени во термичките чекори или бафери, ја тестиравме перформансата на RAPF-HiFi без RecA, и без и RecA и gp32. Изведбата на двете реакции беше намалена во однос на RAPF-HiFi, што укажува дека двата протеини се неопходни за механизмот на дејство на RAPF-HiFi.

За да го тестираме основниот механизам, ги одделуваме двата нови ензими во реакцијата: RecA и gp32. Покажуваме дека секој од овие самостојно ја намалува ефикасноста во однос на HiFi основата. Заедно, тие ја надминуваат основната линија со зголемување на ефикасноста од 2,6 пати. (Грешки: SD на n=3 независни експерименти)

Развојот на RAPF-HiFi сугерира дека GPT‑5 е способен за комплексно, мултидимензионално расудување:

RecA е инхибиран од структурата на ДНК⁠(се отвора во нов прозорец), и е забележливо дека моделот воведе две синергистички модификации одеднаш: додаде RecA и го комплементираше со gp32 за да ја отстрани секундарната структура на ДНК.
Природниот партнер на E. coli RecA е E. coli протеин за врзување на едноверижна ДНК (SSB). SSB извршува слична улога како gp32 за време на репликација, рекомбинација и поправка на геномот. Сепак, E. coli SSB не се отстранува спонтано од ДНК доволно брзо за раст на RecA филаментот, при што RecFOR комплексот ја промовира нуклеацијата на RecA на SSB филаментот in vivo⁠(се отвора во нов прозорец). SSB се врзува како стабилен тетрамер со екстремно бавни стапки на дисоцијација⁠(се отвора во нов прозорец). За разлика од тоа, gp32 филаментот е подинамичен⁠(се отвора во нов прозорец), што овозможува поместување на RecA.

Според нашето знаење, RecA и gp32 не се функционално ко-употребени во методите на молекуларната биологија. Како и со многу нови техники во молекуларната биологија, основните биохемиски активности веќе беа проучени, но нивната употреба како практичен, генерализирачки метод претставува напредок.

На пример, интеракцијата на RecA и gp32 е проучувана во механистички in vitro реконституциони анализи: во студии за формирање на D јамка, се покажа дека gp32⁠(се отвора во нов прозорец) може да ја зголеми активноста на RecA. Gp32 е користен во комбинација со својот природен партнер T4 рекомбиназа UvsX и факторот за вчитување на рекомбиназа uvsY во амплификација на рекомбиназа полимераза (RPA)⁠(се отвора во нов прозорец). Иако спецификацијата на патентот за RPA наведува⁠(се отвора во нов прозорец) дека ефективни RPA реакции се демонстрирани користејќи E. coli RecA во хетерологен систем со компромитиран (т.е. инженерски, не-дива форма) gp32 протеин, ова тврдење се појавува само како тангента во некои патентни обелоденувања и, според нашето знаење, не е поддржано од објавени податоци ниту е усвоено како робустен систем за RPA базиран на RecA. Еден метод за клонирање наречен SLiCE⁠(се отвора во нов прозорец) користи целосен клеточен екстракт од E. coli кој го содржи λ Red рекомбинацискиот систем, каде што Red beta може да има двојна улога како протеин што врзува ДНК и рекомбиназа (иако ние експлицитно го забранивме користењето на клеточни екстракти во нашиот промпт). Во друга апликација, Ферин и Камерини-Отеро⁠(се отвора во нов прозорец) го користеа само RecA за селективно фаќање на ДНК молекули врз основа на совпаѓачки секвенции. Одделно, gp32 е користен како адитив⁠(се отвора во нов прозорец) во процес на амплификација на ДНК наречен PCR за да се намали секундарната структура. Се покажа дека NABSA амплификацијата⁠(се отвора во нов прозорец) беше подобрена и од RecA и од gp32, иако секој од нив можеше да ја подобри реакцијата одделно и не беше идентификувана синергија. Пошироко, пријавените подобрувања на основните реакции за составување на ДНК во стилот на Гибсон се ретки, со најзначајниот пример кој е топлински стабилен протеин што врзува ДНК (ET SSB) кој ја подобрува ефикасноста на составувањето за околу 2,5 пати⁠(се отвора во нов прозорец).

За повеќето апликации, не очекуваме RAPF-HiFi да се натпреварува со едноставноста и робусноста на HiFi/Gibson клонирањето. Сепак, појавата на механистички различен пат на склопување е забележителна: GPT‑5 дојде до решение кое вклучува непозната комбинација на рекомбинациски протеини и динамика на реакции. Основниот механизам може да се покаже како модуларен, обезбедувајќи компоненти што можат да се пренаменат или рекомбинираат во други молекуларни работни текови. Исто така, продолжуваме да истражуваме подобрувања на RAPF-HiFi. Температурите на реакцијата и времетраењата на чекорите може да се прилагодат за да се балансираат активностите на RecA и gp32 против прекумерната дигестија од ексонуклеазата, а количините на двата протеини треба да се оптимизираат. GPT‑5 исто така предложи хиперактивна варијанта на RecA, која моментално ја прочистуваме.

Во однос на протоколот за трансформација, успешните услови за оптимизација опфатија опсег на адитиви и термални нарушувања наменети за подобрување на ефикасноста на топлотниот шок на комерцијалните 10-beta компетентни клетки⁠(се отвора во нов прозорец). Од 13-те еднократни трансформации генерирани со вештачка интелигенција што беа тестирани, најефективната модификација, Трансформација 7 (Т7), ги пелетираше клетките, отстранувајќи половина од доставениот волумен, и ги ресуспендираше клетките пред да се додаде ДНК, сето тоа на 4 °C. Клетки со висока ефикасност кои се хемиски компетентни обично се сметаат за кревки, и таквите чекори за постапување генерално се избегнуваат. Сепак, клетките добро ја поднесоа концентрацијата. Комбинираните ефекти од зголемената изложеност на ДНК по клетка и помалку инхибиторен бафер што водат до поостар топлотен шок резултираа со значително зголемување на ефикасноста на трансформацијата (повеќе од 30 пати).

Овој протокол за трансформација е нов, иако концептуално сличен пристап⁠(се отвора во нов прозорец) каде што клетките се концентрираат на порано ниво е пријавен. Забележително е што методот развиен овде од GPT‑5 е компатибилен со комерцијално достапни хемиски компетентни клетки, елиминирајќи ја потребата за подготовка на клетки во лабораторија, додека ги надминува пријавените добивки во ефикасноста на сличниот пристап на споредливи клеточни линии.

Роботски систем

За да се зголеми капацитетот на овој експериментален систем на модел, Robot on Rails и Red Queen Bio соработуваа за да изградат роботски систем кој прима протокол за клонирање на природен јазик и го извршува во влажната лабораторија.

Системот комбинира три компоненти: 1) LLM за човек-кон-робот кој го претвора обичниот англиски јазик во дејствата на роботот; 2) визуелен систем кој идентификува и локализира лабораториска опрема во реално време; и 3) планер на патека на роботот кој одредува како да се изврши секое дејство безбедно и прецизно. Резултатот е флексибилен, генерализиран лабораториски робот што беше дополнително оптимизиран за варијанти на протоколот за клонирање на Гибсон.

Тестиравме дали автономниот робот може да изврши целосен експеримент за клонирање со истовремено извршување на два протоколи: стандардниот HiFi метод и R8, најдобриот протокол модифициран од вештачка интелигенција од првиот круг на оптимизација.

Ја споредивме работата на роботот со експериментите изведени од луѓе на секој чекор. Роботот успешно го изврши процесот на трансформација, кој бараше различни физички операции: трансфер и мешање на течности, преместување на епрувети за примероци, примена на контролирана топлина на клетки и нанесување на клетки на плочи за растење. Кога директно се споредува со трансформации извршени од луѓе, роботот генерираше податоци со сличен квалитет и еквивалентни подобрувања над основната линија, покажувајќи ран потенцијал за автоматизирање и забрзување на оптимизацијата на биолошките експерименти.

Иако соодносите на промена помеѓу експериментите со робот и човек беа слични, апсолутните броеви на колонии од роботот беа приближно десет пати помали од рачното извршување, што укажува на области за подобрување, како што се прецизноста на ракување со течности, калибрацијата на контрола на температурата и реплицирање на нијансите на рачното ракување со клетки.

И стандардниот HiFi метод (основен) и подобрениот R8 метод беа извршени од човечки истражувачи и автономниот робот, при што ефикасностите на трансформацијата беа нормализирани на соодветните HiFi основни контроли (поставени на 1.0). Човечки изведеното R8 покажа подобрување од 2,39 пати; роботски изведеното R8 постигна подобрување од 2,13 пати (89% од човечките перформанси), демонстрирајќи споредливо рангирање на протоколот и покрај пониските апсолутни приноси.

Иднината

Веруваме дека овие експерименти нудат слика на тоа како ќе изгледа идната наука забрзана од вештачка интелигенција: модели кои постојано учат и комуницираат со реалниот свет. Иако нашите експерименти исклучија човечка интервенција за чисто мерење на способностите на моделот, особено сме возбудени за вештачката интелигенција која им помага на научниците⁠ да дизајнираат експерименти и да придонесат за истражувачки пробиви.

Додека работиме на безбедно и одговорно забрзување на научниот напредок, исто така се стремиме да ги оцениме и намалиме ризиците, особено оние поврзани со биосигурност. Овие резултати од евалуациите покажуваат дека моделите можат да расудуваат во влажната лабораторија за да ги подобрат протоколите и можат да имаат импликации за биосигурноста како што е опишано во нашата Рамка за подготвеност⁠(се отвора во нов прозорец). Ние сме посветени на создавање⁠ неопходни и нијансирани заштитни мерки на ниво на модел и систем за да ги намалиме овие ризици, како и да развиеме евалуации за следење на тековните нивоа.

Автори

Продолжи да читаш

Види ги сите

Scientific computing agentic AI card image (1x1)

Scientific computing in the age of agentic AI

Објава28 јул. 2026 г.

GPT-Red: самоподобрување за поголема робустност

Безбедност15 јул. 2026 г.

Одвојување сигнал од шум во евалуации на кодирање

Истражување8 јул. 2026 г.