Mjerenje sposobnosti UI da ubrza biološka istraživanja u mokrom laboratoriju
GPT‑5 je kreirao nova poboljšanja protokola mokrog laboratorija, optimizirajući efikasnost protokola molekularnog kloniranja za 79 puta.

Ubrzavanje naučnog napretka je jedan od najvrednijih načina na koje UI može koristiti čovječanstvu. Uz GPT‑5, počinjemo primjećivati rane znakove ovoga—ne samo u pomaganju istraživačima da brže prolaze kroz naučnu literaturu, već i u podršci novim oblicima naučnog rezonovanja, kao što su otkrivanje neočekivanih veza, predlaganje strategija dokazivanja ili sugerisanje mogućih mehanizama koje stručnjaci mogu procijeniti i testirati.
Napredak do danas je najvidljiviji u oblastima kao što su matematika, teorijska fizika i teorijska računalna nauka, gdje se ideje mogu rigorozno provjeriti bez fizičkih eksperimenata. Biologija je drugačija: većina napredaka zavisi od eksperimentalnog izvođenja, iteracije i empirijske potvrde u laboratoriji.
Kako bismo pomogli u razumijevanju ponašanja naprednih modela u ovim okruženjima, radili smo s Red Queen Bio, start-upom za biozaštitu, na izgradnji okvira za evaluaciju koji testira kako model predlaže, analizira i iterira ideje u mokrom laboratoriju. Postavili smo jednostavan eksperimentalni sistem za molekularnu biologiju i imali GPT‑5 da optimizira protokol molekularnog kloniranja radi efikasnosti.
Tokom više rundi eksperimentisanja, GPT‑5 je uveo novi mehanizam koji je poboljšao efikasnost kloniranja za 79 puta. Kloniranje je temeljni alat molekularne biologije. Efikasnost metoda kloniranja je ključna za kreiranje velikih, složenih biblioteka koje su centralne za inženjering proteina(otvara se u novom prozoru), genetičke ekrane(otvara se u novom prozoru) i inženjering sojeva organizama(otvara se u novom prozoru). Ovaj projekat nudi uvid u to kako bi AI mogao raditi rame uz rame s biologima kako bi ubrzao istraživanje. Poboljšanje eksperimentalnih metoda pomoći će ljudskim istraživačima da brže napreduju, smanje troškove i prevedu otkrića u stvarni svijet.
Budući da napredak u biološkom razmišljanju nosi implikacije za biološku sigurnost, proveli smo ovaj rad u strogo kontrolisanom okruženju—koristeći benigni eksperimentalni sistem, ograničavajući opseg zadatka i evaluirajući ponašanje modela kako bismo informisali naše procjene rizika za biološku sigurnost i razvoj zaštitnih mjera na nivou modela i sistema, kako je navedeno u našem Okviru za spremnost(otvara se u novom prozoru).
U ovoj postavci, GPT‑5 je autonomno rezonovao o protokolu kloniranja, predložio izmjene i uključio podatke iz novih eksperimenata kako bi predložio dodatna poboljšanja. Jedina ljudska intervencija bila je da naučnici provedu izmijenjeni protokol i otpreme eksperimentalne podatke.
Tokom više rundi, GPT‑5 je optimizirao proceduru kloniranja kako bi poboljšao efikasnost za više od 79 puta—što znači da smo za fiksnu količinu unosa DNK dobili 79 puta više klonova sa potvrđenim sekvencama nego prema osnovnom protokolu. Najznačajnije je da je uveo dva enzima koja čine novi mehanizam: rekombinaza RecA iz E. coli i protein koji veže jednolančanu DNK gena 32 faga T4 (gp32). Radeći u tandemu, gp32 zaglađuje i raspetljava labave krajeve DNK, a RecA zatim vodi svaki lanac do njegovog odgovarajućeg para.
Početno ispitivanje i sekundarni eksperimenti identificirali su RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) i Transformaciju 7 (T7) kao vrhunske enzimske i transformacijske protokole. Sklapanje RAPF i transformacija T7 su nezavisno poboljšali efikasnost kloniranja u odnosu na osnovni HiFi protokol kloniranja, za 2,6 puta i 36 puta respektivno; a kombinovano su pružili aditivno poboljšanje performansi od 79 puta. Svi klonovi su potvrđeni sekvenciranjem. (Greške: SD od n=3 nezavisnih validacionih eksperimenata).
Iako su preliminarni, ovi rezultati su ohrabrujući. Poboljšanja su specifična za našu posebnu postavku kloniranja korištenu u našem modelu sistema, i još uvijek zahtijevaju da ih ljudski naučnici postave i pokrenu protokole. Ipak, ovi eksperimenti pokazuju da AI sistemi mogu značajno pomoći u stvarnom laboratorijskom radu i možda ubrzati rad ljudskih naučnika u budućnosti.
Značajno je da je AI-lab petlja pokrenuta sa fiksnim upitima i bez ljudske intervencije. Ova skela pomogla je otkriti sposobnost modela da predloži istinski nove promjene protokola neovisno o ljudskom vođenju, ali je također zaključala sistem u istraživanje i ograničila njegovu sposobnost da maksimizira performanse novootkrivenih ideja. Bolja dinamička ravnoteža između istraživanja i eksploatacije vjerovatno bi donijela veće dobitke, jer i enzimska i transformacijska poboljšanja imaju značajan prostor za usavršavanje. Očekujemo da će napredak u planiranju i rezonovanju u okviru zadatka poboljšati sposobnost jednostavnih fiksnih upita za podršku i otkrivanje, kao i naknadnu optimizaciju.
Reakcija Gibson assembly(otvara se u novom prozoru) je primarna metoda kloniranja od svog izuma 2009. godine, s širokom primjenom u molekularnoj biologiji. Gibson sklapanje omogućava molekularnim biolozima da "zalijepe" dijelove DNK tako što kratko rastope njihove krajeve kako bi se podudarajuće sekvence mogle spojiti u jednu molekulu. Jedna od glavnih prednosti Gibson sklapanja je njegova jednostavnost: sve se odvija u jednoj epruveti na jednoj temperaturi. Ta ograničenja prirodno ostavljaju prostora za poboljšanje. Pored toga, sljedeće osobine čine ga pogodnim za evaluaciju sposobnosti AI modela da unaprijede tehnike mokrog laboratorija:
- Dobro definiran s kontroliranim komponentama, za razliku od sustava temeljenog na ćelijama
- Ima jasnu funkciju optimizacije: transformabilna cirkularizirana DNK napravljena od fiksne količine linearnih DNK unosa
- Relativno brzi eksperimentalni ciklusi (1-2 dana)
- Visokodimenzionalni dizajnerski prostor koji zahtijeva mehanističko rezonovanje za poboljšanje: optimalni puferi, reagensi i temperature su međusobno zavisni.
Koristili smo HiFi assembly(otvara se u novom prozoru), vlasnički enzimatski sistem razvijen od strane New England Biolabs i zasnovan na Gibson assembly, kao početnu tačku za optimizaciju. Istražili smo može li AI inovirati i učiti iz eksperimentalnog povratnog odgovora kada se uklone ograničenja jedinstvenog koraka i izotermalnosti, te na taj način identificirati poboljšanja protokola u ovom scenariju.
Konkretno, izveli smo reakciju kloniranja u dva dijela koristeći gen za zeleni fluorescentni protein (GFP) i široko korišteni plazmid pUC19, standardno DNK "vozilo" koje se koristi za prenošenje gena u bakterije kako bi se mogli umnožavati. Cilj je bio povećati broj uspješnih kolonija.
Optimizirali smo reakciju kloniranja uvođenjem evolucijskog okvira za iteriranje prijedloga, omogućavajući modelu da uči „online“ iz svojih prošlih eksperimenata. U svakoj rundi, GPT‑5 je predložio seriju od 8-10 različitih reakcija, pri čemu su reakcije pomjerene u kasnije runde ako su zahtijevale prilagođene reagense koje laboratorij nije imao odmah na raspolaganju. Zatim su ljudski naučnici izvršili reakcije i izmjerili broj kolonija u odnosu na osnovnu HiFi Gibson montažu u početnom pregledu. Najbolji podaci iz prethodnog kruga su zatim uneseni u sljedeći krug. Važno je napomenuti da je upit bio standardiziran bez ljudskog unosa osim pojašnjavajućih pitanja, što nam omogućava da nove mehanističke uvide direktno pripišemo AI-u, a ne ljudskom vođenju.
Ponovo smo testirali osam najboljih reakcija iz cijele serije optimizacije koristeći širi raspon razrjeđenja DNK i otkrili da su mnoge pokazale manje efekte nego u početnom pregledu; na kraju, najjači potvrđeni kandidat bila je reakcija iz petog kruga koja je ponovila svoje originalne performanse. Mnogi visokoučinkoviti enzimi spadaju u porodicu ligaza-polish, koja se čini posebno osjetljivom na male varijacije u stanju kompetentnih ćelija i/ili rukovanju DNK nakon reakcije. Budući da su ove reakcije koristile kratki HiFi korak, pretpostavljamo da mnogi proizvodi vjerovatno ulaze u E. coli sa samo jednim zapečaćenim spojem, dok je drugi držan aneliranjem, prepuštajući nizvodno spašavanje staničnim putevima popravke. Ovo kreira visoku varijansu i dinamiku 'jackpota': čak i ako većinu vremena varijante ove reakcije ne nadmašuju, jedan snažan izuzetak može povući porodicu u naredne runde.
Dok smo se fokusirali na optimizaciju reakcije kloniranja kroz više rundi zbog njene mehanističke složenosti, paralelno smo optimizirali proceduru transformacije koristeći jednu „jednokratnu" rundu u kojoj je model predložio mnoge nezavisne promjene, a mi smo odabrali reakciju s najboljim efektom.
Početni ekrani optimizacije dvostepenog kloniranja: enzimska montaža i transformacija. (Lijevo) Iterativna optimizacija enzimatske montaže kroz pet rundi (ukupno 44 reakcija). Počevši od osnovne linije sklapanja HiFi, GPT‑5 je predložio 8-10 varijanti protokola sklapanja po rundi; podaci o najuspješnijim rezultatima su uključeni u naredne upite. U svakom krugu, prikazujemo najbolje izvedenu reakciju do sada (uključujući prethodne krugove). (Desno) Optimizacija u jednom koraku uslova transformacije testiranjem 13 različitih protokola. Za oba ekrana optimizacije, podaci predstavljaju pojedinačna mjerenja (n=1) po uvjetu; ponovljena validacija je provedena odvojeno za najbolje kandidate.
Korištenjem standardiziranih upita bez ljudskog unosa, GPT5 je poboljšao efikasnost kloniranja od početka do kraja 79 puta, što je potvrđeno kroz eksperimentalne replike.
Značajno je da je model predložio novu enzimatsku proceduru, koju je model nazvao RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), koja dodaje dva nova proteina u reakciju: rekombinazu RecA iz E. coli i protein koji veže jednolančanu DNK gena 32 faga T4 (gp32). Nadalje, model je napravio namjerne izmjene u temperaturi i vremenu inkubacije, kao i u vremenu dodavanja enzima: predložio je dodavanje RecA i gp32 nakon početne HiFi reakcije na 50°C, dopuštajući ovim proteinima da djeluju na 37°C, a zatim se vraćajući nazad na 50°C kako bi se kompletirala montaža. Zajedno, ove nove izmjene povećale su efikasnost za više od 2,5 puta. Treba napomenuti da ovo predstavlja početne performanse bez iterativne optimizacije uvjeta reakcije i vremena.
Na strani transformacije, najefikasnija modifikacija pokazala se neočekivano jednostavnom: peletiranje ćelija (centrifugiranjem ih tako da se sakupe na dnu epruvete), ukloniti polovinu isporučene zapremine i resuspendovanje ćelija prije dodavanja DNK, sve na 4°C. Iako se visokoefikasne hemijski kompetentne ćelije obično smatraju krhkim, ćelije su dobro podnosile koncentraciju, a povećani molekularni sudari su značajno povećali efikasnost transformacije (više od 30 puta na konačnoj validaciji).

T5 egzonukleaza kreira 3′ previse koje gp32 stabilizira suzbijanjem sekundarne strukture. RecA zatim invadira s 3′ krajeva, istiskujući gp32 i potičući pretragu homologije i aneliranje. Zagrijavanje na 50 °C uklanja oba proteina, omogućavajući popunjavanje praznine polimerazom i ligaciju.
Gibson sklapanje funkcioniše tako što dijelovima DNK daje odgovarajuće „ljepljive" krajeve kako bi se mogli pronaći i spojiti. Reakcija koristi dva različita enzima (polimerazu i ligazu) za zatvaranje spojenih dijelova. U RAPF-HiFi, uvedena su dva proteina kako bi se poboljšao korak usklađivanja. Prvi, gp32, djeluje kao češalj koji zaglađuje i razmršava labave krajeve DNK. Drugi, RecA, djeluje kao vodič koji traži pravog partnera za svaki lanac i povlači odgovarajuće dijelove zajedno. Viša temperatura uzrokuje da oba pomoćnika otpadaju s DNK, omogućavajući normalnim Gibsonovim enzimima da dovrše reakciju.
U sažetku, pretpostavljamo da se poboljšane performanse ostvaruju putem sljedećeg mehanizma:
- Gp32 oblaže ne-annealovane jednolančane DNA (ssDNA) repove, ukloniti sekundarnu strukturu
- RecA, koji je inače inhibiran strukturom, ulazi s 3' kraja i istiskuje gp32 filament
- RecA posreduje u pretrazi homologije ssDNA:ssDNA(otvara se u novom prozoru), pokrećući aneliranje
- Povratak na 50°C pomjera i recA i gp32 filamente, omogućavajući polimerazi i ligazi da završe reakciju.
Da bismo testirali jesu li novi enzimi funkcionalni i isključili mogućnost da je poboljšanje performansi uzrokovano isključivo promjenama u termalnim koracima ili puferima, testirali smo performanse RAPF-HiFi bez RecA, te bez oba, RecA i gp32. Performanse obje reakcije su smanjene u odnosu na RAPF-HiFi, što sugerira da su oba proteina neophodna za mehanizam radnje RAPF-HiFi.
Da bismo testirali osnovni mehanizam, izdvajamo dva nova enzima u reakciji: RecA i gp32. Pokazujemo da bilo koji od ovih samostalno smanjuje efikasnost u odnosu na HiFi referentnu tačku. Zajedno, nadmašuju osnovnu vrijednost s povećanjem efikasnosti od 2,6 puta. (Greške: SD od n=3 nezavisnih eksperimenata)
Razvoj RAPF-HiFi sugerira da je GPT‑5 sposoban za složeno, višedimenzionalno rasuđivanje:
- RecA je inhibiran strukturom DNA(otvara se u novom prozoru), i značajno je da je model uveo dvije sinergijske modifikacije odjednom: dodati RecA i dopuniti ga s gp32 kako bi se uklonila sekundarna struktura DNA.
- Prirodni partner za E. coli RecA je E. coli jednolančani vezujući protein (SSB). SSB ima sličnu ulogu kao gp32 tokom replikacije, rekombinacije i popravke genoma. Međutim, E. coli SSB se ne odvaja spontano od DNK dovoljno brzo za rast RecA filamenta, dok RecFOR kompleks potiče nukleaciju RecA na SSB filamentu in vivo(otvara se u novom prozoru). SSB se veže kao stabilan tetramer s izuzetno sporim stopama disocijacije(otvara se u novom prozoru). Nasuprot tome, gp32 filament je dinamičniji(otvara se u novom prozoru), što omogućava premještanje RecA.
Prema našem znanju, RecA i gp32 nisu funkcionalno korišteni zajedno u metodama molekularne biologije. Kao i kod mnogih novih tehnika molekularne biologije, osnovne biohemijske aktivnosti su već bile proučavane, ali njihova upotreba kao praktične, opće primjenjive metode predstavlja napredak.
Na primjer, interakcija između RecA i gp32 proučavana je u mehanističkim in vitro reconstitucijskim testovima: u studijama formiranja D petlje, pokazano je(otvara se u novom prozoru) da gp32 može pojačati aktivnost RecA. Gp32 je korišten u kombinaciji sa svojim prirodnim T4 rekombinaznim partnerom UvsX i faktorom za učitavanje rekombinaze uvsY u rekombinaznoj polimeraznoj amplifikaciji (RPA)(otvara se u novom prozoru). Iako specifikacija patenta za RPA navodi(otvara se u novom prozoru) da su efikasne RPA reakcije demonstrirane korištenjem E. coli RecA u heterolognom sistemu sa kompromitovanim (tj. inženjerski izmijenjenim, ne-divljim tipom) gp32 proteinom, ova tvrdnja se pojavljuje samo kao usputna napomena u nekim patentnim objavama i, prema našem znanju, nije podržana objavljenim podacima niti usvojena kao robustan RecA-bazirani RPA sistem. Jedna metoda kloniranja nazvana SLiCE(otvara se u novom prozoru) koristi cijeli stanični ekstrakt iz E. coli koji sadrži λ Red rekombinacijski sistem, gdje Red beta može imati dvostruku ulogu kao i protein koji veže DNK i rekombinaza (iako smo eksplicitno zabranili korištenje staničnih ekstrakata u našem upitu). U drugoj aplikaciji, Ferrin & Camerini-Otero(otvara se u novom prozoru) koristili su samo RecA za selektivno hvatanje DNK molekula na osnovu podudarnih sekvenci. Odvojeno, gp32 je korišten kao dodatak(otvara se u novom prozoru) u procesu amplifikacije DNK nazvanom PCR kako bi se smanjila sekundarna struktura. Pokazano je da je NABSA amplifikacija(otvara se u novom prozoru) poboljšana uz pomoć RecA i gp32, iako je svaki mogao poboljšati reakciju zasebno i nije utvrđena sinergija. Šire gledano, prijavljeni napreci u osnovnim Gibson-style reakcijama sklapanja DNK su rijetki, s najznačajnijim primjerom toplinski stabilnog proteina koji veže DNK (ET SSB) koji poboljšava efikasnost sklapanja približno 2,5 puta(otvara se u novom prozoru).
Za većinu aplikacija, ne očekujemo da će RAPF-HiFi moći konkurisati jednostavnosti i robusnosti HiFi/Gibson kloniranja. Međutim, pojava mehanistički različitog puta sastavljanja je vrijedna pažnje: GPT‑5 je došao do rješenja koje uključuje nepoznatu kombinaciju rekombinacijskih proteina i dinamike reakcije. Osnovni mehanizam može se pokazati modularnim, pružajući komponente koje se mogu prenamijeniti ili kombinirati u drugim molekularnim tijekovima rada. Također nastavljamo istražiti poboljšanja za RAPF-HiFi. Temperature reakcije i trajanje koraka mogu se prilagoditi kako bi se uskladila aktivnost RecA i gp32 protiv prekomjerne digestije egzonukleazom, a količine oba proteina još uvijek treba optimizirati. GPT‑5 je također predložio hiperaktivnu varijantu RecA, koju trenutno pročišćavamo.
S obzirom na protokol transformacije, uspješni uvjeti optimizacije obuhvatili su niz aditiva i toplinskih poremećaja namijenjenih poboljšanju efikasnosti toplinskog šoka komercijalnih 10-beta kompetentnih ćelija(otvara se u novom prozoru). Od 13 AI-generiranih jednokratnih transformacija koje su testirane, najefikasnija modifikacija, Transformacija 7 (T7), peletirala je ćelije, uklonila polovinu isporučene zapremine i resuspendirala ćelije prije dodavanja DNK, sve na 4°C. Hemijski kompetentne ćelije visoke efikasnosti obično se smatraju krhkim, te se takvi koraci rukovanja generalno izbjegavaju. Ipak, ćelije su dobro podnosile koncentraciju. Kombinovani efekti povećane izloženosti DNK po ćeliji i smanjenog inhibitornog pufera, što je dovelo do izraženijeg toplotnog šoka, rezultirali su značajnim povećanjem efikasnosti transformacije (više od 30 puta).
Ovaj protokol transformacije je nov, iako je konceptualno sličan pristup(otvara se u novom prozoru) gdje su ćelije koncentrisane u ranijem koraku već prijavljen. Značajno je da je metoda koju je ovdje razvio GPT‑5 kompatibilna s komercijalno dostupnim hemijski kompetentnim ćelijama, čime se eliminira potreba za pripremom ćelija unutar laboratorija, dok nadmašuje prijavljene efikasnosti sličnog pristupa na uporedivim sojevima ćelija.
Kako bi se povećao protok ovog eksperimentalnog modela sistema, Robot on Rails i Red Queen Bio su sarađivali na izgradnji robotskog sistema koji prima protokol kloniranja u prirodnom jeziku i izvršava ga u mokrom laboratoriju.
Sistem kombinuje tri komponente: 1) LLM za komunikaciju između čovjeka i robota koji pretvara običan engleski u radnje robota; 2) vizuelni sistem koji u stvarnom vremenu identificira i lokalizira laboratorijski pribor; i 3) planiranje putanje robota koje određuje kako sigurno i precizno izvršiti svaku radnju. Rezultat je fleksibilan, generalizirani laboratorijski robot koji je dodatno optimiziran za varijante Gibsonovog protokola kloniranja.
Testirali smo može li autonomni robot izvršiti kompletan eksperiment kloniranja pokretanjem dva protokola istovremeno: standardne HiFi metode i R8, AI-modificiranog protokola sa najboljim efektom iz prve runde optimizacije.
Usporedili smo rad robota s eksperimentima koje su izvodili ljudi na svakom koraku. Robot je uspješno obavio proces transformacije, koji je zahtijevao raznovrsne fizičke operacije: prenijeti i miješati tekućine, pomicanje epruveta sa uzorcima, primjenu kontrolirane toplote na ćelije i razmazivanje ćelija na ploče za rast. Kada se direktno uporedi s transformacijama koje izvode ljudi, robot je generirao podatke sličnog kvaliteta s ekvivalentnim poboljšanjima u odnosu na osnovnu liniju, pokazujući rani potencijal za automatizaciju i ubrzanje optimizacije bioloških eksperimenata.
Iako su promjene u naborima između eksperimenata s robotom i ljudima bile slične, apsolutni brojevi kolonija iz robota bili su približno deset puta niži od ručnog izvođenja, što ukazuje na područja za poboljšanje kao što su preciznost rukovanja tekućinama, kalibracija kontrole temperature i repliciranje nijansi ručnih tehnika rukovanja ćelijama.
I standardna HiFi metoda (osnovna) i poboljšana R8 metoda su izvedene od strane ljudskih istraživača i autonomnog robota, s efikasnostima transformacije normaliziranim prema odgovarajućim HiFi osnovnim kontrolama (postavljenim na 1.0). Ljudski izveden R8 pokazao je poboljšanje od 2,39 puta; robotski izveden R8 postigao je poboljšanje od 2,13 puta (89% ljudske izvedbe), što pokazuje usporedivo rangiranje protokola unatoč nižim apsolutnim prinosima.
Vjerujemo da ovi eksperimenti nude snimak onoga kako će izgledati buduća nauka ubrzana UI-jem: modeli koji kontinuirano uče i komuniciraju sa stvarnim svijetom. Iako su naši eksperimenti isključili ljudsku intervenciju kako bi se isključivo mjerile sposobnosti modela, posebno smo uzbuđeni zbog AI-a koji pomaže ljudskim naučnicima u dizajniranju eksperimenata i doprinosu istraživačkim probojima.
Dok radimo na ubrzanju naučnog napretka na siguran i odgovoran način, takođe nastojimo procijeniti i smanjiti rizike, posebno one povezane sa biosigurnošću. Ovi rezultati evaluacija pokazuju da modeli mogu rezonovati u mokrom laboratoriju kako bi poboljšali protokole, i mogu imati implikacije za biobezbjednost kako je opisano u našem Okviru pripravnosti(otvara se u novom prozoru). Mi smo posvećeni izgradnji potrebnih i nijansiranih zaštitnih mjera na nivou modela i sistema kako bismo smanjili ove rizike, kao i razvoju evaluacija za praćenje trenutnih nivoa.


