A GPT‑5 csökkenti a sejtmentes fehérjeszintézis költségeit
A Ginkgo Bioworks-szel együttműködve létrehoztunk egy AI által vezérelt autonóm labort, és 40%-kal csökkentettük a fehérjetermelés költségeit.
Láttuk, hogy az AI gyors fejlődést mutat olyan területeken, mint a matematika és a fizika, ahol az ötletek gyakran a fizikai világ bevonása nélkül is értékelhetők. A biológia más. A fejlődés a laboratóriumban történik, ahol a tudósok időt és pénzt igényelő kísérleteket végeznek.
Ez kezd megváltozni. Az élvonalbeli modellek most már közvetlenül kapcsolódhatnak a laboratóriumi automatizáláshoz, kísérleteket javasolhatnak, nagy léptékben végrehajthatják azokat, tanulhatnak az eredményekből, és eldönthetik, mi legyen a következő lépés. Az élettudományok nagy részében a szűk keresztmetszet az iteráció, és az autonóm laboratóriumok éppen ennek a korlátozásnak a megszüntetésére épülnek.
Korábbi munkánkban bemutattuk, hogy a GPT‑5 zárt hurkú kísérletezés révén képes javítani a kísérleti laboratóriumi protokollokat. Itt azt mutatjuk be, hogy ugyanez a megközelítés képes csökkenteni a fehérjetermelés költségét.
A Ginkgo Bioworks(új ablakban nyílik meg) vállalattal együttműködve a GPT‑5‑öt egy felhőalapú laboratóriumhoz – szoftverrel távolról vezérelt, olyan automatizált kísérleti laborhoz, ahol robotok végzik el a kísérleteket, majd küldik vissza az adatokat – csatlakoztattuk, és ezt a „lab-in-the-loop” felállást egy széles körben alkalmazott biológiai folyamat, a sejtmentes fehérjeszintézis (cell-free protein synthesis, CFPS) optimalizálására használtuk. Hat zárt hurkú kísérleti kör során a rendszer több mint 36 000 egyedi CFPS reakció-összetételt tesztelt 580 automatizált lemezen. Miután hozzáférést kapott egy számítógéphez, egy webböngészőhöz és a releváns tudományos publikációkhoz, a GPT‑5 három kísérleti kör alatt új csúcstechnológiás eredményt ért el az alacsony költségű CFPS terén: 40%-kal csökkentette a fehérjetermelés költségét (és 57%-kal javította a reagensek költséghatékonyságát). Az eredmények új, olyan reakció-összetételeket is tartalmaztak, amelyek ellenállóbbak az autonóm laboratóriumokra jellemző reakciókörülményeknek.
A sejtmentes fehérjeszintézis (CFPS) egy olyan módszer, amellyel élő sejtek tenyésztése nélkül állíthatók elő fehérjék. Ahelyett, hogy DNS-t juttatnánk sejtekbe és megvárnánk, amíg azok fehérjét termelnek, a CFPS a fehérje-előállítási apparátust egy ellenőrzött összetételű keverékben működteti. Ez praktikus eszközzé teszi a gyors prototípus-készítéshez és teszteléshez, mivel a kutatók rövid idő alatt sok kísérletet futtathatnak, és akár még ugyanazon a napon mérhetik az eredményeket.
A fehérjék a modern biológia eredményeinek jelentős részét képezik. Sok fontos gyógyszer fehérjéken alapul. Számos diagnosztikai és kutatási vizsgálat a fehérjékre épül. Ipari környezetben a fehérjék enzimekként működnek, amelyek tisztábbá és hatékonyabbá teszik a kémiai folyamatokat. Még a mosószeredben is találhatók fehérjék. Ha a fehérjetermelés gyorsabbá és olcsóbbá válik, a kutatók általában rövidebb idő alatt tesztelhetnek több ötletet is, és képesek azok költségeinek csökkentésére, hogy a korai kutatási eredményekből a mindennapi életben is hasznosítható megoldások szülessenek.
A CFPS már most is hasznos az ilyen jellegű iterációhoz. A szűk keresztmetszetet az jelenti, hogy összetett az optimalizálása, és nagy léptékben költségessé válik.
A sejtmentes fehérjeszintézis összetett, egymással kölcsönható összetevőket igényel: az előállítandó fehérjét kódoló DNS-sablont, a sejtlizátumot (a sejtek belsejéből származó sejtalkotó mechanizmus „leve”), valamint számos biokémiai komponenst az energiaforrásoktól a sókig. A rendszert egészként rendkívül nehéz átlátni, és számos(új ablakban nyílik meg) korábbi(új ablakban nyílik meg) tanulmány(új ablakban nyílik meg) alkalmazott különböző gépi tanulási módszereket a fehérjetermelés költségének csökkentésére.
A standard sejtmentes fehérjeszintézis (CFPS) formulák és a kereskedelmi készletek ára gyakran az ember által végzett munkához van szabva. Az autonóm laboratóriumok annyi idő alatt képesek több ezer reakciót lefuttatni, amennyi alatt egy emberi kutatócsoport legfeljebb néhány tucatot végezne el. Ekkora léptékben a reagensek költsége válik a korlátozó tényezővé.
A CFPS pusztán intuíció alapján is nehezen optimalizálható. Ez számos egymással kölcsönhatásban lévő összetevő keveréke. Az apró változtatások is számíthatnak, de a hatás iránya nem mindig egyértelmű, és a legjobb kombinációk sok kísérlet lefuttatása nélkül nehezen találhatók meg. A korábbi megközelítések csökkentették ugyan a költségeket, de az előrehaladás jellemzően fokozatokban valósul meg, mivel a lehetőségek alapos feltérképezése munkaigényes.
A GPT‑5‑öt a Ginkgo Bioworks felhőalapú laboratóriumával párosítottuk, így egy zárt visszacsatolású autonóm rendszert hoztunk létre a sejtmentes fehérjeszintézis (CFPS) optimalizálására.
A GPT‑5 kísérleti sorozatokat tervezett. A laboratórium végrehajtotta a feladatokat. Az eredményeket vissza lettek táplálva a modellbe. A modell ezeket az adatokat felhasználva javasolta a következő kört. Ezt a ciklust hatszor ismételtük meg.

A GPT‑5 szabványos, 384 lyukú mikrolemez-formátumban tervezett kísérleti sorozatokat, és azokat a Ginkgo Bioworks felhőalapú laboratóriumában futtatta. A kísérletek befejezése után a felhőalapú laboratórium visszaküldte az adatokat a GPT‑5 számára, ahol a modell elemezte az eredményeket, új hipotéziseket generált, és megtervezte a kísérletek következő körét.
Annak érdekében, hogy a ciklus az autonóm laboratórium tényleges képességeihez igazodjon, minden kísérlet lefuttatása előtt szigorú programozott ellenőrzéseket vezettünk be. Ez az ellenőrzés biztosította, hogy az AI által tervezett kísérletek fizikailag végrehajthatók legyenek az automatizációs platformon. Ez megakadályozta az olyan „papíron létező kísérleteket”, amelyek szövegben leírva hihetőnek tűnnek, de robotizált munkafolyamatban nem hajthatók végre.
A teljes futás során a rendszer több mint 36 000 CFPS-reakciót hajtott végre 580 automatizált lemezen. Ez a lépték azért fontos, mert lehetővé teszi a mintázatok kirajzolódását. A biológiában az egyedi kísérletek zajosak. Az áteresztőképesség és az iteráció teszi lehetővé a valódi jel elkülönítését a véletlen zajtól. Miután a GPT‑5 hozzáférést kapott a releváns tanulmányhoz és eszközökhöz, három kísérleti kör és két hónap kellett ahhoz, hogy új mércét állítson fel: 40%-kal alacsonyabb fehérjetermelési költség a legjobb korábbi alapértékhez(új ablakban nyílik meg) képest.
A Ginkgo Bioworks átkonfigurálható automatizálási kocsijai. Forrás: Ginkgo Bioworks
Azt találtuk, hogy a javulások olyan kombinációk azonosításából származtak, amelyek jól működnek együtt, és a nagy áteresztőképességű automatizáció gyakorlati körülményei között is megállják a helyüket.
Azt találtuk, hogy a GPT‑5 olyan alacsony költségű reakció-összetételeket azonosított, amelyeket ebben a konfigurációban korábban emberek nem teszteltek. A sejtmentes fehérjeszintézist (CFPS) évek óta kutatják, de a lehetséges keverékek köre továbbra is széles. Amikor gyorsan több ezer kombinációt lehet javasolni és végrehajtani, olyan működő tartományok találhatók, amelyek egy manuális munkafolyamat során könnyen elkerülnék a figyelmet.
Azt is megállapítottuk, hogy a nagy áteresztőképességű, lemezalapú kísérletek gyakran különböznek a kézi, asztali kísérletektől. Az oxigénellátás alacsonyabb lehet a nagy áteresztőképességű reakcióformákban. A keverés és a geometria eltérő lehet. A legtöbb CFPS-reakcióban sokkal több fehérje keletkezik kémcsövekben, mint mikrotiterlemezekben, mivel a nagyobb méretek általában több oxigénhez jutnak és jobban keverednek. Valójában az alacsony térfogatú, lemezalapú reakciók esetében a GPT‑5 már közvetlenül azután számos olyan reakciót javasolt, amelyek felülmúlták a korábbi legjobb eredményeket, hogy hozzáférést kapott egy adatelemzésre szolgáló számítógéphez és egy webböngészőhöz a releváns publikációk keresése érdekében. Összességében a GPT‑5 számos olyan reagenskombinációt javasolt, amelyek jól teljesítettek a nagy áteresztőképességű korlátok mellett, köztük sok olyat is, amelyek robusztusabban működnek az automatizált laboratóriumi környezetekre jellemző alacsony oxigénszintű körülmények között.
Emellett azt is megállapítottuk, hogy a pufferelésben, az energiaregeneráló komponensekben és a poliaminokban végrehajtott kisebb változtatások a költségükhöz képest aránytalanul nagy hatást fejtettek ki. Ezek nem mindig azok a paraméterek, amelyekhez az emberek elsőként nyúlnak, nagy áteresztőképesség mellett azonban tesztelhető hipotézisekké válnak a háttérfeltevések helyett.
Végül maga a költségstruktúra határozta meg, mi a fontos. A CFPS-ben a költségeket most a lizátum és a DNS dominálja. Ez azt jelenti, hogy a hozam a leghatékonyabb stratégia. Ha egységnyi drága bemenetből sikerül növelni a fehérjekibocsátást, már azelőtt érdemi költségcsökkenést lehet elérni, hogy máshol marginális megtakarításokat hajszolnánk.
Hat autonóm kísérleti kör során a rendszer fokozatosan javította a sejtmentes fehérjeszintézist, miközben csökkentette a költségeket és növelte a fehérjehozamot. Az eredmények minden körben a reakcióköltség és a fehérjetiter viszonyaként jelennek meg, a legjobb kompromisszumok pedig élvonalbeli megoldásokat alkotnak. A nagyobb pontok az egyes körökben elért legalacsonyabb grammonkénti költséget jelölik, míg a csillaggal és pontozott vonallal jelölt referencia a korábbi csúcstechnológiás (state-of-the-art) mércét mutatja 384 lyukú mikrolemezekben (Olsen et al., 2025). A későbbi körök részletesebb vizsgálata kiemeli a végső javulásokat, az egyes köröket összefoglaló áttekintés pedig azt mutatja, hogy az idő előrehaladtával folyamatosan csökkent a legjobb grammonkénti költség.
Ezeket az eredményeket egy fehérjén, az sfGFP-n és egy sejtmentes fehérjeszintézis (CFPS) rendszeren mutatták ki. A más fehérjékre és más CFPS rendszerekre vonatkozó általánosíthatóság még bizonyítást igényel.
Az oxigénellátás és a reakciógeometria jelentősen befolyásolhatja a hozamot, és ezek a tényezők léptékenként eltérést mutathatnak. Egyes fejlesztések érzékenyek lehetnek ezekre a feltételekre, és ezen érzékenységek megértése a következő lépések részét képezi.
Emberi felügyeletre volt szükség a protokoll javításához és a reagensek kezeléséhez. A rendszer képes kísérleteket tervezni és értelmezni, de a laboratóriumi munka továbbra is olyan gyakorlati részleteket tartalmaz, amelyekhez tapasztalt operátorokra van szükség.
Tervezzük a laboratóriumi visszacsatolási kör optimalizálásának alkalmazását más biológiai munkafolyamatokra is, ahol a gyorsabb iteráció gyorsabb haladást tehet lehetővé. Az autonóm laboratóriumokra a modellek kiegészítőjeként tekintünk. A modellek képesek tervek létrehozására, de a biológia végső soron továbbra is tesztelést és ismétlést igényel. A generálás és a kísérletezés közötti kör bezárása a módja annak, hogy az ígéretes ötletekből működő eredmények szülessenek.
Miközben azon dolgozunk, hogy a tudományos fejlődést biztonságosan és felelősen gyorsítsuk fel, törekszünk a kockázatok – különösen a biobiztonsággal kapcsolatos veszélyek – felmérésére és csökkentésére is. Az eredmények azt mutatják, hogy a modellek képesek a kísérleti laborban protokollok javítása mellett érvelni, és hogy a biobiztonságra is hatással lehetnek, amelyet a Felkészültségi keretrendszerünk alapján értékelünk és mérsékelünk. Elkötelezettek vagyunk amellett, hogy megteremtsük a szükséges, kifinomult védelmi mechanizmusokat a modellek és a rendszerek szintjén is e kockázatok csökkentése érdekében, valamint hogy olyan értékeléseket dolgozzunk ki, amelyekkel nyomon követhetjük az aktuális kockázati szinteket.
Hálával tartozunk a Ginkgo Bioworksnél dolgozó partnereinknek és azoknak csapatoknak, akik segítettek megtervezni, működtetni és támogatni a munka mögött álló automatizált felhőlaboratóriumot.


