Přeskoč na hlavní obsah
OpenAI

5. února 2026

VýzkumPublikace

GPT‑5 snižuje náklady na syntézu bezbuněčných proteinů

Ve spolupráci se společností Ginkgo Bioworks jsme vytvořili autonomní laboratoř řízenou umělou inteligencí a dosáhli jsme snížení nákladů na výrobu proteinů o 40 %.

Načítání…

Zaznamenali jsme rychlý pokrok AI v oblastech jako matematika a fyzika, kde lze často vyhodnocovat nápady, aniž bychom řešili reálný svět. Biologie je jiná. Pokrok se uskutečňuje v laboratoři, kde vědci provádějí experimenty, které vyžadují čas a peníze.

To se začíná měnit. Špičkové modely se nyní mohou přímo připojit k laboratorní automatizaci, navrhovat experimenty, provádět je ve velkém měřítku, učit se z výsledků a rozhodovat o dalším postupu. V mnoha oblastech věd o živé přírodě je úzkým hrdlem iterace a autonomní laboratoře jsou navrženy tak, aby toto omezení odstranily.

Během předchozích aktivit jsme ukázali, že GPT‑5 může zlepšit protokoly experimentů prováděných v mokrých laboratořích experimentováním v uzavřené smyčce. Ukazujeme, že stejný přístup může snížit náklady na výrobu proteinů.

Navázali jsme partnerství se společností Ginkgo Bioworks(otevře se v novém okně), abychom propojili GPT‑5 s cloudovou laboratoří – automatizovanou mokrou laboratoří řízenou dálkově softwarem, kde experimenty provádějí a data vracejí roboti – a použili tento systém laboratoře ve smyčce k optimalizaci široce používaného biologického procesu: bezbuněčné syntézy proteinů (CFPS). Během šesti kol experimentování v uzavřené smyčce otestoval systém více než 36 000 jedinečných reakčních složení CFPS na 580 automatizovaných destičkách. Po poskytnutí přístupu k počítači, webovému prohlížeči a přístupu k příslušným článkům provedl GPT‑5 tři kola experimentů, aby stanovil nový standard v oblasti nízkonákladové syntézy CFPS. Dosáhl přitom snížení nákladů na výrobu proteinů o 40 % (a zlepšení nákladů na činidla o 57 %), včetně nových reakčních složení, která jsou odolnější vůči reakčním podmínkám běžným v autonomních laboratořích.

Proč je bezbuněčná syntéza proteinů důležitá?

Bezbuněčná syntéza proteinů (CFPS) je způsob výroby proteinů bez pěstování živých buněk. Místo vkládání DNA do buněk a čekání, až vyprodukují protein, spouští CFPS mechanismus výroby proteinů v kontrolované směsi. To z něj činí praktický nástroj pro rychlé prototypování a testování, protože vědci mohou rychle provést mnoho experimentů a změřit výsledky ještě týž den.

Proteiny jsou zásadní součástí toho, co moderní biologie poskytuje. Mnoho důležitých léků je založeno na proteinech. Mnoho diagnostických a výzkumných testů závisí na proteinech. V průmyslovém prostředí fungují proteiny jako enzymy, díky nimž jsou chemické procesy čistší a účinnější. Proteiny se nacházejí dokonce i v pracím prášku. Pokud se výroba proteinů stane rychlejší a levnější, budou mít vědci možnost otestovat dříve více nápadů a snížit náklady na to, aby počáteční výzkum proměnil na něco, co mohou lidé využívat každý den.

Syntéza CFPS je užitečná už díky tomuto druhu iterace. Úzké místo spočívá v tom, že optimalizace je složitá a ve velkém měřítku se prodražuje.

Bezbuněčná syntéza proteinů se těžko optimalizuje a je drahá

Bezbuněčná syntéza proteinů vyžaduje složité, vzájemně se ovlivňující složky: šablonu DNA kódující protein, který má být vyroben, buněčný lyzát (směs buněčných mechanismů z nitra buněk) a velké množství biochemických složek od zdrojů energie po soli. Je neuvěřitelně obtížné uvažovat o systému jako o celku a mnoho(otevře se v novém okně) předchozích(otevře se v novém okně) studií(otevře se v novém okně) aplikovalo různé typy strojového učení ke snížení nákladů na produkci proteinů.

Ceny standardních receptur pro bezbuněčnou syntézu proteinů (CFPS) a komerčních sad jsou často stanoveny pro práci v lidském tempu. Autonomní laboratoře mohou provést tisíce reakcí za dobu, za kterou by lidský tým provedl desítky. V tomto měřítku se limitujícím faktorem stávají náklady na činidla.

Syntézu CFPS je také těžké optimalizovat jen na základě intuice. Je to směs mnoha vzájemně působících složek. Malé změny mohou mít význam, ale směr účinku není vždy zřejmý a nejlepší kombinace lze těžko najít bez provedení mnoha experimentů. Předchozí přístupy snížily náklady, ale pokrok byl spíše postupný, protože důkladné prozkoumání celého prostoru je pracné a náročné

Připojení GPT‑5 k robotické laboratoři

Spojili jsme GPT‑5 s cloudovou laboratoří společnosti Ginkgo Bioworks a vytvořili tak uzavřený autonomní smyčku pro optimalizaci bezbuněčné syntézy proteinů (CFPS).

GPT‑5 navrhl dávky experimentů. Laboratoř je provedla. Výsledky byly převedeny zpět do modelu. Na základě těchto údajů model navrhl další kolo. Tento cyklus jsme zopakovali celkem šestkrát.

Diagram s názvem „Laboratoř řízená umělou inteligencí“. GPT-5 provádí analýzu dat, biochemické uvažování a generování hypotéz a odesílá experimentální návrhy do konfigurovatelných automatických vozíků (RAC), které provádějí fyzické experimenty, automatizují manipulaci s kapalinami, inkubují vzorky a měří fluorescenci. Jednotky RAC vracejí experimentální data a metriky zpět do GPT-5, čímž vytvářejí uzavřenou smyčku zpětné vazby.

GPT‑5 navrhl sady experimentů ve standardním formátu 384jamkové destičky a realizovalo je v cloudové laboratoři společnosti Ginkgo Bioworks. Po skončení experimentů odeslala cloudová laboratoř data zpět do GPT‑5, kde model analyzoval výsledky, generoval nové hypotézy a navrhl další kolo experimentů.

Abychom udrželi smyčku v souladu s tím, co autonomní laboratoř dokáže, přidali jsme před spuštěním jakéhokoli experimentu přísnou programovou validaci. Tato validace zajistila, aby experimenty navržené umělou inteligencí byly fyzicky proveditelné na automatizační platformě. Zabránilo to „papírovým experimentům“, které v textu vypadají věrohodně, ale v robotickém pracovním postupu je nelze provést.

Během celého průběh provedl systém více než 36 000 reakcí syntézy CFPS na 580 automatizovaných destičkách. Tento rozsah je důležitý, protože právě on umožňuje objevení vzorů. V biologii jsou jednotlivé experimenty zatížené šumem. Propustnost a iterace jsou způsoby, jak oddělit signál od náhodného šumu. Jakmile model GPT‑5 získal přístup k příslušným dokumentům a nástrojům, trvalo stanovení nového technologického standardu tři kola experimentů a dva měsíce: o 40 % nižší náklady na výrobu proteinů ve srovnání s nejlepšími předchozími základními hodnotami(otevře se v novém okně).

Rekonfigurovatelné automatizační vozíky Ginkgo Bioworks. Kredit: Ginkgo Bioworks

Co jsme se dozvěděli?

Zjistili jsme, že zlepšení přinesla identifikace kombinací, které spolu dobře fungují a které obstojí v podmínkách vysoce výkonné automatizace.

Zjistili jsme, že model GPT‑5 identifikoval nízkonákladová reakční složení, která lidé v této konfiguraci dříve netestovali. Bezbuněčná syntéza proteinů (CFPS) se studuje už řadu let, ale prostor možných směsí je stále velký. Když dokážete rychle navrhnout a provést tisíce kombinací, můžete najít použitelné oblasti, které se při manuálním pracovním postupu snadno přehlédnou.

Zjistili jsme také, že vysoce výkonné experimenty na destičkách se často liší od manuálních experimentů na stolech. Okysličování může být ve vysoce výkonných reakčních formátech nižší. Míchání a geometrie se mohou lišit. Většina reakcí syntézy CFPS produkuje mnohem více proteinů ve zkumavkách než na mikrotitračních destičkách, protože větší rozsah je obecně spojen s větší dostupností kyslíku a lepším mícháním. Ve skutečnosti GPT‑5 navrhl mnoho reakcí na destičkách při nízkém objemu, které okamžitě překonaly dosavadní nejlepší výsledky poté, co získal přístup k počítači pro analýzu dat a webovému prohlížeči pro vyhledávání relevantních článků. Celkově GPT‑5 navrhl mnoho kombinací reagencií, které si vedly dobře při omezeních vysokého výkonu, včetně mnoha, které jsou odolnější v podmínkách s nízkým obsahem kyslíku, běžných v automatizovaných laboratorních prostředích.

Kromě toho jsme zjistili, že malé změny v pufrování, složkách pro regeneraci energie a polyaminech měly v poměru ke své ceně nadprůměrný dopad. Nejsou to vždy první parametry, po kterých se sáhne, ale při vysoké propustnosti se z nich spíše stávají testovatelné hypotézy než předpoklady na pozadí.

To, na čem záleží, nakonec určila samotná struktura nákladů. V syntéze CFPS nyní převažují náklady na lyzát a DNA. Znamená to, že výtěžnost je strategií s nejvyšší mírou využití. Pokud se podaří zvýšit produkci proteinu na jednotku drahého vstupu, dosáhne se smysluplného pokroku v nákladech ještě před začátkem hledání marginálních úspor.

Autonomní laboratorní iterace snižuje náklady a zvyšuje výtěžnost proteinu.

Během šesti kol autonomních experimentů systém neustále zlepšoval syntézu bezbuněčných proteinů, snižoval náklady a zároveň zvyšoval výtěžnost proteinů. Výsledky jsou zobrazeny jako poměr reakčních nákladů a titru proteinu pro každé kolo, přičemž nejlepší kompromisy tvoří hranici. Větší body označují nejnižší dosažené náklady na gram v každém kole a odkazy s hvězdičkou a tečkované odkazy ukazují předchozí špičkový referenční výkon u 384jamkových destiček (Olsen et al., 2025). Podrobnější pohled na pozdější kola zdůrazňuje konečné zisky a souhrn po jednotlivých kolech ukazuje, že nejlepší cena za gram se postupně snižuje.

Omezení

Tyto výsledky byly prokázány na jednom proteinu sfGFP a jednom systému bezbuněčné syntézy proteinů (CFPS). Ještě je třeba prokázat zobecnění na jiné proteiny a jiné systémy syntézy CFPS.

Okysličování a geometrie reakce mohou silně ovlivnit výtěžnost a tyto faktory se mohou v různých měřítkách lišit. Některá zlepšení mohou být na tyto podmínky citlivá a pochopení této citlivosti je součástí dalšího postupu.

Při vylepšování protokolu a manipulaci s činidly byl nutný lidský dohled. Systém dokáže navrhovat a interpretovat experimenty, ale laboratorní práce stále zahrnuje praktické detaily, které vyžadují zkušené operátory.

Jaký bude další krok

Plánujeme aplikovat optimalizaci v laboratoři na další biologické pracovní postupy, u kterých může rychlejší iterace odblokovat pokrok. Autonomní laboratoře považujeme za doplněk modelů. Modely mohou generovat návrhy, ale biologie nakonec stále vyžaduje testování a iterace. Uzavření smyčky mezi generováním a experimentováním představuje způsob, jak proměnit slibné nápady ve fungující výsledky.

Při práci na bezpečném a odpovědném urychlování vědeckého pokroku se snažíme také vyhodnocovat a snižovat rizika, zejména ta, která souvisejí s biologickou bezpečností. Tyto výsledky ukazují, že modely mohou v mokré laboratoři přispět ke zlepšení protokolů a mohou ovlivnit biologickou bezpečnost způsobem, který hodnotíme a zmírňujeme v našem Rámci připravenosti. Jsme odhodláni budovat⁠ nezbytná a propracovaná ochranná opatření na úrovni modelu a systému, abychom tato rizika snížili, a také vyvíjet hodnocení pro sledování aktuálních úrovní.

Jsme vděční našim partnerům ze společnosti Ginkgo Bioworks a týmům, které se podílely na návrhu, provozu a podpoře automatizované cloudové laboratoře, jež stojí za touto prací.

Autor

OpenAI