GPT‑5 obniża koszty bezkomórkowej syntezy białek
We współpracy z Ginkgo Bioworks stworzyliśmy autonomiczne laboratorium oparte na sztucznej inteligencji i osiągnęliśmy 40-procentową redukcję kosztów produkcji białek.
Zaobserwowaliśmy szybki postęp sztucznej inteligencji w dziedzinach takich jak matematyka i fizyka, gdzie pomysły często można oceniać bez odwoływania się do świata fizycznego. W biologii jest inaczej. Postępy są widoczne w laboratorium, gdzie naukowcy przeprowadzają eksperymenty, które wymagają czasu i pieniędzy.
To zaczyna się zmieniać. Pionierskie modele mogą teraz łączyć się bezpośrednio z automatyzacją laboratoryjną, proponować eksperymenty, przeprowadzać je na dużą skalę, wyciągać wnioski z wyników i decydować o dalszych działaniach. W większości dziedzin nauk przyrodniczych wąskim gardłem jest iteracja, a laboratoria autonomiczne powstają po to, aby wyeliminować to ograniczenie.
Wcześniej udowodniliśmy, że GPT‑5 może ulepszyć protokoły laboratoryjne poprzez eksperymenty w obiegu zamkniętym. Tutaj pokazujemy, że to samo podejście może obniżyć koszty produkcji białek.
Nawiązaliśmy współpracę z firmą Ginkgo Bioworks(otwiera nowe okno), aby połączyć GPT‑5 z laboratorium w chmurze – zautomatyzowanym laboratorium mokrym obsługiwanym zdalnie za pomocą oprogramowania, w którym roboty przeprowadzają eksperymenty i dostarczają dane. Wykorzystaliśmy tę konfigurację laboratorium pracującego w pętli do optymalizacji powszechnie stosowanego procesu biologicznego: bezkomórkowej syntezy białek (CFPS). W ciągu sześciu rund eksperymentów w obiegu zamkniętym system przetestował ponad 36 000 unikatowych kompozycji reakcji CFPS na 580 automatycznych płytkach. Po uzyskaniu dostępu do komputera, przeglądarki internetowej i odpowiednich dokumentów GPT‑5 przeprowadził trzy rundy eksperymentów, aby ustanowić nowy standard w dziedzinie procesu CFPS o niskich kosztach, osiągając redukcję kosztów produkcji białek o 40% (i o 57% w przypadku kosztów odczynników), w tym nowatorskie kompozycje reakcji, które są bardziej odporne na warunki reakcji często występujące w autonomicznych laboratoriach.
Bezkomórkowa synteza białek (CFPS) to metoda produkcji białek bez potrzeby hodowania żywych komórek. Zamiast wprowadzać DNA do komórek i czekać, aż zaczną produkować białko, CFPS uruchamia mechanizm produkcji białka w kontrolowanej mieszaninie. To czyni go praktycznym narzędziem do szybkiego prototypowania i testowania, ponieważ naukowcy mogą szybko przeprowadzać wiele eksperymentów oraz analizować wyniki tego samego dnia.
Białka stanowią ważną część osiągnięć współczesnej biologii. Wiele ważnych leków opiera się na białkach. Wiele badań diagnostycznych i naukowych bazuje na białkach. W przemyśle białka pełnią rolę enzymów, które sprawiają, że procesy chemiczne są czystsze i bardziej wydajne. Białka znajdują się nawet w detergentach do prania. Gdy produkcja białek staje się szybsza i tańsza, naukowcy mogą zazwyczaj szybciej testować więcej koncepcji i obniżyć koszty przełożenia wczesnych badań na codzienne korzyści dla ludzi.
Proces CFPS jest już przydatny do tego rodzaju iteracji. Ograniczeniem jest tutaj trudność optymalizacji i wysokie koszty przy dużej skali.
Synteza białek bezkomórkowych wymaga złożonej kombinacji współdziałających ze sobą składników: matrycy DNA kodującej białko, które ma zostać wytworzone, lizatu komórkowego (mieszaniny mechanizmów komórkowych z wnętrza komórek) oraz dużej liczby składników biochemicznych, od źródeł energii po sole. Niezwykle trudno jest zrozumieć ten system jako całość, dlatego w wielu(otwiera nowe okno) wcześniejszych(otwiera nowe okno) badaniach(otwiera nowe okno) zastosowano różne rodzaje uczenia maszynowego w celu obniżenia kosztów produkcji białek.
Standardowe formulacje bezkomórkowej syntezy białek (CFPS) i komercyjne zestawy są często dostosowane cenowo do pracy wykonywanej w tempie człowieka. Autonomiczne laboratoria mogą przeprowadzić tysiące reakcji w czasie, w którym zespół ludzi wykonałby tylko kilkadziesiąt. W tej skali czynnikiem ograniczającym staje się koszt odczynników.
Proces CFPS jest również trudny do zoptymalizowania wyłącznie na podstawie intuicji. To połączenie wielu współdziałających ze sobą elementów. Niewielkie zmiany mogą mieć duże znaczenie, ale kierunek ich oddziaływania nie zawsze jest oczywisty, a znalezienie najlepszych kombinacji może być problematyczne bez przeprowadzenia wielu eksperymentów. Dotychczasowe podejścia pozwoliły obniżyć koszty, ale postępy są raczej niewielkie, ponieważ dokładne zbadanie danego obszaru wymaga dużego nakładu pracy.
Połączyliśmy model GPT‑5 z laboratorium chmurowym Ginkgo Bioworks, tworząc zamknięty, autonomiczny system do optymalizacji bezkomórkowej syntezy białek (CFPS).
GPT‑5 zaprojektował serie eksperymentów. Laboratorium je wykonało. Wyniki zostały wprowadzone do modelu. Model wykorzystał je do zaproponowania kolejnej rundy. Powtórzyliśmy ten cykl sześć razy.

GPT‑5 zaprojektował serie eksperymentów w standardowym formacie płytek 384-dołkowych i przeprowadził je w laboratorium chmurowym Ginkgo Bioworks. Po zakończeniu eksperymentów laboratorium w chmurze przesłało dane z powrotem do GPT‑5, gdzie model przeanalizował wyniki, wygenerował nowe hipotezy i zaprojektował kolejną rundę eksperymentów.
Aby zapewnić, że cykl pozostaje zgodny z możliwościami autonomicznego laboratorium, przed rozpoczęciem każdego eksperymentu wprowadziliśmy ścisłą weryfikację programową. Dzięki temu można było sprawdzić, czy eksperymenty zaprojektowane przez sztuczną inteligencję były fizycznie możliwe do wykonania na platformie automatyzacji. Zapobiegło to „eksperymentom na papierze”, które wyglądają wiarygodnie w teorii, ale nie mogą być przeprowadzone w ramach zrobotyzowanego procesu.
W trakcie całego cyklu system wykonał ponad 36 000 reakcji CFPS na 580 automatycznych płytkach. Ta skala ma znaczenie, ponieważ pozwala dostrzec powtarzające się wzorce. W biologii pojedyncze eksperymenty są obarczone dużą niepewnością. Dzięki wysokiej przepustowości i iteracji można oddzielić sygnał od przypadkowych zakłóceń. Gdy GPT‑5 uzyskał dostęp do odpowiednich dokumentów i narzędzi, potrzeba było trzech rund eksperymentów i dwóch miesięcy, aby ustanowić nowy standard: o 40% niższy koszt produkcji białka w porównaniu z najlepszym wynikiem bazowym(otwiera nowe okno).
Modułowe wózki automatyczne firmy Ginkgo Bioworks. Źródło: Ginkgo Bioworks
Odkryliśmy, że ulepszenia wynikają z identyfikacji kombinacji, które dobrze ze sobą współgrają i sprawdzają się w realiach automatyzacji o wysokiej przepustowości.
Odkryliśmy, że GPT‑5 zidentyfikował niedrogie kompozycje reakcyjne, które ludzie nie przetestowali wcześniej w tej konfiguracji. Bezkomórkowa synteza białek (CFPS) jest badana od lat, ale zakres możliwych mieszanek jest nadal szeroki. Kiedy można szybko zaproponować i wykonać tysiące kombinacji, możliwe staje się odkrycie całych regionów do wykorzystania, a które łatwo przeoczyć w przypadku pracy ręcznej.
Odkryliśmy również, że eksperymenty oparte na płytkach o wysokiej przepustowości często różnią się od eksperymentów ręcznych przeprowadzanych na stole laboratoryjnym. W formatach reakcji o wysokiej przepustowości natlenienie może być niższe. Mieszanie i geometria mogą się różnić. Większość reakcji CFPS wytwarza znacznie więcej białka w probówkach niż w płytkach mikromiareczkowych, ponieważ większa skala zazwyczaj wiąże się z większą dostępnością tlenu i lepszym mieszaniem. W rzeczywistości, w przypadku reakcji płytkowych o małej objętości, GPT‑5 zaproponował wiele reakcji, które przewyższały dotychczasowe najlepsze wyniki natychmiast po uzyskaniu dostępu do komputera w celu analizy danych i przeglądarki internetowej w celu wyszukania odpowiednich artykułów. Ogólnie rzecz biorąc, GPT‑5 zaproponował wiele kombinacji odczynników, które sprawdziły się w warunkach wysokiej przepustowości, w tym wiele takich, które są bardziej odporne w warunkach niskiego stężenia tlenu, powszechnych w zautomatyzowanych laboratoriach.
Ponadto odkryliśmy, że niewielkie zmiany w buforowaniu, komponentach regeneracji energii i poliaminach miały nieproporcjonalnie duży wpływ w stosunku do ich kosztu. Nie zawsze są to parametry o najwyższym priorytecie, ale przy dużej przepustowości stają się one hipotezami, które można przetestować, a nie tylko założeniami ogólnymi.
Wreszcie to sama struktura kosztów miała decydujące znaczenie. W przypadku procesów CFPS koszty są obecnie zdominowane przez lizat i DNA. Oznacza to, że strategia oparta na rentowności jest strategią o największej dźwigni. Wzrost produkcji białka na jednostkę kosztownych nakładów pozwala osiągnąć znaczący postęp w zakresie kosztów, nawet przed podjęciem działań mających na celu uzyskanie marginalnych oszczędności w innych obszarach.
W trakcie sześciu rund autonomicznych eksperymentów system stopniowo usprawniał bezkomórkową syntezę białek, obniżając koszty i zwiększając wydajność produkcji białek. Wyniki przedstawiono jako koszt reakcji w stosunku do miana białka dla każdej rundy, a najlepsze kombinacje tworzą granicę. Większe punkty oznaczają najniższy koszt za gram osiągnięty w każdej rundzie, a gwiazdka/kropka wskazuje poprzedni najnowocześniejszy punkt odniesienia w płytkach 384-dołkowych (Olsen et al., 2025). Bliższe przyjrzenie się późniejszym rundom pozwala dostrzec ostateczne zyski, a podsumowanie poszczególnych rund pokazuje, że najlepszy koszt za gram zmniejsza się z upływem czasu.
Wyniki te uzyskano w przypadku jednego białka, sfGFP, oraz jednego systemu bezkomórkowej syntezy białek (CFPS). Należy jeszcze wykazać możliwość uogólnienia tych wyników na inne białka i inne systemy CFPS.
Natlenianie i geometria reakcji mogą mieć duży wpływ na wydajność, a czynniki te mogą się różnić w zależności od skali. Niektóre ulepszenia mogą być czułe na te warunki, a zrozumienie tej wrażliwości jest ważnym aspektem dalszych działań.
Konieczna była kontrola ze strony człowieka w zakresie ulepszeń protokołu i obsługi odczynników. System może projektować i interpretować eksperymenty, ale praca laboratoryjna nadal wymaga praktycznych umiejętności doświadczonych operatorów.
Planujemy zastosować optymalizację laboratorium pracującego w pętli w innych procesach biologicznych, w których szybsza iteracja może przyspieszyć postępy. Uważamy, że autonomiczne laboratoria stanowią uzupełnienie modeli. Modele mogą generować projekty, ale ostatecznie biologia nadal wymaga testowania i iteracji. Wypełnienie luki między generowaniem pomysłów a eksperymentowaniem pozwala przekształcić obiecujące koncepcje w realne wyniki.
Skupiając się nad przyspieszeniem postępu naukowego w sposób bezpieczny i odpowiedzialny, dążymy również do oceny i redukcji ryzyka, szczególnie tego związanego z bezpieczeństwem biologicznym. Wyniki te pokazują, że modele mogą służyć do wnioskowania w laboratorium biologicznym w celu ulepszenia protokołów i mogą mieć znaczenie dla bezpieczeństwa biologicznego, które oceniamy i ograniczamy za pomocą naszych ram gotowości. Jesteśmy zaangażowani w budowanie niezbędnych i zróżnicowanych zabezpieczeń na poziomie modelu i systemu, aby zredukować te ryzyka, a także opracować oceny do śledzenia obecnych poziomów.
Jesteśmy wdzięczni naszym partnerom z Ginkgo Bioworks oraz zespołom, które pomogły zaprojektować, uruchomić i wspierać zautomatyzowane laboratorium w chmurze, którego dotyczy niniejsza praca.


