Sari la conținutul principal
OpenAI

5 februarie 2026

CercetarePublicare

GPT‑5 reduce costul sintezei proteinelor fără celule

Colaborând cu Ginkgo Bioworks, am creat un laborator autonom bazat pe inteligență artificială și am obținut o reducere de 40% a costului de producție a proteinelor.

Se încarcă…

Am observat progrese rapide ale inteligenței artificiale în domenii precum matematica și fizica, unde ideile pot fi adesea evaluate fără a atinge lumea fizică. Biologia este diferită. Progresul trece prin laborator, unde oamenii de știință efectuează experimente care necesită timp și bani.

Asta începe să se schimbe. Modelele de vârf se pot conecta acum direct la automatizarea de laborator, pot să propună experimente, să le ruleze la scară, să învețe din rezultate și să decidă pașii următori. În multe domenii ale științelor vieții, blocajul este reprezentat de iterație, iar laboratoarele autonome sunt create pentru a elimina această limitare.

În lucrări anterioare, am arătat că GPT‑5 ar putea îmbunătăți protocoalele de laborator umed prin experimentare în buclă închisă. Aici arătăm că aceeași abordare poate reduce costul producției de proteine.

Am colaborat cu Ginkgo Bioworks(se deschide într-o fereastră nouă) pentru a conecta GPT‑5 la un laborator dematerializat, adică un „laborator umed” automatizat, operat de la distanță prin programe informatice, unde roboții execută experimente și returnează date, și am folosit această configurație de laborator în buclă pentru a optimiza un proces biologic utilizat pe scară largă: sinteza de proteine fără celule (CFPS). Pe parcursul a șase runde de experimentare cu buclă închisă, sistemul a testat mai mult de 36.000 de compoziții unice de reacție CFPS pe 580 de plăci automatizate. După ce i s-a oferit acces la un calculator, un navigator web și la documentele relevante, GPT‑5 a avut nevoie de trei runde de experimentare pentru a stabili un nou standard de referință în CFPS cu costuri reduse, obținând o reducere de 40% a costului de producție a proteinelor (și o îmbunătățire de 57% a costului reactivilor), inclusiv compoziții noi de reacție care sunt mai robuste la condițiile de reacție comune în laboratoarele autonome.

De ce este importantă sinteza proteinelor fără celule

Sinteza de proteine fără celule (CFPS) este o metodă de a crea proteine fără a crește celule vii. În loc să introduci ADN în celule și să aștepți ca acestea să producă o proteină, CFPS rulează mecanismul de producere a proteinelor într-un amestec controlat. Acest lucru îl face un instrument practic pentru prototiparea și testarea rapidă, pentru că cercetătorii pot efectua rapid multe experimente și pot măsura rezultatele în aceeași zi.

Proteinele sunt o componentă majoră a progreselor oferite de biologia modernă. Multe medicamente importante se bazează pe proteine. Multe diagnostice și teste de cercetare se bazează pe proteine. În mediile industriale, proteinele acționează ca enzime care fac procesele chimice mai curate și mai eficiente. Proteinele se găsesc chiar și în detergentul tău de rufe. Când producția de proteine devine mai rapidă și mai ieftină, oamenii de știință pot testa, de obicei, mai multe idei mai devreme și pot reduce costul transformării cercetărilor timpurii în ceva de care oamenii pot beneficia zi de zi.

CFPS este deja util pentru acest tip de iterație. Problema constă în dificultatea optimizării și costul la scară largă.

Sinteza proteinelor fără celule este dificil de optimizat și costisitoare

Sinteza proteinelor fără celule necesită ingrediente complexe și interconectate: șablonul de ADN care codifică proteina ce urmează să fie produsă, lizatul celular (supa de mașinărie celulară din interiorul celulelor) și un număr mare de componente biochimice, de la surse de energie la săruri. Este incredibil de dificil să raționezi despre sistem ca un întreg, iar multe(se deschide într-o fereastră nouă) studii(se deschide într-o fereastră nouă) anterioare(se deschide într-o fereastră nouă) au aplicat diferite tipuri de învățare automată pentru a reduce costul de producție al proteinelor.

Formulările standard de sinteză a proteinelor fără celule (CFPS) și kiturile comerciale au adesea prețuri pentru o muncă în ritm uman. Laboratoarele autonome pot efectua mii de reacții în timpul în care o echipă umană ar putea efectua doar câteva zeci. La acea scară, costul reactivilor devine factorul limitativ.

CFPS este, de asemenea, dificil de optimizat doar prin intuiție. Este un amestec de multe componente care interacționează. Micile schimbări pot conta, dar direcția efectului nu este întotdeauna evidentă, iar cele mai bune combinații pot fi greu de găsit fără a face multe experimente. Abordările anterioare au redus costurile, dar progresul tinde să fie incremental, deoarece explorarea temeinică a spațiului necesită multă muncă.

Conectarea GPT‑5 la un laborator robotic

Am combinat GPT‑5 cu laboratorul cloud al Ginkgo Bioworks pentru a crea un sistem autonom cu buclă închisă pentru optimizarea sintezei proteinelor fără celule (CFPS).

GPT‑5 a proiectat loturi de experimente. Laboratorul le-a executat. Rezultatele au fost returnate modelului. Modelul a folosit acele date pentru a propune următoarea rundă. Am repetat acel ciclu de șase ori.

Diagramă intitulată „Laborator autonom bazat pe AI.” GPT-5 efectuează analiza datelor, raționament biochimic și generare de ipoteze, trimițând modele experimentale către cărucioare de automatizare reconfigurabile (RAC), care execută experimente fizice, automatizează manipularea lichidelor, incubează probele și măsoară fluorescența. RAC-urile returnează datele și măsurătorile experimentale către GPT-5, formând o buclă de feedback închisă.

GPT‑5 a conceput loturi de experimente într-un format standard de placă cu 384 de godeuri și le-a rulat în laboratorul cloud al Ginkgo Bioworks. După ce experimentele s-au încheiat, laboratorul cloud a trimis datele înapoi la GPT‑5, unde modelul a analizat rezultatele, a generat ipoteze noi și a conceput următoarea rundă de experimente.

Pentru a menține bucla ancorată în ceea ce poate face un laborator autonom, am adăugat o validare programatică strictă înainte de a rula orice experiment. Acea validare a asigurat că experimentele proiectate de inteligența artificială erau executabile fizic pe platforma de automatizare. A împiedicat „experimentele pe hârtie” care par plauzibile în text, dar nu pot fi realizate într-un flux de lucru robotizat.

Pe parcursul întregii rulări, sistemul a executat mai mult de 36.000 de reacții CFPS pe 580 de plăci automatizate. Această scară contează deoarece este cea care permite apariția unor tipare. În biologie, experimentele individuale sunt variabile. Debitul și iterația sunt modalitățile prin care este separat semnalul de zgomotul aleatoriu. Odată ce GPT‑5 a avut acces la lucrarea relevantă și la instrumente, a fost nevoie de trei runde de experimentare și două luni pentru a stabili un nou standard de referință: costuri de producție a proteinelor cu 40% mai mici comparativ cu cel mai bun reper anterior(se deschide într-o fereastră nouă).

Cărucioare de automatizare reconfigurabile Ginkgo Bioworks. Credit: Ginkgo Bioworks

Ce am învățat

Am constatat că îmbunătățirile au venit din identificarea combinațiilor care funcționează bine împreună și care rezistă în realitățile automatizării de mare randament.

Am descoperit că GPT‑5 a identificat compoziții de reacție ieftine pe care oamenii nu le testaseră anterior în această configurație. Sinteza proteinelor fără celule (CFPS) a fost studiată de ani de zile, dar spațiul posibil al amestecurilor rămâne mare. Când poți propune și executa rapid mii de combinații, poți găsi regiuni funcționale care sunt ușor de omis în cazul unui flux de lucru manual.

De asemenea, am constatat că experimentele pe plăci cu randament ridicat diferă adesea de experimentele manuale, pe banc de lucru. Oxigenarea poate fi mai mică în formatele de reacție cu randament ridicat. Amestecarea și geometria pot fi diferite. Majoritatea reacțiilor CFPS produc mult mai multe proteine în eprubete decât în plăci de microtitrare, deoarece scările mai mari vin, în general, cu o disponibilitate mai mare a oxigenului și o amestecare mai bună. De fapt, pentru reacțiile pe plăci la volum redus, GPT‑5 a propus multe reacții care au depășit imediat cele mai bune rezultate anterioare după ce a obținut acces la un computer pentru analiza datelor și la un browser web pentru a căuta lucrări relevante. În general, GPT‑5 a propus multe combinații de reactivi care au avut performanțe bune în condiții de randament ridicat, inclusiv multe care sunt mai robuste în condiții de oxigen scăzut, frecvente în mediile de laborator automatizate.

În plus, am constatat că micile modificări ale tamponării, componentelor de regenerare a energiei și poliaminelor au avut un impact supradimensionat în raport cu costul lor. Aceștia nu sunt întotdeauna primii parametri la care apelează oamenii, dar la un randament ridicat, devin ipoteze testabile, mai degrabă decât presupuneri de fundal.

În cele din urmă, structura costurilor în sine a modelat ceea ce era important. În CFPS, costurile sunt acum dominate de lizat și ADN. Asta înseamnă că randamentul este strategia cu cel mai mare impact. Dacă poți crește producția de proteine per unitate de intrare costisitoare, faci progrese semnificative în privința costurilor chiar înainte să cauți economii marginale în altă parte.

Iterația autonomă de laborator reduce costurile și crește randamentul de proteine

Pe parcursul a șase runde de experimentare autonomă, sistemul a îmbunătățit constant sinteza de proteine fără celule, reducând costurile și crescând randamentul proteic. Rezultatele sunt prezentate ca raportul dintre costul reacției și titrul de proteină pentru fiecare rundă, iar cele mai bune compromisuri formează un vârf. Punctele mai mari marchează cel mai mic cost pe gram obținut în fiecare rundă, iar referința stea/punctată indică reperul anterior de ultimă generație în plăci cu 384 de godeuri (Olsen et al., 2025). O analiză mai atentă a rundelor ulterioare evidențiază câștigurile finale, iar un rezumat rundă cu rundă arată că cel mai bun cost pe gram scade în timp.

Limitări

Aceste rezultate au fost demonstrate pe o proteină, sfGFP, și pe un sistem de sinteză de proteine fără celule (CFPS). Generalizarea la alte proteine și alte sisteme CFPS trebuie încă demonstrată.

Oxigenarea și geometria reacției pot afecta puternic randamentele, iar acești factori pot varia la diferite scări. Unele îmbunătățiri pot fi sensibile la aceste condiții, iar înțelegerea acestor sensibilități face parte din ceea ce urmează.

A fost nevoie de supraveghere umană pentru îmbunătățirea protocoalelor și manipularea reactivilor. Sistemul poate proiecta și interpreta experimente, dar munca de laborator încă implică detalii practice care necesită operatori cu experiență.

Ce urmează

Plănuim să aplicăm optimizarea lab-in-the-loop altor fluxuri de lucru biologice, unde o iterare mai rapidă poate debloca progresul. Privim laboratoarele autonome ca fiind complementare modelelor. Modelele pot genera designuri, dar, în cele din urmă, biologia necesită încă testare și iterație. Închiderea buclei dintre generare și experimentare este cum transformi ideile promițătoare în rezultate funcționale.

Concomitent cu eforturile noastre de a accelera progresul științific în condiții de siguranță și responsabilitate, încercăm să evaluăm și reducem riscurile, în special cele legate de biosecuritate. Aceste rezultate arată că modelele pot raționa în laboratorul experimental pentru a îmbunătăți protocoalele și pot avea implicații pentru biosecuritate, pe care le evaluăm și le atenuăm prin Cadru de pregătire. Ne angajăm să construim măsuri de siguranță necesare și nuanțate la nivel de model și sistem pentru a reduce aceste riscuri, precum și să dezvoltăm evaluări pentru a monitoriza nivelurile actuale.

Suntem recunoscători partenerilor noștri de la Ginkgo Bioworks și echipelor care au ajutat la proiectarea, operarea și susținerea laboratorului cloud automatizat din spatele acestei lucrări.