Salta al contingut principal
OpenAI

5 de febrer del 2026

RecercaPublicació

GPT‑5 redueix el cost de la síntesi de proteïnes sense cèl·lules

Treballant amb Ginkgo Bioworks, vam crear un laboratori autònom impulsat per IA i vam aconseguir una reducció del 40 % en el cost de producció de proteïnes.

S'està carregant…

Hem vist un progrés ràpid de la IA en camps com les matemàtiques i la física, on sovint es poden avaluar idees sense tocar el món físic. La biologia és diferent. El progrés passa pel laboratori, on els científics fan experiments que requereixen temps i diners.

Això està començant a canviar. Els models d'avantguarda ara poden connectar-se directament a l'automatització de laboratori, proposar experiments, executar-los a escala, aprendre dels resultats i decidir què fer a continuació. En gran part de les ciències de la vida, el coll d'ampolla és la iteració, i els laboratoris autònoms es construeixen per eliminar aquesta limitació.

En treballs anteriors, vam mostrar que GPT‑5 podia millorar els protocols dels laboratoris experimentals mitjançant l'experimentació en bucle tancat. Aquí, mostrem que el mateix enfocament pot reduir el cost de la producció de proteïnes.

Vam col·laborar amb Ginkgo Bioworks(s'obre en una finestra nova) per connectar GPT‑5 a un laboratori al núvol —un laboratori experimental automatitzat operat remotament mitjançant programari, on els robots executen experiments i retornen dades— i vam fer servir aquesta configuració de laboratori en el bucle per optimitzar un procés biològic d’ús generalitzat: la síntesi de proteïnes sense cèl·lules (cell-free protein synthesis , o CFPS). Al llarg de sis rondes d’experimentació en bucle tancat, el sistema va provar més de 36.000 composicions úniques de reacció CFPS en 580 plaques automatitzades. Després de rebre accés a un ordinador, a un navegador web i a articles rellevants, GPT‑5 va necessitar tres rondes d’experimentació per aconseguir els millors resultats coneguts fins ara en CFPS de baix cost, amb una reducció del 40 % en el cost de producció de proteïnes (i una millora del 57 % en el cost dels reactius), incloses noves composicions de reacció més robustes davant condicions de reacció habituals en laboratoris autònoms.

Per què és important la síntesi de proteïnes sense cèl·lules

La síntesi de proteïnes sense cèl·lules (CFPS) és una manera de produir proteïnes sense fer créixer cèl·lules vives. En lloc d'introduir ADN a les cèl·lules i esperar que produeixin una proteïna, la CFPS fa funcionar la maquinària de producció de proteïnes en una mescla controlada. Això la converteix en una eina pràctica per al prototipatge ràpid i les proves, ja que els científics poden executar molts experiments ràpidament i mesurar els resultats el mateix dia.

Les proteïnes són una part important del que ofereix la biologia moderna. Molts medicaments importants es basen en proteïnes. Moltes proves diagnòstiques i assajos de recerca depenen de les proteïnes. En entorns industrials, les proteïnes actuen com a enzims que fan que els processos químics siguin més nets i més eficients. Les proteïnes fins i tot es troben al detergent de la roba. Quan la producció de proteïnes esdevé més ràpida i més barata, els científics normalment poden provar més idees abans i reduir el cost de convertir la recerca inicial en quelcom del tothom es pugui beneficiar diàriament.

La CFPS ja és útil per a aquest tipus d'iteració. El coll d'ampolla és que és complicat d'optimitzar i es torna car a escala.

La síntesi de proteïnes sense cèl·lules és difícil d'optimitzar i és costosa

La síntesi de proteïnes sense cèl·lules requereix ingredients complexos i interactius: la plantilla d'ADN que codifica la proteïna que s'ha de produir, el lisat cel·lular (la sopa de maquinària cel·lular de l'interior de les cèl·lules) i un gran nombre de components bioquímics que van des de fonts d'energia fins a sals. És increïblement difícil entendre el sistema en el seu conjunt, i molts(s'obre en una finestra nova) estudis(s'obre en una finestra nova) anteriors(s'obre en una finestra nova) han aplicat diferents tipus d'aprenentatge automàtic per reduir el cost de producció de proteïnes.

Les formulacions estàndard de síntesi de proteïnes sense cèl·lules (CFPS) i els kits comercials sovint tenen un preu pensat per a un ritme de treball humà. Els laboratoris autònoms poden dur a terme milers de reaccions en el temps que un equip humà podria fer només desenes. A aquesta escala, el cost dels reactius esdevé el factor limitant.

La CFPS també és difícil d’optimitzar només amb la intuïció. És una barreja de molts components que interactuen. Els petits canvis poden ser importants, però la direcció de l'efecte no sempre és evident, i les millors combinacions poden ser difícils de trobar sense fer molts experiments. Els enfocaments anteriors han reduït els costos, però el progrés tendeix a ser incremental perquè explorar l'espai a fons és molt intensiu en mà d'obra.

Connectant GPT‑5 a un laboratori robòtic

Vam unir GPT‑5 amb el laboratori al núvol de Ginkgo Bioworks per formar un sistema autònom de bucle tancat per a l’optimització de la síntesi de proteïnes sense cèl·lules (CFPS).

GPT‑5 va dissenyar lots d'experiments. El laboratori els va executar. Els resultats es van retroalimentar al model. El model va utilitzar aquestes dades per proposar la ronda següent. Vam repetir aquest cicle sis vegades.

Diagrama titulat "Laboratori autònom impulsat per IA". GPT-5 fa anàlisi de dades, raonament bioquímic i generació d'hipòtesis, i envia dissenys experimentals a Reconfigurable Automation Carts (RAC), que executen experiments físics, automatitzen la manipulació de líquids, incuben mostres i mesuren la fluorescència. Els RAC retornen dades i mètriques experimentals a GPT-5, formant un bucle de retroalimentació tancat.

GPT‑5 va dissenyar lots d’experiments en un format estàndard de placa de 384 pouets i els va executar al laboratori al núvol de Ginkgo Bioworks. Un cop van acabar els experiments, el laboratori al núvol va enviar les dades de tornada a GPT‑5, on el model va analitzar els resultats, va generar noves hipòtesis i va dissenyar la següent ronda d'experiments.

Per mantenir el bucle dins dels límits del que pot fer un laboratori autònom, vam afegir una validació programàtica estricta abans que s'executés qualsevol experiment. Aquesta validació va garantir que els experiments dissenyats per IA es poguessin executar físicament a la plataforma d'automatització. Va evitar "experiments sobre el paper" que semblen plausibles per escrit, però que no es poden dur a terme en un flux de treball robòtic.

Al llarg de tota la sèrie, el sistema va executar més de 36.000 reaccions CFPS en 580 plaques automatitzades. Aquesta escala és important perquè és el que permet que emergeixin patrons. En biologia, els experiments individuals solen tenir molta variabilitat. El rendiment i la iteració són la manera de separar el senyal del soroll aleatori. Un cop GPT‑5 va tenir accés a l’article pertinent i a les eines necessàries, van caldre tres rondes d’experimentació i dos mesos per assolir un nou nivell de referència: un cost de producció de proteïnes un 40 % més baix que el del millor punt de referència anterior(s'obre en una finestra nova).

Carros d'automatització reconfigurables de Ginkgo Bioworks. Crèdit: Ginkgo Bioworks

El que hem après

Hem descobert que les millores provenien d’identificar combinacions que funcionaven bé juntes i que es mantenien en les realitats de l’automatització d’alt rendiment.

Hem trobat que GPT‑5 va identificar composicions de reacció de baix cost que els humans no havien provat prèviament en aquesta configuració. La síntesi de proteïnes sense cèl·lules (CFPS) s'ha estudiat durant anys, però el marge per a possibles mescles encara és gran. Quan pots proposar i executar milers de combinacions ràpidament, pots trobar regions viables que són fàcils de passar per alt amb un flux de treball manual.

També hem descobert que els experiments d'alt rendiment basats en plaques sovint difereixen dels experiments manuals de banc de laboratori. L'oxigenació pot ser més baixa en formats de reacció d'alt rendiment. La mescla i la geometria poden ser diferents. La majoria de reaccions CFPS produeixen molta més proteïna en tubs d’assaig que en microplaques, perquè les escales més grans solen tenir més disponibilitat d’oxigen i una millor mescla. De fet, per a reaccions basades en plaques a baix volum, GPT‑5 va proposar moltes reaccions que van superar el millor resultat anterior immediatament després d'obtenir accés a un ordinador per a l'anàlisi de dades i a un navegador web per cercar articles rellevants. En general, GPT‑5 va proposar moltes combinacions de reactius que van funcionar bé sota les restriccions de rendiment d'alt rendiment, incloses moltes que són més robustes en condicions de baix oxigen habituals en entorns de laboratori automatitzats.

A més, vam observar que petits canvis en el tamponament, els components de regeneració d'energia i les poliamines tenien un impacte desproporcionat en relació amb el seu cost. Aquests no sempre són els primers paràmetres als quals recorre la gent, però amb un rendiment elevat, esdevenen hipòtesis comprovables en lloc de supòsits de fons.

Finalment, la mateixa estructura de costos va determinar què era important. En CFPS, els costos ara estan dominats pel lisat i l'ADN. Això vol dir que el rendiment és l’estratègia amb més palanquejament. Si pots augmentar la producció de proteïnes per unitat d'entrada cara, fas un progrés significatiu en el cost fins i tot abans de buscar estalvis marginals en altres llocs.

La iteració autònoma de laboratori redueix els costos i augmenta el rendiment de proteïnes

Al llarg de sis rondes d'experimentació autònoma, el sistema va millorar de manera constant la síntesi de proteïnes sense cèl·lules, reduint els costos alhora que augmentava el rendiment de proteïnes. Els resultats es mostren com a cost de reacció en funció del títol de proteïna per a cada ronda, amb les millors relacions cost-rendiment formant una frontera. Els punts més grans marquen el cost per gram més baix assolit en cada ronda, i la referència amb estrella/puntejada indica el punt de referència anterior de l'estat de l'art en plaques de 384 pouets (Olsen et al., 2025). Una mirada més de prop a les rondes posteriors posa en relleu els guanys finals i un resum ronda per ronda mostra que el millor cost per gram disminueix amb el temps.

Limitacions

Aquests resultats es van demostrar en una proteïna, sfGFP, i un sistema de síntesi de proteïnes lliure de cèl·lules (CFPS). Encara cal demostrar la generalització a altres proteïnes i altres sistemes CFPS.

L'oxigenació i la geometria de reacció poden afectar fortament els rendiments, i aquests factors poden variar segons l'escala. Algunes millores poden ser sensibles a aquestes condicions, i entendre aquestes sensibilitats forma part del que caldrà fer després.

Es va requerir supervisió humana per a les millores del protocol i la manipulació de reactius. El sistema pot dissenyar i interpretar experiments, però el treball de laboratori encara implica detalls pràctics que necessiten operadors amb experiència.

Què ens ofereix el futur?

Tenim previst aplicar l'optimització amb laboratori en el bucle a altres fluxos de treball biològics en què una iteració més ràpida pot desbloquejar el progrés. Veiem els laboratoris autònoms com a complementaris als models. Els models poden generar dissenys, però en última instància la biologia encara requereix proves i iteració. Tancar el cercle entre la generació i l'experimentació és com converteixes idees prometedores en resultats que funcionen.

Mentre treballem per accelerar el progrés científic de manera segura i responsable, també busquem avaluar i reduir els riscos, especialment els relacionats amb la bioseguretat. Aquests resultats mostren que els models poden raonar en el laboratori experimental per millorar protocols, i poden tenir implicacions per a la bioseguretat que avaluem i mitiguem mitjançant el nostre entorn de treball de preparació. Ens comprometem a crear⁠ les salvaguardes necessàries i matisades a nivell de model i de sistema per reduir aquests riscos, així com a desenvolupar avaluacions per fer el seguiment dels nivells actuals.

Estem agraïts als nostres socis de Ginkgo Bioworks i als equips que van ajudar a dissenyar, executar i donar suport al laboratori automatitzat al núvol que hi ha darrere d’aquest treball.

Autor

OpenAI