Overslaan naar hoofdinhoud
OpenAI

5 februari 2026

OnderzoekPublicatie

GPT‑5 verlaagt de kosten van celvrije eiwitsynthese

Samen met Ginkgo Bioworks hebben we een AI-gedreven autonoom lab opgezet en de kosten voor eiwitproductie met 40% verlaagd.

Bezig met laden...

We hebben snelle vooruitgang gezien door AI op gebieden als wiskunde en natuurkunde, waar ideeën vaak geëvalueerd kunnen worden zonder de fysieke wereld aan te raken. Biologie is anders. Vooruitgang loopt via het lab, waar wetenschappers experimenten doen die tijd en geld kosten.

Dat begint nu te veranderen. Geavanceerde AI-modellen kunnen nu direct worden gekoppeld aan labautomatisering. Ze kunnen experimenten voorstellen, deze op grote schaal uitvoeren, leren van de resultaten en beslissen wat de volgende stap moet zijn. Binnen de levenswetenschappen vormt het iteratieproces vaak het knelpunt. Autonome labs zijn ontworpen om die beperking weg te nemen.

In eerder werk lieten we zien dat GPT‑5 protocollen voor het wet-lab kon verbeteren via closed-loop experimenten. Hier laten we zien dat dezelfde aanpak de kosten van eiwitproductie kan verlagen.

In samenwerking met Ginkgo Bioworks(opent in een nieuw venster) hebben we GPT‑5 gekoppeld aan een 'cloud laboratory'. Dit is een volledig geautomatiseerd laboratorium dat op afstand via software wordt aangestuurd, waarbij robots de experimenten uitvoeren en de data terugsturen. Met deze 'lab-in-the-loop'-opstelling hebben we een veelgebruikt biologisch proces geoptimaliseerd: celvrije eiwitsynthese (CFPS). Gedurende zes experimentele rondes testte het systeem meer dan 36.000 unieke CFPS-samenstellingen, verdeeld over 580 geautomatiseerde testplaten. Nadat GPT‑5 toegang kreeg tot een computer, een webbrowser en relevante wetenschappelijke artikelen, had het model slechts drie rondes nodig om een nieuwe standaard te zetten voor betaalbare CFPS. Het resultaat was een kostenbesparing van 40% op de totale eiwitproductie (en 57% op de reagentia). Daarbij ontdekte het model nieuwe samenstellingen die beter bestand zijn tegen de specifieke omstandigheden in geautomatiseerde laboratoria.

Waarom celvrije eiwitsynthese belangrijk is

Celvrije eiwitsynthese (CFPS) is een methode om eiwitten te produceren zonder levende cellen te kweken. In plaats van DNA in cellen in te brengen en te wachten tot deze een eiwit produceren, laat CFPS het eiwitproductiemechanisme draaien in een gecontroleerd mengsel. Dit maakt het een bijzonder praktisch instrument voor snelle prototyping en testen: wetenschappers kunnen in korte tijd veel experimenten uitvoeren en de resultaten nog dezelfde dag meten.

Eiwitten vormen een belangrijk onderdeel van wat de moderne biologie te bieden heeft. Veel belangrijke geneesmiddelen zijn erop gebaseerd en tal van diagnostische tests en onderzoeken zijn ervan afhankelijk. In de industrie fungeren eiwitten als enzymen die chemische processen schoner en efficiënter maken. Ze zitten zelfs in je wasmiddel. Wanneer eiwitproductie sneller en goedkoper wordt, kunnen wetenschappers ideeën in een vroeger stadium testen. Dit verlaagt de kosten om fundamenteel onderzoek om te zetten in toepassingen waar we dagelijks profijt van hebben.

CFPS is al nuttig voor snelle iteratie. Het knelpunt is dat het moeilijk te optimaliseren is en op grote schaal duur wordt.

Celvrije eiwitsynthese is moeilijk te optimaliseren en duur

Celvrije eiwitsynthese vereist een complex samenspel van ingrediënten: het DNA-template dat codeert voor het eiwit, het cellysaat (een mengsel van de machinerie uit de cel) en een groot aantal biochemische componenten, variërend van energiebronnen tot zouten. Het is enorm lastig om dit systeem als één geheel te doorgronden. In veel(opent in een nieuw venster) eerdere(opent in een nieuw venster) studies(opent in een nieuw venster) zijn dan ook diverse vormen van machine learning toegepast in een poging de productiekosten te verlagen.

Standaard CFPS-formuleringen en commerciële kits zijn qua prijs vaak afgestemd op kleinschalig, handmatig werk. Autonome labs kunnen echter duizenden reacties uitvoeren in de tijd dat een menselijk team er tientallen doet. Op die schaal worden de kosten van reagentia de beperkende factor.

Daarnaast is CFPS moeilijk puur op intuïtie te optimaliseren. Het is een mengsel van vele componenten die op elkaar inwerken. Kleine veranderingen kunnen van invloed zijn, maar de richting van het effect is niet altijd direct duidelijk. De beste combinaties zijn vaak moeilijk te vinden zonder veel experimenten te doen. Eerdere benaderingen hebben de kosten wel verlaagd, maar de vooruitgang is vaak stapsgewijs omdat het grondig verkennen van de mogelijkheden arbeidsintensief is.

GPT‑5 koppelen aan een robotisch laboratorium

We koppelden GPT‑5 aan het cloud-lab van Ginkgo Bioworks om een autonoom 'closed-loop' systeem te creëren voor de optimalisatie van CFPS.

GPT‑5 ontwierp batches met experimenten. Het lab voerde deze uit. De resultaten werden teruggestuurd naar het model. Het model gebruikte deze data om de volgende ronde voor te stellen. Deze cyclus herhaalden we zes keer.

Diagram met titel: 'AI-gestuurd autonoom lab'. GPT-5 voert data-analyse, biochemische redeneringen en hypothesegeneratie uit en stuurt experimentele ontwerpen naar Reconfigurable Automation Carts (RAC's). Deze voeren fysieke experimenten uit, automatiseren vloeistofbehandeling (liquid handling), incuberen monsters en meten fluorescentie. RAC's sturen experimentele data en statistieken terug naar GPT-5, waarmee een gesloten feedbacklus wordt gevormd.

GPT‑5 ontwierp batches experimenten in een standaard 384-wells plaat-formaat en voerde deze uit in het cloud-lab van Ginkgo Bioworks. Zodra de experimenten klaar waren, stuurde het lab de data terug naar GPT‑5, waarna het model de uitkomsten analyseerde, nieuwe hypotheses vormde en de volgende experimentele ronde ontwierp.

Om te zorgen dat het proces haalbaar bleef voor een autonoom lab, voegden we strikte programmatische validatie toe voordat een experiment werd uitgevoerd. Deze validatie zorgde ervoor dat de door AI ontworpen experimenten fysiek uitvoerbaar waren op het automatiseringsplatform. Het voorkwam experimenten die er in tekst aannemelijk uitzien, maar niet in een robotische workflow kunnen worden uitgevoerd.

In totaal voerde het systeem meer dan 36.000 reacties uit op 580 geautomatiseerde platen. Deze schaalgrootte is cruciaal om patronen te kunnen herkennen. Individuele biologische experimenten bevatten vaak veel ruis. Doorvoer en iteratie zijn essentieel om het signaal van de ruis te onderscheiden. Zodra GPT‑5 toegang kreeg tot de relevante literatuur en tools, had het model drie experimentele rondes en twee maanden nodig om een nieuwe state-of-the-art te bereiken: 40% lagere productiekosten vergeleken met de beste eerdere baseline(opent in een nieuw venster).

De herconfigureerbare automatiseringskarren van Ginkgo Bioworks. Bron: Ginkgo Bioworks

Wat we hebben geleerd

We ontdekten dat de verbeteringen voortkwamen uit het identificeren van combinaties die goed samenwerken en standhouden in de realiteit van automatisering met hoge doorvoer.

We zagen dat GPT‑5 goedkope reactiesamenstellingen identificeerde die mensen nog niet eerder in deze configuratie hadden getest. Hoewel CFPS al jaren wordt bestudeerd, is het aantal mogelijke mengsels nog steeds enorm. Door duizenden combinaties snel voor te stellen en uit te voeren, ontdek je werkbare opties die bij een handmatig proces gemakkelijk over het hoofd worden gezien.

Ook ontdekten we dat experimenten met hoge doorvoer op testplaten vaak verschillen van handmatige experimenten op de laboratoriumtafel. Bij formats met hoge doorvoer kan de zuurstoftoevoer lager zijn en kunnen de menging en geometrie afwijken. De meeste CFPS-reacties produceren aanzienlijk meer eiwit in reageerbuisjes dan in microtiterplaten, omdat grotere volumes doorgaans zorgen voor meer zuurstofbeschikbaarheid en betere menging. Voor reacties op kleine schaal in platen stelde GPT‑5 echter veel reacties voor die direct beter presteerden dan de voorgaande standaarden, vlak nadat het toegang kreeg tot een computer voor data-analyse en literatuuronderzoek. Al met al stelde GPT‑5 veel combinaties van reagentia voor die goed presteerden onder de beperkingen van tests met hoge doorvoer, inclusief combinaties die beter bestand zijn tegen de zuurstofarme omstandigheden die typisch zijn voor geautomatiseerde labs.

Daarnaast zagen we dat kleine wijzigingen in buffers, componenten voor energieregeneratie en polyaminen een onevenredig grote impact hadden in verhouding tot de kosten. Dit zijn niet altijd de eerste parameters waar mensen aan denken, maar bij hoge doorvoer worden het toetsbare hypotheses in plaats van vaste aannames.

Tot slot bepaalde de kostenstructuur zelf wat belangrijk was. Bij CFPS worden de kosten tegenwoordig gedomineerd door lysaat en DNA. Dit betekent dat rendement de meest effectieve strategie is. Als je de eiwitopbrengst per eenheid dure input kunt verhogen, boek je aanzienlijke vooruitgang in de kosten, nog voordat je naar marginale besparingen elders zoekt.

Iteratie in autonome labs verlaagt kosten en verhoogt eiwitopbrengst

Gedurende zes rondes van autonome experimenten verbeterde het systeem de celvrije eiwitsynthese gestaag, waarbij de kosten daalden en de eiwitopbrengst steeg. De resultaten worden weergegeven als reactiekosten versus eiwittiter per ronde, waarbij de beste afwegingen een grenslijn vormen. Grotere punten markeren de laagste kosten per gram die in elke ronde zijn bereikt. De ster met stippellijn geeft de eerdere state-of-the-art benchmark in 384-wells platen aan (Olsen et al., 2025). Een blik op de latere rondes benadrukt de uiteindelijke winst, en een samenvatting per ronde toont hoe de beste kosten per gram in de loop van de tijd afnemen.

Beperkingen

Deze resultaten zijn aangetoond met één eiwit, sfGFP, en één CFPS-systeem. Generalisatie naar andere eiwitten en systemen moet nog worden bewezen.

Zuurstoftoevoer en reactiegeometrie kunnen de opbrengst sterk beïnvloeden, en deze factoren kunnen variëren per schaalgrootte. Sommige verbeteringen kunnen gevoelig zijn voor deze omstandigheden en het begrijpen van die gevoeligheden is onderdeel van de volgende stap.

Menselijk toezicht was nodig voor protocolverbeteringen en het hanteren van reagentia. Het systeem kan experimenten ontwerpen en interpreteren, maar laboratoriumwerk omvat nog steeds praktische details die ervaren operators vereisen.

Wat volgt er?

We zijn van plan om lab-in-the-loop optimalisatie toe te passen op andere biologische workflows waar snellere iteratie vooruitgang kan ontsluiten. We zien autonome labs als een aanvulling op modellen. Modellen kunnen ontwerpen genereren, maar biologie vereist uiteindelijk nog steeds testen en iteratie. Het sluiten van de cirkel tussen generatie en experimentatie is de manier om veelbelovende ideeën om te zetten in werkende resultaten.

Terwijl we werken aan het veilig en verantwoord versnellen van wetenschappelijke vooruitgang, willen we ook risico's evalueren en verminderen, vooral die met betrekking tot biosecurity. Deze resultaten tonen aan dat AI-modellen kunnen redeneren in een laboratoriumsetting om protocollen te verbeteren. Dit heeft mogelijke implicaties voor de bioveiligheid, die we beoordelen en beperken via ons Preparedness Framework⁠. We zetten ons in voor het ontwikkelen⁠ van noodzakelijke en genuanceerde waarborgen op model- en systeemniveau om deze risico’s te verkleinen, en voor het opzetten van evaluaties om de huidige stand van zaken te monitoren.

We zijn onze partners bij Ginkgo Bioworks en de teams die hebben geholpen bij het ontwerpen, uitvoeren en ondersteunen van het geautomatiseerde cloudlaboratorium achter dit werk dankbaar.

Auteur

OpenAI