Kalo te përmbajtja kryesore
OpenAI

5 shkurt 2026

KërkimePublikim

GPT‑5 ul koston e sintezës së proteinave pa qeliza.

Duke punuar me Ginkgo Bioworks, krijuam një laborator autonom të drejtuar nga AI dhe arritëm një ulje prej 40% të kostos së prodhimit të proteinave.

Duke ngarkuar…

Kemi parë përparim të shpejtë nga AI në fusha si matematika dhe fizika, ku idetë shpesh mund të vlerësohen pa prekur botën fizike. Biologjia është e ndryshme. Përparimi zhvillohet në laborator, ku shkencëtarët kryejnë eksperimente që kërkojnë kohë dhe para.

Kjo po fillon të ndryshojë. Modelet avangardë tani mund të lidhen drejtpërdrejt me automatizimin e laboratorit, të propozojnë eksperimente, t'i ekzekutojnë ato në shkallë, të mësojnë nga rezultatet dhe të vendosin se çfarë të bëjnë më pas. Në shumicën e shkencave mjekësore, pengesa kryesore është përsëritja, dhe laboratorët autonomë janë krijuar për të eliminuar këtë kufizim.

Në punë të mëparshme, treguam se GPT‑5 mund të përmirësonte protokollet e laboratorit të lagësht përmes eksperimentimit të mbyllur. Këtu, tregojmë se e njëjta qasje mund të ulë koston e prodhimit të proteinave.

Ne u bëmë partnerë me Ginkgo Bioworks(hapet në një dritare të re) për të lidhur GPT‑5 me një laborator në re — një laborator të automatizuar të lagësht që operohet në distancë përmes softuerit, ku robotët kryejnë eksperimente dhe kthejnë të dhëna — dhe përdorëm atë konfigurim laboratorik për të optimizuar një proces biologjik të përdorur gjerësisht: sintezën e proteinave pa qeliza (CFPS). Gjatë më shumë se gjashtë raundeve të eksperimentimit me qark të mbyllur, sistemi testoi mbi 36 000 kompozime unike të reaksioneve CFPS në 580 pllaka të automatizuara. Pasi iu dha akses në një kompjuter, një shfletues uebi dhe dokumentet përkatëse, GPT‑5 kreu tre raunde eksperimentimi për të vendosur një standard të ri në CFPS me kosto të ulët, duke arritur një ulje prej 40% të kostos së prodhimit të proteinave (dhe një përmirësim prej 57% në koston e reagentëve), duke përfshirë përbërje të reja reaksioni që janë më të qëndrueshme ndaj kushteve të zakonshme të reaksionit në laboratorët autonomë.

Pse ka rëndësi sinteza e proteinave pa qeliza

Sinteza e proteinave pa qeliza (CFPS) është një metodë për të prodhuar proteina pa kultivuar qeliza të gjalla. Në vend që të fusësh ADN-në në qeliza dhe të presësh që ato të prodhojnë një proteinë, CFPS vë në punë makinerinë e prodhimit të proteinave në një përzierje të kontrolluar. Kjo e bën një mjet praktik për prototipizim dhe testim të shpejtë, pasi shkencëtarët mund të kryejnë shumë eksperimente shpejt dhe të matin rezultatet brenda ditës.

Proteinat përbëjnë një pjesë të rëndësishme të asaj që ofron biologjia moderne. Shumë barna të rëndësishme bazohen në proteina. Shumë teste diagnostike dhe kërkimore varen nga proteinat. Në mjediset industriale, proteinat veprojnë si enzima që e bëjnë proceset kimike më të pastra dhe më efikase. Proteinat gjenden madje edhe në detergjentin tënd të rrobave. Kur prodhimi i proteinave bëhet më i shpejtë dhe më i lirë, shkencëtarët zakonisht mund të testojnë më shumë ide më herët dhe të ulin koston e shndërrimit të kërkimeve të hershme në diçka nga e cila njerëzit mund të përfitojnë çdo ditë.

CFPS është tashmë i dobishëm për atë lloj iteracioni. Pika e ngushtë është se është e ndërlikuar të optimizohet dhe bëhet e kushtueshme në shkallë.

Sinteza e proteinave pa qeliza është e vështirë për t'u optimizuar dhe e kushtueshme

Sinteza e proteinave pa qeliza kërkon përbërës kompleksë që ndërveprojnë: shablloni i ADN-së që kodifikon proteinën që do të prodhohet, lizati qelizor (përzierja e makinerisë qelizore nga brenda qelizave) dhe një numër i madh përbërësish biokimikë që variojnë nga burimet e energjisë te kripërat. Është jashtëzakonisht e vështirë të arsyetosh për sistemin si një tërësi, dhe shumë(hapet në një dritare të re) të mëparshme(hapet në një dritare të re) studime(hapet në një dritare të re) kanë aplikuar lloje të ndryshme të mësimit automatik për të ulur koston e prodhimit të proteinave.

Formulimet standarde të sintezës së proteinave pa qeliza (CFPS) dhe kompletet komerciale shpesh kanë çmime të përshtatura për punë me ritmin e njeriut. Laboratorët autonomë mund të kryejnë mijëra reaksione në kohën që një ekip njerëzor mund të kryejë dhjetëra. Në atë shkallë, kostoja e reagentëve bëhet faktori kufizues.

CFPS është gjithashtu e vështirë për t'u optimizuar vetëm me intuitë. Është një përzierje e shumë komponentëve që ndërveprojnë. Ndryshimet e vogla mund të kenë rëndësi, por drejtimi i efektit nuk është gjithmonë i qartë, dhe kombinimet më të mira mund të jenë të vështira për t'u gjetur pa kryer shumë eksperimente. Qasjet e mëparshme kanë ulur kostot, por përparimi priret të jetë gradual sepse eksplorimi i hapësirës në mënyrë të plotë është i lodhshëm.

Lidhja e GPT‑5 me një laborator robotik

Ne e çiftuam GPT‑5 me laboratorin cloud të Ginkgo Bioworks për të krijuar një sistem autonom me qark të mbyllur për optimizimin e sintezës së proteinave pa qeliza (CFPS).

GPT‑5 projektoi grupe eksperimentesh. Laboratori i kreu ato. Rezultatet u kthyen te modeli. Modeli përdori ato të dhëna për të propozuar raundin e ardhshëm. Ne e përsëritëm atë cikël gjashtë herë.

Diagram i titulluar “Laborator autonom i drejtuar nga AI.” GPT-5 kryen analizë të të dhënave, arsyetim biokimik dhe gjenerim hipotezash, duke dërguar dizajne eksperimentale te Karrocat e Automatizimit të Rikonfigurueshëm (RACs), të cilat kryejnë eksperimente fizike, automatizojnë trajtimin e lëngjeve, inkubojnë mostrat dhe matin fluorescencën. RAC kthejnë të dhëna eksperimentale dhe metrika te GPT-5, duke formuar një cikël të mbyllur të reagimeve.

GPT‑5 projektoi grupe eksperimentesh në një format standard të pllakës 384-gropa dhe i ekzekutoi ato në laboratorin cloud të Ginkgo Bioworks. Pasi përfunduan eksperimentet, laboratori cloud i dërgoi të dhënat përsëri te GPT‑5, ku modeli analizoi rezultatet, krijoi hipoteza të reja dhe planifikoi raundin e ardhshëm të eksperimenteve.

Për ta mbajtur ciklin të bazuar në atë që mund të bëjë një laborator autonom, shtuam një validim të rreptë programatik përpara se të niste ndonjë eksperiment. Ky validim siguroi që eksperimentet e projektuara nga AI të mund të ekzekutoheshin fizikisht në platformën e automatizimit. Ajo parandaloi “eksperimentet në letër” që duken të besueshme në tekst, por nuk mund të realizohen në një proces pune robotik.

Gjatë gjithë procesit, sistemi ekzekutoi më shumë se 36 000 reaksione CFPS në 580 pllaka të automatizuara. Kjo shkallë ka rëndësi sepse është ajo që lejon modelet të shfaqen. Në biologji, eksperimentet individuale janë të pasakta. Kapaciteti i përpunimit dhe iteracioni janë mënyra se si ti dallon sinjalin nga zhurma e rastësishme. Pasi GPT‑5 pati akses në punimin përkatës dhe mjetet, iu deshën tre raunde eksperimentimi dhe dy muaj për të vendosur një standard të ri: kosto e prodhimit të proteinave 40% më e ulët krahasuar me bazën më të mirë të mëparshme(hapet në një dritare të re).

Karrocat e automatizimit të rikonfigurueshme të Ginkgo Bioworks. Kredi: Ginkgo Bioworks

Çfarë mësuam

Ne zbuluam se përmirësimet erdhën nga identifikimi i kombinimeve që funksionojnë mirë së bashku dhe që qëndrojnë në realitetet e automatizimit me kapacitet përpunimi të lartë.

Ne zbuluam se GPT‑5 identifikoi përbërje reaksionesh me kosto të ulët që njerëzit nuk i kishin testuar më parë në këtë konfigurim. Sinteza e proteinave pa qeliza (CFPS) është studiuar prej vitesh, por hapësira e përzierjeve të mundshme mbetet ende e madhe. Kur mund të propozosh dhe ekzekutosh mijëra kombinime shpejt, mund të gjesh zona të zbatueshme që janë të lehta për t'u humbur me një rrjedhë pune manuale.

Ne gjithashtu zbuluam se eksperimentet me kapacitet të lartë përpunimi, të bazuara në pllaka, shpesh ndryshojnë nga eksperimentet manuale, në tavolinë. Oksigjenimi mund të jetë më i ulët në formatet e reaksionit me kapacitet përpunimi. Përzierja dhe gjeometria mund të jenë të ndryshme. Shumica e reaksioneve CFPS prodhojnë shumë më tepër proteinë në tuba provash sesa në pllaka mikrotitri, sepse shkallët më të mëdha zakonisht kanë më shumë oksigjen të disponueshëm dhe përzierje më të mirë. Në fakt, për reaksione të bazuara në pllaka me vëllim të ulët, GPT‑5 propozoi shumë reaksione që tejkaluan më të mirin e mëparshëm menjëherë pasi pati qasje në një kompjuter për analizë të të dhënave dhe një shfletues uebi për të kërkuar punime përkatëse. Në përgjithësi, GPT‑5 propozoi shumë kombinime reagentësh që performuan mirë nën kufizime të larta të kapacitetit të përpunimit, duke përfshirë shumë që janë më të qëndrueshme në kushte me oksigjen të ulët, të zakonshme në mjedise laboratorike të automatizuara.

Përveç kësaj, zbuluam se ndryshime të vogla në tamponim, komponentët e rigjenerimit të energjisë dhe poliaminat patën një ndikim të madh në krahasim me koston e tyre. Këto nuk janë gjithmonë parametrat e parë që njerëzit zgjedhin, por me një kapacitet të lartë përpunimi, ato shndërrohen në hipoteza të testueshme në vend të supozimeve të sfondit.

Më në fund, vetë struktura e kostos përcaktoi atë që ishte me rëndësi. Në CFPS, kostot tani mbizotërohen nga lizati dhe ADN-ja. Kjo do të thotë se përfitimi është strategjia me ndikimin më të madh. Nëse mund të rritësh prodhimin e proteinave për njësi të inputit të shtrenjtë, bën përparim të rëndësishëm në kosto edhe përpara se të kërkosh kursime margjinale diku tjetër.

Përsëritja autonome në laborator ul kostot ndërsa rrit prodhimin e proteinave

Gjatë gjashtë raundeve të eksperimentimit autonom, sistemi përmirësoi në mënyrë të qëndrueshme sintezën e proteinave pa qeliza, duke ulur kostot dhe duke rritur rendimentin e proteinave. Rezultatet shfaqen si kosto e reaksionit kundrejt titrit të proteinës për çdo raund, me kompromiset më të mira që formojnë një avangardë. Pikat më të mëdha tregojnë koston më të ulët për gram të arritur në çdo raund, ndërsa referenca me yll/pika tregon standardin e mëparshëm të nivelit më të lartë në pllaka me 384 puse (Olsen et al., 2025). Një vështrim më i afërt i raundeve të mëvonshme nxjerr në pah fitimet përfundimtare, ndërsa një përmbledhje raund pas raundi tregon se kostoja më e mirë për gram po ulet me kalimin e kohës.

Kufizimet

Këto rezultate u demonstruan në një proteinë, sfGFP, dhe në një sistem të sintezës së proteinave pa qeliza (CFPS). Përgjithësimi te proteina të tjera dhe te sisteme të tjera CFPS ende duhet të tregohet.

Oksigjenimi dhe gjeometria e reaksionit mund të ndikojnë fuqishëm në rendimentet, dhe këta faktorë mund të ndryshojnë në shkallë të ndryshme. Disa përmirësime mund të jenë të ndjeshme ndaj këtyre kushteve, dhe kuptimi i këtyre ndjeshmërive është pjesë e asaj që vjen më pas.

Mbikëqyrja njerëzore ishte e nevojshme për përmirësimin e protokollit dhe trajtimin e reagentëve. Sistemi mund të projektojë dhe interpretojë eksperimente, por puna laboratorike ende përfshin detaje praktike që kërkojnë operatorë me përvojë.

Çfarë vjen më pas

Ne planifikojmë të zbatojmë optimizimin 'lab-in-the-loop' në flukse të tjera pune biologjike ku iteracioni më i shpejtë mund të zhbllokojë progresin. Ne i shohim laboratorët autonomë si plotësues të modeleve. Modelet mund të gjenerojnë dizajne, por në fund biologjia ende kërkon testim dhe përsëritje. Mbyllja e ciklit midis gjenerimit dhe eksperimentimit është mënyra se si i shndërron idetë premtuese në rezultate të suksesshme.

Ndërsa punojmë për të përshpejtuar përparimin shkencor në mënyrë të sigurt dhe të përgjegjshme, kërkojmë gjithashtu të vlerësojmë dhe të reduktojmë rreziqet, veçanërisht ato që lidhen me biosigurinë. Këto rezultate tregojnë se modelet mund të arsyetojnë në laboratorin e lagësht për të përmirësuar protokollet dhe mund të kenë implikime për biosigurinë, të cilat i vlerësojmë dhe i zbusim përmes Preparedness Framework. Ne jemi të përkushtuar për të ndërtuar masa mbrojtëse të nevojshme dhe të nuancuara në nivel modeli dhe sistemi për të reduktuar këto rreziqe, si dhe për të zhvilluar vlerësime për të ndjekur nivelet aktuale.

Jemi mirënjohës ndaj partnerëve tanë te Ginkgo Bioworks dhe ekipeve që ndihmuan në projektimin, drejtimin dhe mbështetjen e laboratorit të automatizuar në renë kompjuterike që qëndron pas kësaj pune.

Autor

OpenAI