GPT‑5 सेल-फ्री प्रथिन संश्लेषणाचा खर्च कमी करते
Ginkgo Bioworks सोबत काम करत, आम्ही AI-आधारित स्वायत्त प्रयोगशाळा तयार केली आणि प्रथिन उत्पादन खर्चात 40% घट साध्य केली.
आम्ही गणित आणि भौतिकशास्त्र यांसारख्या क्षेत्रांमध्ये AI कडून झपाट्याने प्रगती पाहिली आहे, जिथे कल्पनांचे मूल्यमापन अनेकदा भौतिक जगाला स्पर्श न करता करता येते. बायोलॉजी वेगळी आहे. प्रगती प्रयोगशाळेतून पुढे जाते, जिथे शास्त्रज्ञ वेळ आणि पैसा लागणारे प्रयोग करतात.
ते बदलायला सुरुवात झाली आहे. अत्याधुनिक मॉडेल्स आता थेट प्रयोगशाळा ऑटोमेशनशी जोडले जाऊ शकतात, प्रयोग सुचवू शकतात, ते मोठ्या प्रमाणावर चालवू शकतात, निकालांमधून शिकू शकतात आणि पुढे काय करायचे ते ठरवू शकतात. जीवन विज्ञानाच्या अनेक भागांमध्ये, अडथळा म्हणजे पुनरावृत्ती आहे, आणि स्वायत्त प्रयोगशाळा त्या मर्यादेला दूर करण्यासाठी तयार केल्या जातात.
आधीच्या कामात, आम्ही दाखवले की GPT‑5 बंद-लूप प्रयोगांद्वारे वेट लॅब प्रोटोकॉल्स सुधारू शकतो. येथे, आम्ही दाखवतो की हाच दृष्टिकोन प्रथिन उत्पादनाचा खर्च कमी करू शकतो.
GPT‑5 ला क्लाउड प्रयोगशाळेशी जोडण्यासाठी—सॉफ्टवेअरद्वारे दूरस्थपणे चालवली जाणारी स्वयंचलित वेट लॅब, जिथे रोबोट प्रयोग अंमलात आणतात आणि डेटा परत करतात—आम्ही Ginkgo Bioworks(नवीन विंडोमध्ये उघडेल) सोबत भागीदारी केली आणि त्या lab-in-the-loop सेटअपचा वापर करून मोठ्या प्रमाणावर वापरली जाणारी जैविक प्रक्रिया ऑप्टिमाइझ केली: सेल-फ्री प्रोटीन सिंथेसिस (CFPS). सहा फेऱ्यांच्या क्लोज्ड-लूप प्रयोगांमध्ये, प्रणालीने 580 स्वयंचलित प्लेट्सवर 36,000 हून अधिक अद्वितीय CFPS प्रतिक्रिया संयुगे तपासली. संगणक, वेब ब्राउझर, आणि संबंधित कागदपत्रांमध्ये प्रवेश मिळाल्यानंतर, GPT‑5 ने कमी-किंमत CFPS मध्ये एक नवीन अत्याधुनिक मानक प्रस्थापित करण्यासाठी तीन फेऱ्यांचे प्रयोग केले, ज्यामुळे प्रथिन उत्पादन खर्चात 40% घट (आणि रिअजेंट्सच्या खर्चात 57% सुधारणा) साध्य झाली. यामध्ये स्वायत्त प्रयोगशाळांमध्ये सामान्य असलेल्या प्रतिक्रिया परिस्थितींना अधिक मजबूत असलेल्या नवीन प्रतिक्रिया संयोजनांचा समावेश आहे.
पेशीविरहित प्रथिन संश्लेषण (CFPS) ही जिवंत पेशी वाढविल्याशिवाय प्रथिने तयार करण्याची एक पद्धत आहे. पेशींमध्ये DNA घालून त्यांना प्रथिन तयार करण्याची वाट पाहण्याऐवजी, CFPS नियंत्रित मिश्रणात प्रथिन-निर्मितीची प्रक्रिया चालवते. यामुळे ते रॅपिड प्रोटोटायपिंग आणि चाचणीसाठी एक व्यवहार्य टूल ठरते, कारण शास्त्रज्ञ अनेक प्रयोग त्वरीत चालवू शकतात आणि त्याच दिवशी परिणाम मोजू शकतात.
प्रथिने ही आधुनिक बायोलॉजी जे वितरित करते त्याचा एक मोठा भाग आहेत. अनेक महत्त्वाची औषधे प्रथिनांवर आधारित आहेत. अनेक निदान आणि संशोधन चाचण्या प्रथिनांवर अवलंबून राहतात. औद्योगिक वातावरणात, प्रथिने एन्झाइम्स म्हणून कार्य करतात, ज्यामुळे रासायनिक प्रक्रिया अधिक स्वच्छ आणि कार्यक्षम होतात. तुमच्या कपडे धुण्याच्या डिटर्जंटमध्येही प्रथिने सापडतात. जेव्हा प्रथिनांचे उत्पादन अधिक जलद आणि स्वस्त होते, तेव्हा शास्त्रज्ञ सहसा अधिक कल्पनांची लवकर चाचणी करू शकतात आणि प्रारंभिक संशोधनाचे लोकांना दैनंदिन जीवनात फायदा होईल अशा गोष्टीत रूपांतर करण्याचा खर्च कमी करू शकतात.
त्या प्रकारच्या पुनरावृत्ती साठी CFPS आधीपासूनच उपयुक्त आहे. अडथळा असा आहे की ते ऑप्टिमायझ करणे अवघड आहे आणि मोठ्या प्रमाणावर ते महाग होते.
सेल-फ्री प्रथिन संश्लेषणासाठी जटिल, परस्परसंवादी घटकांची आवश्यकता असते: तयार करायच्या प्रथिनाचे एन्कोडिंग करणारा DNA टेम्पलेट, सेल लायसेट (पेशींच्या आतून मिळणाऱ्या पेशीय यंत्रणेचे सूप), आणि ऊर्जा स्रोतांपासून ते क्षारांपर्यंत पसरलेल्या मोठ्या संख्येने जैवरासायनिक घटक. संपूर्ण प्रणालीबद्दल विचार करणे अत्यंत कठीण आहे, आणि अनेक(नवीन विंडोमध्ये उघडेल) मागील(नवीन विंडोमध्ये उघडेल) अभ्यासांनी(नवीन विंडोमध्ये उघडेल) प्रथिन उत्पादन खर्च कमी करण्यासाठी मशीन लर्निंगचे विविध प्रकार वापरले आहेत.
मानक सेल-फ्री प्रोटीन सिंथेसिस (CFPS) फॉर्म्युलेशन्स आणि व्यावसायिक किट्सची किंमत अनेकदा मानवी गतीने होणाऱ्या कामासाठी असते. स्वायत्त प्रयोगशाळा त्या वेळेत हजारो प्रतिक्रिया चालवू शकतात, ज्यात मानवी टीम फक्त काही डझन प्रतिक्रिया चालवू शकते. त्या प्रमाणावर, अभिकर्मकांचा खर्च मर्यादा ठरतो.
CFPS केवळ अंतर्ज्ञानाच्या आधारे ऑप्टिमाइझ करणे कठीण आहे. हे अनेक परस्परसंवादी घटकांचे मिश्रण आहे. लहान बदल महत्त्वाचे ठरू शकतात, परंतु परिणामाची दिशा नेहमी स्पष्ट नसते, आणि अनेक प्रयोग न करता सर्वोत्तम संयोजन शोधणे कठीण असू शकते. पूर्वीच्या पद्धतींमुळे खर्च कमी झाले आहेत, पण या अवकाशाचा सखोल शोध घेणे श्रम-केंद्रित असल्यामुळे प्रगती टप्प्याटप्प्यानेच होते.
सेल-फ्री प्रोटीन सिंथेसिस (CFPS) ऑप्टिमायझेशनसाठी आम्ही GPT‑5 ला Ginkgo Bioworks’ cloud laboratory सोबत जोडून एक क्लोज्ड-लूप स्वायत्त प्रणाली तयार केली.
GPT‑5 ने प्रयोगांचे संच डिझाइन केले. लॅबने त्यांना फाशी दिली. परिणाम मॉडेलमध्ये परत दिले गेले. मॉडेलने पुढील फेरी प्रस्तावित करण्यासाठी त्या डेटाचा वापर केला. आम्ही तो चक्र सहा वेळा पुन्हा केला.

GPT‑5 ने मानक 384-वेल प्लेट फॉरमॅटमध्ये प्रयोगांचे बॅचेस डिझाइन केले आणि ते Ginkgo Bioworks’ क्लाउड लॅबोरेटरीवर चालवले. प्रयोग संपल्यानंतर, क्लाउड प्रयोगशाळेने डेटा पुन्हा GPT‑5 कडे पाठवला, जिथे मॉडेलने परिणामांचे विश्लेषण केले, नवीन गृहीतके तयार केली आणि पुढील फेरीसाठी प्रयोगांची रचना केली.
स्वायत्त लॅब काय करू शकते यावर आधारित लूप स्थिर ठेवण्यासाठी, कोणताही प्रयोग चालवण्यापूर्वी आम्ही कठोर प्रोग्रामॅटिक पडताळणी समाविष्ट केली. त्या प्रमाणीकरणामुळे AI-डिझाइन केलेले प्रयोग स्वयंचलन प्लॅटफॉर्मवर भौतिकदृष्ट्या अंमलात आणता येतील याची खात्री झाली. यामुळे मजकुरात विश्वासार्ह वाटणारे पण रोबोटिक वर्कफ्लोमध्ये प्रत्यक्षात पार पाडता न येणारे “पेपर प्रयोग” रोखले गेले.
संपूर्ण रनदरम्यान, प्रणालीने 580 स्वयंचलित प्लेट्सवर 36,000 पेक्षा अधिक CFPS प्रतिक्रिया कार्यान्वित केल्या. हे प्रमाण महत्त्वाचे आहे कारण यामुळे नमुने दिसू लागतात. बायोलॉजीमध्ये, एकल प्रयोगांमध्ये गोंगाट असतो. थ्रुपुट आणि पुनरावृत्ती यांद्वारे तुम्ही सिग्नलला यादृच्छिक गोंगाटापासून वेगळे करू शकता. एकदा GPT‑5 ला संबंधित पेपर आणि साधनांमध्ये प्रवेश मिळाल्यानंतर, नवीन अत्याधुनिक मानक स्थापित करण्यासाठी तीन प्रयोगांच्या फेऱ्या आणि दोन महिने लागले: सर्वोत्तम पूर्वीच्या बेसलाइन(नवीन विंडोमध्ये उघडेल)च्या तुलनेत प्रथिन उत्पादन खर्च 40% कमी झाला.
Ginkgo Bioworks’ पुनर्संरचित स्वयंचलन कार्ट्स. क्रेडिट: Ginkgo Bioworks
आम्हाला आढळले की सुधारणा अशा संयोजनांची ओळख पटवण्यामुळे झाल्या जी एकत्र चांगले कार्य करतात आणि उच्च-थ्रुपुट ऑटोमेशनच्या वास्तवात टिकून राहतात.
आम्हाला आढळले की GPT‑5 ने कमी खर्चाच्या प्रतिक्रिया संयुगे ओळखली ज्यांची मानवांनी यापूर्वी या संरचनेत चाचणी केली नव्हती. सेल-फ्री प्रोटीन सिंथेसिस (CFPS) चा अनेक वर्षांपासून अभ्यास केला जात आहे, परंतु संभाव्य मिश्रणांची व्याप्ती अद्याप मोठी आहे. जेव्हा तुम्ही हजारो संयोजनं पटकन प्रस्तावित आणि अंमलात आणू शकता, तेव्हा मॅन्युअल वर्कफ्लोमध्ये सहज नजरेतून सुटणारे व्यवहार्य क्षेत्र तुम्ही शोधू शकता.
आम्हाला असेही आढळले की उच्च-थ्रुपुट, प्लेट-आधारित प्रयोग अनेकदा मॅन्युअल, बेंच-टॉप प्रयोगांपेक्षा भिन्न असतात. उच्च-थ्रुपुट प्रतिक्रिया स्वरूपांमध्ये ऑक्सिजनचे प्रमाण कमी असू शकते. मिक्सिंग आणि भूमिती वेगळे असू शकतात. बहुतेक CFPS अभिक्रिया टेस्ट ट्यूबमध्ये मायक्रोटायटर प्लेट्सपेक्षा खूप अधिक प्रथिने तयार करतात, कारण मोठ्या प्रमाणात सामान्यतः अधिक ऑक्सिजन उपलब्धता आणि चांगले मिश्रण मिळते. खरं तर, कमी व्हॉल्यूममध्ये प्लेट-आधारित प्रतिक्रियांसाठी, GPT‑5 ने डेटा विश्लेषणासाठी संगणक आणि संबंधित पेपर्स शोधण्यासाठी वेब ब्राउझरचा प्रवेश मिळाल्यानंतर लगेचच अनेक प्रतिक्रिया प्रस्तावित केल्या ज्या आधीच्या सर्वोत्तमपेक्षा अधिक चांगल्या ठरल्या. एकूणच, GPT‑5 ने उच्च-थ्रुपुट निर्बंधांखाली चांगली कामगिरी करणाऱ्या अनेक अभिकर्मक संयोजनांचा प्रस्ताव मांडला, ज्यामध्ये स्वयंचलित प्रयोगशाळा सेटिंग्जमध्ये सामान्य असलेल्या कमी-ऑक्सिजन परिस्थितीत अधिक मजबूत असलेली अनेक संयोजनेही समाविष्ट आहेत.
याव्यतिरिक्त, आम्हाला आढळले की बफरिंग, ऊर्जा पुनर्जनन घटक, आणि पॉलीअमाइन्समधील लहान बदलांचा त्यांच्या खर्चाच्या तुलनेत मोठा परिणाम झाला. हे नेहमीच लोक सर्वप्रथम निवडत नाहीत असे पॅरामीटर्स असतात, परंतु उच्च थ्रुपुटवर, ते पार्श्वभूमीतील गृहितकांऐवजी चाचणी करण्यायोग्य परिकल्पना बनतात.
शेवटी, खर्चाची रचना स्वतःच काय महत्त्वाचे आहे याला आकार देते. CFPS मध्ये, खर्च आता लाइसेट आणि DNA मुळे प्रामुख्याने नियंत्रित आहेत. याचा अर्थ yield ही सर्वाधिक लाभदायक धोरण आहे. जर तुम्ही महागड्या इनपुटच्या प्रत्येक युनिटमागे प्रोटीन उत्पादन वाढवू शकता, तर इतरत्र किरकोळ बचतींचा पाठपुरावा करण्यापूर्वीच तुम्ही खर्चावर अर्थपूर्ण प्रगती साध्य करता.
स्वायत्त प्रयोगांच्या सहा फेऱ्यांमध्ये, प्रणालीने सेल-फ्री प्रथिन संश्लेषणात सातत्याने सुधारणा केली, खर्च कमी करताना प्रथिनांचे उत्पादन वाढवले. प्रत्येक फेरीसाठी निकाल प्रतिक्रिया खर्च विरुद्ध प्रोटीन टायटर म्हणून दाखवले जातात, आणि सर्वोत्तम तडजोडी एक अत्याधुनिक तयार करतात. मोठे बिंदू प्रत्येक फेरीत साध्य झालेला सर्वात कमी किमतीचा प्रति-ग्राम दर्शवतात, आणि तारा/डॉटेड संदर्भ 384-वेल प्लेट्समधील पूर्वीचा अत्याधुनिक बेंचमार्क दर्शवतो (Olsen et al., 2025). नंतरच्या फेऱ्यांकडे अधिक बारकाईने पाहिल्यास अंतिम लाभ ठळकपणे दिसून येतात, आणि फेरी-निहाय सारांशातून कालांतराने सर्वोत्तम प्रति-ग्रॅम खर्च कमी होत असल्याचे दिसते.
हे परिणाम एका प्रथिनावर, sfGFP, आणि एका सेल-फ्री प्रोटीन सिंथेसिस (CFPS) प्रणालीवर प्रदर्शित करण्यात आले. इतर प्रोटीन्स आणि इतर CFPS प्रणालींवर सामान्यीकरण अजूनही सिद्ध करणे आवश्यक आहे.
ऑक्सिजनेशन आणि अभिक्रिया भूमिती उत्पन्नांवर मोठ्या प्रमाणात परिणाम करू शकतात, आणि हे घटक विविध स्तरांवर बदलू शकतात. काही सुधारणा या अटींबाबत संवेदनशील असू शकतात, आणि त्या संवेदनशीलता समजून घेणे हे पुढील प्रक्रियेचा एक भाग आहे.
प्रोटोकॉल सुधारणा आणि अभिकर्मक हाताळणीसाठी मानवी देखरेख आवश्यक होती. प्रणाली प्रयोगांची रचना आणि अर्थ लावू शकते, परंतु प्रयोगशाळेच्या कामात अजूनही अनुभवी Operator आवश्यक असलेले व्यावहारिक तपशील समाविष्ट असतात.
आम्ही लॅब-इन-द-लूप ऑप्टिमायझेशन इतर जैविक कार्यप्रवाहांवर लागू करण्याची योजना आखत आहोत, जिथे जलद पुनरावृत्ती प्रगतीला चालना देऊ शकते. आम्ही स्वायत्त लॅब्सना मॉडेल्ससाठी पूरक म्हणून पाहतो. मॉडेल्स डिझाइन्स तयार करू शकतात, परंतु शेवटी जीवशास्त्रासाठी अजूनही चाचणी आणि पुनरावृत्ती आवश्यक आहे. निर्मिती आणि प्रयोग यांमधील चक्र पूर्ण करणे म्हणजे तुम्ही आशादायक कल्पनांना कार्यक्षम परिणामांमध्ये रूपांतरित करता.
जसे तुम्ही वैज्ञानिक प्रगतीला सुरक्षित आणि जबाबदारीने गती देण्यासाठी काम करतो, तसेच आम्ही जोखमींचे मूल्यांकन आणि कमी करण्याचा प्रयत्न करतो, विशेषतः जैवसुरक्षेशी संबंधित जोखीम. हे परिणाम दर्शवतात की मॉडेल्स वेट लॅबमध्ये तर्कशक्ती वापरून प्रोटोकॉल सुधारू शकतात आणि जैवसुरक्षेसाठी परिणाम होऊ शकतात, ज्यांचे आम्ही आमच्या प्रिपेयर्डनेस फ्रेमवर्क द्वारे मूल्यांकन आणि शमन करतो. आम्ही मॉडेल आणि प्रणाली स्तरावर आवश्यक आणि सूक्ष्म सुरक्षा उपाय तयार करण्यास वचनबद्ध आहोत, जेणेकरून या जोखमी कमी होतील, तसेच वर्तमान पातळींचे ट्रॅकिंग करण्यासाठी मूल्यांकनं विकसित करू.
या कामामागील स्वयंचलित क्लाउड प्रयोगशाळेची रचना, संचालन आणि समर्थन करण्यात मदत करणाऱ्या Ginkgo Bioworks येथील आमच्या भागीदारांचे आणि संघांचे आम्ही आभारी आहोत.


