स्किप करके मेन कंटेंट पर जाऍं
OpenAI

GPT‑5 सेल-फ्री प्रोटीन संश्लेषण की लागत को कम करता है

Ginkgo Bioworks के साथ काम करके, हमने एक AI-ड्रिवन ऑटोनॉमस लैब बनाई और प्रोटीन प्रोडक्शन कॉस्ट में 40% की कमी हासिल की.

लोड किया जा रहा है...

हमने गणित और भौतिकी जैसे क्षेत्रों में AI से तेज़ प्रगति देखी है, जहां विचारों का मूल्यांकन अक्सर भौतिक दुनिया को छुए बिना किया जा सकता है. बायोलॉजी अलग है. प्रगति लैब में दौड़ रही है, जहाँ वैज्ञानिक ऐसे प्रयोग करते हैं जिनमें समय और पैसा लगता है.

यह बदलना शुरू हो रहा है. अत्याधुनिक मॉडल अब सीधे लैब ऑटोमेशन से जुड़ सकते हैं, प्रयोगों का प्रस्ताव कर सकते हैं, उन्हें बड़े पैमाने पर चला सकते हैं, परिणामों से सीख सकते हैं, और यह तय कर सकते हैं कि आगे क्या करना है. लाइफ साइंस के अधिकांश हिस्से में, बाधा पुनरावृत्ति है, और स्वायत्त प्रयोगशालाएँ उस बाधा को दूर करने के लिए बनाई जाती हैं.

पहले के काम में, हमने दिखाया कि GPT‑5 बंद-लूप प्रयोगों के माध्यम से वेट लैब प्रोटोकॉल में सुधार कर सकता है. यहाँ, हम दिखाते हैं कि वही दृष्टिकोण प्रोटीन उत्पादन की लागत को कम कर सकता है.

हमने Ginkgo Bioworks(एक नई विंडो में खुलेगा) के साथ साझेदारी की, ताकि GPT‑5 को एक क्लाउड लैबोरेटरी से जोड़ा जा सके—एक स्वचालित वेट लैब जिसे सॉफ़्टवेयर के माध्यम से दूर से संचालित किया जाता है, जहां रोबोट प्रयोग करते हैं और डेटा लौटाते हैं—और उस लैब-इन-द-लूप सेटअप का उपयोग करके एक व्यापक रूप से उपयोग की जाने वाली जैविक प्रक्रिया को अनुकूलित किया: सेल-फ्री प्रोटीन सिंथेसिस (CFPS). क्लोज़्ड-लूप एक्सपेरिमेंटेशन के छह राउंड्स में, सिस्टम ने 580 ऑटोमेटेड प्लेट्स में 36,000 से ज़्यादा यूनिक CFPS रिएक्शन कंपोज़िशन्स टेस्ट किए. कंप्यूटर, एक वेब ब्राउज़र, और संबंधित पेपर्स तक पहुँच मिलने के बाद, GPT‑5 ने कम लागत वाले CFPS में एक नया मानक स्थापित करने के लिए तीन दौर की प्रयोगशाला परीक्षण किए, जिससे प्रोटीन उत्पादन लागत में 40% की कमी (और रीजेंट्स की लागत में 57% का सुधार) प्राप्त हुआ, जिसमें नए रिएक्शन संयोजन शामिल हैं जो स्वायत्त प्रयोगशालाओं में आम रिएक्शन स्थितियों के प्रति अधिक मजबूत हैं.

कोशिका-मुक्त प्रोटीन संश्लेषण क्यों महत्वपूर्ण है

सेल-फ्री प्रोटीन सिंथेसिस (CFPS) जीवित कोशिकाओं को उगाए बिना प्रोटीन बनाने का एक तरीका है. कोशिकाओं में DNA डालने और उनके द्वारा प्रोटीन बनाने का इंतज़ार करने के बजाय, CFPS एक नियंत्रित मिश्रण में प्रोटीन बनाने की प्रक्रिया को संचालित करता है. इससे यह त्वरित प्रोटोटाइपिंग और परीक्षण के लिए एक व्यावहारिक उपकरण बन जाता है, क्योंकि वैज्ञानिक कई प्रयोग जल्दी से कर सकते हैं और उसी दिन परिणाम माप सकते हैं.

प्रोटीन आधुनिक बायोलॉजी जो डिलीवर करती है, उसका एक बड़ा हिस्सा हैं. कई महत्वपूर्ण दवाइयाँ प्रोटीन पर आधारित होती हैं. कई डायग्नोस्टिक्स और रिसर्च एस्से प्रोटीन पर निर्भर करते हैं. इंडस्ट्रियल सेटिंग्स में, प्रोटीन ऐसे एंजाइम के तौर पर काम करते हैं जो केमिकल प्रोसेस को ज़्यादा साफ़ और ज़्यादा कुशल बनाते हैं. प्रोटीन आपके लॉन्ड्री डिटर्जेंट में भी मिलते हैं. जब प्रोटीन उत्पादन तेज़ और सस्ता हो जाता है, तो वैज्ञानिक आमतौर पर जल्दी ही अधिक विचारों का परीक्षण कर सकते हैं, और शुरुआती अनुसंधान को ऐसी चीज़ में बदलने की लागत कम कर सकते हैं जिससे लोग रोज़मर्रा में लाभ उठा सकें.

CFPS उस प्रकार के इटरेशन के लिए पहले से ही उपयोगी है. रुकावट यह है कि इसे ऑप्टिमाइज़ करना मुश्किल है और बड़े पैमाने पर यह महंगा हो जाता है.

कोशिका-मुक्त प्रोटीन संश्लेषण को अनुकूलित करना मुश्किल और महंगा है

सेल-फ्री प्रोटीन संश्लेषण के लिए जटिल, परस्पर क्रिया करने वाले अवयवों की आवश्यकता होती है: बनने वाले प्रोटीन को एन्कोड करने वाला डीएनए टेम्पलेट, सेल लाइसेट (कोशिकाओं के अंदर की सेलुलर मशीनरी का मिश्रण), और ऊर्जा स्रोतों से लेकर लवणों तक फैले बड़ी संख्या में जैव-रासायनिक घटक. पूरे सिस्टम के बारे में समग्र रूप से तर्क करना बेहद कठिन है, और कई(एक नई विंडो में खुलेगा) पिछले(एक नई विंडो में खुलेगा) अध्ययनों(एक नई विंडो में खुलेगा) ने प्रोटीन उत्पादन लागत को कम करने के लिए विभिन्न प्रकार की मशीन लर्निंग लागू की है.

स्टैंडर्ड सेल-फ्री प्रोटीन सिंथेसिस (CFPS) फ़ॉर्मूलेशन और कमर्शियल किट की कीमत अक्सर इंसानों की स्पीड से होने वाले काम के हिसाब से तय की जाती है. स्वायत्त लैब्स उतने समय में हजारों प्रतिक्रियाएं चला सकती हैं, जितने में एक मानव टीम दर्जनों चला सकती है. उस पैमाने पर, अभिकर्मकों की लागत सीमित करने वाला कारक बन जाता है.

CFPS को केवल अंतर्ज्ञान के आधार पर अनुकूलित करना भी कठिन है. यह कई परस्पर क्रिया करने वाले घटकों का मिश्रण है. छोटे बदलाव महत्वपूर्ण हो सकते हैं, लेकिन प्रभाव की दिशा हमेशा स्पष्ट नहीं होती है, और बिना कई प्रयोग किए सबसे अच्छे संयोजन खोजना कठिन हो सकता है. पिछले दृष्टिकोणों ने लागत कम की है, लेकिन प्रगति आमतौर पर क्रमिक होती है क्योंकि स्थान का पूरी तरह से अन्वेषण करना श्रमसाध्य है.

GPT‑5 को रोबोटिक लैब से जोड़ना

हमने GPT‑5 को Ginkgo Bioworks’ cloud laboratory के साथ पेयर किया ताकि cell-free protein synthesis (CFPS) optimization के लिए एक क्लोज़्ड-लूप ऑटोनॉमस सिस्टम बनाया जा सके.

GPT‑5 ने प्रयोगों के बैच डिज़ाइन किए. लैब ने उन्हें निष्पादित किया. परिणामों को मॉडल में वापस फीड किया गया. मॉडल ने उस डेटा का उपयोग अगले चरण का प्रस्ताव करने के लिए किया. हमने उस चक्र को छह बार दोहराया.

“AI-संचालित स्वायत्त लैब” शीर्षक वाला आरेख. GPT-5 डेटा विश्लेषण, जैव रासायनिक रीज़निंग, और परिकल्पना निर्माण करता है, और Reconfigurable Automation Carts (RACs) को प्रयोगात्मक डिज़ाइन भेजता है, जो भौतिक प्रयोगों को निष्पादित करते हैं, तरल पदार्थ प्रबंधन को स्वचालित करते हैं, नमूनों को इनक्यूबेट करते हैं, और फ्लोरोसेंस मापते हैं. RACs एक्सपेरिमेंटल डेटा और मेट्रिक्स को GPT-5 को लौटाते हैं, जिससे एक बंद फ़ीडबैक लूप बनता है.

GPT‑5 ने मानक 384-वेल प्लेट फॉर्मेट में प्रयोगों के बैच डिज़ाइन किए और उन्हें Ginkgo Bioworks की क्लाउड प्रयोगशाला में चलाया. जब प्रयोग समाप्त हो गए, क्लाउड प्रयोगशाला ने डेटा को GPT‑5 पर वापस भेजा, जहाँ मॉडल ने परिणामों का विश्लेषण किया, नई परिकल्पनाएँ बनाई, और अगले दौर के प्रयोगों की योजना बनाई.

यह पक्का करने के लिए कि ऑटोनॉमस लैब क्या कर सकती है, हमने कोई भी एक्सपेरिमेंट शुरू होने से पहले सख्त प्रोग्रामेटिक वैलिडेशन जोड़ा. उस सत्यापन ने यह सुनिश्चित किया कि AI द्वारा डिज़ाइन किए गए प्रयोग ऑटोमेशन प्लेटफ़ॉर्म पर भौतिक रूप से निष्पादित किए जा सकते थे. इसने उन “पेपर एक्सपेरिमेंट्स” को रोका जो टेक्स्ट में तो विश्वसनीय लगते हैं, लेकिन रोबोटिक वर्कफ़्लो में लागू नहीं हो सकते.

पूरे रन के दौरान, सिस्टम ने 580 ऑटोमेटेड प्लेट्स में 36,000 से ज़्यादा CFPS रिएक्शन किए. यह पैमाना मायने रखता है, क्योंकि यह पैटर्न्स को उभरने की अनुमति देता है. जीवविज्ञान में, एकल प्रयोग शोरपूर्ण होते हैं. थ्रूपुट और इटरेशन वे तरीके हैं जिनसे आप सिग्नल को रैंडम शोर से अलग करते हैं. जब GPT‑5 को संबंधित पेपर और टूल्स का एक्सेस मिला, तो नया स्टेट-ऑफ़-द-आर्ट स्थापित करने में तीन राउंड्स के प्रयोग और दो महीने लगे: सर्वश्रेष्ठ पूर्व बेंचमार्क(एक नई विंडो में खुलेगा) की तुलना में प्रोटीन उत्पादन की लागत 40% कम.

Ginkgo Bioworks के पुनर्संयोज्य ऑटोमेशन कार्ट्स. क्रेडिट: Ginkgo Bioworks

हमने क्या सीखा

हमने पाया कि सुधार उन संयोजनों की पहचान करने से आए जो एक साथ अच्छी तरह काम करते हैं और उच्च-थ्रूपुट स्वचालन की वास्तविकताओं में भी टिके रहते हैं.

हमने पाया कि GPT‑5 ने कम लागत वाली प्रतिक्रिया संरचनाओं की पहचान की, जिन्हें मनुष्यों ने इस विन्यास में पहले कभी परीक्षण नहीं किया था. सेल-फ्री प्रोटीन सिंथेसिस (CFPS) का वर्षों से अध्ययन किया गया है, लेकिन संभावित मिश्रणों की संख्या अभी भी बहुत अधिक है. जब तुम हज़ारों संयोजनों को तेज़ी से प्रस्तावित और निष्पादित कर सकते हो, तो तुम ऐसे व्यावहारिक क्षेत्रों को ढूंढ सकते हो जिन्हें मैनुअल वर्कफ़्लो के साथ आसानी से नज़रअंदाज़ किया जा सकता है.

हमने यह भी पाया कि हाई-थ्रूपुट, प्लेट-आधारित प्रयोग अक्सर मैनुअल, बेंच-टॉप प्रयोगों से भिन्न होते हैं. हाई-थ्रूपुट रिएक्शन फॉर्मैट्स में ऑक्सीजनशन कम हो सकता है. मिक्सिंग और ज्योमेट्री अलग हो सकते हैं. अधिकांश CFPS प्रतिक्रियाएँ माइक्रोटाइटर प्लेट्स की तुलना में टेस्ट ट्यूबों में अधिक प्रोटीन उत्पन्न करती हैं, क्योंकि बड़े पैमाने पर आमतौर पर अधिक ऑक्सीजन उपलब्ध होती है और मिक्सिंग बेहतर होती है. दरअसल, कम वॉल्यूम पर प्लेट-आधारित रिएक्शन्स के लिए, GPT‑5 ने कई रिएक्शन्स प्रस्तावित किए जो डेटा एनालिसिस के लिए कंप्यूटर और संबंधित पेपर्स खोजने के लिए वेब ब्राउज़र तक एक्सेस मिलने के तुरंत बाद, पहले के सबसे बेहतर रिएक्शन से भी बेहतर परफॉर्म कर गए . कुल मिलाकर, GPT‑5 ने कई रिएजेंट संयोजन प्रस्तावित किए जो उच्च-थ्रूपुट बाधाओं के तहत अच्छा प्रदर्शन करते थे, जिनमें कई ऐसे भी शामिल हैं जो स्वचालित लैब सेटिंग्स में आम कम-ऑक्सीजन परिस्थितियों में अधिक मज़बूत हैं.

इसके अलावा, हमने पाया कि बफ़रिंग, ऊर्जा पुनर्जनन घटकों और पॉलीएमाइन्स में छोटे बदलावों का उनकी लागत की तुलना में अत्यधिक प्रभाव पड़ा. ये हमेशा वे पहले पैरामीटर नहीं होते जिन तक लोग पहुँचते हैं, लेकिन उच्च थ्रूपुट पर, वे पृष्ठभूमि मान्यताओं के बजाय परीक्षण योग्य परिकल्पनाएँ बन जाते हैं.

अंत में, लागत संरचना ने यह निर्धारित किया कि क्या महत्वपूर्ण था. CFPS में, लागतें अब लाइसेट और डीएनए द्वारा प्रमुख रूप से निर्धारित होती हैं. इसका मतलब है कि yield सबसे ज़्यादा फ़ायदा उठाने वाली स्ट्रैटेजी है. अगर तुम महंगे इनपुट की प्रति यूनिट प्रोटीन उत्पादन बढ़ा सकते हो, तो तुम लागत पर सार्थक प्रगति कर लेते हो, इससे पहले कि तुम कहीं और मामूली बचत के पीछे जाओ.

ऑटोनॉमस लैब इटिरेशन से प्रोटीन यील्ड बढ़ाने के साथ-साथ लागत भी कम होती है

छह दौर के स्वायत्त प्रयोगों के दौरान, प्रणाली ने सेल-फ्री प्रोटीन संश्लेषण में लगातार सुधार किया, जिससे लागत कम हुई और प्रोटीन उत्पादन बढ़ा. परिणाम प्रत्येक राउंड के लिए रिएक्शन लागत बनाम प्रोटीन टाइटर के रूप में दिखाए जाते हैं, और सबसे अच्छे ट्रेडऑफ़्स एक अत्याधुनिक बनाते हैं. प्रत्येक राउंड में प्राप्त सबसे कम लागत-प्रति-ग्राम को बड़े बिंदु चिह्नित करते हैं, और स्टार/डॉटेड संदर्भ 384-वेल प्लेट्स में पूर्व की अत्याधुनिक बेंचमार्क को दर्शाता है (Olsen et al., 2025). बाद के दौरों पर करीब से नज़र डालने से अंतिम लाभ स्पष्ट होते हैं, और दौर-दर-दौर का सारांश दिखाता है कि समय के साथ सबसे अच्छी लागत-प्रति-ग्राम घट रही है.

सीमाऍं

ये परिणाम एक प्रोटीन, sfGFP, और एक सेल-फ्री प्रोटीन संश्लेषण (CFPS) प्रणाली पर प्रदर्शित किए गए थे. अन्य प्रोटीनों और अन्य CFPS प्रणालियों के लिए सामान्यीकरण अभी भी प्रदर्शित किया जाना बाकी है.

ऑक्सीजनेशन और रिएक्शन ज्योमेट्री यील्ड पर बहुत ज़्यादा असर डाल सकते हैं, और ये फैक्टर अलग-अलग स्केल पर अलग-अलग हो सकते हैं. कुछ सुधार इन शर्तों के प्रति संवेदनशील हो सकते हैं, और उन संवेदनशीलताओं को समझना आगे आने वाले कार्य का हिस्सा है.

प्रोटोकॉल में सुधार और रीजेंट हैंडलिंग के लिए मानव पर्यवेक्षण की आवश्यकता थी. सिस्टम प्रयोगों को डिज़ाइन और व्याख्या कर सकता है, लेकिन प्रयोगशाला का काम अभी भी ऐसे व्यावहारिक विवरणों से जुड़ा होता है जिनके लिए अनुभवी Operator की आवश्यकता होती है.

आगे क्या है

हम अन्य जैविक वर्कफ़्लोज़ में भी लैब-इन-द-लूप ऑप्टिमाइजेशन लागू करने की योजना बना रहे हैं, जहां तेज़ पुनरावृत्ति प्रगति को अनलॉक कर सकती है. हम स्वायत्त लैब्स को मॉडलों के पूरक के रूप में देखते हैं. मॉडल डिज़ाइन बना सकते हैं, लेकिन अंततः जीवविज्ञान में अभी भी परीक्षण और पुनरावृत्ति की आवश्यकता होती है. जनरेशन और प्रयोग के बीच लूप को बंद करना ही वह तरीका है जिससे आप आशाजनक विचारों को कार्यशील परिणामों में बदलते हैं.

साइंटिफिक प्रोग्रेस को सुरक्षित और जिम्मेदारी से तेज़ करने के साथ-साथ, हम जोखिमों का मूल्यांकन करने और उन्हें कम करने पर भी ध्यान दे रहे हैं, खासकर बायोसिक्योरिटी से जुड़े जोखिमों पर. ये परिणाम दिखाते हैं कि मॉडल वेट लैब में तर्क कर प्रोटोकॉल्स को सुधार सकते हैं, और इसके बायोसिक्योरिटी पर प्रभाव हो सकते हैं, जिनका हम अपने प्रिपेयर्डनेस फ़्रेमवर्क⁠ के माध्यम से मूल्यांकन और शमन करते हैं. हम इन जोखिमों को कम करने के लिए मॉडल और सिस्टम स्तर पर आवश्यक और सूक्ष्म सुरक्षा उपाय बनाने के लिए प्रतिबद्ध हैं, और साथ ही वर्तमान स्तरों को ट्रैक करने के लिए मूल्यांकन विकसित कर रहे हैं.

हम Ginkgo Bioworks में अपने पार्टनर्स और उन टीमों के आभारी हैं जिन्होंने इस काम के पीछे ऑटोमेटेड क्लाउड लेबोरेटरी को डिज़ाइन करने, चलाने और सपोर्ट करने में मदद की.

लेखक

OpenAI