16 दिसंबर 2025

वेट लैब में बायोलॉजिकल रिसर्च को तेज़ करने में AI की क्षमता को मापना.

GPT‑5 ने वेट लैब प्रोटोकॉल में नए सुधार किए, जिससे एक मॉलेक्यूलर क्लोनिंग प्रोटोकॉल की एफिशिएंसी 79x तक बढ़ गई.

सॉफ्ट ब्लू–ऑरेंज ग्रेडिएंट्स, DNA असेंबली डायग्राम, और “Biology Research” लिखा हुआ बोल्ड टेक्स्ट दिखाने वाला कोलाज-स्टाइल ग्राफ़िक, जो “OpenAI for Science” के तहत लेबल किया गया है.

लोड किया जा रहा है...

साइंटिफिक प्रोग्रेस को तेज़ करना उन सबसे अहम तरीकों में से एक है जिनसे AI मानवता को फायदा पहुंचा सकता है. GPT‑5 के साथ, हम इसके शुरुआती संकेत⁠ देखना शुरू कर रहे हैं—सिर्फ रिसर्चर्स को साइंटिफिक लिटरेचर तेज़ी से समझने में मदद करने में ही नहीं, बल्कि साइंटिफिक रीज़निंग के नए तरीकों को सपोर्ट करने में भी, जैसे अनएक्सपेक्टेड कनेक्शन्स सामने लाना, प्रूफ स्ट्रैटेजीज़ सुझाना, या ऐसे प्लॉज़िबल मैकेनिज़्म्स प्रस्तावित करना जिन्हें एक्सपर्ट्स इवैल्यूएट और टेस्ट कर सकें.

अब तक की प्रोग्रेस सबसे ज़्यादा गणित, थ्योरिटिकल फिज़िक्स, और थ्योरिटिकल कंप्यूटर साइंस जैसे फील्ड्स में दिखी है, जहां आइडियाज़ को फिज़िकल एक्सपेरिमेंट्स के बिना सख्ती से जांचा जा सकता है. बायोलॉजी अलग है: यहां ज़्यादातर प्रगति एक्सपेरिमेंटल एक्ज़ीक्यूशन, इटरेशन, और लैब में एम्पिरिकल वैलिडेशन पर निर्भर करती है.

इन सेटिंग्स में फ्रंटियर मॉडल्स कैसे बिहेव करते हैं, इसे समझने के लिए हमने बायोसिक्योरिटी स्टार्ट-अप Red Queen Bio के साथ मिलकर एक इवैल्यूएशन फ्रेमवर्क बनाया, जो यह टेस्ट करता है कि वेट लैब में कोई मॉडल आइडियाज़ कैसे प्रस्तावित करता है, उनका एनालिसिस करता है, और उन पर इटरेट करता है. हमने एक सिंपल मॉलेक्यूलर बायोलॉजी एक्सपेरिमेंटल सिस्टम सेटअप किया और GPT‑5 से एक मॉलेक्यूलर क्लोनिंग प्रोटोकॉल की एफिशिएंसी ऑप्टिमाइज़ करवाई.

कई राउंड्स की एक्सपेरिमेंटेशन के दौरान, GPT‑5 ने एक नया मैकेनिज़्म पेश किया, जिससे क्लोनिंग एफिशिएंसी 79x तक बेहतर हो गई. क्लोनिंग, मॉलेक्यूलर बायोलॉजी का एक बुनियादी टूल है. क्लोनिंग मेथड्स की एफिशिएंसी प्रोटीन इंजीनियरिंग⁠(एक नई विंडो में खुलेगा), जेनेटिक स्क्रीनज़⁠(एक नई विंडो में खुलेगा), और ऑर्गेनिज़्मल स्ट्रेन इंजीनियरिंग⁠(एक नई विंडो में खुलेगा) के लिए ज़रूरी बड़े और कॉम्प्लेक्स लाइब्रेरीज़ बनाने में बेहद अहम होती है. यह प्रोजेक्ट दिखाता है कि AI किस तरह बायोलॉजिस्ट्स के साथ कंधे से कंधा मिलाकर काम करते हुए रिसर्च को तेज़ कर सकता है. एक्सपेरिमेंटल मेथड्स में सुधार, ह्यूमन रिसर्चर्स को तेज़ी से आगे बढ़ने, लागत कम करने, और खोजों को रियल-वर्ल्ड इम्पैक्ट में बदलने में मदद करेगा.

क्योंकि बायोलॉजिकल रीज़निंग में हुई प्रगति के साथ बायोसिक्योरिटी से जुड़े निहितार्थ भी आते हैं, इसलिए हमने यह काम एक कड़े तौर पर कंट्रोल किए गए सेटिंग में किया—एक बेनाइन एक्सपेरिमेंटल सिस्टम का इस्तेमाल करते हुए, टास्क के स्कोप को सीमित रखते हुए, और मॉडल बिहेवियर का इवैल्यूएशन करते हुए, ताकि हमारे बायोसिक्योरिटी रिस्क असेसमेंट्स और मॉडल- व सिस्टम-लेवल सेफगार्ड्स के डेवलपमेंट को जानकारी मिल सके, जैसा कि हमारे Preparedness Framework⁠(एक नई विंडो में खुलेगा) में बताया गया है.

एक्सपेरिमेंटल रिज़ल्ट्स.

इस सेट-अप में, GPT‑5 ने क्लोनिंग प्रोटोकॉल पर अपने आप रीज़निंग की, मॉडिफिकेशन्स सुझाए, और नए एक्सपेरिमेंट्स से मिले डेटा को शामिल करके और सुधार प्रस्तावित किए. एकमात्र ह्यूमन इंटरवेंशन यह था कि साइंटिस्ट्स ने मॉडिफाइड प्रोटोकॉल को एक्सिक्यूट किया और एक्सपेरिमेंटल डेटा अपलोड किया.

कई राउंड्स के दौरान, GPT‑5 ने क्लोनिंग प्रोसीजर को ऑप्टिमाइज़ किया और एफिशिएंसी को 79x से भी ज्यादा बढ़ा दिया—यानी एक तय मात्रा के इनपुट DNA से, हमें बेसलाइन प्रोटोकॉल की तुलना में 79x ज्यादा सीक्वेंस-वेरिफ़ाइड क्लोन्स मिले. सबसे खास बात यह रही कि इसमें दो एंज़ाइम्स पेश किए गए, जो मिलकर एक नया मैकेनिज़्म बनाते हैं: E. coli, से रिकॉम्बिनेज़ RecA, और फेज़ T4 जीन 32 सिंगल-स्ट्रैंडेड DNA–बाइंडिंग प्रोटीन (gp32). साथ मिलकर काम करते हुए, gp32 ढीले DNA सिरों को स्मूद और डीटैंगल करता है, और फिर RecA हर स्ट्रैंड को उसके सही मैच तक गाइड करता है.

शुरुआती स्क्रीनिंग और सेकेंडरी एक्सपेरिमेंट्स के आधार पर, RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) और Transformation 7 (T7) को क्रमशः टॉप एंज़ाइमेटिक और ट्रांसफॉर्मेशन प्रोटोकॉल्स के रूप में पहचाना गया. RAPF असेंबली और T7 ट्रांसफॉर्मेशन—दोनों ने बेस HiFi रिएक्शन क्लोनिंग प्रोटोकॉल की तुलना में क्लोनिंग एफिशिएंसी को स्वतंत्र रूप से बेहतर किया: क्रमशः 2.6-फोल्ड और 36-फोल्ड. दोनों को मिलाकर परफॉर्मेंस में कुल 79-फोल्ड का ऐडिटिव सुधार मिला. सभी क्लोन्स की पुष्टि सीक्वेंसिंग के ज़रिए की गई. (एरर बार्स: n=3 इंडिपेंडेंट वैलिडेशन एक्सपेरिमेंट्स का SD).

भले ही यह शुरुआती नतीजे हों, लेकिन ये उत्साहजनक हैं. ये सुधार हमारे मॉडल सिस्टम में इस्तेमाल किए गए खास क्लोनिंग सेटअप तक सीमित हैं, और अभी भी प्रोटोकॉल सेटअप करने और चलाने के लिए ह्यूमन साइंटिस्ट्स की ज़रूरत होती है. इसके बावजूद, ये एक्सपेरिमेंट्स दिखाते हैं कि AI सिस्टम्स रियल लैबोरेटरी काम में सार्थक रूप से मदद कर सकते हैं और भविष्य में ह्यूमन साइंटिस्ट्स को तेज़ कर सकते हैं.

खास तौर पर, AI-लैब लूप को फिक्स्ड प्रॉम्प्टिंग के साथ और बिना किसी ह्यूमन इंटरवेंशन के चलाया गया. इस स्कैफोल्डिंग ने यह दिखाने में मदद की कि मॉडल ह्यूमन गाइडेंस के बिना भी सचमुच नए प्रोटोकॉल बदलाव सुझा सकता है, लेकिन साथ ही इसने सिस्टम को एक्सप्लोरेशन तक सीमित कर दिया और नई खोजी गई आइडियाज़ की परफॉर्मेंस को पूरी तरह मैक्सिमाइज़ करने की उसकी क्षमता को रोक दिया. एक्सप्लोरेशन और एक्सप्लॉइटेशन के बीच बेहतर डायनैमिक बैलेंस से शायद कहीं ज्यादा लाभ मिल सकते हैं, क्योंकि एंज़ाइमेटिक और ट्रांसफॉर्मेशन दोनों तरह के सुधारों में अभी भी काफी रिफ़ाइनमेंट की गुंजाइश है. हमें उम्मीद है कि प्लानिंग और टास्क-होराइज़न रीज़निंग में होने वाली प्रगति, सिंपल फिक्स्ड प्रॉम्प्ट्स की उस क्षमता को बेहतर बनाएगी जिससे वे डिस्कवरी और उसके बाद होने वाले ऑप्टिमाइज़ेशन—दोनों को सपोर्ट कर सकें.

रियल-वर्ल्ड प्रोटोकॉल्स को ऑप्टिमाइज़ करने के लिए एक इवॉल्यूशनरी फ्रेमवर्क.

Gibson assembly⁠(एक नई विंडो में खुलेगा) रिएक्शन 2009 में इसके आविष्कार के बाद से एक प्राइमरी क्लोनिंग मेथड रहा है, और मॉलेक्यूलर बायोलॉजी में इसका व्यापक रूप से इस्तेमाल होता रहा है. Gibson assembly मॉलेक्यूलर बायोलॉजिस्ट्स को DNA के टुकड़ों को आपस में “ग्लू” करने देता है, इसके लिए उनके सिरों को थोड़ी देर के लिए मेल्ट किया जाता है ताकि मैचिंग सीक्वेन्सेज़ एक ही मॉलेक्यूल में सील हो सकें. Gibson assembly की एक बड़ी खासियत इसकी सादगी है: सब कुछ एक ही ट्यूब में, एक ही तापमान पर होता है. ये सीमाएं अपने आप सुधार की गुंजाइश छोड़ देती हैं. इसके अलावा, नीचे दी गई विशेषताएं इसे वेट लैब तकनीकों को बेहतर बनाने में AI मॉडल्स की क्षमता का मूल्यांकन करने के लिए उपयुक्त बनाती हैं:

सेल-बेस्ड सिस्टम के विपरीत, कंट्रोल्ड कॉम्पोनेंट्स के साथ स्पष्ट रूप से परिभाषित.
एक साफ़ ऑप्टिमाइज़ेशन फ़ंक्शन है: तय मात्रा के लीनियर DNA इनपुट्स से बनने वाला ट्रांसफॉर्मेबल सर्क्युलराइज़्ड DNA.
अपेक्षाकृत तेज़ एक्सपेरिमेंटल साइकल्स (1–2 दिन).
हाई-डायमेंशनल डिज़ाइन स्पेस, जिसमें सुधार के लिए मेकैनिस्टिक रीज़निंग की ज़रूरत होती है: ऑप्टिमल बफ़र्स, रीजेंट्स और टेम्परेचर्स—all आपस में जुड़े होते हैं.

हमने HiFi assembly⁠(एक नई विंडो में खुलेगा), का इस्तेमाल एक ऑप्टिमाइज़ेशन स्टार्टिंग पॉइंट के रूप में किया, जो New England Biolabs द्वारा डेवलप किया गया एक प्रोप्रायटरी एंज़ाइम सिस्टम है और Gibson assembly पर आधारित है. "हमने यह एक्सप्लोर किया कि क्या सिंगल-स्टेप और आइसोथर्मल सीमाएं हटाने के बाद कोई AI एक्सपेरिमेंटल फीडबैक से इनोवेट और सीख सकता है, और इस स्थिति में प्रोटोकॉल सुधारों की पहचान कर सकता है.खास तौर पर, हमने ग्रीन फ्लोरोसेंट प्रोटीन (GFP) के एक जीन और व्यापक रूप से इस्तेमाल होने वाले pUC19 प्लाज़्मिड का उपयोग करके एक टू-पीस क्लोनिंग रिएक्शन किया, जो बैक्टीरिया में जीन ले जाने और उनकी कॉपी बनाने के लिए इस्तेमाल होने वाला एक स्टैंडर्ड DNA “व्हीकल” है. लक्ष्य सफल कॉलोनीज़ की संख्या बढ़ाना था.

हमने क्लोनिंग रिएक्शन को ऑप्टिमाइज़ करने के लिए प्रपोज़ल्स पर इटरेट करने वाला एक इवॉल्यूशनरी फ्रेमवर्क पेश किया, जिससे मॉडल अपने पिछले एक्सपेरिमेंट्स से “ऑनलाइन” सीख सका. हर राउंड में, GPT‑5 ने 8–10 अलग-अलग रिएक्शन्स का एक बैच प्रस्तावित किया. जिन रिएक्शन्स के लिए ऐसे कस्टम रीजेंट्स चाहिए थे जो लैब में तुरंत उपलब्ध नहीं थे, उन्हें बाद के राउंड्स के लिए आगे बढ़ा दिया गया. इसके बाद ह्यूमन साइंटिस्ट्स ने रिएक्शन्स को एक्सिक्यूट किया और शुरुआती स्क्रीन में बेसलाइन HiFi Gibson assembly के मुकाबले कॉलोनी काउंट्स को मापा. पिछले राउंड का सबसे बेहतर परफॉर्म करने वाला डेटा फिर अगले राउंड में इनपुट के तौर पर दिया गया. अहम बात यह रही कि प्रॉम्प्टिंग को स्टैंडर्डाइज़ किया गया था, और क्लैरिफ़ाइंग सवालों के अलावा कोई ह्यूमन इनपुट नहीं था. इससे हमें नए मेकैनिस्टिक इनसाइट्स को सीधे AI से जोड़ने का मौका मिला, न कि ह्यूमन गाइडेंस से.

हमने पूरी ऑप्टिमाइज़ेशन सीरीज़ से टॉप आठ रिएक्शन्स को DNA डायल्यूशन्स की एक बड़ी रेंज के साथ दोबारा टेस्ट किया, और पाया कि कई रिएक्शन्स का असर शुरुआती स्क्रीन से कम था. अंततः, सबसे मजबूत वैलिडेटेड कैंडिडेट राउंड-5 का एक रिएक्शन निकला, जिसने अपनी ओरिजिनल परफॉर्मेंस को दोहराया. कई हाई परफॉर्मर्स ligase-polish फैमिली में आए, जो कंपिटेंट-सेल स्टेट में छोटे बदलावों और/या पोस्ट-रिएक्शन DNA हैंडलिंग के प्रति खास तौर पर संवेदनशील दिखाई देती है. क्योंकि इन रिएक्शन्स में एक छोटा HiFi स्टेप इस्तेमाल किया गया था, हमारा अनुमान है कि कई प्रोडक्ट्स E. coli में सिर्फ एक जंक्शन सील होने की स्थिति में एंटर करते हैं, जबकि दूसरा ऐनिलिंग से जुड़ा रहता है, और आगे की रिकवरी सेलुलर रिपेयर पाथवेज़ पर छोड़ दी जाती है. इससे हाई वैरिएंस और एक ‘जैकपॉट’ डायनैमिक बनती है: भले ही ज़्यादातर समय इस रिएक्शन के वेरिएंट्स बेहतर परफॉर्म न करें, लेकिन एक अकेला स्ट्रॉन्ग आउट्लायर पूरी फैमिली को अगले राउंड्स तक ले जा सकता है.

जहां हमने मेकैनिस्टिक कॉम्प्लेक्सिटी की वजह से राउंड्स में क्लोनिंग रिएक्शन को ऑप्टिमाइज़ करने पर फोकस किया, वहीं समानांतर रूप से हमने ट्रांसफॉर्मेशन प्रोसीजर को एक सिंगल “वन-शॉट” राउंड में ऑप्टिमाइज़ किया, जिसमें मॉडल ने कई इंडिपेंडेंट बदलाव सुझाए, और हमने टॉप परफॉर्म करने वाला रिएक्शन चुना.

टू-स्टेप क्लोनिंग वर्कफ़्लो—एंज़ाइमेटिक असेंबली और ट्रांसफॉर्मेशन—की शुरुआती ऑप्टिमाइज़ेशन स्क्रीनिंग. (लेफ्ट) पाँच राउंड्स में एंज़ाइमेटिक असेंबली का इटरेटिव ऑप्टिमाइज़ेशन (कुल 44 रिएक्शन्स). HiFi असेंबली बेसलाइन से शुरू करते हुए, GPT‑5 ने हर राउंड में 8–10 असेंबली प्रोटोकॉल वेरिएंट्स प्रस्तावित किए. टॉप-परफॉर्मिंग रिज़ल्ट्स का डेटा अगले प्रॉम्प्ट्स में शामिल किया गया. हर राउंड में, अब तक का टॉप-परफॉर्मिंग रिएक्शन प्लॉट किया गया (पिछले राउंड्स सहित). (राइट) 13 अलग-अलग प्रोटोकॉल्स को टेस्ट करते हुए ट्रांसफॉर्मेशन कंडीशन्स का वन-शॉट ऑप्टिमाइज़ेशन. दोनों ऑप्टिमाइज़ेशन स्क्रीनिंग्स में, डेटा हर कंडीशन के लिए सिंगल मेज़रमेंट (n=1) को दर्शाता है; टॉप कैंडिडेट्स के लिए रिप्लिकेटेड वैलिडेशन अलग से किया गया.

स्टैंडर्डाइज़्ड प्रॉम्प्ट्स और बिना किसी ह्यूमन इनपुट के, GPT5 ने एंड-टू-एंड क्लोनिंग एफिशिएंसी को 79 गुना तक बेहतर किया, जिसकी पुष्टि कई एक्सपेरिमेंटल रेप्लिकेट्स में हुई.

खास तौर पर, मॉडल ने एक नया एंज़ाइमेटिक प्रोसीजर प्रस्तावित किया, जिसे उसने RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi) नाम दिया. इसमें रिएक्शन में दो नए प्रोटीन्स जोड़े गए: E. coli से रिकॉम्बिनेज़ RecA, और फेज़ T4 जीन 32 सिंगल-स्ट्रैंडेड DNA–बाइंडिंग प्रोटीन (gp32). इसके अलावा, मॉडल ने इनक्यूबेशन टेम्परेचर और टाइम, और एंज़ाइमेटिक ऐडिशन्स के टाइमिंग में जानबूझकर बदलाव किए. उसने सुझाव दिया कि शुरुआती 50°C HiFi रिएक्शन के बाद RecA और gp32 जोड़े जाएं, इन प्रोटीन्स को 37°C पर काम करने दिया जाए, और फिर असेंबली पूरी करने के लिए दोबारा 50°C पर जाया जाए. मिलकर, इन नए बदलावों ने एफिशिएंसी को 2.5 गुना से भी ज्यादा बढ़ा दिया. यह ध्यान देने योग्य है कि यह रिएक्शन कंडीशन्स और टाइमिंग के इटरेटिव ऑप्टिमाइज़ेशन के बिना की गई शुरुआती परफॉर्मेंस को दर्शाता है.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

ट्रांसफॉर्मेशन की तरफ, सबसे असरदार बदलाव उम्मीद से कहीं ज्यादा सिंपल निकला: सेल्स को पेलेट करना (सेंट्रीफ्यूज में घुमाकर उन्हें ट्यूब के नीचे जमा करना), दिए गए वॉल्यूम का आधा हिस्सा हटाना, और DNA जोड़ने से पहले सेल्स को दोबारा सस्पेंड करना—ये सब 4°C पर किया गया. हालांकि हाई-एफिशिएंसी केमिकल कंपिटेंट सेल्स को आमतौर पर नाज़ुक माना जाता है, लेकिन इन सेल्स ने कंसन्ट्रेशन को अच्छी तरह सहन किया, और बढ़ी हुई मॉलेक्यूलर कोलिज़न्स ने ट्रांसफॉर्मेशन एफिशिएंसी को काफी बढ़ा दिया (फाइनल वैलिडेशन में >30 गुना).

होमोलॉजी-बेस्ड क्लोनिंग में एक नया सुधार.

RecA-असिस्टेड पेयर-एंड-फिनिश HiFi DNA असेंबली के स्टेप्स दिखाने वाला डायग्राम, जिसमें DNA स्ट्रैंड्स पर क्रमशः काम करने वाले T5 एक्सोन्यूक्लिएज़, GP32, RecA, पॉलिमरेज़ और लिगेज़ के लेबल्ड स्टेज़ दिखाए गए हैं.

T5 एक्सोन्यूक्लिएज़ 3′ ओवरहैंग्स बनाता है, जिन्हें gp32 सेकेंडरी स्ट्रक्चर को दबाकर स्टेबलाइज़ करता है. इसके बाद RecA 3′ एंड्स से इनवेड करता है, gp32 को डिस्प्लेस करता है, और होमोलॉजी सर्च व ऐनिलिंग को बढ़ावा देता है. 50 °C तक गर्म करने पर दोनों प्रोटीन्स हट जाते हैं, जिससे पॉलिमरेज़ गैप-फिल और लिगेशन संभव हो पाता है.

Gibson assembly DNA के टुकड़ों को मैचिंग “स्टिकी” एंड्स देकर काम करता है, ताकि वे एक-दूसरे को खोज सकें और जुड़ सकें. इस रिएक्शन में जुड़े हुए टुकड़ों को सील करने के लिए दो अलग-अलग एंज़ाइम्स (एक पॉलिमरेज़ और एक लिगेज़) इस्तेमाल किए जाते हैं. RAPF-HiFi में, मैचिंग स्टेप को बेहतर बनाने के लिए दो प्रोटीन्स जोड़े गए. पहला, gp32, एक कंघी की तरह काम करता है जो ढीले DNA सिरों को स्मूद और अनटैंगल करता है. दूसरा, RecA, एक गाइड की तरह काम करता है जो हर स्ट्रैंड के लिए सही पार्टनर खोजता है और मैचिंग टुकड़ों को एक साथ खींच लाता है. ज्यादा टेम्परेचर पर दोनों हेल्पर्स DNA से अलग हो जाते हैं, जिससे नॉर्मल Gibson एंज़ाइम्स रिएक्शन को पूरा कर पाते हैं.

संक्षेप में, हमारा अनुमान है कि बेहतर परफॉर्मेंस नीचे दिए गए मैकेनिज़्म के ज़रिए हासिल होती है:

Gp32 नॉन-ऐनिल्ड सिंगल-स्ट्रैंडेड DNA (ssDNA) टेल्स को कोट करता है, जिससे सेकेंडरी स्ट्रक्चर हट जाता है.
RecA, जो आमतौर पर DNA की संरचना से इनहिबिट हो जाता है, 3’ एंड से इनवेड करता है और gp32 फिलामेंट को डिस्प्लेस कर देता है.
RecA एक ssDNA:ssDNA homology search⁠(एक नई विंडो में खुलेगा), को मेडिएट करता है, जिससे ऐनिलिंग ड्राइव होती है.
50°C पर दोबारा लौटने से RecA और gp32 दोनों फिलामेंट्स डिस्प्लेस हो जाते हैं, जिससे पॉलिमरेज़ और लिगेज़ रिएक्शन को पूरा कर पाते हैं.

यह जांचने के लिए कि नए एंज़ाइम्स वास्तव में फंक्शनल हैं या नहीं, और यह सुनिश्चित करने के लिए कि परफॉर्मेंस सुधार सिर्फ थर्मल स्टेप्स या बफ़र्स में बदलाव की वजह से नहीं है, हमने RAPF-HiFi को RecA के बिना, और फिर RecA और gp32 दोनों के बिना टेस्ट किया. दोनों ही रिएक्शन्स की परफॉर्मेंस RAPF-HiFi की तुलना में कम रही, जिससे यह संकेत मिलता है कि RAPF-HiFi के मैकेनिज़्म ऑफ़ एक्शन के लिए दोनों प्रोटीन्स ज़रूरी हैं.

अंडरलाइंग मैकेनिज़्म को टेस्ट करने के लिए, हमने रिएक्शन में मौजूद दो नए एंज़ाइम्स—RecA और gp32—को अलग-अलग करके देखा. हमने दिखाया कि इनमें से कोई एक अकेले होने पर HiFi बेसलाइन की तुलना में एफिशिएंसी कम हो जाती है. साथ मिलकर, ये दोनों बेसलाइन से बेहतर परफॉर्म करते हैं और 2.6x की एफिशिएंसी गेन देते हैं. (एरर बार्स: n=3 इंडिपेंडेंट एक्सपेरिमेंट्स का SD).

RAPF-HiFi का डेवलपमेंट यह संकेत देता है कि GPT‑5 जटिल, मल्टी-डायमेंशनल रीज़निंग करने में सक्षम है.

RDNA की संरचना RecA को इनहिबिट करती है⁠(एक नई विंडो में खुलेगा), और यह खास बात है कि मॉडल ने एक साथ दो सिनर्जिस्टिक बदलाव किए: RecA को जोड़ना, और DNA सेकेंडरी स्ट्रक्चर हटाने के लिए gp32 से उसे कॉम्प्लीमेंट करना.
E. coli RecA का नेचुरल पार्टनर E. coli single-stranded binding protein (SSB) होता है. SSB, जीनोम रिप्लिकेशन, रिकॉम्बिनेशन और रिपेयर के दौरान gp32 जैसी ही भूमिका निभाता है. हालांकि, E. coli SSB DNA से इतनी जल्दी अपने आप अलग नहीं होता कि RecA फिलामेंट ग्रोथ हो सके; इसके लिए RecFOR complex promoting RecA nucleation at SSB filament in vivo⁠(एक नई विंडो में खुलेगा). SSB एक स्टेबल टेट्रामर के रूप में बाइंड करता है, जिसकी extremely slow off-rates⁠(एक नई विंडो में खुलेगा). इसके विपरीत, gp32 फिलामेंट ज़्यादा डायनैमिक⁠(एक नई विंडो में खुलेगा) होता है, जिससे RecA का डिस्प्लेसमेंट संभव हो पाता है.

हमारी जानकारी के अनुसार, अब तक मॉलेक्यूलर बायोलॉजी मेथड्स में RecA और gp32 को फंक्शनली एक साथ इस्तेमाल नहीं किया गया है. कई नई मॉलेक्यूलर बायोलॉजी तकनीकों की तरह, इनके अंडरलाइंग बायोकेमिकल एक्टिविटीज़ पहले से स्टडी की जा चुकी थीं, लेकिन इन्हें एक प्रैक्टिकल और जनरलाइज़ेबल मेथड के रूप में इस्तेमाल करना ही असली एडवांस है.

उदाहरण के तौर पर, RecA और gp32 की इंटरैक्शन को मेकैनिस्टिक in vitro रीकॉन्स्टिट्यूशन असेज़ में स्टडी किया गया है. D-loop फॉर्मेशन के अध्ययनों में यह दिखाया गया कि gp32 ⁠(एक नई विंडो में खुलेगा) की एक्टिविटी को बढ़ाने में सक्षम है. Gp32 को उसके नेचुरल T4 रिकॉम्बिनेज़ पार्टनर UvsX और रिकॉम्बिनेज़ लोडिंग फ़ैक्टर uvsY के साथ रिकॉम्बिनेज़ पॉलिमरेज़ एम्प्लीफिकेशन (RPA⁠(एक नई विंडो में खुलेगा)) में इस्तेमाल किया गया है. हालांकि एक RPA patent specification states⁠(एक नई विंडो में खुलेगा) में यह कहा गया है कि E. coli RecA का इस्तेमाल एक हेटेरोलॉगस सिस्टम में (यानी इंजीनियर्ड, नॉन–वाइल्ड-टाइप) gp32 प्रोटीन के साथ करके प्रभावी RPA रिएक्शन्स दिखाए गए हैं, लेकिन यह दावा कुछ पेटेंट डिस्क्लोज़र्स में केवल एक साइड नोट के तौर पर आता है और हमारी जानकारी के अनुसार इसे न तो प्रकाशित डेटा का समर्थन मिला है और न ही इसे एक मज़बूत RecA-आधारित RPA सिस्टम के रूप में अपनाया गया है. SLiCE⁠(एक नई विंडो में खुलेगा) नाम की एक क्लोनिंग मेथड E. coli से लिए गए पूरे सेल एक्सट्रैक्ट का इस्तेमाल करती है, जिसमें λ Red रिकॉम्बिनेशन सिस्टम मौजूद होता है. इसमें Red beta, DNA-बाइंडिंग प्रोटीन और रिकॉम्बिनेज़—दोनों की भूमिका निभा सकता है (हालांकि हमने अपने प्रॉम्प्ट में सेल एक्सट्रैक्ट्स के इस्तेमाल को साफ़ तौर पर प्रतिबंधित किया था). एक अलग एप्लिकेशन में, Ferrin & Camerini-Otero⁠(एक नई विंडो में खुलेगा) ने मैचिंग सीक्वेन्सेज़ के आधार पर DNA मॉलेक्यूल्स को सेलेक्टिवली कैप्चर करने के लिए केवल RecA का इस्तेमाल किया. अलग से, gp32 को एक एडिटिव के रूप में इस्तेमाल किया गया है⁠(एक नई विंडो में खुलेगा) ताकि PCR नाम की DNA एम्प्लीफिकेशन प्रोसेस में सेकेंडरी स्ट्रक्चर को कम किया जा सके. NABSA एम्प्लीफिकेशन को दिखाया गया⁠(एक नई विंडो में खुलेगा) कि RecA और gp32 दोनों से बेहतर होती है, हालांकि दोनों अलग-अलग रूप से भी रिएक्शन को बेहतर बना सकते थे और कोई सिनर्जी पहचानी नहीं गई. व्यापक तौर पर देखें तो, बेसिक Gibson-स्टाइल DNA असेंबली रिएक्शन्स में रिपोर्ट किए गए सुधार बहुत कम रहे हैं. सबसे उल्लेखनीय उदाहरण एक हीट-स्टेबल DNA-बाइंडिंग प्रोटीन (ET SSB) है, जो असेंबली एफिशिएंसी को लगभग 2.5 गुना बढ़ाता है⁠(एक नई विंडो में खुलेगा).

ज़्यादातर एप्लिकेशन्स के लिए, हमें उम्मीद नहीं है कि RAPF-HiFi, HiFi/Gibson क्लोनिंग की सादगी और मज़बूती से मुकाबला करेगा. हालांकि, एक मेकैनिस्टिकली अलग असेंबली पाथवे का उभरना काबिले-गौर है. GPT‑5 ऐसे सॉल्यूशन तक पहुंचा जिसमें रिकॉम्बिनेशन प्रोटीन्स और रिएक्शन डायनैमिक्स का एक अनजाना कॉम्बिनेशन शामिल है. अंडरलाइंग मैकेनिज़्म मॉड्यूलर साबित हो सकता है, जो ऐसे कॉम्पोनेंट्स देता है जिन्हें दूसरे मॉलेक्यूलर वर्कफ़्लोज़ में दोबारा इस्तेमाल या री-कॉम्बाइन किया जा सकता है. हम RAPF-HiFi में और सुधारों को भी लगातार एक्सप्लोर कर रहे हैं. रिएक्शन टेम्परेचर्स और स्टेप ड्यूरेशन्स को इस तरह ट्यून किया जा सकता है कि RecA और gp32 की एक्टिविटी को एक्सोन्यूक्लीएज़ ओवर-डाइजेशन के खिलाफ बैलेंस किया जा सके, और दोनों प्रोटीन्स की मात्रा अभी भी ऑप्टिमाइज़ की जानी बाकी है. GPT‑5 ने एक हाइपरएक्टिव RecA वेरिएंट भी प्रस्तावित किया है, जिसे हम फिलहाल प्यूरिफ़ाई कर रहे हैं.

ट्रांसफॉर्मेशन प्रोटोकॉल के संदर्भ में, सफल ऑप्टिमाइज़ेशन कंडीशन्स में कई तरह के एडिटिव्स और थर्मल पर्टर्बेशन्स शामिल थे, जिनका उद्देश्य कमर्शियल 10-beta competent cells⁠(एक नई विंडो में खुलेगा) की हीट-शॉक एफिशिएंसी को बेहतर बनाना था. टेस्ट की गई 13 AI-जनरेटेड वन-शॉट ट्रांसफॉर्मेशन्स में से सबसे प्रभावी बदलाव Transformation 7 (T7) रहा, जिसमें सेल्स को पेलेट किया गया, दिए गए वॉल्यूम का आधा हिस्सा हटाया गया, और DNA जोड़ने से पहले सेल्स को दोबारा सस्पेंड किया गया—ये सब 4°C पर. हाई-एफिशिएंसी केमिकल कंपिटेंट सेल्स को आमतौर पर नाज़ुक माना जाता है, और ऐसे हैंडलिंग स्टेप्स से आम तौर पर बचा जाता है. इसके बावजूद, सेल्स ने कंसन्ट्रेशन को अच्छी तरह सहन किया. प्रति सेल बढ़े हुए DNA एक्सपोज़र और कम इनहिबिटरी बफ़र के कारण ज़्यादा शार्प हीट-शॉक मिला, और इन दोनों के संयुक्त प्रभाव से ट्रांसफॉर्मेशन एफिशिएंसी में बड़ा इज़ाफ़ा हुआ (>30 गुना).

यह ट्रांसफॉर्मेशन प्रोटोकॉल नया है, हालांकि एक कॉन्सेप्चुअली similar approach⁠(एक नई विंडो में खुलेगा) पहले रिपोर्ट किया गया है, जिसमें सेल्स को एक शुरुआती स्टेप पर कंसन्ट्रेट किया जाता है. खास बात यह है कि GPT‑5 द्वारा यहां डेवलप किया गया मेथड ऑफ-द-शेल्फ केमिकल कंपिटेंट सेल्स के साथ कम्पैटिबल है, जिससे इन-हाउस सेल प्रिपरेशन की ज़रूरत खत्म हो जाती है, और साथ ही यह समान अप्रोच की रिपोर्ट की गई एफिशिएंसी गेन से भी आगे निकल जाता है.

रोबोटिक सिस्टम.

इस मॉडल एक्सपेरिमेंटल सिस्टम की थ्रूपुट बढ़ाने के लिए, Robot on Rails और Red Queen Bio ने मिलकर एक रोबोटिक सिस्टम बनाया, जो नैचुरल लैंग्वेज में दिए गए क्लोनिंग प्रोटोकॉल को इनपुट के रूप में लेता है और उसे वेट लैब में एक्सिक्यूट करता है.

यह सिस्टम तीन कॉम्पोनेंट्स को जोड़ता है: 1) एक human-to-robot LLM, जो सादी इंग्लिश को रोबोट की ऐक्शन्स में बदलता है; 2) एक विज़न सिस्टम, जो रियल टाइम में लैबवेयर की पहचान और लोकेलाइज़ेशन करता है; और 3) एक रोबोटिक पाथ प्लानर, जो यह तय करता है कि हर ऐक्शन को सुरक्षित और सटीक तरीके से कैसे अंजाम दिया जाए. इसका नतीजा एक फ्लेक्सिबल, जनरलाइज़्ड लैब रोबोट है, जिसे Gibson क्लोनिंग प्रोटोकॉल के अलग-अलग वेरिएंट्स के लिए और ऑप्टिमाइज़ किया गया है.

हमने यह जांचा कि क्या स्वायत्त रोबोट एक संपूर्ण क्लोनिंग प्रयोग को अंजाम दे सकता है, दो प्रोटोकॉल को एक साथ चलाकर: मानक HiFi विधि और R8, जो पहले अनुकूलन दौर से सबसे अच्छा प्रदर्शन करने वाला AI-संशोधित प्रोटोकॉल है।

हमने हर स्टेप पर रोबोट के काम की तुलना ह्यूमन द्वारा किए गए एक्सपेरिमेंट्स से की. रोबोट ने ट्रांसफॉर्मेशन प्रोसेस को सफलतापूर्वक संभाला, जिसमें कई तरह के फिज़िकल ऑपरेशन्स शामिल थे: लिक्विड्स को ट्रांसफर और मिक्स करना, सैंपल ट्यूब्स को मूव करना, सेल्स पर कंट्रोल्ड हीट लगाना, और ग्रोथ प्लेट्स पर सेल्स को फैलाना. ह्यूमन द्वारा किए गए ट्रांसफॉर्मेशन्स से सीधे तुलना करने पर, रोबोट ने बेसलाइन के मुकाबले समान स्तर के सुधारों के साथ मिलती-जुलती क्वालिटी का डेटा जनरेट किया, जो बायोलॉजिकल एक्सपेरिमेंट ऑप्टिमाइज़ेशन को ऑटोमेट और तेज़ करने की शुरुआती क्षमता दिखाता है.

हालांकि रोबोट और ह्यूमन एक्सपेरिमेंट्स के बीच फोल्ड-चेंजेस काफ़ी हद तक समान थे, लेकिन रोबोट से मिले एब्सोल्यूट कॉलोनी काउंट्स मैनुअल एक्सिक्यूशन की तुलना में लगभग दस गुना कम थे. इससे यह संकेत मिलता है कि लिक्विड हैंडलिंग प्रिसीजन, टेम्परेचर कंट्रोल कैलिब्रेशन, और मैनुअल सेल हैंडलिंग तकनीकों की बारीकियों को रिप्लिकेट करने जैसे क्षेत्रों में अभी सुधार की गुंजाइश है.

स्टैंडर्ड HiFi मेथड (बेसलाइन) और इम्प्रूव्ड R8 मेथड—दोनों को ह्यूमन रिसर्चर्स और ऑटोनॉमस रोबोट ने एक्सिक्यूट किया, और ट्रांसफॉर्मेशन एफिशिएंसीज़ को उनके संबंधित HiFi बेसलाइन कंट्रोल्स (1.0 पर सेट) के अनुसार नॉर्मलाइज़ किया गया. ह्यूमन द्वारा एक्सिक्यूट किए गए R8 में 2.39-फोल्ड सुधार दिखा, जबकि रोबोट द्वारा एक्सिक्यूट किए गए R8 ने 2.13-फोल्ड सुधार हासिल किया (जो ह्यूमन परफॉर्मेंस का 89% है). यह कम एब्सोल्यूट यील्ड्स के बावजूद, प्रोटोकॉल रैंकिंग में तुलनीय परफॉर्मेंस दिखाता है.

भविष्य.

हमारा मानना है कि ये एक्सपेरिमेंट्स इस बात की एक झलक देते हैं कि भविष्य की AI-एक्सेलरेटेड साइंस कैसी दिखेगी: ऐसे मॉडल्स जो लगातार सीखते रहेंगे और रियल वर्ल्ड के साथ इंटरैक्ट करेंगे. हालांकि हमारे एक्सपेरिमेंट्स में मॉडल की क्षमताओं को शुद्ध रूप से मापने के लिए ह्यूमन इंटरवेंशन को शामिल नहीं किया गया, फिर भी हम AI helping human scientists⁠ को लेकर खास तौर पर उत्साहित हैं—खासकर एक्सपेरिमेंट डिज़ाइन करने और रिसर्च ब्रेकथ्रूज़ में योगदान देने के संदर्भ में.

साइंटिफिक प्रोग्रेस को सुरक्षित और जिम्मेदारी से तेज़ करने के साथ-साथ, हम जोखिमों का मूल्यांकन करने और उन्हें कम करने पर भी ध्यान दे रहे हैं, खासकर बायोसिक्योरिटी से जुड़े जोखिमों पर. ये इवैल्यूएशन रिज़ल्ट्स दिखाते हैं कि मॉडल्स वेट लैब में रीज़निंग करके प्रोटोकॉल्स को बेहतर बना सकते हैं, और इसके बायोसिक्योरिटी से जुड़े निहितार्थ हो सकते हैं, जैसा कि हमारे Preparedness Framework⁠(एक नई विंडो में खुलेगा) में बताया गया है. हम इन जोखिमों को कम करने के लिए मॉडल और सिस्टम लेवल पर ज़रूरी और सूक्ष्म सेफगार्ड्स बिल्ड करने के लिए प्रतिबद्ध⁠ हैं, और साथ ही मौजूदा स्तरों को ट्रैक करने के लिए इवैल्यूएशन्स भी डेवलप कर रहे हैं.

लेखक

पढ़ते रहें

सभी देखें

Scientific computing agentic AI card image (1x1)

Scientific computing in the age of agentic AI

प्रकाशन28 जुलाई 2026

GPT-Red: मजबूती के लिए स्व-सुधार को अनलॉक करना

सुरक्षा15 जुलाई 2026

कोडिंग मूल्यांकनों में संकेत को शोर से अलग करना

रिसर्च8 जुलाई 2026