મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

16 ડિસેમ્બર, 2025

સંશોધનપ્રકાશન

વેટ લેબમાં જૈવિક સંશોધનને વેગ આપવા AIની ક્ષમતા માપવી

GPT‑5 એ નવા વેટ લેબ પ્રોટોકોલ સુધારાઓ બનાવ્યા, જેમાં મોલેક્યુલર ક્લોનિંગ પ્રોટોકોલની કાર્યક્ષમતાને 79x સુધી ઑપ્ટિમાઇઝ કરી.

નરમ વાદળી–નારંગી ગ્રેડિયન્ટ, DNA એસેમ્બલી આકૃતિ અને “સાયન્સ માટે OpenAI” હેઠળ “Biology Research” લખાણ ધરાવતું કોલાજ-શૈલીનું ગ્રાફિક.
લોડિંગ…

વૈજ્ઞાનિક પ્રગતિને ઝડપી બનાવવી એ AI માનવજાતને લાભ આપી શકે તેમાંથી એક સૌથી મૂલ્યવાન માર્ગ છે. GPT‑5 સાથે, અમે આના પ્રારંભિક સંકેતો જોવા શરૂ કર્યા છે—માત્ર સંશોધકોને વૈજ્ઞાનિક સાહિત્યમાં વધુ ઝડપથી આગળ વધવામાં મદદરૂપ થવામાં જ નહીં, પણ વૈજ્ઞાનિક રિઝનિંગના નવા સ્વરૂપોને ટેકો આપવામાં પણ, જેમ કે અનપેક્ષિત જોડાણો ઉજાગર કરવું, પુરાવા માટેની વ્યૂહરચનાઓ પ્રસ્તાવિત કરવી, અથવા નિષ્ણાતો મૂલ્યાંકન કરી શકે અને પરીક્ષણ કરી શકે તેવી સંભાવ્ય પ્રક્રિયાઓ સૂચવવી.

આજ સુધીની પ્રગતિ ગણિત, સિદ્ધાંત ભૌતિકશાસ્ત્ર અને સિદ્ધાંત કમ્પ્યુટર વિજ્ઞાન જેવા ક્ષેત્રોમાં સૌથી વધુ દેખાઈ છે, જ્યાં ભૌતિક પ્રયોગો વિના વિચારોને કડક રીતે ચકાસી શકાય છે. જૈવવિજ્ઞાન અલગ છે: મોટાભાગની પ્રગતિ પ્રયોગાત્મક અમલીકરણ, આવર્તન અને પ્રયોગશાળામાં પ્રાયોગિક માન્યતા પર આધાર રાખે છે.

આ પરિસ્થિતિઓમાં અત્યાધુનિક મોડલ કેવી રીતે વર્તે છે તે સમજવામાં મદદ કરવા માટે, અમે biosecurity start-up Red Queen Bio સાથે મળીને એક મૂલ્યાંકન ફ્રેમવર્ક બનાવ્યું, જે તપાસે છે કે મોડલ વેટ લેબમાં વિચારો કેવી રીતે પ્રસ્તાવિત કરે છે, વિશ્લેષણ કરે છે અને તેમ પર પુનરાવર્તન કરે છે. અમે એક સરળ મોલેક્યુલર બાયોલોજી પ્રયોગાત્મક સિસ્ટમ ગોઠવી અને GPT‑5 ને કાર્યક્ષમતા માટે મોલેક્યુલર ક્લોનિંગ પ્રોટોકોલ ઑપ્ટિમાઇઝ કરાવ્યો.

પ્રયોગોના અનેક રાઉન્ડ દરમિયાન, GPT‑5 એ એક નવી પ્રક્રિયા રજૂ કરી જે ક્લોનિંગ કાર્યક્ષમતા 79x સુધી સુધારે છે. ક્લોનિંગ મોલેક્યુલર બાયોલોજીનું એક મૂળભૂત સાધન છે. ક્લોનિંગ પદ્ધતિઓની કાર્યક્ષમતા protein engineering(નવી વિન્ડોમાં ખૂલે છે), genetic screens(નવી વિન્ડોમાં ખૂલે છે), અને organismal strain engineering(નવી વિન્ડોમાં ખૂલે છે) માટે કેન્દ્રસ્થાને રહેલા મોટા, જટિલ લાઇબ્રેરીઝ બનાવવા માટે અત્યંત મહત્વની છે. આ પ્રોજેક્ટ દર્શાવે છે કે AI કેવી રીતે જૈવવિજ્ઞાનીઓની બાજુમાં રહીને સંશોધનને ઝડપી બનાવી શકે. પ્રયોગાત્મક પદ્ધતિઓમાં સુધારો માનવીય સંશોધકોને વધુ ઝડપથી આગળ વધવામાં, ખર્ચ ઘટાડવામાં અને શોધોને વાસ્તવિક દુનિયામાં અસરકારક પરિણામોમાં રૂપાંતરિત કરવામાં મદદ કરશે.

જૈવિક રિઝનિંગમાં પ્રગતિ biosecurity માટે અસરકારક હોઈ શકે છે, તેથી અમે આ કામ કડક નિયંત્રિત પરિસ્થિતિમાં કર્યું—હાનિરહિત પ્રયોગાત્મક સિસ્ટમનો ઉપયોગ કરીને, કાર્યની વ્યાપ્તિ મર્યાદિત રાખીને, અને અમારા biosecurity જોખમ મૂલ્યાંકનો તથા મોડલ અને સિસ્ટમ-સ્તરની સુરક્ષા વ્યવસ્થાઓના વિકાસને માહિતી આપવા માટે મોડલના વર્તનની તપાસ કરીને, જેમ કે અમારા પ્રિપેરડનેસ ફ્રેમવર્ક(નવી વિન્ડોમાં ખૂલે છે) માં દર્શાવ્યું છે.

પ્રયોગાત્મક પરિણામો

આ ગોઠવણમાં, GPT‑5 એ ક્લોનિંગ પ્રોટોકોલ વિશે સ્વાયત્ત રીતે રિઝનિંગ કર્યું, ફેરફારો પ્રસ્તાવિત કર્યા, અને વધુ સુધારા સૂચવવા માટે નવા પ્રયોગોના ડેટાને સામેલ કર્યા. એકમાત્ર માનવીય હસ્તક્ષેપ એ હતો કે વૈજ્ઞાનિકોએ ફેરફાર કરાયેલ પ્રોટોકોલ અમલમાં મૂક્યો અને પ્રયોગાત્મક ડેટા અપલોડ કર્યો.

અનેક રાઉન્ડ દરમિયાન, GPT‑5 એ ક્લોનિંગ પ્રક્રિયાને ઑપ્ટિમાઇઝ કરીને કાર્યક્ષમતા 79x થી વધુ વધારી—એનો અર્થ એ કે ઇનપુટ DNA ની નિશ્ચિત માત્રા માટે, અમે બેઝલાઇન પ્રોટોકોલની તુલનામાં 79x વધુ sequence-verified clones મેળવ્યા. ખાસ કરીને, તેણે બે એન્ઝાઇમ્સ રજૂ કર્યા જે એક નવી પ્રક્રિયા બનાવે છે: E. coli નું recombinase RecA, અને phage T4 gene 32 single-stranded DNA–binding protein (gp32). સાથે મળીને કામ કરતાં, gp32 ઢીલા DNA છેડાઓને સરળ અને ગૂંચવણમુક્ત બનાવે છે, અને પછી RecA દરેક strand ને તેના સાચા મેળ સુધી દોરી જાય છે.

પ્રારંભિક સ્ક્રીનિંગ અને દ્વિતીયક પ્રયોગોએ RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) અને Transformation 7 (T7) ને અનુક્રમે શ્રેષ્ઠ એન્ઝાઇમેટિક અને ટ્રાન્સફોર્મેશન પ્રોટોકોલ તરીકે ઓળખ્યા. RAPF એસેમ્બલી અને T7 ટ્રાન્સફોર્મેશન બંનેએ બેઝ HiFi પ્રતિક્રિયા ક્લોનિંગ પ્રોટોકોલની સરખામણીએ ક્લોનિંગ કાર્યક્ષમતા સ્વતંત્ર રીતે સુધારી, અનુક્રમે 2.6-ગણી અને 36-ગણી; અને બંનેના સંયોજનથી કાર્યક્ષમતામાં 79-ગણો વધારાનો સુધારો મળ્યો. બધા ક્લોન્સ સિક્વેન્સિંગ દ્વારા પુષ્ટિ કરવામાં આવ્યા. (Error bars: n=3 સ્વતંત્ર માન્યતા પ્રયોગોનું SD).

હજુ શરૂઆતનો તબક્કો હોવા છતાં, આ પરિણામો ઉત્સાહજનક છે. આ સુધારાઓ અમારા મોડલ સિસ્ટમમાં ઉપયોગમાં લેવાયેલી ખાસ ક્લોનિંગ ગોઠવણ માટે વિશિષ્ટ છે, અને પ્રોટોકોલ ગોઠવવા અને ચલાવવા માટે હજુ પણ માનવીય વૈજ્ઞાનિકોની જરૂર છે. તેમ છતાં, આ પ્રયોગો બતાવે છે કે AI સિસ્ટમો વાસ્તવિક પ્રયોગશાળાકીય કાર્યમાં અર્થપૂર્ણ સહાય કરી શકે છે અને ભવિષ્યમાં માનવીય વૈજ્ઞાનિકોને ઝડપી બનાવી શકે છે.

ખાસ નોંધનીય છે કે AI-લેબ લૂપ સ્થિર પ્રોમ્પ્ટિંગ અને કોઈ માનવીય હસ્તક્ષેપ વગર ચલાવવામાં આવ્યો હતો. આ scaffolding એ માનવીય માર્ગદર્શનથી સ્વતંત્ર રીતે ખરેખર નવા પ્રોટોકોલ ફેરફારો પ્રસ્તાવિત કરવાની મોડલની ક્ષમતા ઉજાગર કરવામાં મદદ કરી, પરંતુ તેણે સિસ્ટમને અન્વેષણમાં બંધાઈ રાખી અને નવી શોધાયેલી કલ્પનાઓના પ્રદર્શનને મહત્તમ કરવાની તેની ક્ષમતા મર્યાદિત કરી. અન્વેષણ અને ઉપયોગ વચ્ચેનું વધુ સારું ગતિશીલ સંતુલન કદાચ વધુ મોટા લાભ આપશે, કારણ કે એન્ઝાઇમેટિક અને ટ્રાન્સફોર્મેશન બંને સુધારાઓમાં નોંધપાત્ર સુધારાની જગ્યા છે. અમે અપેક્ષા રાખીએ છીએ કે આયોજન અને task-horizon રિઝનિંગમાં પ્રગતિ, સરળ સ્થિર પ્રોમ્પ્ટ્સની ક્ષમતાને શોધ તથા અનુગામી ઑપ્ટિમાઇઝેશન બંનેમાં ટેકો આપવા માટે સુધારશે.

વાસ્તવિક-જગતના પ્રોટોકોલને ઑપ્ટિમાઇઝ કરવા માટેનું એક evolutionary ફ્રેમવર્ક

Gibson assembly(નવી વિન્ડોમાં ખૂલે છે) પ્રતિક્રિયા 2009 માં તેના અવিষ્કારથી ક્લોનિંગની મુખ્ય પદ્ધતિ રહી છે, અને મોલેક્યુલર બાયોલોજીમાં તેનો વ્યાપક સ્વીકાર થયો છે. Gibson assembly મોલેક્યુલર બાયોલોજિસ્ટોને DNA ના ટુકડાઓના છેડાઓને થોડા સમય માટે ઓગાળી “જોડવાની” મંજૂરી આપે છે, જેથી મેળ ખાતા અનુક્રમોને એક જ અણુમાં સીલ કરી શકાય. Gibson assembly નું એક મોટું આકર્ષણ તેની સાદગી છે: બધું એક જ ટ્યુબમાં એક જ તાપમાને થાય છે. આ મર્યાદાઓ સ્વાભાવિક રીતે સુધારાની જગ્યા છોડી જાય છે. ઉપરાંત, નીચેના ગુણધર્મો તેને વેટ લેબ તકનીકો સુધારવામાં AI મોડલની ક્ષમતાનું મૂલ્યાંકન કરવા માટે યોગ્ય બનાવે છે:

  • કોષ-આધારિત સિસ્ટમથી ભિન્ન, નિયંત્રિત ઘટકો સાથે સારી રીતે વ્યાખ્યાયિત
  • સ્પષ્ટ ઑપ્ટિમાઇઝેશન કાર્ય ધરાવે છે: નિશ્ચિત માત્રાના linear DNA inputsમાંથી બનેલું transformable circularized DNA
  • તુલનાત્મક રીતે ઝડપી પ્રયોગાત્મક ચક્રો (1-2 દિવસ)
  • ઉચ્ચ-પરિમાણીય ડિઝાઇન સ્પેસ, જેમાં સુધારો કરવા માટે પ્રક્રિયાત્મક રિઝનિંગ જરૂરી છે: ઉત્તમ buffers, reagents અને temperatures બધા પરસ્પર નિર્ભર છે

અમે HiFi assembly(નવી વિન્ડોમાં ખૂલે છે), New England Biolabs દ્વારા વિકસિત અને Gibson assembly પર આધારિત માલિકી ધરાવતી enzyme system, ને ઑપ્ટિમાઇઝેશનના શરૂઆતના બિંદુ તરીકે ઉપયોગમાં લીધી. અમે તપાસ્યું કે એક AI એક-ચરણીય અને isothermal મર્યાદાઓ દૂર થયા પછી પ્રયોગાત્મક પ્રતિસાદમાંથી નવીનતા અને શીખવા સક્ષમ છે કે નહીં, અને આ પરિસ્થિતિમાં પ્રોટોકોલ સુધારાઓ ઓળખી શકે છે કે નહીં.

વિશેષરૂપે, અમે green fluorescent protein (GFP) માટેના gene અને વ્યાપક રીતે ઉપયોગમાં લેવાતા pUC19 plasmid નો ઉપયોગ કરીને બે-ટુકડાનો ક્લોનિંગ રિએક્શન કર્યો, જે genes ને bacteria માં લઈ જવા માટે ઉપયોગમાં લેવાતું માનક DNA “vehicle” છે જેથી તેમની નકલ થઈ શકે. લક્ષ્ય સફળ colonies ની સંખ્યા વધારવાનું હતું.

અમે પ્રસ્તાવોમાં પુનરાવર્તન કરવા માટે evolutionary ફ્રેમવર્ક રજૂ કરીને ક્લોનિંગ પ્રતિક્રિયાને ઑપ્ટિમાઇઝ કરી, જેથી મોડલ તેના ભૂતકાળના પ્રયોગોમાંથી “online” શીખી શકે. દરેક રાઉન્ડમાં, GPT‑5 એ 8-10 જુદી પ્રતિક્રિયાઓનો batch પ્રસ્તાવિત કર્યો, અને જો પ્રતિક્રિયાઓ માટે એવા custom reagents જોઈએ જે પ્રયોગશાળામાં સહેલાઈથી ઉપલબ્ધ ન હોય, તો તેમને આગળના રાઉન્ડમાં ધકેલવામાં આવી. ત્યારબાદ માનવીય વૈજ્ઞાનિકોએ પ્રતિક્રિયાઓ અમલમાં મૂકી અને પ્રારંભિક સ્ક્રીનમાં colony counts ને બેઝલાઇન HiFi Gibson assembly સામે માપ્યાં. પછી અગાઉના રાઉન્ડના શ્રેષ્ઠ પ્રદર્શનના ડેટાને આગળના રાઉન્ડમાં આપ્યા. મહત્વપૂર્ણ રીતે, clarifying questions સિવાય કોઈ માનવીય ઇનપુટ વિના પ્રોમ્પ્ટિંગ માનકીકૃત હતું, જેથી અમે નવા પ્રક્રિયાત્મક અવલોકનો સીધા AI ને ફાળવી શકીએ, માનવીય માર્ગદર્શનને નહીં.

અમે સંપૂર્ણ ઑપ્ટિમાઇઝેશન શ્રેણીની ટોચની આઠ પ્રતિક્રિયાઓને DNA dilutions ની વિશાળ શ્રેણીનો ઉપયોગ કરીને ફરી પરીક્ષણ કરી, અને જાણવા મળ્યું કે ઘણી પ્રતિક્રિયાઓએ પ્રારંભિક સ્ક્રીન કરતાં નાની અસરો દર્શાવી; અંતે, સૌથી મજબૂત રીતે માન્ય ઉમેદવાર round-5 ની એક પ્રતિક્રિયા હતી જેણે તેના મૂળ પ્રદર્શનનું પુનરુત્પાદન કર્યું. ઘણા high performers ligase-polish family માં આવ્યા, જે competent-cell state અને/અથવા post-reaction DNA handling માં નાના ફેરફારો પ્રત્યે ખાસ સંવેદનશીલ લાગે છે. કારણ કે આ પ્રતિક્રિયાઓએ ટૂંકા HiFi step નો ઉપયોગ કર્યો, અમે અનુમાન કરીએ છીએ કે ઘણા products સંભવતઃ E. coli માં માત્ર એક junction sealed અને બીજું annealing દ્વારા પકડાયેલ હોય તેવી સ્થિતિમાં પ્રવેશે છે, જેથી નીચેની cellular repair pathways દ્વારા બચાવ થાય. આ ઊંચી ભિન્નતા અને ‘jackpot’ ગતિશીલતા બનાવે છે: જો મોટાભાગે આ family ના variants વધુ સારું ન કરતા હોય, તો પણ એક મજબૂત outlier આ family ને આગળના રાઉન્ડ સુધી લઈ જઈ શકે છે.

અમે રાઉન્ડ્સ દરમિયાન તેની પ્રક્રિયાત્મક જટિલતાને કારણે ક્લોનિંગ પ્રતિક્રિયાના ઑપ્ટિમાઇઝેશન પર ધ્યાન કેન્દ્રિત કર્યું, જ્યારે સમકાલીન રીતે ટ્રાન્સફોર્મેશન પ્રક્રિયાને એક જ “વન-શોટ” રાઉન્ડમાં ઑપ્ટિમાઇઝ કરી, જેમાં મોડલે અનેક સ્વતંત્ર ફેરફારો પ્રસ્તાવિત કર્યા, અને અમે શ્રેષ્ઠ પ્રદર્શન કરનાર પ્રતિક્રિયા લીધી.

બે-ચરણીય ક્લોનિંગ વર્કફ્લોનું પ્રારંભિક ઑપ્ટિમાઇઝેશન સ્ક્રીનિંગ: એન્ઝાઇમેટિક એસેમ્બલી અને ટ્રાન્સફોર્મેશન. (ડાબે) પાંચ રાઉન્ડમાં એન્ઝાઇમેટિક એસેમ્બલીનું આવર્તિત ઑપ્ટિમાઇઝેશન (કુલ 44 પ્રતિક્રિયાઓ). HiFi એસેમ્બલી બેઝલાઇનથી શરૂ કરીને, GPT‑5 એ દરેક રાઉન્ડમાં 8-10 એસેમ્બલી પ્રોટોકોલ વેરિઅન્ટ્સ પ્રસ્તાવિત કર્યા; શ્રેષ્ઠ પરિણામોના ડેટાને અનુસર્જિત પ્રોમ્પ્ટ્સમાં સામેલ કરવામાં આવ્યા. દરેક રાઉન્ડમાં, અમે અત્યાર સુધીની શ્રેષ્ઠ પ્રતિક્રિયા દર્શાવીએ છીએ (પહેલાના રાઉન્ડ્સ સહિત). (જમણે) ટ્રાન્સફોર્મેશન પરિસ્થિતિઓનું વન-શોટ ઑપ્ટિમાઇઝેશન, જેમાં 13 અલગ પ્રોટોકોલનું પરીક્ષણ થયું. બંને ઑપ્ટિમાઇઝેશન સ્ક્રીન માટે, ડેટા દરેક પરિસ્થિતિ દીઠ એકલ માપન (n=1) દર્શાવે છે; ટોચના ઉમેદવારો માટે પુનરાવર્તિત માન્યતા અલગથી કરવામાં આવી.

કોઈ માનવીય ઇનપુટ વિના માનકીકૃત પ્રોમ્પ્ટ્સનો ઉપયોગ કરીને, GPT5 એ end-to-end ક્લોનિંગ કાર્યક્ષમતા 79-ગણી સુધારી, જે પ્રયોગાત્મક પુનરાવર્તનોમાં પુષ્ટિ થઈ.

ખાસ નોંધનીય છે કે મોડલે નવી એન્ઝાઇમેટિક પ્રક્રિયા પ્રસ્તાવિત કરી, જેને મોડલે RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi) નામ આપ્યું, જે પ્રતિક્રિયામાં બે નવા પ્રોટીન ઉમેરે છે: E. coli નું recombinase RecA, અને phage T4 gene 32 single-stranded DNA–binding protein (gp32). આગળ વધીને, મોડલે incubation temperature અને time, તેમજ enzymatic additions ના timing માં પણ વિચારપૂર્વક ફેરફારો કર્યા: તેણે પ્રારંભિક 50°C HiFi પ્રતિક્રિયા પછી RecA અને gp32 ઉમેરવાનું, આ પ્રોટીનને 37°C પર કાર્ય કરવા દેવાનું, અને પછી assembly પૂર્ણ કરવા માટે ફરી 50°C પર પરત જવાનું સૂચવ્યું. આ નવા ફેરફારો સાથે મળીને કાર્યક્ષમતામાં 2.5-ગણા કરતાં વધુ વધારો થયો. નોંધવું જોઈએ કે આ reaction conditions અને timing ના iterative optimization વિના પ્રારંભિક પ્રદર્શન દર્શાવે છે.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

ટ્રાન્સફોર્મેશન તરફ, સૌથી અસરકારક ફેરફાર અનપેક્ષિત રીતે સરળ સાબિત થયો: cells ને pellet કરવી (centrifuge માં ફેરવી જેથી તેઓ ટ્યુબના તળિયે એકત્ર થાય), આપેલ વોલ્યુમનો અડધો ભાગ દૂર કરવો, અને DNA ઉમેરતા પહેલાં cells ને ફરીથી resuspend કરવી, આ બધું 4°C પર. ઉચ્ચ-કાર્યક્ષમતા chemically competent cells ને સામાન્ય રીતે નાજુક માનવામાં આવે છે, છતાં cells એ concentration સારી રીતે સહન કરી અને વધેલી molecular collisions એ ટ્રાન્સફોર્મેશન કાર્યક્ષમતામાં નોંધપાત્ર વધારો કર્યો (>30-fold final validation પર).

homology-based cloning માટે એક નવી સુધારણા

RecA-assisted pair-and-finish HiFi DNA એસેમ્બલીના પગલાં દર્શાવતી આકૃતિ, જેમાં T5 exonuclease, GP32, RecA, polymerase અને ligase ના લેબલવાળા તબક્કા DNA strands પર ક્રમશઃ કાર્ય કરે છે.

T5 exonuclease 3′ overhangs બનાવે છે, જેને gp32 દ્વિતીયક રચનાને દબાવીને સ્થિર કરે છે. પછી RecA 3′ છેડાઓથી પ્રવેશ કરે છે, gp32 ને હટાવે છે અને homology શોધ તથા annealing ને પ્રોત્સાહિત કરે છે. 50 °C સુધી ગરમ કરવાથી બંને પ્રોટીન દૂર થાય છે, જે polymerase દ્વારા gap fill અને ligation ને સક્ષમ બનાવે છે.

Gibson assembly DNA ના ટુકડાઓને મેળ ખાતા “sticky” છેડાઓ આપીને કાર્ય કરે છે જેથી તેઓ એકબીજાને શોધી શકે અને જોડાઈ શકે. પ્રતિક્રિયા જોડાયેલા ટુકડાઓને સીલ કરવા માટે બે જુદા એન્ઝાઇમ્સ (polymerase અને ligase) નો ઉપયોગ કરે છે. RAPF-HiFi માં, matching step ને વધુ સારી રીતે કાર્યરત બનાવવા માટે બે પ્રોટીન ઉમેરાયા. પ્રથમ, gp32, કાંસાની જેમ કાર્ય કરે છે જે ઢીલા DNA છેડાઓને સરળ અને ગૂંચવણમુક્ત બનાવે છે. બીજું, RecA, માર્ગદર્શકની જેમ કાર્ય કરે છે જે દરેક strand માટે યોગ્ય partner શોધે છે અને મેળ ખાતા ટુકડાઓને એકસાથે ખેંચે છે. ઊંચું તાપમાન બંને સહાયકોને DNA પરથી દૂર કરી દે છે, જેથી સામાન્ય Gibson એન્ઝાઇમ્સ પ્રતિક્રિયા પૂર્ણ કરી શકે.

સારાંશરૂપે, અમે અનુમાન કરીએ છીએ કે સુધારેલ પ્રદર્શન નીચેની પ્રક્રિયા દ્વારા મધ્યસ્થ થાય છે:

  • Gp32 non-annealed single-stranded DNA (ssDNA) tails ને કોટ કરે છે, દ્વિતીયક રચના દૂર કરે છે
  • RecA, જે સામાન્ય રીતે રચનાથી અવરોધાય છે, 3’ છેડાથી પ્રવેશ કરે છે અને gp32 filament ને હટાવે છે
  • RecA એક ssDNA:ssDNA homology search(નવી વિન્ડોમાં ખૂલે છે) ને મધ્યસ્થ કરે છે, જે annealing ને પ્રેરિત કરે છે
  • 50°C પર પરત ફરવાથી recA અને gp32 બંને filaments હટી જાય છે, જે polymerase અને ligase ને પ્રતિક્રિયા પૂર્ણ કરવાની મંજૂરી આપે છે.

નવી એન્ઝાઇમ્સ કાર્યરત છે કે નહીં તેની તપાસ કરવા માટે, અને પ્રદર્શન સુધારો માત્ર thermal steps અથવા buffers ના ફેરફારોને કારણે નથી તે નિશ્ચિત કરવા માટે, અમે RecA વિના અને RecA તથા gp32 બંને વિના RAPF-HiFi ના પ્રદર્શનનું પરીક્ષણ કર્યું. બંને પ્રતિક્રિયાઓનું પ્રદર્શન RAPF-HiFi ની તુલનામાં ઘટ્યું, જે સૂચવે છે કે RAPF-HiFi ની કાર્યપદ્ધતિ માટે બંને પ્રોટીન જરૂરી છે.

આંતરિક પ્રક્રિયા તપાસવા માટે, અમે પ્રતિક્રિયામાં રહેલા બે નવા એન્ઝાઇમ્સને અલગ કરીએ છીએ: RecA અને gp32. અમે બતાવીએ છીએ કે આમાંથી કોઈપણ એકલો હોય તો HiFi બેઝલાઇનની સરખામણીએ કાર્યક્ષમતા ઘટાડે છે. બંને સાથે, તેઓ 2.6x કાર્યક્ષમતા વૃદ્ધિ સાથે બેઝલાઇન કરતાં વધુ સારું પ્રદર્શન કરે છે. (Error bars: n=3 સ્વતંત્ર પ્રયોગોનું SD)

RAPF-HiFi નો વિકાસ સૂચવે છે કે GPT‑5 જટિલ, બહુ-પરિમાણીય રિઝનિંગ કરવામાં સક્ષમ છે:

અમારી જાણ મુજબ, મોલેક્યુલર બાયોલોજીની પદ્ધતિઓમાં RecA અને gp32 નો કાર્યાત્મક સંયુક્ત ઉપયોગ અગાઉ થયો નથી. અનેક નવી મોલેક્યુલર બાયોલોજી તકનીકોની જેમ, આધારભૂત biochemical activities પહેલેથી જ અભ્યાસિત હતી, પરંતુ તેમની વ્યાવહારિક, સામાન્યકરણ કરી શકાય તેવી પદ્ધતિ તરીકેનો ઉપયોગ જ અહીંનો વિકાસ છે.

ઉદાહરણ તરીકે, RecA અને gp32 ની પરસ્પર ક્રિયાનો અભ્યાસ mechanistic in vitro reconstitution assays માં થયો છે: D loop formation ના અભ્યાસોમાં, gp32 સક્ષમ હોવાનું દર્શાવવામાં આવ્યું(નવી વિન્ડોમાં ખૂલે છે) હતું કે તે RecA activity વધારી શકે. gp32 નો ઉપયોગ તેના સ્વાભાવિક T4 recombinase partner UvsX અને recombinase loading factor uvsY સાથે recombinase polymerase amplification (RPA(નવી વિન્ડોમાં ખૂલે છે)) માં થયો છે. જો કે RPA પેટન્ટ સ્પષ્ટીકરણમાં કહેવામાં આવે છે(નવી વિન્ડોમાં ખૂલે છે) કે અસરકારક RPA પ્રતિક્રિયાઓ E. coli RecA નો ઉપયોગ કરીને એક heterologous system માં compromised (અર્થાત engineered, non–wild-type) gp32 protein સાથે દર્શાવવામાં આવી છે, આ દાવો કેટલીક patent disclosures માં માત્ર ગૌણ રીતે જ દેખાય છે અને, અમારી જાણ મુજબ, પ્રકાશિત ડેટા દ્વારા સમર્થિત નથી કે મજબૂત RecA-આધારિત RPA સિસ્ટમ તરીકે અપનાવવામાં આવ્યો નથી. SLiCE(નવી વિન્ડોમાં ખૂલે છે) નામની એક ક્લોનિંગ પદ્ધતિ E. coli માંથી સમગ્ર cell extract નો ઉપયોગ કરે છે, જેમાં λ Red recombination system હોય છે, જ્યાં Red beta DNA-binding protein અને recombinase બંને તરીકે દ્વિભૂમિકા ભજવી શકે છે (જોકે અમે અમારા પ્રોમ્પ્ટમાં cell extracts નો ઉપયોગ સ્પષ્ટ રીતે પ્રતિબંધિત કર્યો હતો). એક અલગ એપ્લિકેશનમાં, Ferrin & Camerini-Otero(નવી વિન્ડોમાં ખૂલે છે) એ RecA નો એકલો ઉપયોગ કરીને મેળ ખાતા અનુક્રમોના આધારે DNA molecules ને પસંદગીપૂર્વક પકડ્યા હતા. અલગ રીતે, gp32 નો ઉપયોગ additive તરીકે થયો છે(નવી વિન્ડોમાં ખૂલે છે) DNA amplification પ્રક્રિયા PCR માં દ્વિતીયક રચના ઘટાડવા માટે. NABSA amplification બંને RecA અને gp32 દ્વારા વધારવામાં આવ્યું હોવાનું દર્શાવવામાં આવ્યું(નવી વિન્ડોમાં ખૂલે છે), જોકે બંનેમાંથી દરેક પ્રતિક્રિયાને અલગથી વધારી શકતું હતું અને કોઈ synergy ઓળખાઈ નહોતી. વધુ વ્યાપક રીતે જોવામાં આવે તો, મૂળ Gibson-શૈલી DNA assembly reactions માં નોંધાયેલા સુધારાઓ ઓછા રહ્યા છે, જેમાં સૌથી નોંધપાત્ર ઉદાહરણ heat-stable DNA-binding protein (ET SSB) છે, જે assembly efficiency ને આશરે 2.5-ગણી સુધારે છે(નવી વિન્ડોમાં ખૂલે છે).

મોટાભાગના ઉપયોગોમાં, અમે અપેક્ષા રાખતા નથી કે RAPF-HiFi તેની સાદગી અને મજબૂતાઈમાં HiFi/Gibson cloning સાથે સ્પર્ધા કરશે. છતાં, પ્રક્રિયાત્મક રીતે ભિન્ન assembly pathway નો ઉદ્ભવ નોંધપાત્ર છે: GPT‑5 એ એવો ઉકેલ શોધ્યો જેમાં recombination proteins અને reaction dynamics નો અજાણ્યો સંયોજન સામેલ છે. આધારભૂત પ્રક્રિયા મોડીયુલર સાબિત થઈ શકે છે, જે એવા ઘટકો પૂરા પાડે છે જેને અન્ય molecular workflows માં ફરી ઉપયોગમાં લઈ શકાય અથવા પુનઃસંયોજિત કરી શકાય. અમે RAPF-HiFi માં વધુ સુધારાઓ શોધવાનું પણ ચાલુ રાખ્યું છે. Reaction temperatures અને step durations ને RecA અને gp32 activity ને exonuclease over-digestion સામે સંતુલિત કરવા માટે સમાયોજિત કરી શકાય છે, અને બંને પ્રોટીનની માત્રાઓ હજુ ઑપ્ટિમાઇઝ થવાની બાકી છે. GPT‑5 એ hyperactive RecA variant નો પણ પ્રસ્તાવ કર્યો છે, જેને અમે હાલમાં શુદ્ધ કરી રહ્યા છીએ.

ટ્રાન્સફોર્મેશન પ્રોટોકોલના સંદર્ભમાં, સફળ ઑપ્ટિમાઇઝેશન પરિસ્થિતિઓમાં additives અને thermal perturbations ની શ્રેણી સામેલ હતી, જે વ્યાપારી 10-beta competent cells(નવી વિન્ડોમાં ખૂલે છે) ની heat-shock efficiency વધારવા માટે નિર્ધારિત હતી. પરીક્ષણ કરાયેલ 13 AI-generated વન-શોટ ટ્રાન્સફોર્મેશન્સમાંથી, સૌથી અસરકારક ફેરફાર, Transformation 7 (T7), માં cells ને pellet કરવી, આપેલ વોલ્યુમનો અડધો ભાગ દૂર કરવો, અને DNA ઉમેરતા પહેલાં 4°C પર cells ને ફરી resuspend કરવી સામેલ હતી. ઉચ્ચ-કાર્યક્ષમ chemically competent cells સામાન્ય રીતે નાજુક માનવામાં આવે છે, અને આવા handling steps સામાન્ય રીતે ટાળવામાં આવે છે. તેમ છતાં, cells એ concentration સારી રીતે સહન કરી. પ્રતિ કોષ વધેલો DNA exposure અને ઓછો inhibitory buffer, જે વધુ તીવ્ર heat-shock તરફ દોરી જાય છે, તેના સંયુક્ત પ્રભાવથી ટ્રાન્સફોર્મેશન કાર્યક્ષમતામાં નોંધપાત્ર વધારો થયો (>30-fold).

આ ટ્રાન્સફોર્મેશન પ્રોટોકોલ નવીન છે, જોકે એક વિચારાત્મક રીતે સમાન અભિગમ(નવી વિન્ડોમાં ખૂલે છે), જેમાં cells ને અગાઉના તબક્કે concentration કરવામાં આવે છે, અગાઉ નોંધાયો છે. ખાસ કરીને, GPT‑5 દ્વારા અહીં વિકસાવેલી પદ્ધતિ off-the-shelf chemically competent cells સાથે સુસંગત છે, જે in-house cell preparation ની જરૂરિયાત દૂર કરે છે, અને સમાન cell strains પર નોંધાયેલા કાર્યક્ષમતા વધારાને વટાવે છે.

રોબોટિક સિસ્ટમ

આ મોડલ પ્રયોગાત્મક સિસ્ટમનો થ્રૂપુટ વધારવા માટે, Robot on Rails અને Red Queen Bio એ મળીને એક રોબોટિક સિસ્ટમ બનાવી જે natural language cloning protocol સ્વીકારે છે અને તેને વેટ લેબમાં અમલમાં મૂકે છે.

સિસ્ટમ ત્રણ ઘટકોને જોડે છે: 1) માનવ-થી-રોબોટ LLM, જે સરળ અંગ્રેજીને રોબોટની ક્રિયાઓમાં રૂપાંતરિત કરે છે; 2) vision system, જે real time માં labware ને ઓળખે અને સ્થાનીકૃત કરે છે; અને 3) robotic path planner, જે નક્કી કરે છે કે દરેક ક્રિયા સુરક્ષિત અને ચોક્કસ રીતે કેવી રીતે અમલમાં મૂકી શકાય. પરિણામે, એક લવચીક, સામાન્યકૃત લેબ રોબોટ મળ્યો, જેને Gibson cloning protocol ના variants માટે વધુ ઑપ્ટિમાઇઝ કરવામાં આવ્યો.

અમે તપાસ્યું કે સ્વાયત્ત રોબોટ સંપૂર્ણ ક્લોનિંગ પ્રયોગ અમલમાં મૂકી શકે છે કે નહીં, માટે બે પ્રોટોકોલ એકસાથે ચલાવ્યા: માનક HiFi પદ્ધતિ અને R8, પ્રથમ ઑપ્ટિમાઇઝેશન રાઉન્ડમાંથી શ્રેષ્ઠ પ્રદર્શન કરતો AI-સુધારેલ પ્રોટોકોલ.

અમે દરેક તબક્કે રોબોટના કામની માનવ દ્વારા કરાયેલા પ્રયોગો સાથે તુલના કરી. રોબોટે ટ્રાન્સફોર્મેશન પ્રક્રિયાને સફળતાપૂર્વક સંભાળી, જેમાં વિવિધ ભૌતિક ક્રિયાઓ જરૂરી હતી: પ્રવાહીઓનું સ્થાનાંતરણ અને મિશ્રણ, sample tubes ખસેડવી, કોષો પર નિયંત્રિત ઉષ્મા લાગુ કરવી, અને growth plates પર કોષો ફેલાવા. માનવ દ્વારા કરાયેલા ટ્રાન્સફોર્મેશન્સની સીધી તુલનામાં, રોબોટે સમાન ગુણવત્તાવાળો ડેટા અને બેઝલાઇન સામે સમકક્ષ સુધારા ઉત્પન્ન કર્યા, જે જૈવિક પ્રયોગોના ઑપ્ટિમાઇઝેશનને સ્વચાલિત અને ઝડપી કરવાની પ્રારંભિક સંભાવના દર્શાવે છે.

જ્યાં રોબોટ અને માનવ પ્રયોગોમાં fold-changes સમાન હતા, ત્યાં રોબોટથી મળેલા પરમ colony counts manual execution કરતાં આશરે દસ-ગણા ઓછા હતા, જે સુધારાની જરૂરિયાતવાળા ક્ષેત્રો દર્શાવે છે જેમ કે liquid handling precision, temperature control calibration, અને manual cell handling techniques ની સૂક્ષ્મતાઓનું પુનરુત્પાદન.

માનક HiFi પદ્ધતિ (બેઝલાઇન) અને સુધારેલી R8 પદ્ધતિ બંને માનવીય સંશોધકો અને સ્વાયત્ત રોબોટ દ્વારા અમલમાં મુકાઈ, જેમાં ટ્રાન્સફોર્મેશન કાર્યક્ષમતા સંબંધિત HiFi બેઝલાઇન નિયંત્રણો સામે સામાન્યીકૃત કરવામાં આવી (1.0 તરીકે સેટ). માનવ-અમલિત R8 એ 2.39-ગણો સુધારો બતાવ્યો; રોબોટ-અમલિત R8 એ 2.13-ગણો સુધારો હાંસલ કર્યો (માનવ પ્રદર્શનનું 89%), જે નીચા પરમ ઉત્પન્ન હોવા છતાં સમાન પ્રોટોકોલ રેન્કિંગ દર્શાવે છે.

ભવિષ્ય

અમારું માનવું છે કે આ પ્રયોગો ભવિષ્યમાં AI-વેગવંતી વિજ્ઞાન કેવું લાગશે તેનો એક ઝલક આપે છે: મોડલો સતત શીખતા અને વાસ્તવિક દુનિયા સાથે ક્રિયાશીલ રહેતા. જો કે અમારી પ્રયોગોમાં મોડલની ક્ષમતાઓ શુદ્ધ રીતે માપવા માટે માનવીય હસ્તક્ષેપને બહાર રાખવામાં આવ્યો હતો, તેમ છતાં અમે ખાસ કરીને AI માનવીય વૈજ્ઞાનિકોને મદદ કરે છે અને પ્રયોગો ડિઝાઇન કરવામાં તથા સંશોધન સફળતાઓમાં યોગદાન આપે છે તે અંગે ઉત્સાહિત છીએ.

જ્યારે અમે વૈજ્ઞાનિક પ્રગતિને સલામત અને જવાબદારીપૂર્ણ રીતે ઝડપી બનાવવા કામ કરીએ છીએ, ત્યારે અમે જોખમોનું મૂલ્યાંકન અને ઘટાડો કરવાની પણ કોશિશ કરીએ છીએ, ખાસ કરીને biosecurity સંબંધિત. આ મૂલ્યાંકનના પરિણામો દર્શાવે છે કે મોડલો વેટ લેબમાં પ્રોટોકોલ સુધારવા માટે રિઝનિંગ કરી શકે છે, અને અમારા પ્રિપેરડનેસ ફ્રેમવર્ક(નવી વિન્ડોમાં ખૂલે છે) માં વર્ણવ્યા મુજબ biosecurity માટે અસરકારક હોઈ શકે છે. અમે આ જોખમો ઘટાડવા માટે મોડલ અને સિસ્ટમ સ્તરે જરૂરી અને સૂક્ષ્મ સુરક્ષા વ્યવસ્થાઓ બનાવવા પ્રતિબદ્ધ છીએ, તેમજ વર્તમાન સ્તરોને ટ્રેક કરવા માટે મૂલ્યાંકનો વિકસાવવાના પણ પ્રતિબદ્ધ છીએ.

લેખકો

Nikolai Eroshenko, Miles Wang, Rachel Smith, Liliana Abramson, Tejal Patwardhan, Kemo Jammeh, Chase Olle, Azadeh Samadian, Nitin Mahadeo