ప్రధాన కంటెంట్‌కి దాటండి
OpenAI

16 డిసెంబర్, 2025

రీసెర్చ్ప్రచురణ

వెట్ ల్యాబ్‌లో జీవ శాస్త్ర పరిశోధనను వేగవంతం చేయడంలో AI సామర్థ్యాన్ని కొలవడం.

GPT‑5 వెట్ ల్యాబ్ ప్రోటోకాల్‌లో కొత్త మెరుగుదలలను రూపొందించి, మాలిక్యులర్ క్లోనింగ్ ప్రోటోకాల్ సామర్థ్యాన్ని 79x వరకు ఆప్టిమైజ్ చేసింది.

సాఫ్ట్ బ్లూ–ఆరెంజ్ గ్రేడియెంట్స్‌తో కూడిన కొలాజ్-స్టైల్ గ్రాఫిక్, ఒక DNA అసెంబ్లీ డయాగ్రామ్, మరియు “Biology Research” అని బోల్డ్ టెక్స్ట్‌తో, “OpenAI for Science” కింద లేబుల్ చేయబడింది.
లోడ్ అవుతోంది…

శాస్త్రీయ పురోగతిని వేగవంతం చేయడం AI మానవాళికి అందించగల అత్యంత విలువైన ప్రయోజనాల్లో ఒకటి. GPT‑5తో, దీనికి సంబంధించిన ప్రారంభ సంకేతాలు కనిపించడం మొదలైంది—శాస్త్రీయ సాహిత్యాన్ని పరిశోధకులు వేగంగా ముందుకు సాగడంలో సహాయపడటమే కాకుండా, అనుకోని సంబంధాలను బయటకు తీసుకురావడం, ప్రూఫ్ స్ట్రాటజీలను ప్రతిపాదించడం, లేదా నిపుణులు మూల్యాంకనం చేసి పరీక్షించగల సాధ్యమైన మెకానిజంలను సూచించడం వంటి కొత్త శాస్త్రీయ రీజనింగ్ విధానాలకు కూడా మద్దతు ఇస్తోంది.

ఇప్పటివరకు పురోగతి గణితం, థియోరెటికల్ ఫిజిక్స్, థియోరెటికల్ కంప్యూటర్ సైన్స్ వంటి రంగాల్లో ఎక్కువగా కనిపించింది, అక్కడ భౌతిక ప్రయోగాలు లేకుండానే ఆలోచనలను కఠినంగా పరిశీలించవచ్చు. బయాలజీ భిన్నమైనది: ఇక్కడ ఎక్కువ పురోగతి ల్యాబ్‌లో జరిగే ప్రయోగాల అమలు, పునరావృతం, మరియు అనుభవాధారిత ధృవీకరణపై ఆధారపడి ఉంటుంది.

ఈ పరిస్థుతుల్లో ఫ్రంటియర్ మోడల్స్ ఎలా ప్రవర్తిస్తాయో అర్థం చేసుకోవడానికి, బయోసెక్యూరిటీ స్టార్ట్-అప్ అయిన Red Queen Bioతో కలిసి, వెట్ ల్యాబ్‌లో ఒక మోడల్ ఎలా ఐడియాలను ప్రతిపాదిస్తుంది, విశ్లేషిస్తుంది, పునరావృతం చేస్తుందో పరీక్షించే ఒక ఈవాల్యుయేషన్ ఫ్రేమ్‌వర్క్‌ను నిర్మించాము. మేము ఒక సింపుల్ మాలిక్యులర్ బయాలజీ ఎక్స్‌పెరిమెంటల్ సిస్టమ్‌ను ఏర్పాటు చేసి, సామర్థ్యం కోసం మాలిక్యులర్ క్లోనింగ్ ప్రోటోకాల్‌ను GPT‑5తో ఆప్టిమైజ్ చేయించాము.

అనేక రౌండ్ల ప్రయోగాల సమయంలో, GPT‑5 ఒక కొత్త మెకానిజాన్ని పరిచయం చేసి, క్లోనింగ్ సామర్థ్యాన్ని 79x వరకు మెరుగుపరిచింది. క్లోనింగ్ అనేది మాలిక్యులర్ బయాలజీలో ఒక ప్రాథమిక టూల్. ప్రోటీన్ ఇంజినీరింగ్(కొత్త విండోలో తెరుచుకుంటుంది), జెనెటిక్ స్క్రీన్స్(కొత్త విండోలో తెరుచుకుంటుంది), మరియు ఆర్గానిజ్మల్ స్ట్రెయిన్ ఇంజినీరింగ్(కొత్త విండోలో తెరుచుకుంటుంది)కు కేంద్రంగా ఉండే పెద్ద, క్లిష్టమైన లైబ్రరీలను రూపొందించడానికి క్లోనింగ్ పద్ధతుల సామర్థ్యం అత్యంత కీలకం. పరిశోధనను వేగవంతం చేయడానికి AI బయాలజిస్టులతో పక్కపక్కనే ఎలా పనిచేయగలదో ఈ ప్రాజెక్ట్ ఒక స్పష్టమైన చూపును అందిస్తుంది. ప్రయోగాత్మక పద్ధతులను మెరుగుపరచడం ద్వారా మానవ పరిశోధకులు వేగంగా ముందుకు సాగడం, ఖర్చులను తగ్గించడం, మరియు ఆవిష్కరణలను నిజ జీవిత ప్రభావంగా మార్చడం సాధ్యమవుతుంది.

బయాలజికల్ రీజనింగ్‌లో జరిగే పురోగతులు బయోసెక్యూరిటీ ప్రభావాలను కలిగి ఉండటం వల్ల, మేము ఈ పనిని కఠినంగా నియంత్రిత వాతావరణంలో నిర్వహించాము—హానికరం కాని ఎక్స్‌పెరిమెంటల్ సిస్టమ్‌ను ఉపయోగించడం, టాస్క్ పరిధిని పరిమితం చేయడం, మరియు మా Preparedness Framework(కొత్త విండోలో తెరుచుకుంటుంది)లో వివరించినట్లుగా, బయోసెక్యూరిటీ రిస్క్ అసెస్‌మెంట్‌లు మరియు మోడల్-స్థాయి, సిస్టమ్-స్థాయి రక్షణల అభివృద్ధికి దోహదపడేలా మోడల్ ప్రవర్తనను మూల్యాంకనం చేయడం జరిగింది.

ప్రయోగాత్మక ఫలితాలు.

ఈ సెటప్‌లో, GPT‑5 స్వయంచాలకంగా క్లోనింగ్ ప్రోటోకాల్‌పై రీజనింగ్ చేసి, మార్పులను ప్రతిపాదించి, కొత్త ప్రయోగాల నుంచి వచ్చిన డేటాను ఉపయోగించి మరిన్ని మెరుగుదలలను సూచించింది. మానవ జోక్యం అనేది శాస్త్రవేత్తలు మార్చిన ప్రోటోకాల్‌ను అమలు చేసి, ప్రయోగ డేటాను అప్‌లోడ్ చేయడమే.

అనేక రౌండ్లలో, GPT‑5 క్లోనింగ్ విధానాన్ని 79x కంటే ఎక్కువగా సామర్థ్యం పెరిగేలా ఆప్టిమైజ్ చేసింది—అంటే, ఒకే పరిమాణంలో ఇన్‌పుట్ DNAకు, బేస్‌లైన్ ప్రోటోకాల్‌తో పోలిస్తే 79x ఎక్కువ సీక్వెన్స్-వెరిఫైడ్ క్లోన్లను మేము పొందాము. ముఖ్యంగా, ఇది ఒక కొత్త మెకానిజాన్ని ఏర్పరచే రెండు ఎంజైమ్‌లను పరిచయం చేసింది: E. coli నుంచి వచ్చిన రీకాంబినేజ్ RecA, మరియు ఫేజ్ T4 జీన్ 32 సింగిల్-స్ట్రాండెడ్ DNA–బైండింగ్ ప్రోటీన్ (gp32). సమన్వయంగా పనిచేస్తూ, gp32 విడిగా ఉన్న DNA చివరలను సర్దుబాటు చేసి చిక్కులు తొలగిస్తుంది, తరువాత RecA ప్రతి స్ట్రాండ్‌ను దానికి సరైన మ్యాచ్ వైపు దారి చూపిస్తుంది.

ప్రారంభ స్క్రీనింగ్ మరియు ద్వితీయ ప్రయోగాలు, ఎంజైమాటిక్ ప్రోటోకాల్‌గా RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF)ను మరియు ట్రాన్స్‌ఫర్మేషన్ ప్రోటోకాల్‌గా Transformation 7 (T7)ను అత్యుత్తమమైనవిగా గుర్తించాయి. బేస్ HiFi రియాక్షన్ క్లోనింగ్ ప్రోటోకాల్‌తో పోలిస్తే, RAPF అసెంబ్లీ 2.6 రెట్లు మరియు T7 ట్రాన్స్‌ఫర్మేషన్ 36 రెట్లు స్వతంత్రంగా క్లోనింగ్ సామర్థ్యాన్ని పెంచాయి; రెండూ కలిపి 79 రెట్ల యాడిటివ్ పనితీరు మెరుగుదల అందించాయి. అన్ని క్లోన్‌లను సీక్వెన్సింగ్ ద్వారా నిర్ధారించారు. (ఎర్రర్ బార్స్: n=3 స్వతంత్ర వాలిడేషన్ ప్రయోగాల SD).

ఇవి ప్రారంభ దశలో ఉన్నప్పటికీ, ఈ ఫలితాలు ఆశాజనకంగా ఉన్నాయి. ఈ మెరుగుదలలు మా మోడల్ సిస్టమ్‌లో ఉపయోగించిన ప్రత్యేక క్లోనింగ్ సెటప్‌కే పరిమితమైనవి, అలాగే ప్రోటోకాల్స్‌ను సెట్ చేసి అమలు చేయడానికి ఇప్పటికీ మానవ శాస్త్రవేత్తలు అవసరం. అయినప్పటికీ, ఈ ప్రయోగాలు AI సిస్టమ్‌లు నిజమైన ల్యాబ్ పనికి అర్థవంతంగా సహాయపడగలవని, భవిష్యత్తులో మానవ శాస్త్రవేత్తల పనిని వేగవంతం చేయవచ్చని చూపిస్తున్నాయి.

గమనించదగ్గ విషయం ఏమిటంటే, AI–ల్యాబ్ లూప్‌ను ఫిక్స్‌డ్ ప్రాంప్టింగ్‌తో, ఎలాంటి మానవ జోక్యం లేకుండా నడిపించారు. ఈ స్కాఫోల్డింగ్ మానవ మార్గనిర్దేశం లేకుండానే నిజంగా కొత్త ప్రోటోకాల్ మార్పులను ప్రతిపాదించే మోడల్ సామర్థ్యాన్ని బయటపెట్టింది, అయితే అదే సమయంలో సిస్టమ్‌ను ఎక్స్‌ప్లోరేషన్‌లోనే నిలిపివేసి, కొత్తగా కనుగొన్న ఆలోచనల పనితీరును పూర్తిగా గరిష్టం చేసే సామర్థ్యాన్ని పరిమితం చేసింది. ఎక్స్‌ప్లోరేషన్ మరియు ఎక్స్‌ప్లాయిటేషన్ మధ్య మెరుగైన డైనమిక్ సమతుల్యత సాధిస్తే మరింత పెద్ద లాభాలు రావచ్చని భావిస్తున్నాం, ఎందుకంటే ఎంజైమాటిక్ మరియు ట్రాన్స్‌ఫర్మేషన్ మెరుగుదలల రెండింటికీ ఇంకా గణనీయమైన మెరుగుదల అవకాశాలు ఉన్నాయి. ప్లానింగ్ మరియు టాస్క్-హారైజన్ రీజనింగ్‌లో జరిగే పురోగతులు, సింపుల్ ఫిక్స్‌డ్ ప్రాంప్ట్స్‌తోనే ఆవిష్కరణను మరియు తదుపరి ఆప్టిమైజేషన్‌ను మద్దతు ఇవ్వగల సామర్థ్యాన్ని మెరుగుపరుస్తాయని మేము ఆశిస్తున్నాం.

నిజ జీవిత ప్రోటోకాల్స్‌ను ఆప్టిమైజ్ చేయడానికి ఒక ఎవల్యూషనరీ ఫ్రేమ్‌వర్క్.

Gibson assembly(కొత్త విండోలో తెరుచుకుంటుంది) రియాక్షన్ 2009లో ఆవిష్కరణ జరిగినప్పటి నుంచి మాలిక్యులర్ బయాలజీ అంతటా విస్తృతంగా ఉపయోగించబడుతున్న ప్రధాన క్లోనింగ్ పద్ధతిగా ఉంది. Gibson assembly ద్వారా మాలిక్యులర్ బయాలజిస్టులు DNA ముక్కల చివరలను క్షణకాలం కరిగించి, సరిపోలే సీక్వెన్స్‌లను ఒకే మాలిక్యూల్‌గా “అట్టిపెట్టే” అవకాశం పొందుతారు. Gibson assembly యొక్క ప్రధాన ఆకర్షణ దాని సరళత: మొత్తం ప్రక్రియ ఒకే ట్యూబ్‌లో, ఒకే ఉష్ణోగ్రత వద్ద జరుగుతుంది. ఆ పరిమితులు సహజంగానే మరింత మెరుగుదలకు అవకాశం ఇస్తాయి. అదనంగా, క్రింది లక్షణాలు వెట్ ల్యాబ్ టెక్నిక్స్‌ను మెరుగుపరచడంలో AI మోడల్స్ సామర్థ్యాన్ని అంచనా వేయడానికి దీనిని అనుకూలంగా మారుస్తాయి:

  • సెల్-బేస్డ్ సిస్టమ్‌తో పోలిస్తే, నియంత్రిత భాగాలతో స్పష్టంగా నిర్వచించబడినది.
  • స్పష్టమైన ఆప్టిమైజేషన్ ఫంక్షన్ ఉంది: ఒక స్థిర పరిమాణం లీనియర్ DNA ఇన్‌పుట్స్ నుంచి తయారయ్యే ట్రాన్స్‌ఫార్మ్ చేయగల సర్క్యులరైజ్డ్ DNA.
  • తులనాత్మకంగా వేగమైన ప్రయోగ చక్రాలు (1–2 రోజులు).
  • మెరుగుపరచడానికి మెకానిస్టిక్ రీజనింగ్ అవసరమైన హై-డైమెన్షనల్ డిజైన్ స్పేస్: ఉత్తమ బఫర్స్, రియాజెంట్స్, మరియు ఉష్ణోగ్రతలు అన్నీ పరస్పరంగా ఆధారపడి ఉంటాయి.

మేము ఆప్టిమైజేషన్ ప్రారంభ బిందువుగా, New England Biolabs అభివృద్ధి చేసిన మరియు Gibson assembly ఆధారంగా రూపొందిన ప్రొప్రైటరీ ఎంజైమ్ సిస్టమ్ అయిన HiFi assembly(కొత్త విండోలో తెరుచుకుంటుంది)ను ఉపయోగించాము. ఒక్క దశ మరియు ఐసోథర్మల్ పరిమితులను తొలగించిన తర్వాత, AI ప్రయోగాత్మక ఫీడ్‌బ్యాక్ నుంచి కొత్తగా నేర్చుకుని ఇన్నోవేట్ చేయగలదా, అలాగే ఈ పరిస్థితిలో ప్రోటోకాల్ మెరుగుదలలను గుర్తించగలదా అనే విషయాన్ని మేము పరిశీలించాము.

ప్రత్యేకంగా, గ్రీన్ ఫ్లోరెసెంట్ ప్రోటీన్ (GFP) జీన్‌ను మరియు విస్తృతంగా ఉపయోగించే pUC19 ప్లాస్మిడ్‌ను ఉపయోగించి మేము రెండు-భాగాల క్లోనింగ్ రియాక్షన్ నిర్వహించాము; pUC19 అనేది బ్యాక్టీరియాలోకి జీన్లను తీసుకెళ్లి వాటిని కాపీ చేయడానికి ఉపయోగించే ఒక ప్రామాణిక DNA “వాహనం”. లక్ష్యం విజయవంతమైన కాలనీల సంఖ్యను పెంచడం.

ప్రతిపాదనలపై పునరావృతంగా పనిచేసే ఎవల్యూషనరీ ఫ్రేమ్‌వర్క్‌ను ప్రవేశపెట్టి, మోడల్ తన గత ప్రయోగాల నుంచి “ఆన్‌లైన్”గా నేర్చుకునేలా చేసి, మేము క్లోనింగ్ రియాక్షన్‌ను ఆప్టిమైజ్ చేసాము. ప్రతి రౌండ్‌లో, GPT‑5 8–10 భిన్నమైన రియాక్షన్‌ల బ్యాచ్‌ను ప్రతిపాదించింది; ల్యాబ్‌లో వెంటనే అందుబాటులో లేని కస్టమ్ రియాజెంట్స్ అవసరమైన రియాక్షన్‌లను తరువాతి రౌండ్‌లకు వాయిదా వేశారు. అనంతరం మానవ శాస్త్రవేత్తలు ఆ రియాక్షన్‌లను అమలు చేసి, ప్రారంభ స్క్రీన్‌లో బేస్‌లైన్ HiFi Gibson assemblyతో పోల్చి కాలనీ కౌంట్లను కొలిచారు. ముందు రౌండ్‌లో అత్యుత్తమంగా పనిచేసిన డేటాను తరువాతి రౌండ్‌కు ఇన్‌పుట్‌గా ఇచ్చారు. ముఖ్యంగా, స్పష్టీకరణ ప్రశ్నలు తప్ప ఇతర మానవ ఇన్‌పుట్ లేకుండా ప్రాంప్టింగ్‌ను స్టాండర్డైజ్ చేయడం వల్ల, కొత్త మెకానిస్టిక్ ఇన్‌సైట్స్‌ను మానవ మార్గనిర్దేశం కాకుండా నేరుగా AIకే ఆపాదించగలిగాము.

పూర్తి ఆప్టిమైజేషన్ సిరీస్‌లోని టాప్ ఎనిమిది రియాక్షన్‌లను విస్తృతమైన DNA డైల్యూషన్‌లతో మళ్లీ పరీక్షించగా, చాలావరకు ప్రారంభ స్క్రీన్‌తో పోలిస్తే తక్కువ ప్రభావాన్ని చూపాయి; చివరికి, ఐదో రౌండ్‌లోని ఒక రియాక్షన్ తన అసలు పనితీరును పునరుత్పత్తి చేసి, అత్యంత బలమైన వాలిడేటెడ్ కాండిడేట్‌గా నిలిచింది. అధిక పనితీరు చూపిన అనేక రియాక్షన్‌లు లిగేజ్-పాలిష్ ఫ్యామిలీకి చెందాయి; ఇవి కంపిటెంట్ సెల్ స్థితిలో లేదా రియాక్షన్ తర్వాత DNA హ్యాండ్లింగ్‌లో చిన్న మార్పులకు కూడా అత్యంత సున్నితంగా స్పందిస్తున్నట్లు కనిపించింది. ఈ రియాక్షన్‌లు చిన్న HiFi దశను ఉపయోగించినందున, అనేక ప్రొడక్ట్స్ E. coli లోకి ఒక్క జంక్షన్ మాత్రమే సీల్ అయి, మరొకటి అన్నీలింగ్‌తో నిలుపబడిన స్థితిలో ప్రవేశించి, తరువాతి రికవరీని సెల్యులర్ రిపేర్ పాత్‌వేలకు వదిలేస్తాయని మేము ఊహిస్తున్నాము. దీని వల్ల అధిక వేరియన్స్ మరియు ‘జాక్‌పాట్’ డైనమిక్ ఏర్పడుతుంది: ఎక్కువసార్లు ఈ రియాక్షన్ వేరియంట్స్ మెరుగ్గా పనిచేయకపోయినా, ఒకే ఒక్క బలమైన అవుట్‌లయర్ ఆ ఫ్యామిలీని తరువాతి రౌండ్‌లకు తీసుకెళ్లగలదు. 

మెకానిస్టిక్ క్లిష్టత కారణంగా రౌండ్‌లలో క్లోనింగ్ రియాక్షన్ ఆప్టిమైజేషన్‌పై దృష్టి పెట్టినప్పటికీ, సమాంతరంగా మేము ఒకే “వన్-షాట్” రౌండ్‌లో మోడల్ అనేక స్వతంత్ర మార్పులను ప్రతిపాదించేలా చేసి, ట్రాన్స్‌ఫర్మేషన్ ప్రొసీజర్‌ను కూడా ఆప్టిమైజ్ చేసి, అత్యుత్తమంగా పనిచేసిన రియాక్షన్‌ను ఎంచుకున్నాము.

రెండు దశల క్లోనింగ్ వర్క్‌ఫ్లోకు సంబంధించిన ప్రారంభ ఆప్టిమైజేషన్ స్క్రీన్‌లు: ఎంజైమాటిక్ అసెంబ్లీ మరియు ట్రాన్స్‌ఫర్మేషన్. (ఎడమ) ఐదు రౌండ్‌లలో (మొత్తం 44 రియాక్షన్‌లు) ఎంజైమాటిక్ అసెంబ్లీపై పునరావృత ఆప్టిమైజేషన్. HiFi అసెంబ్లీ బేస్‌లైన్ నుంచి ప్రారంభించి, ప్రతి రౌండ్‌లో GPT‑5 8–10 అసెంబ్లీ ప్రోటోకాల్ వేరియంట్లను ప్రతిపాదించింది; అత్యుత్తమ పనితీరు చూపిన ఫలితాల డేటాను తరువాతి ప్రాంప్ట్‌లలో చేర్చారు. ప్రతి రౌండ్‌లో, అప్పటివరకు (మునుపటి రౌండ్‌లు సహా) అత్యుత్తమంగా పనిచేసిన రియాక్షన్‌ను ప్లాట్ చేశారు. (కుడి) 13 వేర్వేరు ప్రోటోకాల్‌లను పరీక్షిస్తూ ట్రాన్స్‌ఫర్మేషన్ కండిషన్‌లకు వన్-షాట్ ఆప్టిమైజేషన్. రెండు ఆప్టిమైజేషన్ స్క్రీన్‌లలోనూ, ప్రతి కండిషన్‌కు డేటా సింగిల్ మెజర్‌మెంట్ (n=1)ను సూచిస్తుంది; టాప్ కాండిడేట్స్‌కు విడిగా రిప్లికేటెడ్ వాలిడేషన్ చేశారు.

స్టాండర్డైజ్డ్ ప్రాంప్ట్స్‌ను మానవ ఇన్‌పుట్ లేకుండా ఉపయోగించి, GPT‑5 ఎండ్-టు-ఎండ్ క్లోనింగ్ సామర్థ్యాన్ని 79 రెట్లు పెంచింది; ఇది అనేక ప్రయోగ రిప్లికేట్స్‌లో నిర్ధారించబడింది.

గమనించదగ్గ విషయం ఏమిటంటే, మోడల్ RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi) అని పిలిచిన ఒక కొత్త ఎంజైమాటిక్ ప్రొసీజర్‌ను ప్రతిపాదించింది; ఇందులో రియాక్షన్‌కు రెండు కొత్త ప్రోటీన్లు జోడించబడ్డాయి: E. coli నుంచి వచ్చిన రీకాంబినేజ్ RecA, మరియు ఫేజ్ T4 జీన్ 32 సింగిల్-స్ట్రాండెడ్ DNA–బైండింగ్ ప్రోటీన్ (gp32). అదనంగా, మోడల్ ఇంక్యూబేషన్ ఉష్ణోగ్రత, సమయం, అలాగే ఎంజైమ్స్‌ను జోడించే టైమింగ్‌లో ఉద్దేశపూర్వక మార్పులు చేసింది: మొదటి 50°C HiFi రియాక్షన్ తర్వాత RecA మరియు gp32ను జోడించి, అవి 37°C వద్ద పనిచేయనిచ్చి, అనంతరం అసెంబ్లీని పూర్తి చేయడానికి మళ్లీ 50°Cకి వెళ్లాలని ప్రతిపాదించింది. ఈ కొత్త మార్పులు కలిపి సామర్థ్యాన్ని 2.5 రెట్లు కంటే ఎక్కువగా పెంచాయి. ఇది రియాక్షన్ కండిషన్స్ మరియు టైమింగ్‌పై పునరావృత ఆప్టిమైజేషన్ చేయకముందు ఉన్న ప్రారంభ పనితీరును మాత్రమే సూచిస్తుందని గమనించాలి.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

ట్రాన్స్‌ఫర్మేషన్ వైపున, అత్యంత ప్రభావవంతమైన మార్పు అనూహ్యంగా సింపుల్‌గా ఉంది: సెల్‌లను పెల్లెట్ చేయడం (సెంట్రిఫ్యూజ్‌లో తిప్పి ట్యూబ్ దిగువన చేరేలా చేయడం), అందించిన వాల్యూమ్‌లో సగాన్ని తీసివేయడం, మరియు DNA జోడించే ముందు సెల్‌లను మళ్లీ సస్పెండ్ చేయడం—ఇవన్నీ 4°C వద్ద చేయడం. అధిక సామర్థ్యం గల కెమికల్‌గా కంపిటెంట్ సెల్‌లు సాధారణంగా నాజూకుగా భావించబడినా, ఈ సెల్‌లు కాన్సెంట్రేషన్‌ను బాగా తట్టుకున్నాయి మరియు పెరిగిన మాలిక్యులర్ కొలిజన్స్ ట్రాన్స్‌ఫర్మేషన్ సామర్థ్యాన్ని గణనీయంగా పెంచాయి (చివరి వాలిడేషన్‌లో >30 రెట్లు). 

హోమాలజీ-ఆధారిత క్లోనింగ్‌కు ఒక కొత్త మెరుగుదల.

RecA-ఆధారిత pair-and-finish HiFi DNA అసెంబ్లీ దశలను చూపించే డయాగ్రామ్; ఇందులో DNA స్ట్రాండ్‌లపై క్రమంగా పనిచేసే T5 ఎక్సోన్యూక్లియేజ్, GP32, RecA, పాలిమరేజ్, మరియు లిగేజ్ దశలు లేబుల్ చేయబడ్డాయి.

T5 ఎక్సోన్యూక్లియేజ్ 3′ ఓవర్‌హాంగ్‌లను సృష్టిస్తుంది; gp32 సెకండరీ స్ట్రక్చర్‌ను అణిచివేసి వాటిని స్థిరపరుస్తుంది. ఆ తరువాత RecA 3′ చివరల నుంచి ప్రవేశించి, gp32ను తొలగిస్తూ హోమాలజీ సెర్చ్ మరియు అన్నీలింగ్‌ను ప్రోత్సహిస్తుంది. 50 °Cకి వేడి చేయడం ద్వారా రెండు ప్రోటీన్లు DNA నుంచి విడిపోయి, పాలిమరేజ్ గ్యాప్ ఫిల్ మరియు లిగేషన్ జరగడానికి అవకాశం కల్పిస్తుంది.

Gibson assembly అనేది సరిపోలే “స్టిక్కీ” ఎండ్స్‌ను DNA ముక్కలకు ఇవ్వడం ద్వారా అవి ఒకదానిని ఒకటి కనుగొని కలవగలిగేలా పనిచేస్తుంది. కలిపిన DNA ముక్కలను సీల్ చేయడానికి ఈ రియాక్షన్ రెండు వేర్వేరు ఎంజైమ్స్‌ను (ఒక పాలిమరేజ్ మరియు ఒక లిగేజ్) ఉపయోగిస్తుంది. RAPF-HiFiలో, మ్యాచ్ అయ్యే దశ మరింత సమర్థంగా పనిచేయడానికి రెండు ప్రోటీన్లను ప్రవేశపెట్టారు. మొదటిది gp32, ఇది విడిగా ఉన్న DNA చివరలను సర్దుతూ చిక్కులు తొలగించే దువ్వెనలా పనిచేస్తుంది. రెండవది RecA, ఇది ప్రతి స్ట్రాండ్‌కు సరైన భాగస్వామిని వెతికి, సరిపోలే DNA ముక్కలను కలిసి లాగుతూ మార్గనిర్దేశం చేసే గైడ్‌లా పనిచేస్తుంది. అధిక ఉష్ణోగ్రత వద్ద ఈ రెండు సహాయక ప్రోటీన్లు DNA నుంచి విడిపోయి, సాధారణ Gibson ఎంజైమ్స్ రియాక్షన్‌ను పూర్తిచేయడానికి అవకాశం ఇస్తాయి.

సంక్షిప్తంగా చెప్పాలంటే, మెరుగైన పనితీరు క్రింది మెకానిజం ద్వారా జరుగుతుందని మేము ఊహిస్తున్నాము:

  • Gp32 అన్నీలింగ్ కాని సింగిల్-స్ట్రాండెడ్ DNA (ssDNA) టెయిల్స్‌ను కప్పి, సెకండరీ స్ట్రక్చర్‌ను తొలగిస్తుంది.
  • సాధారణంగా స్ట్రక్చర్ వల్ల నిరోధించబడే RecA, 3’ చివర నుంచి ప్రవేశించి gp32 ఫిలమెంట్‌ను తొలగిస్తుంది.
  • ssDNA:ssDNA homology search(కొత్త విండోలో తెరుచుకుంటుంది) మాధ్యమం చేసి, అన్నీలింగ్‌ను ప్రేరేపిస్తుంది.
  • మళ్లీ 50°Cకు వెళ్లడం ద్వారా RecA మరియు gp32 ఫిలమెంట్‌లు రెండూ DNA నుంచి విడిపోయి, పాలిమరేజ్ మరియు లిగేజ్ రియాక్షన్‌ను పూర్తి చేయడానికి అవకాశం కల్పిస్తాయి.

కొత్త ఎంజైమ్‌లు నిజంగా పనిచేస్తున్నాయా అనే విషయాన్ని పరీక్షించడానికి, అలాగే పనితీరు మెరుగుదల కేవలం థర్మల్ దశలు లేదా బఫర్ మార్పుల వల్ల మాత్రమే కాదని నిర్ధారించడానికి, RecA లేకుండా మరియు RecA, gp32 రెండూ లేకుండా RAPF-HiFi పనితీరును మేము పరీక్షించాము. ఈ రెండు సందర్భాల్లోనూ పనితీరు RAPF-HiFiతో పోలిస్తే తగ్గింది; దీని వల్ల RAPF-HiFi పనిచేయడానికి ఈ రెండు ప్రోటీన్లు అవసరమని సూచిస్తుంది.

అంతర్లీన మెకానిజాన్ని పరీక్షించడానికి, రియాక్షన్‌లోని రెండు కొత్త ఎంజైమ్‌లను—RecA మరియు gp32—వేరు చేసి పరిశీలించాము. వీటిలో ఏదో ఒకటి మాత్రమే ఉన్నప్పుడు, HiFi బేస్‌లైన్‌తో పోల్చితే సామర్థ్యం తగ్గుతుందని మేము చూపించాము. అయితే రెండూ కలిసినప్పుడు, బేస్‌లైన్‌తో పోల్చితే 2.6 రెట్లు సామర్థ్య పెరుగుదల చూపించాయి. (ఎర్రర్ బార్స్: n=3 స్వతంత్ర ప్రయోగాల SD).

RAPF-HiFi అభివృద్ధి GPT‑5 క్లిష్టమైన, మల్టీ-డైమెన్షనల్ రీజనింగ్ చేయగల సామర్థ్యం కలిగి ఉందని సూచిస్తుంది:

మా అవగాహన మేరకు, మాలిక్యులర్ బయాలజీ పద్ధతుల్లో RecA మరియు gp32ను ఫంక్షనల్‌గా కలిసి ఉపయోగించిన ఉదాహరణలు లేవు. అనేక కొత్త మాలిక్యులర్ బయాలజీ టెక్నిక్‌ల మాదిరిగానే, ప్రాథమిక బయోకెమికల్ కార్యకలాపాలు ముందే అధ్యయనం చేయబడ్డాయి; అయితే వాటిని ప్రాక్టికల్‌గా, సాధారణంగా వర్తింపజేయగల పద్ధతిగా ఉపయోగించడమే ఇక్కడి పురోగతి.

ఉదాహరణకు, RecA మరియు gp32 పరస్పర చర్యను మెకానిస్టిక్ in vitro రీకాన్స్టిట్యూషన్ అస్సేల్లో అధ్యయనం చేశారు; D లూప్ ఫార్మేషన్‌పై జరిగిన అధ్యయనాల్లో, gp32 RecA కార్యకలాపాన్ని పెంచగలదని చూపబడింది(కొత్త విండోలో తెరుచుకుంటుంది). gp32ను దాని సహజ T4 రీకాంబినేజ్ భాగస్వామి UvsX మరియు రీకాంబినేజ్ లోడింగ్ ఫ్యాక్టర్ uvsYతో కలిసి రీకాంబినేజ్ పాలిమరేజ్ యాంప్లిఫికేషన్ (RPA(కొత్త విండోలో తెరుచుకుంటుంది))లో ఉపయోగించారు. ఒక RPA పేటెంట్ స్పెసిఫికేషన్(కొత్త విండోలో తెరుచుకుంటుంది) లో, ఇంజినీర్ చేయబడిన (అంటే, వైల్డ్-టైప్ కాని) gp32 ప్రోటీన్‌తో హెటెరోలాగస్ సిస్టమ్‌లో E. coli RecAను ఉపయోగించి ప్రభావవంతమైన RPA రియాక్షన్‌లు చూపబడ్డాయని పేర్కొన్నప్పటికీ, ఈ వాదన కొన్ని పేటెంట్ వివరణల్లో పక్క ప్రస్తావనగా మాత్రమే కనిపిస్తుంది; మా అవగాహన మేరకు, ఇది ప్రచురిత డేటాతో మద్దతు పొందలేదు లేదా బలమైన RecA-ఆధారిత RPA సిస్టమ్‌గా స్వీకరించబడలేదు. SLiCE(కొత్త విండోలో తెరుచుకుంటుంది) అనే ఒక క్లోనింగ్ పద్ధతి, λ Red రీకాంబినేషన్ సిస్టమ్ కలిగిన E. coli హోల్-సెల్ ఎక్స్‌ట్రాక్ట్‌ను ఉపయోగిస్తుంది; ఇందులో Red beta DNA-బైండింగ్ ప్రోటీన్‌గా మరియు రీకాంబినేజ్‌గా రెండు పాత్రలు పోషించవచ్చు (అయితే మా ప్రాంప్ట్‌లో సెల్ ఎక్స్‌ట్రాక్ట్‌ల వినియోగాన్ని మేము స్పష్టంగా నిషేధించాము). మరో అప్లికేషన్‌లో, Ferrin & Camerini-Otero(కొత్త విండోలో తెరుచుకుంటుంది) సరిపోలే సీక్వెన్స్‌ల ఆధారంగా DNA మాలిక్యూల్‌లను సెలెక్టివ్‌గా క్యాప్చర్ చేయడానికి RecAను ఒంటరిగా ఉపయోగించారు. విడిగా, gp32ను యాడిటివ్‌గా ఉపయోగించారు(కొత్త విండోలో తెరుచుకుంటుంది) అని నివేదించబడింది; ఇది PCR అనే DNA యాంప్లిఫికేషన్ ప్రక్రియలో సెకండరీ స్ట్రక్చర్‌ను తగ్గించడానికి ఉపయోగించబడింది. NABSA యాంప్లిఫికేషన్(కొత్త విండోలో తెరుచుకుంటుంది) RecA మరియు gp32 రెండింటి వల్ల మెరుగుపడిందని చూపబడింది; అయితే ఇవి విడివిడిగా కూడా రియాక్షన్‌ను మెరుగుపరచగలిగాయి మరియు స్పష్టమైన సైనర్జీ గుర్తించబడలేదు. విస్తృతంగా చూస్తే, ప్రాథమిక Gibson-స్టైల్ DNA అసెంబ్లీ రియాక్షన్‌లకు నివేదించబడిన మెరుగుదలలు చాలా అరుదుగా ఉన్నాయి; అందులో అత్యంత గమనార్హమైన ఉదాహరణ హీట్-స్టేబుల్ DNA-బైండింగ్ ప్రోటీన్ (ET SSB), ఇది అసెంబ్లీ సామర్థ్యాన్ని సుమారు 2.5 రెట్లు పెంచుతుంది(కొత్త విండోలో తెరుచుకుంటుంది).

ఎక్కువ అప్లికేషన్‌లలో, HiFi/Gibson క్లోనింగ్ యొక్క సరళత మరియు బలంతో RAPF-HiFi పోటీ పడుతుందని మేము ఆశించడం లేదు. అయితే, మెకానిస్టిక్‌గా భిన్నమైన ఒక అసెంబ్లీ మార్గం వెలుగులోకి రావడం గమనార్హం: GPT‑5 రీకాంబినేషన్ ప్రోటీన్లు మరియు రియాక్షన్ డైనమిక్స్‌కు అపరిచితమైన కలయికను కలిగి ఉన్న పరిష్కారానికి చేరుకుంది. అంతర్లీన మెకానిజం మాడ్యులర్‌గా నిరూపితమై, ఇతర మాలిక్యులర్ వర్క్‌ఫ్లోల్లో తిరిగి ఉపయోగించగల లేదా మళ్లీ కలపగల భాగాలను అందించే అవకాశం ఉంది. RAPF-HiFiకు మరిన్ని మెరుగుదలలను కూడా మేము కొనసాగిస్తూ పరిశీలిస్తున్నాము. ఎక్సోన్యూక్లియేజ్ అధిక డైజెషన్‌కు ఎదురుగా RecA మరియు gp32 కార్యకలాపాలను సమతుల్యం చేయడానికి, రియాక్షన్ ఉష్ణోగ్రతలు మరియు దశల వ్యవధులను ట్యూన్ చేయవచ్చు; అలాగే రెండు ప్రోటీన్ల పరిమాణాలు ఇంకా ఆప్టిమైజ్ చేయాల్సి ఉంది. GPT‑5 ఒక హైపర్‌యాక్టివ్ RecA వేరియంట్‌ను కూడా ప్రతిపాదించింది; ప్రస్తుతం మేము దానిని శుద్ధి చేస్తున్నాము.

ట్రాన్స్‌ఫర్మేషన్ ప్రోటోకాల్ విషయంలో, విజయవంతమైన ఆప్టిమైజేషన్ కండిషన్‌లు వాణిజ్య 10-beta competent cells(కొత్త విండోలో తెరుచుకుంటుంది) యొక్క హీట్-షాక్ సామర్థ్యాన్ని పెంచేందుకు ఉద్దేశించిన వివిధ యాడిటివ్‌లు మరియు థర్మల్ పెర్టర్బేషన్‌ల పరిధిని కలిగి ఉన్నాయి. పరీక్షించిన 13 AI-జనరేటెడ్ వన్-షాట్ ట్రాన్స్‌ఫర్మేషన్‌లలో, అత్యంత ప్రభావవంతమైన మార్పు అయిన Transformation 7 (T7)లో సెల్‌లను పెల్లెట్ చేసి, అందించిన వాల్యూమ్‌లో సగాన్ని తొలగించి, DNA జోడించే ముందు సెల్‌లను మళ్లీ సస్పెండ్ చేయడం జరిగింది—ఇవన్నీ 4°C వద్ద. అధిక సామర్థ్యం గల కెమికల్‌గా కంపిటెంట్ సెల్‌లు సాధారణంగా నాజూకుగా భావించబడతాయి, అందుకే ఇలాంటి హ్యాండ్లింగ్ దశలను సాధారణంగా నివారిస్తారు. అయినప్పటికీ, ఈ సెల్‌లు కాన్సెంట్రేషన్‌ను బాగా తట్టుకున్నాయి. ప్రతి సెల్‌కు పెరిగిన DNA ఎక్స్‌పోజర్ మరియు తక్కువ ఇన్హిబిటరీ బఫర్ వల్ల మరింత పదునైన హీట్-షాక్ ఏర్పడి, ట్రాన్స్‌ఫర్మేషన్ సామర్థ్యం గణనీయంగా పెరిగింది (>30 రెట్లు).

ఈ ట్రాన్స్‌ఫర్మేషన్ ప్రోటోకాల్ కొత్తదే అయినప్పటికీ, సెల్‌లను ముందస్తు దశలో కాన్సెంట్రేట్ చేసే భావనాత్మకంగా సమానమైన విధానం(కొత్త విండోలో తెరుచుకుంటుంది) ఇప్పటికే నివేదించబడింది. గమనించదగ్గ విషయం ఏమిటంటే, GPT‑5 ఇక్కడ అభివృద్ధి చేసిన విధానం ఆఫ్-ది-షెల్ఫ్ కెమికల్‌గా కంపిటెంట్ సెల్‌లతో అనుకూలంగా ఉండి, ఇన్-హౌస్ సెల్ ప్రిపరేషన్ అవసరాన్ని తొలగిస్తుంది; అలాగే సమానమైన సెల్ స్ట్రెయిన్‌లపై నివేదించిన విధానాల కంటే ఎక్కువ సామర్థ్య లాభాలను అందిస్తుంది.

రోబోటిక్ సిస్టమ్.

ఈ మోడల్ ఎక్స్‌పెరిమెంటల్ సిస్టమ్ త్రుపుట్‌ను పెంచేందుకు, Robot on Rails మరియు Red Queen Bio కలిసి, నేచురల్ లాంగ్వేజ్ క్లోనింగ్ ప్రోటోకాల్‌ను తీసుకుని వెట్ ల్యాబ్‌లో అమలు చేసే ఒక రోబోటిక్ సిస్టమ్‌ను నిర్మించాయి.

ఈ సిస్టమ్ మూడు భాగాలను కలిపి పనిచేస్తుంది: 1) సాధారణ ఇంగ్లీష్‌ను రోబోట్ చర్యలుగా మార్చే హ్యూమన్-టు-రోబోట్ LLM; 2) ల్యాబ్‌వేర్‌ను రియల్ టైమ్‌లో గుర్తించి స్థానాన్ని నిర్ధారించే విజన్ సిస్టమ్; 3) ప్రతి చర్యను సురక్షితంగా మరియు ఖచ్చితంగా ఎలా అమలు చేయాలో నిర్ణయించే రోబోటిక్ పాత్ ప్లానర్. ఫలితంగా, Gibson క్లోనింగ్ ప్రోటోకాల్ వేరియంట్లకు మరింత ఆప్టిమైజ్ చేయబడిన ఒక ఫ్లెక్సిబుల్, జనరలైజ్డ్ ల్యాబ్ రోబోట్ సిద్ధమైంది.

స్వయం నియంత్రిత రోబోట్ ఒక పూర్తి క్లోనింగ్ ప్రయోగాన్ని అమలు చేయగలదా అనే విషయాన్ని పరీక్షించేందుకు, మేము ఒకేసారి రెండు ప్రోటోకాల్స్‌ను నడిపాము: స్టాండర్డ్ HiFi పద్ధతి మరియు మొదటి ఆప్టిమైజేషన్ రౌండ్‌లో అత్యుత్తమంగా పనిచేసిన AI-మోడిఫైడ్ ప్రోటోకాల్ R8.ప్రతి దశలో రోబోట్ చేసిన పనిని మానవులు నిర్వహించిన ప్రయోగాలతో పోల్చాము. లిక్విడ్‌లను మార్చడం మరియు కలపడం, సాంపిల్ ట్యూబ్‌లను కదిలించడం, సెల్‌లకు నియంత్రిత వేడి ఇవ్వడం, మరియు సెల్‌లను గ్రోత్ ప్లేట్‌లపై పంచడం వంటి విభిన్న భౌతిక చర్యలు అవసరమైన ట్రాన్స్‌ఫర్మేషన్ ప్రక్రియను రోబోట్ విజయవంతంగా నిర్వహించింది. మానవులు చేసిన ట్రాన్స్‌ఫర్మేషన్‌లతో నేరుగా పోల్చినప్పుడు, రోబోట్ సమానమైన నాణ్యత గల డేటాను, బేస్‌లైన్‌తో పోల్చితే సమానమైన మెరుగుదలలతో ఉత్పత్తి చేసింది; ఇది బయాలజికల్ ప్రయోగాల ఆప్టిమైజేషన్‌ను ఆటోమేట్ చేసి వేగవంతం చేసే ప్రారంభ సామర్థ్యాన్ని చూపిస్తోంది.

రోబోట్ మరియు మానవ ప్రయోగాల మధ్య ఫోల్డ్-చేంజ్‌లు సమానంగా ఉన్నప్పటికీ, రోబోట్‌లోని అబ్సల్యూట్ కాలనీ కౌంట్లు మాన్యువల్ ఎగ్జిక్యూషన్‌తో పోల్చితే సుమారు పది రెట్లు తక్కువగా ఉండాయి; ఇది లిక్విడ్ హ్యాండ్లింగ్ ప్రెసిషన్, టెంపరేచర్ కంట్రోల్ కాలిబ్రేషన్, మరియు మాన్యువల్ సెల్ హ్యాండ్లింగ్ టెక్నిక్స్‌లోని సూక్ష్మతలను పునరుత్పత్తి చేయడం వంటి మెరుగుదల అవసరాల్ని సూచిస్తుంది.

స్టాండర్డ్ HiFi పద్ధతి (బేస్‌లైన్) మరియు మెరుగైన R8 పద్ధతి రెండింటినీ మానవ పరిశోధకులు మరియు స్వయం నియంత్రిత రోబోట్ అమలు చేశాయి; ట్రాన్స్‌ఫర్మేషన్ సామర్థ్యాలను తత్కాలిక HiFi బేస్‌లైన్ కంట్రోల్స్‌కు (1.0గా సెట్ చేసి) నార్మలైజ్ చేశారు. మానవులు అమలు చేసిన R8 2.39 రెట్లు మెరుగుదల చూపగా, రోబోట్ అమలు చేసిన R8 2.13 రెట్లు మెరుగుదల సాధించింది (మానవ పనితీరులో 89%), అబ్సల్యూట్ యీల్డ్స్ తక్కువగా ఉన్నప్పటికీ ప్రోటోకాల్ ర్యాంకింగ్ సమానంగా ఉందని ఇది చూపిస్తుంది.

భవిష్యత్తు.

భవిష్యత్తులో AI వేగవంతం చేసిన సైన్స్ ఎలా ఉండబోతుందో ఈ ప్రయోగాలు ఒక చిన్న దృశ్యాన్ని అందిస్తున్నాయని మేము విశ్వసిస్తున్నాము: మోడల్స్ నిరంతరం నేర్చుకుంటూ, నిజ ప్రపంచంతో పరస్పర చర్యలో ఉండటం. మోడల్ సామర్థ్యాలను స్వచ్ఛంగా కొలవడానికి మా ప్రయోగాల్లో మానవ జోక్యాన్ని తొలగించినప్పటికీ, AI మానవ శాస్త్రవేత్తలకు సహాయం చేయడం ద్వారా ప్రయోగాలను రూపకల్పన చేయడం మరియు పరిశోధనలో బ్రేక్‌త్రూలకు తోడ్పడే అవకాశాలపై మేము ప్రత్యేకంగా ఉత్సాహంగా ఉన్నాము.


శాస్త్రీయ పురోగతిని సురక్షితంగా మరియు బాధ్యతాయుతంగా వేగవంతం చేయడంపై పని చేస్తూనే, ముఖ్యంగా బయోసెక్యూరిటీకి సంబంధించిన రిస్క్‌లను అంచనా వేసి తగ్గించడానికీ మేము ప్రయత్నిస్తున్నాము. ఈ ఈవాల్యుయేషన్ ఫలితాలు, మోడల్స్ వెట్ ల్యాబ్‌లో రీజనింగ్ చేసి ప్రోటోకాల్‌లను మెరుగుపరచగలవని చూపిస్తున్నాయి; అలాగే మా
Preparedness Framework(కొత్త విండోలో తెరుచుకుంటుంది)లో వివరించినట్లుగా, ఇవి బయోసెక్యూరిటీపై ప్రభావాలను కలిగి ఉండవచ్చని సూచిస్తున్నాయి. ఈ రిస్క్‌లను తగ్గించేందుకు మోడల్ మరియు సిస్టమ్ స్థాయిలో అవసరమైన, సూక్ష్మమైన రక్షణలను నిర్మించడానికి మేము కట్టుబడి ఉన్నాము; అలాగే ప్రస్తుత స్థాయిలను ట్రాక్ చేసే ఈవాల్యుయేషన్లను కూడా అభివృద్ధి చేస్తున్నాము.