GPT‑5 سیل فری پروٹین کی ترکیب کی لاگت کو کم کرتا ہے
Ginkgo Bioworks کے ساتھ کام کرتے ہوئے، ہم نے AI سے چلنے والی ایک خودمختار لیب تیار کی اور پروٹین کی پیداوار کی لاگت میں 40% کمی حاصل کی.
ہم نے ریاضی اور طبیعیات جیسے شعبوں میں AI کی جانب سے تیز رفتار ترقی دیکھی ہے، جہاں خیالات کو اکثر مادی دنیا کو چھوئے بغیر پرکھا جا سکتا ہے. حیاتیات مختلف ہے. ترقی لیبارٹری میں ہوتی ہے، جہاں سائنسدان تجربات کرتے ہیں جو وقت اور پیسہ لیتے ہیں.
یہ بدلنا شروع ہو رہا ہے. جدید ترین ماڈلز اب براہِ راست لیب آٹومیشن سے منسلک ہو سکتے ہیں، تجربات کی تجویز دے سکتے ہیں، انہیں بڑے پیمانے پر چلا سکتے ہیں، نتائج سے سیکھ سکتے ہیں اور یہ فیصلہ کر سکتے ہیں کہ آگے کیا کرنا ہے. زندگی کے سائنس کے زیادہ تر شعبوں میں رکاوٹ تکرار ہے اور خودمختار لیبارٹریاں اس رکاوٹ کو دور کرنے کے لیے بنائی جاتی ہیں.
پچھلے کام میں، ہم نے دکھایا کہ GPT‑5 بند-لوپ تجربہ کاری کے ذریعے ویٹ لیب پروٹوکولز کو بہتر بنا سکتا ہے. یہاں، ہم یہ دکھاتے ہیں کہ یہی طریقہ پروٹین کی پیداوار کی لاگت کو کم کر سکتا ہے.
ہم نے Ginkgo Bioworks(نئی ونڈو میں کھلتا ہے) کے ساتھ شراکت کی ہے تاکہ GPT‑5 کو ایک کلاؤڈ لیبارٹری سے جوڑا جا سکے—ایک خودکار ویٹ لیب جسے سافٹ ویئر کے ذریعے دور سے چلایا جاتا ہے, جہاں روبوٹس تجربات انجام دیتے ہیں اور ڈیٹا واپس بھیجتے ہیں—اور ہم نے اس لیب-ان-دی-لوپ سیٹ اپ کو ایک وسیع پیمانے پر استعمال ہونے والے حیاتیاتی عمل کو بہتر بنانے کے لیے استعمال کیا: سیل فری پروٹین سنتھیسز (CFPS). چھ سے زیادہ کلوزڈ-لوپ تجرباتی راؤنڈز میں, سسٹم نے 580 خودکار پلیٹس پر 36,000 سے زیادہ منفرد CFPS ردعمل کی ترکیبات کی جانچ کی. کمپیوٹر, ویب براؤزر اور متعلقہ کاغذات تک رسائی فراہم کیے جانے کے بعد, GPT‑5 نے کم لاگت CFPS میں ایک نیا معیار قائم کرنے کے لیے تین تجرباتی مراحل مکمل کیے, جس سے پروٹین کی پیداوار کی لاگت میں 40% کمی (اور ری ایجنٹس کی لاگت میں 57% بہتری) حاصل ہوئی, جس میں نئے ردعمل کی ترکیبات شامل ہیں جو خودکار لیبز میں عام ردعمل کی شرائط کے مقابلے میں زیادہ مضبوط ہیں.
سیل فری پروٹین سنتھیسز (CFPS) پروٹین بنانے کا ایک طریقہ ہے جس میں زندہ خلیات کو بڑھائے بغیر پروٹین تیار کیے جاتے ہیں. خلیات میں DNA ڈالنے اور ان کے پروٹین بنانے کا انتظار کرنے کے بجائے، CFPS ایک کنٹرول شدہ آمیزے میں پروٹین بنانے کی مشینری کو چلاتا ہے. یہ اسے تیز پروٹو ٹائپنگ اور جانچ کے لیے ایک عملی آلہ بناتا ہے کیونکہ سائنسدان تیزی سے کئی تجربات کر سکتے ہیں اور اسی دن نتائج کی پیمائش کر سکتے ہیں.
پروٹینز جدید حیاتیات کی پیش کردہ اہم چیزوں میں شامل ہیں. بہت سی اہم دوائیں پروٹینز پر مبنی ہوتی ہیں. بہت سے تشخیصی اور تحقیقی اسّیز پروٹینز پر منحصر ہوتے ہیں. صنعتی ماحول میں، پروٹین انزائمز کے طور پر کام کرتے ہیں جو کیمیائی عمل کو زیادہ صاف اور مؤثر بناتے ہیں. پروٹین آپ کے لانڈری ڈٹرجنٹ میں بھی موجود ہوتے ہیں. جب پروٹین کی پیداوار تیز تر اور سستی ہو جاتی ہے، تو سائنس دان عموماً زیادہ خیالات کو جلد آزما سکتے ہیں اور ابتدائی تحقیق کو ایسی چیز میں تبدیل کرنے کی لاگت کم کر سکتے ہیں جس سے لوگ روزمرہ کی زندگی میں فائدہ اٹھا سکیں.
CFPS اس قسم کی تکرار کے لیے پہلے ہی کارآمد ہے. رکاوٹ یہ ہے کہ اسے بہتر بنانا مشکل ہے اور بڑے پیمانے پر یہ مہنگا ہو جاتا ہے.
سیل فری پروٹین سنتھیسز کے لیے پیچیدہ اور باہمی تعامل کرنے والے اجزاء کی ضرورت ہوتی ہے: پروٹین کو انکوڈ کرنے والا DNA ٹیمپلیٹ, سیل لائسیٹ (خلیات کے اندر کی سیلولر مشینری کا محلول) اور توانائی کے ذرائع سے لے کر نمکیات تک پھیلے ہوئے متعدد حیاتی کیمیائی اجزاء. پورے سسٹم کے بارے میں استدلال کرنا انتہائی مشکل ہے اور کئی(نئی ونڈو میں کھلتا ہے) پچھلی(نئی ونڈو میں کھلتا ہے) تحقیقات(نئی ونڈو میں کھلتا ہے) نے پروٹین کی پیداوار کی لاگت کو کم کرنے کے لیے مشین لرننگ کی مختلف اقسام کو استعمال کیا ہے.
معیاری سیل فری پروٹین سنتھیسس (CFPS) فارمولیشنز اور تجارتی کٹس کی قیمتیں اکثر انسانی رفتار کے مطابق کام کے لیے مقرر کی جاتی ہیں. خودمختار لیبارٹریاں اتنے وقت میں ہزاروں تجربات کر سکتی ہیں جتنے میں ایک انسانی ٹیم شاید درجنوں تجربات کر سکے. اس پیمانے پر، ری ایجنٹس کی لاگت محدود کرنے والا عنصر بن جاتی ہے.
CFPS کو صرف بدیہی اندازے کی بنیاد پر بہتر بنانا مشکل ہے. یہ کئی باہمی تعامل کرنے والے اجزاء کا مجموعہ ہے. چھوٹی تبدیلیاں اہمیت رکھ سکتی ہیں، لیکن اثر کی سمت ہمیشہ واضح نہیں ہوتی اور بہترین امتزاج کو تلاش کرنا بہت سے تجربات کیے بغیر مشکل ہو سکتا ہے. پچھلے طریقوں نے لاگت کو کم کیا ہے، لیکن پیش رفت عام طور پر بتدریج ہوتی ہے کیونکہ اس دائرہ کار کو مکمل طور پر کھنگالنا محنت طلب ہے.
ہم نے GPT‑5 کو Ginkgo Bioworks کی کلاؤڈ لیبارٹری کے ساتھ جوڑا تاکہ سیل فری پروٹین سنتھیسز (CFPS) کی آپٹیمائزیشن کے لیے ایک بند-حلقہ خودمختار نظام تشکیل دیا جا سکے.
GPT‑5 نے تجربات کے مجموعے ڈیزائن کیے. لیب نے انہیں انجام دیا. نتائج کو ماڈل میں واپس فیڈ کیا گیا. ماڈل نے اس ڈیٹا کو اگلے مرحلے کی تجویز کے لیے استعمال کیا. ہم نے اس چکر کو چھ بار دہرایا.

GPT‑5 نے معیاری 384-ویل پلیٹ فارمیٹ میں تجربات کے بیچز ڈیزائن کیے اور انہیں Ginkgo Bioworks کی کلاؤڈ لیبارٹری پر چلایا. جب تجربات مکمل ہو گئے، تو کلاؤڈ لیبارٹری نے ڈیٹا واپس GPT‑5 کو بھیج دیا، جہاں ماڈل نے نتائج کا تجزیہ کیا، نئے مفروضے بنائے اور تجربات کے اگلے دور کو ڈیزائن کیا.
لوپ کو اس بات سے مربوط رکھنے کے لیے کہ ایک خود مختار لیب کیا کر سکتی ہے، ہم نے کسی بھی تجربے کے شروع ہونے سے پہلے سخت پروگراماتی توثیق شامل کی. اس توثیق نے یہ یقینی بنایا کہ AI کے ڈیزائن کردہ تجربات خودکار پلیٹ فارم پر جسمانی طور پر قابل عمل ہیں. اس نے ایسے "کاغذی تجربات" کو روکا جو متن میں قابلِ یقین لگتے ہیں لیکن روبوٹک ورک فلو میں انجام نہیں دیے جا سکتے.
مکمل رن کرنے کے دوران، سسٹم نے 580 خودکار پلیٹس پر 36,000 سے زیادہ CFPS ری ایکشنز انجام دیئے. یہ پیمانہ اہمیت کا حامل ہے کیونکہ یہ وہ چیز ہے جو رجحانات کو ابھرنے کی اجازت دیتی ہے. حیاتیات میں, انفرادی تجربات میں شور ہوتا ہے. تھروپٹ اور تکرار وہ طریقے ہیں جن سے آپ اشارے کو بے ترتیب شور سے الگ کرتے ہیں. جب GPT‑5 کو متعلقہ پیپر اور ٹولز تک رسائی مل گئی, تو اسے تجربات کے تین مراحل اور دو ماہ لگے تاکہ ایک نیا جدید ترین معیار قائم کیا جا سکے: بہترین سابقہ بیس لائن(نئی ونڈو میں کھلتا ہے) کے مقابلے میں پروٹین کی پیداوار کی لاگت 40% کم ہو گئی.
Ginkgo Bioworks کے دوبارہ ترتیب دیئے جا سکنے والے آٹومیشن کارٹس. کریڈٹ: Ginkgo Bioworks
ہم نے یہ پایا کہ بہتریاں ان امتزاجات کی شناخت سے آئیں جو ایک ساتھ مؤثر طریقے سے کام کرتے ہیں اور ہائی تھروپٹ آٹومیشن کی عملی حقیقتوں میں بھی قائم رہتے ہیں.
ہمیں یہ پتہ چلا کہ GPT‑5 نے کم لاگت والے ردعمل کے مرکبات کی نشاندہی کی جنہیں انسانوں نے اس ترتیب میں پہلے کبھی نہیں آزمایا تھا. سیل فری پروٹین سنتھیسس (CFPS) کا برسوں سے مطالعہ کیا جا رہا ہے، لیکن ممکنہ مرکبات کی گنجائش اب بھی وسیع ہے. جب آپ ہزاروں امتزاجات کو تیزی سے تجویز اور نافذ کر سکتے ہیں، تو آپ ایسے قابل عمل علاقے تلاش کر سکتے ہیں جو دستی ورک فلو کے ساتھ آسانی سے نظر انداز ہو سکتے ہیں.
ہم نے یہ بھی پایا کہ ہائی-تھروپٹ، پلیٹ پر مبنی تجربات اکثر دستی، بینچ ٹاپ تجربات سے مختلف ہوتے ہیں. ہائی-تھروپٹ ردعمل فارمیٹس میں آکسیجینیشن کی سطح کم ہو سکتی ہے. مکسنگ اور جیومیٹری مختلف ہو سکتے ہیں. زیادہ تر CFPS ری ایکشنز ٹیسٹ ٹیوبز میں مائیکروٹائٹر پلیٹس کے مقابلے میں زیادہ پروٹین پیدا کرتے ہیں کیونکہ بڑے پیمانے پر عموماً زیادہ آکسیجن کی دستیابی اور بہتر مکسنگ ہوتی ہے. درحقیقت، کم حجم پر پلیٹ پر مبنی ردعمل کے لیے، GPT‑5 نے بہت سے ردعمل تجویز کیے جو ڈیٹا کے تجزیے کے لیے کمپیوٹر تک رسائی اور متعلقہ پیپرز تلاش کرنے کے لیے ویب براؤزر تک رسائی حاصل کرنے کے فوراً بعد پہلے سے موجود بہترین نتائج سے بھی بہتر ثابت ہوئے . مجموعی طور پر، GPT‑5 نے کئی ری ایجنٹ امتزاجات تجویز کیے جو ہائی-تھروپٹ پابندیوں کے تحت عمدہ کارکردگی کا مظاہرہ کرتے ہیں، جن میں سے کئی خودکار لیب سیٹنگز میں عام کم آکسیجن حالات میں زیادہ مضبوط ہیں.
مزید برآں، ہم نے یہ پایا کہ بفرنگ، توانائی کی دوبارہ پیداوار کے اجزاء اور پولی امائنز میں معمولی تبدیلیوں کا ان کی لاگت کے مقابلے میں غیر متناسب طور پر بڑا اثر ہوتا ہے. یہ ہمیشہ وہ پہلے پیرامیٹرز نہیں ہوتے جن تک لوگ پہنچتے ہیں، لیکن زیادہ تھروپٹ پر، یہ پس منظر کے مفروضات کے بجائے قابل آزمائش مفروضے بن جاتے ہیں.
آخر کار، لاگت کے ڈھانچے نے خود اس بات کو اہمیت دی کہ کیا چیز اہم تھی. CFPS میں، لاگت اب لائسیٹ اور ڈی این اے کے زیر اثر ہے. اس کا مطلب ہے کہ ییلڈ سب سے زیادہ فائدہ مند حکمت عملی ہے. اگر آپ مہنگی ان پٹ کی فی اکائی پروٹین کی پیداوار بڑھا سکتے ہیں، تو آپ لاگت پر بامعنی پیش رفت کرتے ہیں، اس سے پہلے کہ آپ کہیں اور معمولی بچت کے پیچھے جائیں.
چھ خودکار تجرباتی مراحل کے دوران، نظام نے مستقل طور پر سیل فری پروٹین کی ترکیب کو بہتر بنایا، اخراجات کو کم کیا اور پروٹین کی پیداوار میں اضافہ کیا. نتائج ہر راؤنڈ کے لیے ردعمل کی لاگت بمقابلہ پروٹین ٹائٹر کے طور پر دکھائے جاتے ہیں اور بہترین سمجھوتے ایک جدید ترین بناتے ہیں. بڑے پوائنٹس ہر راؤنڈ میں حاصل کی گئی کم ترین لاگت فی گرام کو نشان زد کرتے ہیں اور ستارہ/نقطہ دار حوالہ 384-ویل پلیٹس میں سابقہ جدید ترین بینچ مارک کی نشاندہی کرتا ہے (Olsen et al., 2025). بعد کے راؤنڈز پر قریب سے نظر ڈالنے سے آخری فوائد نمایاں ہوتے ہیں اور راؤنڈ بہ راؤنڈ خلاصہ دکھاتا ہے کہ بہترین قیمت فی گرام وقت کے ساتھ کم ہوتی جا رہی ہے.
یہ نتائج ایک پروٹین، sfGFP اور ایک سیل-فری پروٹین سنتھیسز (CFPS) سسٹم پر ظاہر کیے گئے. دیگر پروٹینز اور دیگر CFPS سسٹمز پر عمومی اطلاق ابھی ثابت ہونا باقی ہے.
آکسیجینیشن اور ردِعمل کی جیومیٹری پیداوار کو مضبوطی سے متاثر کر سکتے ہیں اور یہ عوامل پیمانوں کے درمیان مختلف ہو سکتے ہیں. کچھ بہتریاں ان شرائط کے لیے حساس ہو سکتی ہیں اور ان حساسیتوں کو سمجھنا اس بات کا حصہ ہے کہ آگے کیا کرنا ہے.
پروٹوکول میں بہتری اور ری ایجنٹ کی ہینڈلنگ کے لیے انسانی نگرانی ضروری تھی. سسٹم تجربات کو ڈیزائن اور ان کی تشریح کر سکتا ہے، لیکن لیبارٹری کا کام اب بھی عملی تفصیلات پر مشتمل ہوتا ہے جن کے لیے تجربہ کار آپریٹرز کی ضرورت ہوتی ہے.
ہم دیگر حیاتیاتی ورک فلو میں بھی لیب-ان-دی-لوپ آپٹیمائزیشن لاگو کرنے کا منصوبہ رکھتے ہیں جہاں تیز تر تکرار ترقی کو ممکن بنا سکتی ہے. ہم خود مختار لیبارٹریز کو ماڈلز کے لیے تکمیلی کے طور پر دیکھتے ہیں. ماڈل ڈیزائن تیار کر سکتے ہیں، لیکن آخرکار حیاتیات کو جانچ اور تکرار کی ضرورت ہوتی ہے. جنریشن اور تجربات کے درمیان لوپ کو مکمل کرنا ہی وہ طریقہ ہے جس سے آپ امید افزا خیالات کو کارآمد نتائج میں بدل سکتے ہیں.
جب ہم سائنسی ترقی کو محفوظ اور ذمہ داری کے ساتھ تیز کرنے کی کوشش کرتے ہیں، تو ہم بائیو سیکیورٹی سے متعلق خطرات کا جائزہ لینے اور انہیں کم کرنے کی بھی کوشش کرتے ہیں. یہ نتائج ظاہر کرتے ہیں کہ ماڈلز ویٹ لیب میں پروٹوکولز کو بہتر بنانے کے لیے استدلال کر سکتے ہیں اور بائیوسیکیورٹی کے لیے مضمرات ہو سکتے ہیں جن کا ہم اپنے پریفرنس فائن-ٹیوننگ کے ذریعے جائزہ لیتے اور ان کی تخفیف کرتے ہیں. ہم ضروری اور باریک بینی سے حفاظتی تدابیر ماڈل اور نظام کی سطح پر بنانے کے لیے پرعزم ہیں تاکہ ان خطرات کو کم کیا جا سکے اور موجودہ سطحوں کی نگرانی کے لیے جائزے تیار کریں.
ہم Ginkgo Bioworks میں اپنے پارٹنرز اور ان ٹیموں کے شکر گزار ہیں جنہوں نے اس کام کے پیچھے موجود خودکار کلاؤڈ لیبارٹری کو ڈیزائن، چلانے اور سپورٹ کرنے میں مدد کی.


