مرکزی مواد پر جائیں
OpenAI

۱۲ فروری، ۲۰۲۶

پروڈکٹریلیزکمپنی

GPT‑5.3‑Codex‑Spark کا تعارف

Codex میں ریئل ٹائم کوڈنگ کے لیے ایک الٹرا فاسٹ ماڈل۔

لوڈ ہو رہا ہے…

آج ہم GPT‑5.3‑Codex‑Spark کا ایک ریسرچ پری ویو ریلیز کر رہے ہیں، جو GPT‑5.3‑Codex کا ایک چھوٹا ورژن ہے، اور ہمارا پہلا ماڈل ہے جو real-time کوڈنگ کے لیے ڈیزائن کیا گیا ہے۔ Codex-Spark کو تقریباً فوری محسوس ہونے کے لیے بہتر بنایا گیا ہے—یہ 15 گنا تیز جنریشن اسپیڈ فراہم کرتا ہے جبکہ حقیقی دنیا کے کوڈنگ کاموں کے لیے بھی بہت قابلِ اعتماد رہتا ہے۔

Codex-Spark ہمارے Cerebras کے ساتھ شراکت میں پہلا سنگِ میل ہے، جس کا اعلان ہم نے جنوری میں کیا تھا۔ ہم Codex-Spark کو ChatGPT Pro صارفین کے لیے ایک ریسرچ پری ویو کے طور پر شیئر کر رہے ہیں تاکہ ڈویلپرز ابتدائی مرحلے میں ہی تجربات شروع کر سکیں، جبکہ ہم Cerebras کے ساتھ مل کر ڈیٹا سینٹر کی گنجائش بڑھانے، اینڈ ٹو اینڈ تجربے کو مزید مضبوط بنانے، اور اپنے بڑے جدید ترین ماڈل (فرنٹیئر) کو تعینات کرنے پر کام کر رہے ہیں۔

ہمارے جدید ترین فرنٹیئر ماڈلز نے طویل دورانیے کے کام انجام دینے کی صلاحیت میں خاص طور پر نمایاں کارکردگی دکھائی ہے، جہاں وہ بغیر کسی مداخلت کے گھنٹوں، دنوں بلکہ ہفتوں تک خود مختار طور پر کام کر سکتے ہیں۔ Codex-Spark ہمارا پہلا ماڈل ہے جو خاص طور پر Codex کے ساتھ ریئل ٹائم میں کام کرنے کے لیے ڈیزائن کیا گیا ہے—جس سے آپ ہدفی ترامیم کر سکتے ہیں، لاجک (منطق) کو نئی شکل دے سکتے ہیں، یا انٹرفیسز کو بہتر بنا سکتے ہیں اور نتائج فوراً دیکھ سکتے ہیں۔ Codex-Spark کے ساتھ Codex فیملی اب طویل المدت، بڑے پیمانے کے کاموں کے ساتھ ساتھ فوری طور پر کام نمٹانے کی صلاحیت بھی رکھتی ہے۔ ہمیں امید ہے کہ ہم ڈویلپرز کے استعمال کے طریقوں سے سیکھیں گے اور جیسے جیسے رسائی کو وسعت دیتے جائیں گے، ان کی آراء (فیڈبیک) کو بھی شامل کرتے رہیں گے۔

لانچ کے وقت، Codex-Spark میں 128k کانٹیکسٹ ونڈو ہے اور یہ صرف ٹیکسٹ پر مشتمل ہے. ریسرچ پری ویو کے دوران Codex-Spark کے لیے اپنی الگ ریٹ لِمٹس ہوں گی اور اس کا استعمال معیاری ریٹ لِمٹس میں شامل نہیں ہوگا۔ تاہم جب ڈیمانڈ زیادہ ہوتی ہے تو تمام صارفین کے لیے سسٹم کی قابلِ اعتماد کارکردگی برقرار رکھنے کے لیے آپ کو دھیمی رسائی یا عارضی قطار (کیوئنگ) کا سامنا کرنا پڑ سکتا ہے۔

اسپیڈ اور ذہانت

Codex-Spark کو انٹرایکٹو کام کے لیے بہتر بنایا گیا ہے جہاں تاخیر (latency) اتنی ہی اہمیت رکھتی ہے جتنی ذہانت۔ آپ اس ماڈل کے ساتھ بالکل ایک ریئل-ٹائم ساتھی کی طرح کام کر سکتے ہیں—جب یہ کام کر رہا ہو تو اسے درمیان میں روک سکتے ہیں یا نیا رخ دے سکتے ہیں، اور کسی مکمل عمل کے ختم ہونے کا انتظار کیے بغیر تیزی سے بار بار بہتری (اِٹریشن) کر سکتے ہیں۔ کیونکہ یہ اسپیڈ کے لیے موزوں ہے، Codex-Spark اپنے ڈیفالٹ کام کرنے کے انداز کو ہلکا رکھتا ہے: یہ کم سے کم اور مخصوص ترمیم کرتا ہے، اس کے علاوہ خود بخود ٹیسٹ نہیں چلاتا جب تک کہ آپ اسے نہ کہیں۔

کوڈنگ

Codex-Spark ایک انتہائی قابل چھوٹا ماڈل ہے جو تیز انفیرنس کے لیے بہتر بنایا گیا ہے۔ SWE-Bench Pro اور Terminal-Bench 2.0، جو ایجنٹک سافٹ ویئر انجینئرنگ کی صلاحیتوں کو جانچنے والے دو معیار ہیں، پر GPT‑5.3‑Codex‑Spark بعض جگہوں پر GPT‑5.3‑Codex جتنا مضبوط نہیں دکھائی دیتا، لیکن وہ کام کو مکمل کرنے میں بہت کم وقت لیتا ہے۔

مدّت کا اندازہ درج ذیل اجزا کے مجموعے سے لگایا جاتا ہے:(1) آؤٹ پُٹ تیار کرنے کا وقت (آؤٹ پُٹ ٹوکنز ÷ سیمپلنگ اسپیڈ)،(2) پری فل ٹائم (پری فل ٹوکنز ÷ پری فل اسپیڈ)،(3) ٹولز کے کل نفاذ کا وقت،اور (4) نیٹ ورک اوورہیڈ کا مجموعی وقت۔

تمام ماڈلز کی تاخیر (لیٹنسی) میں بہتری

جب ہم نے Codex-Spark کو تربیت دی، تو یہ بات واضح ہو گئی کہ ماڈل کی رفتار صرف real-time تعاون کے لیے حل کا ایک حصہ ہے—ہمیں پورے درخواست-جواب کے عمل میں latency کو کم کرنے کی ضرورت بھی تھی تاکہ سسٹم زیادہ تیز اور جواب دینے میں مؤثر ہو سکے۔ ہم نے اپنے ہارنس میں اینڈ-ٹو-اینڈ لیٹنسی میں بہتریاں نافذ کیں جو تمام ماڈلز کے لیے فائدہ مند ہیں۔ پسِ منظر میں ہم نے کلائنٹ سے سَرور اور پھر واپس جوابات کے بہاؤ (اسٹریملائن) کو زیادہ ہموار بنایا، اپنے اِنفرنس اسٹیک کے اہم حصوں کو دوبارہ لکھا، اور سیشنز کے آغاز کے طریقۂ کار کو ازسرِنو ترتیب دیا تاکہ پہلا نمایاں ٹوکن زیادہ جلدی ظاہر ہو اور آپ کے بار بار تجربات کے دوران Codex مسلسل تیز اور مؤثر ردِعمل دیتا رہے۔ مسلسل WebSocket کنکشن کے تعارف اور Responses API کے اندر مخصوص اصلاحات کے ذریعے ہم نے ہر کلائنٹ/سرور راؤنڈ ٹرِپ پر اوورہیڈ میں 80%، ہر ٹوکن پر اوورہیڈ میں 30%، اور پہلے ٹوکن تک پہنچنے کے وقت میں 50% کمی کی ہے۔ آپ چاہے کوئی بھی ماڈل منتخب کریں، آپ پورے Codex تجربے میں ایک زیادہ مربوط لوپ کا تجربہ کریں گے۔

Cerebras کی طاقت سے چلنے والا

Codex-Spark ،Cerebras کے Wafer Scale Engine 3(نئی ونڈو میں کھلتا ہے)پر چلتا ہے—یہ تیز رفتار انفیرنس کے لیے خاص طور پر تیار کردہ AI ایکسیلیریٹر ہے جو Codex کو لیٹنسی-فرسٹ سرونگ ٹئیر فراہم کرتا ہے۔ ہم نے Cerebras کے ساتھ شراکت کی ہے تاکہ اسی پروڈکشن سروسنگ اسٹیک میں یہ کم لیٹنسی راستہ شامل کیا جا سکے جو ہماری باقی فلیٹ کے لیے استعمال ہوتا ہے، تاکہ یہ Codex میں بغیر رکاوٹ کام کرے اور ہم مستقبل کے ماڈلز کی سپورٹ کے لیے بھی مضبوط بنیاد قائم کر سکیں۔

“GPT-5.3-Codex-Spark کے بارے میں ہم سب سے زیادہ پُرجوش اس بات کے لئے ہیں کہ ہم OpenAI اور ڈویلپر کمیونٹی کے ساتھ شراکت داری کریں تاکہ دریافت کر سکیں کہ تیز اِنفرنس کیا ممکن بناتا ہے—نئے تعامل کے پیٹرنز، نئے استعمال کے کیسز، اور ایک بنیادی طور پر مختلف ماڈل تجربہ۔ یہ پریویو صرف آغاز ہے۔”
— شان لی، سی ٹی او اور شریک بانی (Co-Founder)، Cerebras

GPUs ہماری تربیتی اور استنباطی پائپ لائنز میں بنیادی حیثیت رکھتے ہیں اور وسیع پیمانے پر استعمال کے لیے سب سے کم لاگت والے ٹوکن فراہم کرتے ہیں۔ Cerebras اس بنیاد کو مکمل (complement) کرتا ہے کیونکہ وہ اُن ورک فلوز میں بہترین کارکردگی دکھاتا ہے جہاں انتہائی کم لیٹنسی (تاخیر) کی ضرورت ہوتی ہے، اور پورے اینڈ ٹو اینڈ عمل کو مزید مضبوط بناتا ہے تاکہ آپ بار بار تجربات کرتے ہوئے Codex کو زیادہ تیز اور جواب دینے میں مؤثر محسوس کریں۔

دستیابی اور تفصیلات

Codex-Spark آج Codex ایپ، CLI، اور VS Code ایکسٹینشن کے تازہ ترین ورژنز میں تمام ChatGPT Pro صارفین کے لیے ایک ریسرچ پریویو کے طور پر لانچ ہو رہا ہے۔ چونکہ یہ مخصوص کم لیٹنسی ہارڈویئر پر چلتا ہے، اس لیے اس کا استعمال ایک علیحدہ ریٹ لِمٹ کے تحت ہوتا ہے جو ریسرچ پری ویو کے دوران طلب کے مطابق ایڈجسٹ ہو سکتی ہے۔ اس کے علاوہ، ہم Codex-Spark کو API میں ڈیزائن پارٹنرز کے ایک چھوٹے سے گروپ کے لیے دستیاب کر رہے ہیں تاکہ یہ سمجھا جا سکے کہ ڈویلپرز Codex-Spark کو اپنی مصنوعات میں کیسے ضم کرنا چاہتے ہیں۔ ہم آنے والے ہفتوں میں رسائی کو بتدریج وسیع کریں گے، جبکہ حقیقی ورک لوڈز کے تحت اپنی انٹیگریشن کو مزید بہتر بناتے رہیں گے۔

Codex-Spark اس وقت 128k کانٹیکسٹ ونڈو کے ساتھ صرف ٹیکسٹ پر مبنی ہے اور یہ ultra-fast ماڈلز کی فیملی کا پہلا ماڈل ہے۔ جیسے جیسے ہم ڈویلپر کمیونٹی کے ساتھ یہ سیکھتے جائیں گے کہ تیز رفتار ماڈلز کوڈنگ میں کن مواقع پر سب سے بہتر کارکردگی دکھاتے ہیں، ہم مزید صلاحیتیں متعارف کرائیں گے—جن میں بڑے ماڈلز، طویل کانٹیکسٹ لمبائیاں (lengths)، اور ملٹی موڈل اِن پُٹ بھی شامل ہوں گے۔

Codex-Spark میں ہمارے مرکزی ماڈلز کی طرح ہی حفاظتی تربیت شامل ہے، جس میں سائبر سے متعلق تربیت بھی شامل ہے۔ ہم نے Codex-Spark کو اپنے معیاری تعیناتی عمل کے تحت جانچا، جس میں سائبر سیکیورٹی اور دیگر صلاحیتوں کے لیے بنیادی جائزے شامل ہوتے ہیں، اور یہ نتیجہ اخذ کیا کہ اس کے سائبر سیکیورٹی میں اعلیٰ صلاحیت کے لیے ہمارے پریفرنس فائن-ٹیوننگ کی حد تک پہنچنے کا کوئی قابلِ اعتبار امکان نہیں ہے۔

اگلا قدم کیا ہے

Codex-Spark دو تکمیلی موڈز والے Codex کی طرف پہلا قدم ہے: طویل المدتی ریزننگ اور عمل درآمد، اور تیز رفتار تکرار کے لیے حقیقی وقت (ریئل-ٹائم) میں تعاون۔ وقت کے ساتھ یہ موڈز باہم یکجا ہوتے جائیں گے—Codex آپ کو ایک قریبی اور مسلسل تعاملاتی عمل میں مصروف رکھ سکتا ہے جبکہ پسِ منظر میں طویل دورانیے کے کام ذیلی ایجنٹس کو سونپ دے، یا جب آپ کو وسعت اور رفتار درکار ہو تو متعدد ماڈلز کو بیک وقت متوازی طور پر کام پر لگا دے، تاکہ آپ کو ابتدا ہی میں کسی ایک موڈ کا انتخاب نہ کرنا پڑے۔

جیسے جیسے ماڈلز زیادہ طاقتور بنتے جا رہے ہیں، تعامل کی رفتار ایک واضح رکاوٹ (باٹل نیک) بن رہی ہے۔ الٹرا-فاسٹ اِنفرنس اس عمل (لوپ) کو مزید مضبوط بناتا ہے، جس سے Codex استعمال کرنے میں زیادہ فطری محسوس ہوتا ہے اور کسی بھی شخص کے آئیڈیا کو کام کرنے والے سافٹ ویئر میں تبدیل کرنا ممکن بناتا ہے۔

مصنف

OpenAI