اليوم، نُطلق معاينة بحثية لنموذج GPT‑5.3‑Codex‑Spark، وهو إصدار أصغر من GPT‑5.3‑Codex وأول نموذج نصمّمه خصيصًا للبرمجة الفورية. ويمثّل Codex-Spark أول محطة بارزة في شراكتنا مع Cerebras، التي أعلنا عنها في يناير. وقد جرى تحسين هذا النموذج ليقدّم استجابة شبه فورية عند تشغيله على أجهزة بزمن استجابة منخفض للغاية، حيث يتجاوز معدل التوليد 1000 رمز في الثانية، مع الحفاظ على مستوى عالٍ من الكفاءة في تنفيذ مهام البرمجة الواقعية.
نُشارك Codex-Spark على Cerebras كمعاينة بحثية لمستخدمي ChatGPT Pro، لتمكين المطورين من بدء التجربة مبكرًا، بينما نعمل مع Cerebras على زيادة سعة مراكز البيانات، وتحسين تجربة المستخدم الشاملة، ونشر نماذجنا رائد الأكبر.
أظهرت أحدث نماذجنا الرائدة قدرات متميزة في تنفيذ المهام طويلة الأمد، إذ يمكنها العمل بشكل مستقل لساعات أو أيام أو حتى أسابيع من دون تدخل. أما Codex-Spark فهو أول نموذج نصممه خصيصًا للعمل مع Codex بشكل مباشر وفوري، بما يتيح إجراء تعديلات دقيقة، وإعادة صياغة المنطق البرمجي، أو تحسين الواجهات، مع رؤية النتائج فورًا. وبفضل Codex-Spark، أصبح Codex يدعم اليوم كلًا من المهام الطموحة طويلة المدى وإنجاز العمل لحظة حدوثه. ونتطلع إلى التعلّم من كيفية استخدام المطورين لهذا النموذج، والاستفادة من ملاحظاتهم بينما نواصل توسيع نطاق الوصول إليه.
عند الإطلاق، يتمتع Codex-Spark بسياق يصل إلى 128 ألف رمز، ويعمل بنمط نصّي فقط. وخلال فترة المعاينة البحثية، ستكون لـ Codex-Spark حدود استخدام مستقلة، ولن يُحتسب استخدامه ضمن الحدود القياسية المعتادة. ومع ذلك، عندما يكون الطلب مرتفعًا، قد تلاحظ وصولًا محدودًا أو انتظارًا مؤقتًا، وذلك لضمان استقرار الخدمة لجميع المستخدمين.
صُمّم Codex-Spark ليخدم أسلوب العمل التفاعلي الذي تُعد فيه سرعة الاستجابة عاملًا لا يقل أهمية عن الذكاء. ويمكنك التعاون مع النموذج بشكل مباشر أثناء عمله، مع إمكانية مقاطعته أو إعادة توجيهه، والتكرار بسرعة استنادًا إلى استجابات شبه فورية. وبفضل ضبطه لتحقيق أعلى سرعة ممكنة، يحافظ Codex-Spark افتراضيًا على أسلوب عمل خفيف؛ فهو يُجري تعديلات محدودة وموجّهة بدقة، ولا يشغّل الاختبارات تلقائيًا ما لم تطلب ذلك صراحةً.
يُعدّ Codex-Spark نموذجًا صغيرًا عالي الكفاءة، جرى تحسينه لتحقيق استدلال سريع. وفي اختباري SWE-Bench Pro وTerminal-Bench 2.0، وهما معياران لتقييم قدرات هندسة البرمجيات القائمة على الوكلاء، يُظهر GPT‑5.3‑Codex‑Spark أداءً قويًا مع إنجاز المهام في وقت قصير مقارنةً بـ GPT‑5.3‑Codex.
تُقدَّر المدة الإجمالية باعتبارها مجموع: (1) وقت توليد المخرجات (عدد رموز الإخراج ÷ سرعة التوليد)، و(2) وقت التهيئة المسبقة (عدد رموز التهيئة ÷ سرعة التهيئة)، و(3) إجمالي وقت تنفيذ الأدوات، و(4) إجمالي زمن الحمل الزائد للشبكة.
أثناء تدريب Codex-Spark، تبيّن أن سرعة النموذج وحدها لا تكفي لتحقيق تعاون تفاعلي فعّال؛ بل كان من الضروري أيضًا تقليل زمن الاستجابة عبر سلسلة الطلب والاستجابة بالكامل. لذلك، نفّذنا تحسينات شاملة على مستوى البنية عبر جميع المراحل، بما يعود بالتأكيد بالفائدة على جميع النماذج. وعلى المستوى التقني، قمنا بتبسيط آلية تدفّق الاستجابات بين العميل والخادم، وإعادة كتابة مكوّنات رئيسية في طبقة الاستدلال، وتحسين طريقة تهيئة الجلسات بحيث يظهر أول رمز مرئي بسرعة أكبر، ويظل Codex مستجيبًا أثناء التكرار والتعديل. كما أسهم اعتماد اتصال WebSocket دائم وتحسينات موجّهة داخل Responses API في خفض العبء لكل جولة اتصال بين العميل والخادم بنسبة 80%، وتقليل العبء لكل رمز بنسبة 30%، وتقليص زمن الوصول إلى أول رمز بنسبة 50%. ويتم تفعيل مسار WebSocket بشكل افتراضي في Codex-Spark، وسيصبح قريبًا المسار الافتراضي لجميع النماذج.
يعمل Codex-Spark على معالج Wafer Scale Engine 3(يفتح في نافذة جديدة) من Cerebras، وهو مسرّع ذكاء اصطناعي صُمّم خصيصًا لتحقيق استدلال عالي السرعة، ويوفّر طبقة تشغيل تركّز على تقليل زمن الاستجابة. وقد تعاونّا مع Cerebras لإضافة هذا المسار منخفض الكمون إلى بيئة التشغيل الإنتاجية نفسها التي تخدم بقية نماذجنا، بما يضمن عمله بسلاسة ضمن منظومة Codex، ويهيّئ البنية لدعم النماذج المستقبلية.
“ما يثير حماسنا أكثر في GPT-5.3-Codex-Spark هو شراكتنا مع OpenAI ومع مجتمع المطورين لاكتشاف الإمكانات التي يفتحها الاستدلال السريع، بما في ذلك أنماط تفاعل جديدة، وحالات استخدام مبتكرة، وتجربة نموذج مختلفة جذريًا. هذه المعاينة ليست سوى البداية.“
تظل وحدات معالجة الرسومات (GPUs) ركيزة أساسية في مسارات التدريب والاستدلال لدينا، إذ توفّر أعلى كفاءة من حيث التكلفة لكل رمز عند الاستخدام واسع النطاق. ويأتي دور Cerebras ليكمل هذه البنية، حيث يتفوّق في سير العمل الذي يتطلّب زمن استجابة منخفضًا للغاية، مما يختصر دورة الطلب والاستجابة ويجعل Codex أكثر سرعة واستجابة أثناء التكرار والتعديل. كما يمكن الجمع بين وحدات معالجة الرسوميات وتقنيات Cerebras ضمن عبء عمل واحد لتحقيق أفضل أداء ممكن.
يبدأ اليوم طرح Codex-Spark كمعاينة بحثية لمستخدمي ChatGPT Pro، وذلك ضمن أحدث إصدارات تطبيق Codex وواجهة سطر الأوامر (CLI) وإضافة VS Code. ونظرًا لاعتماده على أجهزة متخصصة منخفضة زمن الاستجابة، يخضع استخدامه لحدود منفصلة قد تُعدَّل بحسب مستوى الطلب خلال فترة المعاينة البحثية. كما نتيح Codex-Spark عبر واجهة API لعدد محدود من شركاء التصميم، بهدف فهم كيفية رغبة المطورين في دمجه داخل منتجاتهم. وسنوسّع نطاق الوصول خلال الأسابيع المقبلة، مع استمرار تطوير التكامل واختباره تحت ظروف استخدام حقيقية.
يعمل Codex-Spark حاليًا بنمط نصّي فقط، مع نافذة سياق تبلغ 128 ألف رمز، وهو الأول ضمن عائلة من النماذج فائقة السرعة. ومع تعلّمنا من مجتمع المطورين حول المجالات التي تتألق فيها النماذج السريعة في البرمجة، سنضيف قدرات إضافية، بما في ذلك نماذج أكبر، ونوافذ سياق أطول، ودعم إدخال متعدد الأنماط.
يتضمّن Codex-Spark تدريبات السلامة نفسها المعتمدة في نماذجنا الرئيسية، بما في ذلك التدريب المرتبط بجوانب الأمن السيبراني. وقد خضع Codex-Spark للتقييم ضمن عملية النشر القياسية لدينا، والتي تشمل اختبارات مرجعية أساسية في مجالات الأمن السيبراني وغيرها من القدرات. وبناءً على هذه التقييمات، تبيّن أنه لا توجد احتمالية معقولة لبلوغه العتبة المحددة في إطار الجاهزية لدينا فيما يتعلق بمستويات القدرة العالية في مجالي الأمن السيبراني أو الأحياء.
يمثّل Codex-Spark الخطوة الأولى نحو Codex يعمل بنمطين متكاملين: نمط يركّز على الاستدلال والتنفيذ عبر أفق زمني أطول، ونمط يتيح تعاونًا تفاعليًا سريعًا لدعم التكرار السريع. ومع مرور الوقت، سيتداخل هذان النمطان تدريجيًا؛ إذ سيتمكن Codex من إبقائك ضمن حلقة تفاعلية ضيقة وسريعة، بينما يُفوّض المهام الأطول زمنًا إلى وكلاء فرعيين يعملون في الخلفية، أو يوزّع المهام على عدة نماذج بالتوازي عندما تحتاج إلى اتساع النطاق والسرعة. وبهذا، لن تضطر إلى اختيار نمط واحد مسبقًا.
كلما أصبحت النماذج أكثر قدرة، تصبح سرعة التفاعل عائقًا واضحًا. ويسهم الاستدلال فائق السرعة في تضييق هذه الحلقة، مما يجعل استخدام Codex أكثر طبيعية، ويوسّع نطاق الإمكانات أمام كل من يسعى إلى تحويل فكرة إلى برنامج يعمل.


