نُقدّم نموذجًا جديدًا يفتح آفاقًا أوسع لقدرات Codex: GPT‑5.3‑Codex، وهو أقوى نموذج برمجة وكيلّي حتى اليوم. يجمع GPT‑5.3‑Codex بين الأداء المتقدّم في البرمجة الذي يقدّمه GPT‑5.2‑Codex وبين قدرات الاستدلال والمعرفة المهنية في GPT‑5.2 ضمن نموذج واحد، مع أداء أسرع بنسبة 25%. ويُمكّنه ذلك من تنفيذ مهام طويلة الأمد تشمل البحث، واستخدام الأدوات، والتنفيذ المعقّد. تمامًا مثل الزميل في العمل، يمكنك توجيه GPT‑5.3‑Codex والتفاعل معه أثناء عمله دون فقدان للسياق.
يُعدّ GPT‑5.3‑Codex أول نموذج لدينا لعب دورًا محوريًا في تطوير نفسه. فقد استخدم فريق Codex إصدارات مبكرة منه لتصحيح أخطاء تدريبه، وإدارة نشره، وتشخيص نتائج الاختبارات والتقييمات. وقد أُعجب فريقنا إلى حدّ كبير بمدى قدرة Codex على تسريع عملية تطويره الذاتية.
مع GPT‑5.3‑Codex، ينتقل Codex من كونه وكيلًا يكتب الشيفرة ويُراجعها إلى وكيل قادر على إنجاز معظم ما يستطيع المطوّرون والمهنيون القيام به على الحاسوب.
يُسجّل GPT‑5.3‑Codex مستوىً رائدًا جديدًا في الصناعة على SWE-Bench Pro وTerminal-Bench، ويُظهر أداءً قويًا على OSWorld وGDPval—وهي أربعة معايير نستخدمها لقياس قدرات البرمجة، والعمل الوكيلي، والتعامل مع مهام العالم الحقيقي.
يحقق GPT‑5.3‑Codex أداءً متقدّمًا يُعدّ الأفضل حتى الآن على SWE-Bench Pro، وهو تقييم صارم لهندسة البرمجيات في بيئات واقعية. فبينما يقتصر SWE-Bench Verified على اختبار لغة Python فقط، يمتد SWE-Bench Pro ليشمل أربع لغات، ويتميّز بمقاومة أعلى لتلوّث البيانات، ومستوى تحدٍّ وتنوّع أكبر، وارتباط أوثق باحتياجات الصناعة. كما يتفوّق النموذج بشكل كبير على أفضل أداء سابق في Terminal-Bench 2.0، الذي يقيس مهارات التعامل مع الطرفية التي يحتاجها وكيل برمجي مثل Codex. واللافت أن GPT‑5.3‑Codex يحقق هذه النتائج باستخدام عدد أقل من الرموز مقارنة بأي نموذج سابق، ما يتيح للمستخدمين إنجاز المزيد بكفاءة أعلى.
من خلال الجمع بين قدرات البرمجة المتقدّمة، والتحسينات الجمالية، وتقنيات الضغط، يقدّم النموذج نتائج لافتة، حيث يستطيع بناء ألعاب وتطبيقات معقّدة وعالية الوظائف من الصفر على مدى أيام. ولاختبار قدراته في تطوير الويب والعمل الوكيلي طويل الأمد، طلبنا من GPT‑5.3‑Codex إنشاء لعبتين: الإصدار الثاني من لعبة السباق التي أُطلقت مع تطبيق Codex، ولعبة غوص. وباستخدام مهارة تطوير ألعاب الويب، مع مطالبات متابعة عامة ومحدّدة مسبقًا مثل 'إصلاح الخلل' أو 'تحسين اللعبة'، واصل GPT‑5.3‑Codex تطوير الألعاب ذاتيًا عبر ملايين الرموز. شاهد المقاطع الترويجية وجرّب اللعب بنفسك لتتعرّف على ما يستطيع Codex إنجازه.
لعبة سباق متكاملة تضم متسابقين مختلفين، و8 مسارات لعب، بالإضافة إلى عناصر يمكن تفعيلها باستخدام زر المسافة. جرّبها بنفسك(يفتح في نافذة جديدة)!
لعبة غوص تستكشف فيها شعابًا مرجانية متنوّعة، وتجمعها جميعًا لإكمال سجلّ الأسماك الخاص بك، مع إدارة الأكسجين والضغط والمخاطر طوال الرحلة. جرّبها بنفسك(يفتح في نافذة جديدة)!
وإلى جانب ذلك، يُظهر GPT‑5.3‑Codex فهمًا أفضل لنيّتك عند طلب إنشاء مواقع ويب يومية مقارنةً بـ GPT‑5.2‑Codex. فالمطالبات البسيطة أو غير المحدّدة تنتج الآن مواقع أكثر اكتمالًا، مع وظائف افتراضية منطقية، ما يمنحك نقطة انطلاق أقوى لتحويل أفكارك إلى واقع.
على سبيل المثال، طلبنا من GPT‑5.3‑Codex وGPT‑5.2‑Codex إنشاء صفحتَي هبوط. قام GPT‑5.3‑Codex تلقائيًا بعرض الخطة السنوية كسعر شهري مخفّض، ما جعل الخصم واضحًا ومقصودًا بدل الاكتفاء بضرب الإجمالي السنوي. كما أنشأ شريط آراء عملاء متحركًا تلقائيًا يضم ثلاثة اقتباسات مختلفة بدل اقتباس واحد، لينتج عن ذلك صفحة تبدو أكثر اكتمالًا وجاهزية للإنتاج بشكل افتراضي.
مطالبة: أنشئ صفحة هبوط لـ Quiet KPI، وهي نشرة أسبوعية ودّية للمؤسسين تلخّص المقاييس الأساسية. الطابع البصري والجمالي: أسلوب SaaS ناعم، بطاقات زجاجية، تدرّج لوني من البنفسجي الفاتح إلى الأزرق، وتمويه خفيف. الأقسام، قسم رئيسي (Hero) مع نموذج إدخال البريد الإلكتروني، شبكة بطاقات لتقارير نموذجية، صف التكاملات، شريط متحرّك لآراء العملاء، قسم التسعير مع مفتاح تبديل شهري/سنوي، الأسئلة الشائعة، التذييل.
- استخدام خط Satoshi أو خط هندسي sans مشابه.
- أزرار بحواف ناعمة، نصف قطر 14 بكسل، مع حالات تركيز واضحة وقوية.
- إضافة تأثير كشف واحد أنيق يعتمد على التمرير.
لا يقتصر عمل مهندسي البرمجيات والمصممين ومديري المنتجات وعلماء البيانات على كتابة الشيفرة فقط. فقد صُمّم GPT‑5.3‑Codex لدعم كامل دورة حياة العمل البرمجي—من تصحيح الأخطاء والنشر والمراقبة، إلى كتابة وثائق المتطلبات (PRDs)، وتحرير النصوص، وأبحاث المستخدمين، والاختبارات، وقياس المؤشرات، وغير ذلك. وتمتد قدراته الوكيلية إلى ما هو أبعد من البرمجيات، لمساعدتك على بناء وتطوير أي شيء تريد، سواء كانت عروضًا تقديمية أو تحليل بيانات في جداول.
بفضل مهارات مخصصة مشابهة لتلك المستخدمة في نتائج GDPval السابقة، يُظهر GPT‑5.3‑Codex أيضًا أداءً قويًا في العمل المعرفي الاحترافي وفق مقياس GDPval، مما يجعله يضاهي GPT‑5.2. ويُعدّ GDPval تقييمًا أطلقته OpenAI في عام 2025 لقياس أداء النماذج في مهام معرفية محدّدة بوضوح عبر 44 مهنة، وتشمل مهام مثل إعداد العروض التقديمية، وجداول البيانات، وغيرها من مخرجات العمل المهني.
فيما يلي بعض الأمثلة على الأعمال التي أنجزها الوكيل.
مطالبة + سياق المهمة
GPT-5.3-Codex output

يُعدّ OSWorld معيارًا لقياس استخدام الحاسوب بأسلوب وكيلي، حيث يُطلب من الوكيل إتمام مهام إنتاجية داخل بيئة حاسوب مكتبي مرئية. ويُظهر GPT‑5.3‑Codex قدرات أقوى بكثير في استخدام الحاسوب مقارنةً بنماذج GPT السابقة.
في OSWorld-Verified، تستخدم النماذج الرؤية لإنجاز مهام حاسوبية متنوّعة، بينما يحقّق البشر دقّة تقارب ~72٪.
وتُبيّن هذه النتائج مجتمعة، عبر البرمجة، والواجهات الأمامية، واستخدام الحاسوب، ومهام العالم الحقيقي، أن GPT‑5.3‑Codex لا يقدّم تحسينات على مهام فردية فحسب، بل يمثّل نقلة نوعية نحو وكيل عام واحد قادر على الاستدلال والبناء والتنفيذ عبر كامل نطاق العمل التقني الواقعي.
مع ازدياد قدرات النماذج، لم يعد جوهر التحدّي مرتبطًا بما يستطيع الوكلاء إنجازه، بل بمدى سهولة تفاعل البشر معهم وتوجيههم والإشراف على أعداد كبيرة منهم تعمل بالتوازي. يسهّل تطبيق Codex إدارة الوكلاء وتوجيههم، ومع GPT‑5.3‑Codex أصبح التفاعل أكثر سلاسة. فمع النموذج الجديد، يقدّم Codex تحديثات متكرّرة تُبقيك على اطّلاع بالقرارات الأساسية وتقدّم العمل أثناء التنفيذ. وبدل انتظار المخرجات النهائية، يمكنك التفاعل في اللحظة، لطرح الأسئلة، ومناقشة الأساليب، وتوجيه المسار نحو الحل. يشرح GPT‑5.3‑Codex ما يقوم به، ويستجيب للتغذية الراجعة، ويُبقيك في الصورة من البداية إلى النهاية.
فعّل التوجيه أثناء عمل النموذج داخل التطبيق ضمن الإعدادات > عام > سلوك المتابعة.
تعتمد التحسينات السريعة الأخيرة في Codex على نتائج أبحاث امتدّت لأشهر وسنوات ضمن مختلف فرق OpenAI. وقد أسهم Codex في تسريع هذه الأبحاث، حتى إن كثيرًا من الباحثين والمهندسين يصفون طبيعة عملهم اليوم بأنها مختلفة جذريًا عمّا كانت عليه قبل شهرين فقط. كما أظهرت الإصدارات المبكرة من GPT‑5.3‑Codex قدرات لافتة مكّنت الفريق من استخدامها لتحسين التدريب ودعم نشر الإصدارات اللاحقة.
وبفضل نطاق استخدامه الواسع، يصعب حصر جميع الطرق التي يدعم بها Codex فرقنا. فعلى سبيل المثال، استخدم فريق البحث Codex لمراقبة عملية التدريب وتشخيص مشكلاتها. ولم يقتصر دوره على تصحيح أعطال البنية التحتية، بل ساعد أيضًا في تتبّع الأنماط أثناء التدريب، وتقديم تحليلات معمّقة لجودة التفاعلات، واقتراح تحسينات، وبناء تطبيقات تُمكّن الباحثين من فهم الفروق السلوكية مقارنة بالنماذج السابقة بدقة.
وفي المقابل، استخدم فريق الهندسة Codex لتحسين أدوات الاختبار وتكييفها مع GPT‑5.3‑Codex. وعند ظهور حالات طرفية غير متوقعة أثّرت على المستخدمين، استعان الفريق بـ Codex لتحديد أخطاء عرض السياق وتشخيص أسباب انخفاض معدّلات الاستفادة من الذاكرة المؤقتة. وخلال الإطلاق، واصل GPT‑5.3‑Codex دعم الفريق عبر التوسّع الديناميكي لعناقيد وحدات المعالجة الرسومية لمواكبة فترات ذروة الطلب، والحفاظ على زمن استجابة مستقر.
أثناء اختبارات المرحلة التجريبية (Alpha)، أراد أحد الباحثين قياس مقدار العمل الإضافي الذي ينجزه GPT‑5.3‑Codex في كل تفاعل وتأثير ذلك على الإنتاجية. فأنشأ GPT‑5.3‑Codex مجموعة بسيطة من مصنّفات التعبيرات النمطية لتقدير معدّل طلبات التوضيح، والاستجابات الإيجابية والسلبية، وتقدّم المهام، ثم طبّقها على جميع سجلات الجلسات وأنتج تقريرًا بالنتائج. وأظهر ذلك تحسّنًا ملحوظًا في رضا المستخدمين، مع فهم أفضل للنية وتقدّم أكبر في كل تفاعل وعدد أقل من أسئلة التوضيح والاستفسارات.
وبسبب اختلاف GPT‑5.3‑Codex بشكل كبير عن أسلافه، أظهرت بيانات الاختبارات التجريبية نتائج غير مألوفة وأحيانًا غير متوقعة. وتعاون أحد علماء البيانات مع النموذج لبناء مسارات بيانات جديدة وتمثيل النتائج بصريًا بصورة أعمق مما تتيحه أدوات لوحات المتابعة التقليدية. ثم جرى تحليل النتائج بالتعاون مع Codex، الذي لخّص أهم الاستنتاجات عبر آلاف نقاط البيانات في أقل من ثلاث دقائق.
وبشكلٍ منفرد، تُعدّ كل واحدة من هذه المهام أمثلة لافتة على كيفية مساعدة Codex للباحثين وبُنّاة المنتجات. وعند النظر إليها مجتمعة، وجدنا أن هذه القدرات الجديدة أدّت إلى تسريع كبير لعمل فرق البحث والهندسة وتطوير المنتجات لدينا.
خلال الأشهر الماضية، شهدنا تحسّنًا ملموسًا في أداء النماذج على مهام الأمن السيبراني، بما يفيد المطوّرين ومتخصّصي الأمن على حدّ سواء. وبالتوازي، عملنا على إعداد ضوابط سيبرانية معزّزة لدعم الاستخدام الدفاعي وتعزيز مرونة المنظومة ككل.
يُعدّ GPT‑5.3‑Codex أول نموذج نصنّفه ضمن فئة القدرات العالية لمهام الأمن السيبراني وفق إطار الجاهزية لدينا، وأول نموذج ندرّبه مباشرة على تحديد ثغرات البرمجيات. ورغم عدم توفّر أدلّة قاطعة على قدرته على أتمتة الهجمات السيبرانية من البداية إلى النهاية، فإننا نتّبع نهجًا احترازيًا عبر نشر أشمل حزمة ضوابط أمان سيبراني لدينا حتى الآن. وتشمل إجراءات التخفيف التدريب على السلامة، والمراقبة الآلية، والوصول الموثوق للقدرات المتقدّمة، وخطوط إنفاذ تتضمن استخبارات التهديدات.
وبما أن الأمن السيبراني بطبيعته ثنائي الاستخدام، فإننا نعتمد نهجًا تكراريًا قائمًا على الأدلة يسرّع قدرة المدافعين على اكتشاف الثغرات ومعالجتها، مع إبطاء إساءة الاستخدام. وفي هذا الإطار، نطلق Trusted Access for Cyber الوصول الموثوق للأمن السيبراني، وهو برنامج تجريبي يهدف إلى تسريع أبحاث الدفاع السيبراني.
كما نستثمر في ضوابط على مستوى المنظومة، بما في ذلك توسيع النسخة التجريبية الخاصة من Aardvark، وهو وكيل أبحاث الأمن لدينا، كأول طرح ضمن مجموعة Codex Security من المنتجات والأدوات، إلى جانب الشراكة مع القائمين على صيانة المصادر المفتوحة لتقديم فحص مجاني لقواعد الشيفرة لمشاريع واسعة الانتشار مثل Next.js، حيث استخدم باحث أمني Codex لاكتشاف ثغرات كُشف(يفتح في نافذة جديدة) عنها الأسبوع الماضي.
وبناءً على برنامج منح الأمن السيبراني بقيمة مليون دولار الذي أطلقناه في عام 2023، نلتزم أيضًا بتقديم 10 ملايين دولار من أرصدة واجهات البرمجة (API) لتسريع الدفاع السيبراني باستخدام أقوى نماذجنا، لا سيما لمشاريع المصادر المفتوحة وأنظمة البنية التحتية الحيوية. ويمكن للجهات المنخرطة في أبحاث أمنية بحسن نية التقدّم بطلب للحصول على أرصدة API ودعم عبر برنامج منح الأمن السيبراني لدينا.
يتوفّر GPT‑5.3‑Codex ضمن خطط ChatGPT المدفوعة، وفي جميع الأماكن التي يمكن استخدام Codex فيها: التطبيق، وواجهة سطر الأوامر (CLI)، وإضافة بيئات التطوير (IDE)، والويب. ونعمل حاليًا على إتاحة الوصول الآمن عبر واجهة البرمجة (API) قريبًا.
ومع هذا التحديث، أصبح GPT‑5.3‑Codex أسرع بنسبة 25% لمستخدمي Codex، بفضل التحسينات في بنيتنا التحتية وطبقة الاستدلال، مما يؤدي إلى تفاعلات ونتائج أسرع.
وقد جرى التصميم المشترك والتدريب وتشغيل GPT‑5.3‑Codex على أنظمة NVIDIA GB200 NVL72. ونُعرب عن تقديرنا لشركة NVIDIA على شراكتها.
مع GPT‑5.3‑Codex، ينتقل Codex من مجرّد كتابة الشيفرة إلى استخدامها كأداة لتشغيل الحاسوب وإنجاز العمل من البداية إلى النهاية. ومن خلال توسيع حدود ما يمكن لوكيل برمجي القيام به، نفتح المجال أيضًا لفئة أوسع من أعمال المعرفة، من بناء البرمجيات ونشرها، إلى البحث والتحليل وتنفيذ المهام المعقّدة. وما بدأ كتركيز على أن نكون أفضل وكيل للبرمجة أصبح اليوم أساسًا لمتعاون عام على الحاسوب، يوسّع من نطاق من يستطيع البناء، ويزيد مما هو ممكن إنجازه باستخدام Codex.
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (عام) | 56.8% | 56.4% | 55.6% |
Terminal-Bench 2.0 | 77.3% | 64.0% | 62.2% |
OSWorld-Verified | 64.7% | 38.2% | 37.9% |
GDPval (الفوز أو التعادل) | 70.9% | - | 70.9% (high) |
تحدّيات CTF للأمن السيبراني | 77.6% | 67.4% | 67.7% |
SWE-lancer IC Diamond | 81.4% | 76.0% | 74.6% |


