تخطي إلى المحتوى الرئيسي
OpenAI

إطلاق GPT‑5.2‑Codex

أكثر نماذج البرمجة الوكيلية تطورًا المخصّصة لهندسة البرمجيات الاحترافية والأمن السيبراني الدفاعي.

نعلن اليوم عن إطلاق GPT‑5.2‑Codex، وهو أكثر نماذج البرمجة الوكيلية تقدّمًا حتى الآن للتعامل مع هندسة البرمجيات المعقّدة في العالم الحقيقي. ويُعد GPT‑5.2‑Codex إصدارًا من GPT‑5.2 جرى تحسينه بشكل خاص للبرمجة الوكيلية ضمن Codex، مع تطويرات تشمل أداءً أفضل في المهام طويلة الأمد عبر ضغط السياق، وقدرة أقوى على تنفيذ التغييرات الكبيرة في الشيفرة مثل إعادة الهيكلة وعمليات الترحيل، وتحسينات في العمل ضمن بيئات Windows، إضافة إلى تعزيزات كبيرة في قدرات الأمن السيبراني.

مع استمرار نماذجنا في التقدّم على مسارات تطوّر الذكاء الاصطناعي، نلاحظ أن هذه التحسينات تقود أيضًا إلى قفزات نوعية في القدرات داخل مجالات متخصصة، وعلى رأسها الأمن السيبراني. فعلى سبيل المثال، تمكّن باحث أمني مؤخرًا، باستخدام GPT‑5.1‑Codex‑Max مع Codex CLI، من اكتشاف ثغرة في React وقام بالإفصاح المسؤول(يفتح في نافذة جديدة) عنها، وهي ثغرة قد تؤدي إلى كشف الشيفرة المصدرية.

يتمتع GPT‑5.2‑Codex بقدرات أقوى في مجال الأمن السيبراني مقارنةً بأي نموذج أطلقناه حتى الآن. ويمكن لهذه التطورات أن تسهم في تعزيز الأمن السيبراني على نطاق واسع، لكنها في الوقت نفسه تثير مخاطر جديدة ذات استخدام مزدوج تتطلب نشرًا مدروسًا بعناية. ومع أن GPT‑5.2‑Codex لا يصل إلى مستوى "عالٍ" من القدرات السيبرانية وفقًا لإطار الجاهزية لدينا، فإننا نصمّم نهج الإطلاق مع وضع النمو المستقبلي لهذه القدرات في الحسبان.

نُطلق اليوم GPT‑5.2‑Codex عبر جميع واجهات Codex لمستخدمي ChatGPT للخطط المدفوعة، ونعمل بالتوازي على تمكين الوصول الآمن إلى GPT‑5.2‑Codex لمستخدمي واجهة برمجة التطبيقات (API) خلال الأسابيع المقبلة. وفي الوقت نفسه، نُجري برنامج وصول موثوقًا قائمًا على الدعوات فقط لاختبار قدرات قادمة ونماذج أكثر مرونة، مخصّصة لمهنيين ومنظمات خضعوا للتحقق ويتركّز عملهم على الأمن السيبراني الدفاعي. ونرى أن هذا النهج في الإطلاق يحقق توازنًا مدروسًا بين إتاحة الوصول والحفاظ على معايير السلامة.

تعزيز حدود الابتكار في هندسة البرمجيات الواقعية

يعتمد GPT‑5.2‑Codex على نقاط القوة التي يتمتع بها GPT‑5.2 في أعمال المعرفة الاحترافية، وعلى قدرات GPT‑5.1‑Codex‑Max الرائدة في البرمجة الوكيلية والتفاعل مع الطرفية. ويعدّ GPT‑5.2‑Codex الآن أكثر كفاءة في فهم السياقات الطويلة، وأكثر موثوقية في استدعاء الأدوات، مع تحسّن في الدقّة الواقعية واعتماد الضغط الأصلي للسياق، ما يجعله شريكًا أكثر اعتمادًا للمهام البرمجية طويلة الأمد، مع الحفاظ في الوقت نفسه على كفاءة استخدام الرموز أثناء الاستدلال.

يحقق GPT‑5.2‑Codex أداءً من الطراز الأول على معياري SWE-Bench Pro وTerminal-Bench 2.0، وهما معياران صُمِّما لاختبار الأداء الوكيلي عبر طيف واسع من المهام ضمن بيئات طرفية واقعية. كما أصبح أكثر فاعلية وموثوقية في البرمجة الوكيلية ضمن بيئات Windows الأصلية، مستندًا إلى القدرات التي قُدّمت في GPT‑5.1‑Codex‑Max.

بفضل هذه التحسينات، أصبح Codex أكثر قدرة على العمل ضمن بيئات برمجية كبيرة وعلى مدى جلسات ممتدة مع الحفاظ الكامل على السياق. كما بات بإمكانه إنجاز مهام معقّدة مثل إعادة الهيكلة واسعة النطاق وترحيل الشيفرة وبناء الميزات بموثوقية أعلى، مع الاستمرار في التكرار والتحسين دون فقدان المسار، حتى عند تغيّر الخطط أو تعثّر بعض المحاولات.

في معيار SWE-Bench Pro، يتم تزويد النموذج ببيئة أكواد وعليه إنشاء تصحيح لحل مهمة هندسة برمجيات حقيقية. Terminal-Bench 2.0 هو معيار لاختبار وكلاء الذكاء الاصطناعي في البيئات الطرفية الفعلية. وتشمل المهام تجميع الأكواد، وتدريب النماذج، وإعداد الخوادم.

تعزّز قدرات الرؤية الأقوى في GPT‑5.2‑Codex دقته في تفسير لقطات الشاشة، والمخططات التقنية، والرسوم البيانية، وواجهات المستخدم التي تتم مشاركتها أثناء جلسات البرمجة.

يمكن لـ Codex تحويل نماذج التصميم الأولية بسرعة إلى نماذج وظيفية قابلة للتشغيل، كما يمكنك العمل معه بشكل تشاركي لتطوير هذه النماذج وصولًا إلى بيئة الإنتاج.

نموذج تصميم أولي
نموذج تصميم أولي يُستخدم لإنشاء نموذج ويب تجريبي باستخدام Codex-5.2
نموذج أوّلي تم إنشاؤه بواسطة GPT‑5.2‑Codex

الارتقاء بحدود الأمن السيبراني

عند تتبّع الأداء عبر الزمن على أحد تقييماتنا الأساسية في مجال الأمن السيبراني، نلاحظ قفزة واضحة في القدرات بدءًا من GPT‑5‑Codex، تلتها قفزة أخرى مع GPT‑5.1‑Codex‑Max، والآن قفزة ثالثة مع GPT‑5.2‑Codex. ونتوقع أن تواصل النماذج القادمة هذا المسار التصاعدي. واستعداداً لذلك، نقوم بالتخطيط والتقييم كما لو أن كل نموذج جديد يمكن أن يصل إلى مستويات "عالية" من قدرات الأمن السيبراني، كما تم قياسها من خلال إطار الجاهزية(يفتح في نافذة جديدة) الخاص بنا. ورغم أن GPT‑5.2‑Codex لم يصل بعد إلى هذا المستوى، فإننا نُهيّئ أنفسنا للنماذج المستقبلية التي قد تتجاوز هذا الحد. وبالنظر إلى تنامي القدرات السيبرانية، أضفنا إجراءات حماية إضافية على مستوى النموذج والمنتج، كما هو موضّح في بطاقة النظام.

يقيس تقييم Professional Capture-the-Flag (CTF) مدى تكرار قدرة النموذج على حل تحديات متقدمة ومتعددة الخطوات في العالم الحقيقي، والتي تتطلب مهارات احترافية في الأمن السيبراني، وذلك ضمن بيئة Linux.

القدرات السيبرانية في العالم الواقعي

يعتمد المجتمع الحديث على البرمجيات، وتقوم موثوقيته على أمن سيبراني قوي يحافظ على استمرارية الأنظمة الحيوية في القطاعات المصرفية والرعاية الصحية والاتصالات والخدمات الأساسية، ويحمي البيانات الحساسة، ويضمن ثقة الناس بالبرمجيات التي يعتمدون عليها يوميًا. وقد تبقى الثغرات موجودة لفترات طويلة قبل اكتشافها، كما أن العثور عليها والتحقق منها ومعالجتها يعتمد غالبًا على مجتمع من المهندسين وباحثي الأمن المستقلين المزوّدين بالأدوات المناسبة.

في 11 ديسمبر 2025، نشر فريق React ثلاث ثغرات أمنية تؤثر في التطبيقات المبنية باستخدام React Server Components. وما جعل هذا الكشف لافتًا لم يكن الثغرات بحد ذاتها فحسب، بل الطريقة التي تم بها اكتشافها.

كان أندرو ماكفيرسون، مهندس الأمن الرئيسي في شركة Privy (إحدى شركات Stripe)، يستخدم GPT‑5.1‑Codex‑Max مع Codex CLI ووكلاء برمجيين آخرين لإعادة إنتاج ودراسة ثغرة حرجة مختلفة في React جرى الإفصاح عنها في الأسبوع السابق، والمعروفة باسم React2Shell(يفتح في نافذة جديدة) (CVE-2025-55182(يفتح في نافذة جديدة)). وكان هدفه تقييم مدى قدرة النموذج على المساعدة في أبحاث الثغرات الأمنية في بيئات واقعية.

في البداية، أجرى عدة محاولات تحليلية دون أمثلة مسبقة، طالبًا من النموذج فحص التصحيح البرمجي وتحديد الثغرة التي يعالجها. وعندما لم تُسفر هذه المحاولات عن نتائج، انتقل إلى نهج تفاعلي أعلى كثافة يعتمد على التكرار. ولما لم تنجح تلك الأساليب أيضًا، وجّه Codex عبر سير عمل أمني دفاعي معياري، شمل إعداد بيئة اختبار محلية، وتحليل أسطح الهجوم المحتملة، واستخدام تقنيات fuzzing لاختبار النظام بمدخلات مشوّهة. وأثناء محاولته إعادة إنتاج مشكلة React2Shell الأصلية، كشف Codex عن سلوكيات غير متوقعة استدعت تحقيقًا أعمق. وخلال أسبوع واحد، أسفرت هذه العملية عن اكتشاف ثغرات غير معروفة سابقًا، جرى الإفصاح عنها بشكل مسؤول لفريق React.

مخطط بعنوان "اكتشاف الثغرات باستخدام Codex: ‏CVE-2025-55183" يوضّح سير عمل يبدأ بقاعدة تخزين الشيفرة Git، حيث يقوم Codex بفحص الشيفرة بحثًا عن ثغرات. تفشل محاولة التحليل دون أمثلة مسبقة، يليها مسار موجّه بخبرة بشرية يتضمّن فحص قاعدة الشيفرة، وتحديد الأهداف المحتملة، وبناء إطار اختبار، وإجراء اختبارات مدخلات عشوائية على تطبيق نموذجي مع إعادة التحقّق. تُراجَع النتائج للتحقق منها وإنشاء إثبات مفهوم، ما يقود إلى الإفصاح المسؤول عن الثغرة وتطبيق تصحيح يُعاد دمجه في قاعدة تخزين الشيفرة.

يُظهر ذلك كيف يمكن لأنظمة الذكاء الاصطناعي المتقدمة أن تُسرّع بشكل ملموس أعمال الأمن الدفاعي في برمجيات واسعة الاستخدام وفي العالم الحقيقي. وفي الوقت نفسه، فإن القدرات التي تساعد المدافعين على العمل بوتيرة أسرع قد يُساء استخدامها أيضًا من قِبل جهات خبيثة.

ومع تزايد قدرات الأنظمة الوكيلية في المهام المرتبطة بالأمن السيبراني، نضع في صميم أولوياتنا ضمان نشر هذه التطورات بشكل مسؤول، عبر موازنة كل تحسّن في القدرات بضمانات أقوى، وضوابط وصول أشد إحكامًا، وتعاون مستمر مع مجتمع الأمن السيبراني.

تعزيز الدفاع السيبراني من خلال الوصول الموثوق

قد تواجه فرق الأمن قيودًا عند محاولة محاكاة جهات التهديد، أو تحليل البرمجيات الخبيثة لدعم جهود المعالجة، أو إجراء اختبارات ضغط للبنى التحتية الحرجة. ولهذا نعمل على تطوير برنامج وصول موثوق تجريبي يهدف إلى إزالة هذه العوائق للمستخدمين والمنظمات المؤهّلة، وتمكين المدافعين الموثوقين من الاستفادة من قدرات الذكاء الاصطناعي المتقدمة في الأمن السيبراني لتسريع جهود الدفاع السيبراني.

في المرحلة الأولى، سيكون البرنامج التجريبي متاحًا بالدعوة فقط لمهنيي الأمن الذين خضعوا للتحقق ولديهم سجل مثبت في الإفصاح المسؤول عن الثغرات، وكذلك للمنظمات التي تمتلك حالات استخدام مهنية واضحة في مجال الأمن السيبراني. وسيحصل المشاركون المؤهَّلون على إمكانية الوصول إلى أقوى نماذجنا للاستخدامات الدفاعية، بما يتيح تنفيذ أعمال الاستخدام المزدوج المشروعة بصورة مسؤولة.

إذا كنت مختصًا في الأمن السيبراني أو جزءًا من مؤسسة تمارس أعمالًا أمنية أخلاقية، مثل أبحاث الثغرات أو اختبارات التحدي (red-teaming) المصرّح بها، ندعوك إلى إبداء اهتمامك بالانضمام ومشاركة ملاحظاتك حول ما تودّ رؤيته من هذا البرنامج(يفتح في نافذة جديدة).

نتائج

يُمثّل GPT‑5.2‑Codex خطوة متقدمة في كيفية دعم الذكاء الاصطناعي المتطور لهندسة البرمجيات في العالم الحقيقي وللمجالات المتخصصة مثل الأمن السيبراني، إذ يساعد المطوّرين والمدافعين على التعامل مع الأعمال المعقّدة وطويلة الأمد، ويعزّز الأدوات المتاحة لإجراء أبحاث أمنية مسؤولة.

من خلال إطلاق GPT‑5.2‑Codex تدريجيًا، وإقران الإطلاق بضوابط حماية مناسبة، والعمل عن كثب مع مجتمع الأمن، نسعى إلى تعظيم الأثر الدفاعي مع تقليل مخاطر سوء الاستخدام. وما سنتعلّمه من هذا الإطلاق سيسهم مباشرة في توجيه كيفية توسيع نطاق الوصول بمرور الوقت، مع استمرار تقدّم آفاق البرمجيات والأمن السيبراني.

المؤلف

OpenAI