تخطي إلى المحتوى الرئيسي
OpenAI

23 أبريل 2026

المنتجإصدار

إطلاق GPT‑5.5

فئة جديدة من الذكاء للعمل الحقيقي

جاري التحميل...

تحديث بتاريخ 24 أبريل 2026: أصبحا GPT‑5.5 وGPT‑5.5 Pro متاحين الآن في واجهة برمجة التطبيقات. بطاقة النظام تم أيضًا تحديثها لتوضيح وسائل الحماية الإضافية المطبّقة.


نطلق اليوم GPT‑5.5، وهو أذكى نماذجنا حتى الآن وأكثرها سلاسة في الاستخدام، ويمثل الخطوة التالية نحو أسلوب جديد لإنجاز العمل على الكمبيوتر.

يفهم GPT‑5.5 ما تحاول إنجازه بسرعة أكبر، ويمكنه تولي جزء أكبر من العمل بنفسه. فهو يتفوق في كتابة الشيفرة وتصحيحها، والبحث على الإنترنت، وتحليل البيانات، وإنشاء المستندات وجداول البيانات، وتشغيل البرامج، والتنقل بين الأدوات إلى أن تكتمل المهمة. وبدلًا من إدارة كل خطوة بعناية، يمكنك أن تسند إلى GPT‑5.5 مهمة معقدة ومتعددة الأجزاء وغير مرتبة تمامًا، وتثق بقدرته على التخطيط، واستخدام الأدوات، والتحقق من عمله، والتعامل مع الغموض، ومواصلة التقدم.

وتظهر هذه المكاسب بوضوح أكبر في البرمجة الوكيلية، واستخدام الكمبيوتر، والعمل المعرفي، والأبحاث العلمية المبكرة، وهي مجالات يعتمد فيها التقدم على الاستدلال عبر السياق واتخاذ الإجراءات بمرور الوقت. ويقدم GPT‑5.5 هذه النقلة في الذكاء من دون التفريط في السرعة. فالنماذج الأكبر والأكثر قدرة تكون غالبًا أبطأ في التقديم، لكن GPT‑5.5 يضاهي GPT‑5.4 في زمن الاستجابة لكل رمز في الاستخدام الواقعي، مع أداء أعلى بكثير على مستوى الذكاء. كما يستخدم عددًا أقل بكثير من الرموز لإكمال مهام Codex نفسها، مما يجعله أكثر كفاءة وأكثر قدرة في آنٍ واحد.

ونطرح GPT‑5.5 اليوم مزودًا بأقوى مجموعة من الضمانات الوقائية لدينا حتى الآن، صُممت للحد من إساءة الاستخدام مع الحفاظ على إتاحة الوصول للأعمال ذات الفائدة. وقد قيّمنا هذا النموذج عبر مجموعتنا الكاملة من أطر السلامة والجاهزية، وعملنا مع فرق اختبار هجومية داخلية وخارجية، وأضفنا اختبارات موجهة للقدرات المتقدمة في الأمن السيبراني وعلم الأحياء، وجمعنا ملاحظات حول حالات الاستخدام الواقعية من نحو 200 شريك موثوق حصلوا على وصول مبكر قبل الإطلاق.

ويبدأ GPT‑5.5 اليوم بالوصول إلى مستخدمي Plus وPro وBusiness وEnterprise في ChatGPT وCodex، كما يبدأ GPT‑5.5 Pro بالوصول إلى مستخدمي Pro وBusiness وEnterprise في ChatGPT. أما عمليات النشر عبر API فتتطلب ضمانات مختلفة، ونحن نعمل عن قرب مع الشركاء والعملاء بشأن متطلبات السلامة والأمان اللازمة لتقديمه على نطاق واسع. وسنوفّر GPT‑5.5 وGPT‑5.5 Pro عبر API قريبًا جدًا.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82.7%

75.1%

-

-

69.4%

68.5%

Expert-SWE (داخلي)

73.1%

68.5%

-

-

-

-

GDPval (الفوز أو التعادل)

84.9%

83.0%

82.3%

82.0%

80.3%

67.3%

OSWorld-Verified

78.7%

75.0%

-

-

78.0%

-

Toolathlon

55.6%

54.6%

-

-

-

48.8%

BrowseComp

84.4%

82.7%

90.1%

89.3%

79.3%

85.9%

FrontierMath المستويات 1–3

51.7%

47.6%

52.4%

50.0%

43.8%

36.9%

FrontierMath المستوى 4

35.4%

27.1%

39.6%

38.0%

22.9%

16.7%

CyberGym

81.8%

79.0%

-

-

73.1%

-

قدرات النموذج

تعمل OpenAI على بناء البنية التحتية العالمية للذكاء الاصطناعي الوكيلي، بما يتيح للأفراد والشركات حول العالم إنجاز العمل باستخدام الذكاء الاصطناعي. وخلال العام الماضي، رأينا الذكاء الاصطناعي يسرّع هندسة البرمجيات بشكل كبير. ومع GPT‑5.5 في Codex وChatGPT، بدأت هذه النقلة نفسها تمتد إلى البحث العلمي وإلى نطاق أوسع من الأعمال التي ينجزها الناس على أجهزة الكمبيوتر.

وعبر هذه المجالات، لا يقدّم GPT‑5.5 مستوى أعلى من الذكاء فحسب، بل يعمل أيضًا بكفاءة أكبر في طريقة معالجته للمشكلات، إذ يصل كثيرًا إلى مخرجات أعلى جودة باستخدام عدد أقل من الرموز وعدد أقل من المحاولات. وعلى مؤشر Artificial Analysis's Coding Index، يقدّم GPT‑5.5 ذكاءً بمستوى متقدم مقابل نصف تكلفة نماذج البرمجة المنافسة من الفئة الرائدة.

Artificial Analysis Intelligence Index(يفتح في نافذة جديدة) هو متوسط مرجّح لعشرة تقييمات تجريها جهة خارجية، وهي: AA-LCR، وAA-Omniscience، وCritPt، وGDPval-AA، وGPQA Diamond، وHumanity’s Last Exam، وIF Bench، وSciCode، وTerminal-Bench Hard، وτ²-Bench Telecom.

البرمجة الوكيلة

يمثل GPT‑5.5 أقوى نماذجنا في البرمجة الوكيلية حتى الآن. ففي Terminal-Bench 2.0، الذي يختبر مسارات العمل المعقدة في سطر الأوامر والتي تتطلب التخطيط، والتكرار، وتنسيق الأدوات، يحقق دقة رائدة تبلغ 82.7%. وفي SWE-Bench Pro، الذي يقيم حل المشكلات الواقعية على GitHub، يصل إلى 58.6%، مع حل عدد أكبر من المهام من البداية إلى النهاية في تمريرة واحدة مقارنة بالنماذج السابقة. أما في Expert-SWE، وهو تقييمنا الداخلي المتقدم لمهام البرمجة طويلة الأفق، التي يبلغ متوسط الزمن التقديري لإنجازها بشريًا 20 ساعة، فإن GPT‑5.5 يتفوق أيضًا على GPT‑5.4.

عبر التقييمات الثلاثة جميعها، يتفوّق GPT‑5.5 على أداء GPT‑5.4 في درجات مع استخدام عدد أقل من رمز.

تظهر نقاط قوة النموذج في البرمجة بوضوح خاص داخل Codex، حيث يمكنه التعامل مع أعمال هندسية تمتد من التنفيذ وإعادة الهيكلة إلى تصحيح الأخطاء، والاختبار، والتحقق. وتشير الاختبارات المبكرة إلى أن GPT‑5.5 أصبح أفضل في السلوكيات التي يعتمد عليها العمل الهندسي الحقيقي، مثل الحفاظ على السياق عبر الأنظمة الكبيرة، والاستدلال في حالات الإخفاقات الملتبسة، والتحقق من الافتراضات باستخدام الأدوات، وتمرير التغييرات عبر قاعدة الشيفرة المحيطة.

يستخدم المسار المعروض بيانات المتجهات من NASA/JPL Horizons الخاصة بأوريون والقمر والشمس، مع تطبيق مقياس العرض لتحسين سهولة القراءة.

مطالبة: [attached image] Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.

وإلى جانب النتائج المعيارية، قال المختبرون الأوائل إن GPT‑5.5 يُظهر قدرة أقوى على فهم البنية العامة للنظام: لماذا يحدث الخلل، وأين ينبغي أن يقع الإصلاح، وما الأجزاء الأخرى في قاعدة الشيفرة التي قد تتأثر به.

بديل

"أول نموذج برمجة أستخدمه يتمتع بوضوح مفاهيمي حقيقي."

دان شيبر، مؤسس شركة Every ورئيسها التنفيذي، وصف GPT‑5.5 بأنه "أول نموذج للبرمجة أستخدمه يتمتع بوضوح مفاهيمي حقيقي".

بعد إطلاق أحد التطبيقات، أمضى أيامًا في تصحيح مشكلة ظهرت بعد الإطلاق قبل أن يستعين بأحد أفضل مهندسيه لإعادة كتابة جزء من النظام. ولتجربة GPT‑5.5، عاد فعليًا بالزمن إلى الوراء: هل يمكن للنموذج أن ينظر إلى الحالة المعطلة ويقدّم النوع نفسه من إعادة الكتابة الذي انتهى إليه المهندس في النهاية؟ لم يكن GPT‑5.4 قادرًا على ذلك. أما GPT‑5.5 فكان قادرًا.

بديل

"تشعرني هذه التجربة فعلًا بأنني أعمل مع مستوى أعلى من الذكاء، وبأن هناك شبه إحساس بالاحترام."

شهد بيترو شيرانو، الرئيس التنفيذي لشركة MagicPath، نقلة مشابهة عندما دمج GPT‑5.5 فرعًا يتضمن مئات التعديلات على الواجهة الأمامية وإعادة الهيكلة في فرع رئيسي كان قد شهد هو الآخر تغييرات جوهرية، وأنجز ذلك دفعة واحدة في نحو 20 دقيقة.

قال مهندسون كبار اختبروا النموذج إن GPT‑5.5 كان أقوى بوضوح من GPT‑5.4 وClaude Opus 4.7 في الاستدلال والاستقلالية، إذ كان يلتقط المشكلات مسبقًا ويتنبأ باحتياجات الاختبار والمراجعة من دون مطالبة صريحة. وفي إحدى الحالات، طلب منه مهندس إعادة تصميم بنية نظام التعليقات في محرر Markdown تعاوني، ثم عاد ليجد حزمة من 12 فرقًا برمجيًا تكاد تكون مكتملة. وقال آخرون إنهم احتاجوا إلى قدر ضئيل على نحو لافت من التصحيحات التنفيذية، وإنهم شعروا بثقة أكبر في خطط GPT‑5.5 مقارنةً بـ GPT‑5.4.

ذهب أحد مهندسي NVIDIA، ممن حصلوا على وصول مبكر إلى النموذج، إلى حد القول: "إن فقدان الوصول إلى GPT‑5.5 يشبه فقدان أحد أطرافي."

"يبدو GPT-5.5 أذكى بوضوح وأكثر مثابرة من GPT-5.4، مع أداء أقوى في البرمجة واستخدام أكثر موثوقية للأدوات. كما أنه يواصل العمل على المهمة لفترة أطول بكثير من دون أن يتوقف مبكرًا، وهو ما يكتسب أهمية خاصة في الأعمال المعقدة والطويلة التي يفوضها مستخدمونا إلى Cursor."
— مايكل ترول، الشريك المؤسس والرئيس التنفيذي في Cursor

الأعمال المعرفية

إن نقاط القوة نفسها التي تجعل GPT‑5.5 متميزًا في البرمجة تجعله أيضًا قويًا في الأعمال اليومية على الكمبيوتر. وبما أن النموذج أصبح أفضل في فهم المقصود، فإنه يستطيع الانتقال بصورة أكثر سلاسة عبر الحلقة الكاملة للعمل المعرفي: العثور على المعلومات، وفهم ما يهم، واستخدام الأدوات، والتحقق من المخرجات، وتحويل المواد الخام إلى شيء مفيد.

وفي Codex، يتفوق GPT‑5.5 على GPT‑5.4 في إنشاء المستندات، وجداول البيانات، والعروض التقديمية. وقد قال مختبرو الإصدار الأولي إنه تفوق على النماذج السابقة في أعمال مثل البحث التشغيلي، ونمذجة جداول البيانات، وتحويل المدخلات التجارية غير المرتبة إلى خطط. وعند دمجه مع مهارات Codex في استخدام الكمبيوتر، يقرّبنا GPT‑5.5 أكثر من الإحساس بأن النموذج يستطيع بالفعل استخدام الكمبيوتر معك: يرى ما يظهر على الشاشة، وينقر، ويكتب، ويتنقل عبر الواجهات، ويتحرك بين الأدوات بدقة.

وقد بدأت فرق OpenAI بالفعل في الاستفادة من هذه القدرات داخل مسارات عمل فعلية. فاليوم، يستخدم أكثر من 85% من الشركة Codex أسبوعيًا عبر وظائف تشمل هندسة البرمجيات، والمالية، والاتصالات، والتسويق، وعلوم البيانات، وإدارة المنتجات. وفي فريق الاتصالات، استخدم الفريق GPT‑5.5 داخل Codex لتحليل بيانات طلبات التحدث لمدة ستة أشهر، وبناء إطار للتقييم والمخاطر، والتحقق من وكيل آلي على Slack بحيث تُعالج الطلبات منخفضة المخاطر تلقائيًا، بينما تستمر الطلبات الأعلى خطرًا في المرور إلى المراجعة البشرية. وفي قسم المالية، استخدم الفريق Codex لمراجعة 24,771 نموذجًا ضريبيًا من نوع K-1 بإجمالي 71,637 صفحة، ضمن مسار عمل استبعد المعلومات الشخصية وساعد الفريق على تسريع المهمة بمقدار أسبوعين مقارنة بالعام السابق. أما ضمن فريق "استراتيجية الإطلاق في السوق"، فقد نجح أحد الموظفين في أتمتة إعداد التقارير التجارية الأسبوعية، موفرًا من 5 إلى 10 ساعات أسبوعيًا.

في ChatGPT، يوفّر GPT‑5.5 Thinking مساعدة أسرع في التعامل مع المشكلات الأصعب، من خلال إجابات أذكى وأكثر إيجازًا تساعدك على التقدم في الأعمال المعقدة بكفاءة أعلى. وهو يتفوق في الأعمال المهنية مثل البرمجة، والبحث، وتجميع المعلومات وتحليلها، والمهام كثيفة المستندات، ولا سيما عند استخدام الإضافات.

أما في GPT‑5.5 Pro، فيرى المختبرون الأوائل نقلة واضحة في كل من صعوبة الأعمال التي يستطيع ChatGPT التعامل معها وجودتها، إلى جانب تحسينات في زمن الاستجابة تجعله أكثر عملية بكثير للمهام المتطلبة. وبالمقارنة مع GPT‑5.4 Pro، وجد المختبرون أن استجابات GPT‑5.5 Pro أكثر شمولًا، وأفضل تنظيمًا، وأكثر دقة وارتباطًا بالسياق وفائدة، مع أداء قوي بشكل خاص في مجالات الأعمال، والقانون، والتعليم، وعلوم البيانات.

يحقق GPT‑5.5 أداءً رائدًا عبر عدة معايير تعكس هذا النوع من العمل. ففي اختبار GDPval⁠، الذي يختبر قدرات الوكلاء على إنجاز مهام عمل معرفي محددة بدقة عبر 44 مهنة، يسجل GPT‑5.5 نسبة 84.9%. وفي OSWorld-Verified، الذي يقيس ما إذا كان النموذج قادرًا على تشغيل بيئات كمبيوتر حقيقية بمفرده، يصل إلى 78.7%. أما في Tau2-bench Telecom، الذي يختبر مسارات عمل معقدة في خدمة العملاء، فيحقق 98.0% من دون ضبط للمطالبة. كما يقدّم GPT‑5.5 أداءً قويًا أيضًا عبر معايير أخرى للأعمال المعرفية: 60.0% على FinanceAgent، و88.5% على مهام النمذجة الداخلية للخدمات المصرفية الاستثمارية، و54.1% على OfficeQA Pro.

تم تشغيل Tau2-bench Telecom من دون ضبط المطالبات (وباستخدام GPT‑4.1 كنموذج مستخدم). ويفهم GPT‑5.5 الهدف من المهمة بشكل أفضل، ويتمتع بكفاءة أعلى في استخدام رمز مقارنةً بالإصدارات السابقة له.

"يقدّم GPT-5.5 مستوى الأداء المستمر الذي تتطلبه الأعمال الكثيفة التنفيذ. وقد بُني النموذج وشُغّل على أنظمة NVIDIA GB200 NVL72، بما يتيح لفرقنا إطلاق ميزات متكاملة من البداية إلى النهاية انطلاقًا من مطالبات باللغة الطبيعية، وتقليص وقت تصحيح الأخطاء من أيام إلى ساعات، وتحويل أسابيع من التجريب إلى تقدم يتحقق بين عشية وضحاها داخل قواعد شيفرة معقدة. والأمر هنا لا يقتصر على برمجة أسرع، بل يتعلق بطريقة عمل جديدة تساعد الناس على الإنجاز بسرعة مختلفة جذريًا."
— جاستن بويتانو، نائب الرئيس للذكاء الاصطناعي المؤسسي في NVIDIA

البحث العلمي

يُظهر GPT‑5.5 أيضًا مكاسب واضحة في مسارات العمل الخاصة بالبحث العلمي والتقني، وهي مسارات تتطلب أكثر من مجرد الإجابة عن سؤال صعب. فالباحثون يحتاجون إلى استكشاف فكرة، وجمع الأدلة، واختبار الافتراضات، وتفسير النتائج، وتحديد ما ينبغي تجربته بعد ذلك. ويُظهر GPT‑5.5 قدرة أفضل من النماذج الأخرى على الاستمرار عبر هذه الحلقة البحثية.

ويبرز هذا بشكل خاص في GeneBench(يفتح في نافذة جديدة)، وهو تقييم جديد يركز على تحليل البيانات العلمية متعدد المراحل في علم الوراثة وعلم الأحياء الكمي، حيث يُظهر GPT‑5.5 تحسنًا واضحًا مقارنةً بـ GPT‑5.4. وتتطلب هذه المشكلات من النماذج الاستدلال على بيانات قد تكون ملتبسة أو مشوبة بالأخطاء مع حد أدنى من التوجيه الإشرافي، ومعالجة عقبات واقعية مثل العوامل المربكة الخفية أو إخفاقات ضبط الجودة، وتطبيق الأساليب الإحصائية الحديثة وتفسيرها على نحو صحيح. ويبدو أداء النموذج لافتًا هنا، خاصة أن المهام في هذا التقييم تماثل في كثير من الأحيان مشاريع تمتد عدة أيام بالنسبة إلى الخبراء العلميين.

وبالمثل، حقق GPT‑5.5 على BixBench(يفتح في نافذة جديدة)، وهو معيار صُمم انطلاقًا من تطبيقات واقعية في المعلوماتية الحيوية وتحليل البيانات، أداءً متصدرًا بين النماذج التي نُشرت نتائجها. وقد أصبحت القدرات العلمية للنموذج قوية بما يكفي لتسريع التقدم بشكل ملموس عند حدود البحث الطبي الحيوي، بوصفه شريكًا علميًا حقيقيًا.

وفي مثال آخر، ساعد إصدار داخلي من GPT‑5.5، مرفقًا ببيئة تشغيل مخصصة، في اكتشاف برهان جديد(يفتح في نافذة جديدة) يتعلق بأعداد Ramsey، وهي من الكيانات المحورية في علم التوافقيات. ويدرس هذا المجال كيفية انتظام الكيانات المنفصلة معًا، مثل الرسوم البيانية، والشبكات، والمجموعات، والأنماط. وتسأل أعداد Ramsey، على نحو تقريبي، عن الحجم الذي يجب أن تبلغه شبكة ما قبل أن يصبح ظهور نوع معين من النظام أمرًا مضمونًا. وتُعد النتائج في هذا المجال نادرة وغالبًا ما تكون صعبة من الناحية التقنية. وفي هذه الحالة، توصّل GPT‑5.5 إلى برهان لحقيقة تقاربية قديمة تتعلق بأعداد Ramsey خارج القطر، ثم جرى التحقق منه لاحقًا باستخدام Lean. وتمثل هذه النتيجة مثالًا ملموسًا على إسهام GPT‑5.5 ليس فقط في الشيفرة أو الشرح، بل في تقديم حجة رياضية مفاجئة ومفيدة داخل مجال بحثي أساسي.

وقد استخدم المختبرون الأوائل GPT‑5.5 Pro داخل ChatGPT على نحو يتجاوز كونه محركًا لإجابات سريعة لمرة واحدة، ليصبح أقرب إلى شريك بحثي: يراجع المسودات البحثية عبر عدة جولات، ويختبر الحجج التقنية تحت الضغط، ويقترح تحليلات، ويعمل مع الشيفرة، والملاحظات، وسياق ملفات PDF. والخيط المشترك في كل ذلك هو أن GPT‑5.5 أصبح أفضل في مساعدة الباحثين على الانتقال من السؤال إلى التجربة ثم إلى المخرجات.

استخدم Derya Unutmaz، وهو أستاذ في علم المناعة وباحث في مختبر جاكسون لطب الجينوم، GPT‑5.5 Pro لتحليل مجموعة بيانات للتعبير الجيني تضم 62 عينة ونحو 28000 جين، ما أنتج تقريرًا بحثيًا مفصلًا لم يقتصر على تلخيص النتائج فحسب، بل أبرز أيضًا أسئلة ورؤى رئيسية، وهو عمل قال إنه كان سيستغرق من فريقه أشهرًا.

بارتوش ناسكرينتسكي، الأستاذ المساعد في الرياضيات بجامعة Adam Mickiewicz في بوزنان، بولندا، استخدم GPT‑5.5 في Codex لبناء تطبيق في الهندسة الجبرية انطلاقًا من مطالبة واحدة خلال 11 دقيقة، حيث صوّر تقاطع الأسطح التربيعية وحوّل المنحنى الناتج إلى نموذج Weierstrass.

ثم عاد لاحقًا إلى توسيع التطبيق بإضافة تصور أكثر استقرارًا لنقاط التفرد، ومعاملات دقيقة يمكن إعادة استخدامها في أعمال لاحقة. وبالنسبة إليه، فإن التحول الأكبر يتمثل في أن Codex أصبح الآن قادرًا على المساعدة في تنفيذ مسارات عمل مخصصة للتصور الرياضي والجبر الحاسوبي، وهي مسارات كانت تتطلب سابقًا أدوات مخصصة. وتُظهر هذه الأمثلة مجتمعة كيف يحوّل GPT‑5.5 نية الخبير إلى أدوات بحثية وتحليلات عملية.

""

حقوق الصورة: بارتوش ناسكرينتسكي(يفتح في نافذة جديدة)

المطالبة: # Algebraic geometry surface intersection

Make an app which draws two quadratic surfaces and colors in red the intersection curve. Use computational Riemann-Roch theorem to convert this into Weierstrass curve.

## Main window

Two tinted surfaces with a slightly transparent shading, high quality rendering intersect along a red colored algebraic curve

Rotation with mouses in both directions, full pinch mechanism for zoom, haptic press to show the little menu with sliders for changing the coefficients of each surface; detection via Z-buffor level

## Side right window

Short Weierstrass equation (over Q or quadratic field extension) computed on the go via effective Riemann-Roch theorem formulas

## Ambient mode where all the controls are hidden and the user can admire the beauty of the shapes

## Specs

App is running in the browser, light-weight implementation with full stack newest libraries, portable, deployable

## Docs

Git repo, journal, plan (Markdown files)

"من المُلهم للغاية أن نستخدم نموذج GPT-5.5 الجديد من OpenAI ضمن بيئة الاختبار الخاصة بنا، ونراه يستدل عبر مجموعات هائلة من البيانات الكيميائية الحيوية للتنبؤ بنتائج الأدوية لدى البشر، ثم يحقق بعد ذلك مكاسب واضحة في الدقة على أصعب تقييماتنا في اكتشاف الأدوية. وإذا واصلت OpenAI هذا الزخم، فستتغير أسس اكتشاف الأدوية بحلول نهاية العام."
— براندون وايت، الشريك المؤسس والرئيس التنفيذي في Axiom Bio

كفاءة الاستدلال من الجيل التالي

تطلّب تقديم GPT‑5.5 بزمن استجابة يماثل GPT‑5.4 إعادة التفكير في الاستدلال بوصفه نظامًا متكاملًا، لا مجرد مجموعة من التحسينات المنفصلة. فقد جرى تصميم GPT‑5.5 بالتوازي مع أنظمة NVIDIA GB200 وGB300 NVL72، وتدريبه عليها وتقديمه من خلالها. وكان لكل من Codex وGPT‑5.5 دور أساسي في الوصول إلى أهدافنا على مستوى الأداء. فقد ساعد Codex الفريق على الانتقال بسرعة أكبر من الفكرة إلى تنفيذ قابل للقياس، من خلال رسم النهوج، وربط التجارب، والمساعدة في تحديد أي التحسينات تستحق استثمارًا أعمق. كما ساعد GPT‑5.5 في اكتشاف تحسينات رئيسية داخل البنية نفسها وتنفيذها. وباختصار، ساعد النموذج في تحسين البنية التحتية التي تشغّله.

وكان من بين هذه التحسينات موازنة الأحمال وآليات التجزئة الإرشادية. فقبل GPT‑5.5، كنا نقسم الطلبات على المسرّع إلى عدد ثابت من الأجزاء لموازنة العمل عبر أنوية الحوسبة، بما يضمن تشغيل الطلبات الكبيرة والصغيرة على وحدة GPU نفسها. لكن هذا العدد المحدد مسبقًا من الأجزاء الثابتة لا يكون مثاليًا لكل أنماط المرور. وللاستفادة بصورة أفضل من وحدات GPU، حلّل Codex أنماط حركة الإنتاج على مدى أسابيع، وكتب خوارزميات إرشادية مخصصة لتجزئة العمل وموازنته على نحو أمثل. وقد كان لهذا الجهد أثر كبير، إذ رفع سرعات توليد الرموز بأكثر من 20%.

الارتقاء بالأمن السيبراني من أجل سلامة الجميع

إن تهيئة العالم لنماذج أصبحت بارعة جدًا في اكتشاف الثغرات الأمنية ومعالجتها ليست مهمة فردية، بل جهد جماعي سيتطلب من المنظومة بأكملها أن تعمل بجد لبناء مزيد من المرونة. ويشمل ذلك إتاحة الوصول إلى النماذج على نطاق واسع، واعتماد النشر التدريجي استعدادًا للحقبة المقبلة من الدفاع السيبراني.

وتزداد قدرات النماذج الرائدة في مجال الأمن السيبراني باطراد. ومع مرور الوقت، ستنتشر هذه القدرات على نطاق واسع، ونحن نرى أن أفضل مسار للمضي قدمًا هو ضمان توظيفها في تسريع الدفاع السيبراني وتعزيز المنظومة ككل.

ويمثل GPT‑5.5 خطوة تدريجية لكنها مهمة نحو ذكاء اصطناعي قادر على المساهمة في حل بعض أصعب التحديات في العالم، ومنها الأمن السيبراني. ومع GPT‑5.2 في ديسمبر، نشرنا استباقيًا الضمانات السيبرانية اللازمة للحد من إساءة الاستخدام السيبراني المحتملة لنماذجنا. أما الآن، ومع GPT‑5.5، فننشر مصنفات أكثر صرامة لرصد المخاطر السيبرانية المحتملة، وقد يجد بعض المستخدمين ذلك مزعجًا في البداية، إلى أن نواصل ضبطها وتحسينها بمرور الوقت.

ولسنوات، صنّفنا الأمن السيبراني ضمن الفئات الأساسية في إطار الجاهزية(يفتح في نافذة جديدة)، بالتوازي مع التحسن التدريجي لنماذجنا. وفي الوقت نفسه، نواصل تطوير إجراءات التخفيف ومعايرتها بصورة متدرجة، حتى نتمكن من طرح نماذج ذات قدرات سيبرانية مؤثرة على نحو مسؤول.

  • ننشر ضمانات رائدة على مستوى القطاع لهذا المستوى من القدرات السيبرانية. فقد قدمنا للمرة الأولى ضمانات مخصصة للأمن السيبراني مع GPT‑5.2(يفتح في نافذة جديدة) في العام الماضي، وواصلنا منذ ذلك الحين اختبارها وتحسينها والبناء عليها في الإصدارات اللاحقة. ومع GPT‑5.5، صممنا ضوابط أكثر إحكامًا حول الأنشطة الأعلى خطورة والطلبات السيبرانية الحساسة، وأضفنا وسائل حماية للتعامل مع إساءة الاستخدام المتكرر. وأصبح الوصول الواسع ممكنًا بفضل استثماراتنا في سلامة النماذج، والاستخدام الموثق، والرصد المخصص لحالات الاستخدام غير المسموح بها. كما عملنا لأشهر مع خبراء خارجيين لتطوير هذه الضمانات واختبارها وتحسين متانتها على نحو متدرج. ومع GPT‑5.5، نحرص على تمكين المطورين من تأمين شيفراتهم بسهولة، مع فرض ضوابط أقوى حول مسارات العمل السيبرانية الأكثر عرضة لأن تُستغل في إحداث ضرر على يد جهات خبيثة.
  • نعمل على توسيع نطاق الوصول لتسريع الدفاع السيبراني على جميع المستويات. نحن نتيح نموذجنا ذات القيود الأقل في المجال السيبراني من خلال Trusted Access for Cyber، بدءًا من Codex، الذي يتضمن إمكانية وصول موسّعة إلى قدرات GPT‑5.5 المتقدمة في مجال الأمن السيبراني مع قيود أقل للمستخدمين الذين تم التحقق منهم ويستوفون بعض إشارات الثقة(يفتح في نافذة جديدة) عند الإطلاق. يمكن للمؤسسات المسؤولة عن الدفاع عن البنية التحتية الحيوية التقدّم بطلب للوصول إلى النموذج الأكثر سماحًا في السياقات السيبرانية مثل GPT‑5.4‑Cyber، شريطة استيفاء متطلبات أمنية صارمة لاستخدام هذا النموذج في تأمين أنظمتها الداخلية. وهذا يوفّر لمجموعة واسعة من الجهات الدفاعية الموثوقة أدوات أكثر قدرةً للأعمال الأمنية المشروعة، مع تقليل العوائق غير الضرورية، بما يضمن إتاحة الوصول إلى القدرات الدفاعية المهمة على نطاق أوسع. يمكن للمستخدمين التقدّم بطلب للحصول على الوصول الموثوق على chatgpt.com/cyber(يفتح في نافذة جديدة) لتقليل حالات الرفض غير الضرورية أثناء استخدام GPT‑5.5 في الأعمال الدفاعية المُتحقَّق منها.
  • كما نعمل مع شركاء حكوميين للمساعدة في حماية البنية التحتية الحيوية للصالح العام. ومعًا، نستكشف كيف يمكن للذكاء الاصطناعي المتقدم أن يدعم العمل الدفاعي للمسؤولين الموثوقين المكلفين بحماية الأنظمة التي يعتمد عليها الناس، بدءًا من الأنظمة الرقمية التي تؤمّن بيانات ضريبية مهمة، وصولًا إلى شبكات الكهرباء وإمدادات المياه في المجتمعات المحلية.

نتعامل مع القدرات البيولوجية/الكيميائية وقدرات الأمن السيبراني لدى GPT‑5.5 على أنها عالية ضمن إطار الجاهزية(يفتح في نافذة جديدة). ورغم أن GPT‑5.5 لم يصل إلى مستوى القدرة الحرج في الأمن السيبراني، فقد أظهرت تقييماتنا واختباراتنا أن قدراته في الأمن السيبراني تمثل تقدّمًا مقارنةً بـ GPT‑5.4.

بالإضافة إلى ذلك، خضع GPT‑5.5 لعملية السلامة والحوكمة الكاملة لدينا قبل الإطلاق، بما في ذلك تقييمات الجاهزية، واختبارات خاصة بالمجالات، وتقييمات مستهدفة جديدة لقدرات الأحياء المتقدمة والأمن السيبراني، واختبارات مكثفة بمشاركة خبراء خارجيين. ونشارك مزيدًا من التفاصيل في بطاقة نظام(يفتح في نافذة جديدة) GPT‑5.5.

يجسّد هذا العمل نهجنا الأوسع لتعزيز مرونة الذكاء الاصطناعي، الذي نرى أنه ضروري مع تطور قدرات النموذج. نريد أن يكون الذكاء الاصطناعي القوي متاحًا للأشخاص الذين يستخدمونه للدفاع عن الأنظمة والمؤسسات وعامة الناس. يتمثل المسار العملي في الوصول الموثوق، والضمانات القوية التي تتوسع مع تطور القدرات، والقدرة التشغيلية على رصد إساءة الاستخدام الجسيمة والاستجابة لها.

التوافر والأسعار

ويبدأ GPT‑5.5 اليوم بالوصول إلى مستخدمي Plus وPro وBusiness وEnterprise في ChatGPT وCodex، كما يبدأ GPT‑5.5 Pro بالوصول إلى مستخدمي Pro وBusiness وEnterprise في ChatGPT. وسنوفّر GPT‑5.5 وGPT‑5.5 Pro عبر API قريبًا جدًا.

وفي ChatGPT، يتوفر GPT‑5.5 Thinking لمستخدمي Plus وPro وBusiness وEnterprise. أما GPT‑5.5 Pro، المصمم للأسئلة الأصعب والأعمال الأعلى دقة، فهو متاح لمستخدمي Pro وBusiness وEnterprise.

وفي Codex، يتوفر GPT‑5.5 لخطط Plus وPro وBusiness وEnterprise وEdu وGo، مع نافذة سياق تبلغ 400 ألف. كما يتوفر GPT‑5.5 أيضًا في Fast mode، حيث يولّد الرموز بسرعة أكبر بمقدار 1.5 مرة مقابل تكلفة أعلى بمقدار 2.5 مرة.

وبالنسبة إلى مطوري API، سيتوفر gpt-5.5 قريبًا في واجهتَي Responses وChat Completions بسعر 5 دولارات لكل مليون رمز إدخال و30 دولارًا لكل مليون رمز إخراج، مع نافذة سياق تبلغ مليون رمز. كما يتوفر تسعير Batch وFlex بنصف سعر واجهة API القياسي، بينما تتوفر المعالجة ذات الأولوية بسعر يعادل 2.5 ضعف السعر القياسي. وسنطرح أيضًا gpt-5.5-pro عبر API لدقة أعلى، بسعر 30 دولارًا لكل مليون رمز إدخال و180 دولارًا لكل مليون رمز إخراج. ويمكن الرجوع إلى صفحة الأسعار للاطلاع على التفاصيل الكاملة.

ورغم أن سعر GPT‑5.5 أعلى من GPT‑5.4، فإنه أكثر ذكاءً وأكثر كفاءة بكثير في استخدام الرموز. وفي Codex، حرصنا على ضبط التجربة بعناية بحيث يقدّم GPT‑5.5 نتائج أفضل باستخدام عدد أقل من الرموز مقارنةً بـ GPT‑5.4 بالنسبة إلى معظم المستخدمين، مع الاستمرار في توفير استخدام سخي عبر مختلف مستويات الاشتراك.

التقييمات

البرمجة

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (عام) *

58.6%

57,7%

-

-

64.3%

54.2%

Terminal-Bench 2.0

82.7%

75.1%

-

-

69.4%

68.5%

Expert-SWE (داخلي)

73,1%

68.5%

-

-

-

-

*أشارت المختبرات إلى وجوددلائل على الحفظ(يفتح في نافذة جديدة) في هذا التقييم

احترافي

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (الفوز أو التعادل)

84.9%

83.0%

82.3%

82.0%

80.3%

67.3%

FinanceAgent v1.1

60.0%

56.0%

-

61.5%

64.4%

59.7%

مهام نمذجة الخدمات المصرفية الاستثمارية (داخلي)

88.5%

87.3%

88.6%

83.6%

-

-

OfficeQA Pro

54.1%

53.2%

-

-

43.6%

18.1%

استخدام الحاسوب والرؤية

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld-Verified

78.7%

75.0%

-

-

78.0%

-

MMMU Pro (بدون أدوات)

81.2%

81.2%

-

-

-

80.5%

MMMU Pro (مع أدوات)

83.2%

82.1%

-

-

-

-

استخدام الأدوات

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84.4%

82.7%

90.1%

89.3%

79.3%

85.9%

MCP Atlas**

75.3%

٧٠٫٦٪

-

-

79,1%

78.2%

Toolathlon

55.6%

54.6%

-

-

-

48.8%

Tau2-bench Telecom***
(المطالبات الأصلية)

98.0%

92.8%

-

-

-

-

**‏ MCP Atlas: نتائج Scale AI بعد آخر تحديث في أبريل 2026. 
*** ‏Tau2-bench Telecom: نتائج 5.5 و5.4 باستخدام المطالبات الأصلية، أي من دون أي تعديل على المطالبات. وهذا يستبعد نتائج المختبرات الأخرى التي جرى تقييمها بعد إجراء تعديلات على المطالبات.

أكاديمي

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25.0%

19.0%

33,2%

25,6%

-

-

FrontierMath المستويات 1–3

51.7%

47.6%

52,4%

50.0%

43.8%

36.9%

FrontierMath المستوى 4

35.4%

27.1%

39.6%

38.0%

22.9%

16.7%

BixBench

80.5%

74.0%

-

-

-

-

ماسة GPQA

93.6%

92.8%

-

94.4%

94.2%

94.3%

الاختبار الأخير للبشرية (بدون أدوات)

41.4%

39.8%

43.1%

42.7%

46.9%

44.4%

الاختبار الأخير للبشرية (مع الأدوات)

52.2%

52.1%

57.2%

58.7%

54.7%

51.4%

الأمن السيبراني

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

مهام تحدّيات Capture-the-Flag (داخلي)****

88.1%

83.7%

-

-

-

-

CyberGym

81.8%

79.0%

-

-

73.1%

-

**** توسيع لأصعب مسابقات CTFs المستخدمة في بطاقات النظام مع تحديات إضافية صعبة.

السياق الطويل

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256k f1

73.7%

62.5%

-

-

76.9%

-

Graphwalks BFS 1mil f1

45.4%

9.4%

-

-

41.2% (Opus 4.6)

-

Graphwalks parents 256k f1

90.1%

82.8%

-

-

93.6%

-

Graphwalks parents 1mil f1

58.5%

44.4%

-

-

72.0% (Opus 4.6)

-

OpenAI MRCR v2 8-needle 4K-8K

98.1%

97.3%

-

-

-

-

OpenAI MRCR v2 8-needle 8K-16K

93.0%

91.4%

-

-

-

-

OpenAI MRCR v2 8-needle 16K-32K

96.5%

97.2%

-

-

-

-

OpenAI MRCR v2 8-needle 32K-64K

90.0%

90.5%

-

-

-

-

OpenAI MRCR v2 8-needle 64K-128K

83.1%

86.0%

-

-

-

-

OpenAI MRCR v2 8-needle 128K-256K

87.5%

79.3%

-

-

59.2%

-

OpenAI MRCR v2 8-needle 256K-512K

81.5%

57.5%

-

-

-

-

OpenAI MRCR v2 8-needle 512K-1M

74.0%

36.6%

-

-

32.2%

-

الاستدلال المجرد

تقييم

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (Verified)

95.0%

93.7%

-

94.5%

93.5%

98.0%

ARC-AGI-2 (Verified)

85.0%

73.3%

-

83.3%

75.8%

77.1%

وقد أُجريت تقييمات GPT مع ضبط جهد الاستدلال على xhigh، كما أُجريت في بيئة بحثية، وهو ما قد يؤدي في بعض الحالات إلى مخرجات تختلف قليلًا عمّا يظهر في ChatGPT ضمن بيئة الإنتاج.

المؤلف

OpenAI