إطلاق GPT‑5
نموذج يجمع بين السرعة والبراعة والتفكير العميق، ليضع ذكاء الخبراء في متناول الجميع.
نقدّم لكم GPT‑5، نظام الذكاء الاصطناعي الأحدث والأكثر تطورًا من OpenAI حتى اليوم. يشكّل هذا الإصدار قفزة كبيرة في مستوى الذكاء والأداء مقارنة بجميع النماذج السابقة، إذ يقدّم أداءً رائدًا في مجالات متعددة تشمل البرمجة، والرياضيات، والكتابة، والصحة، والإدراك البصري، وغيرها من المجالات التي تتطلّب دقة عالية وقدرات تحليلية متقدمة. يتميّز GPT‑5 بكونه نظامًا موحدًا قادرًا على التكيّف مع طبيعة المهمة، فيعرف متى يحتاج إلى الاستجابة السريعة ومتى يتطلّب الموقف تفكيرًا أعمق لإنتاج إجابات بمستوى الخبراء. ويُتاح هذا النموذج لجميع المستخدمين، في حين يحصل مشتركو Plus على استخدام أوسع، ويستفيد مشتركو Pro من الوصول إلى GPT‑5 Pro — الإصدار المزود بقدرات استدلال موسّعة تمكّنه من تقديم إجابات أكثر شمولًا ودقة.
نظام نموذج GPT‑5 هو نظام موحد يحتوي على نموذج ذكي وفعال يجيب على معظم الأسئلة، ونموذج استدلال عميق (GPT‑5 thinking) للمشاكل الأكثر تعقيدًا، وموجه لحظي يقرر بسرعة أي نموذج يستخدم بناءً على نوع المحادثة وتعقيدها واحتياجات الأدوات وقصدك الصريح (على سبيل المثال، إذا قلت "فكر بعمق في هذا" في المطالبة). يتم تدريب الموجه باستمرار على إشارات حقيقية، بما في ذلك عند تبديل المستخدمين للنماذج، ومعدلات تفضيل الإجابات، وصحة الإجابات المقاسة، مما يؤدي إلى تحسينه بمرور الوقت. وبمجرد الوصول إلى حدود الاستخدام، تتولى نسخة مصغرة من كل نموذج معالجة الاستعلامات المتبقية. وفي المستقبل القريب، لدينا خطة لدمج هذه القدرات في نموذج واحد.
لا يقتصر GPT‑5 على التفوق في الاختبارات أو تقديم الإجابات بسرعة أكبر، بل الأهم من ذلك أنه أصبح أكثر فائدة في التعامل مع الأسئلة الواقعية والتطبيقات اليومية. لقد أحرزنا تقدمًا كبيرًا في تقليل الهلوسة، وتحسين دقة تنفيذ التعليمات، والحدّ من التكرار والمجاراة غير الضرورية، مع تعزيز أداء GPT‑5 في ثلاثة من أكثر استخدامات ChatGPT شيوعًا: الكتابة، والبرمجة، والصحة.
يُعدّ GPT‑5 أقوى نموذج برمجة طورناه حتى الآن، إذ أظهر تطوّرًا ملحوظًا في إنشاء واجهات الاستخدام المعقدة وتصحيح الأخطاء في المستودعات البرمجية الكبيرة. يتميّز بقدرته على ابتكار مواقع إلكترونية وتطبيقات وألعاب أنيقة وسريعة الاستجابة من خلال طلب واحد فقط، محوّلًا الأفكار إلى واقع بلمسة جمالية راقية وحسّ تصميمي متكامل. وقد لاحظ المستخدمون الأوائل للنموذج تحسّنًا كبيرًا في خيارات التصميم التي يقدّمها، بما في ذلك فهمه الأفضل لتفاصيل مثل التباعد، والخطوط الطباعية، والمساحات البيضاء. يمكنك الاطلاع على التفاصيل الكاملة حول ما يتيحه GPT‑5 للمطوّرين عبر هذا الرابط.
إليكم بعض الأمثلة على ما تم إنشاءه بواسطة نموذج GPT‑5 باستخدام مطالبة واحد فقط:
المطالبة: قم بإنشاء تطبيق من صفحة واحدة في ملف HTML واحد بالمتطلبات التالية:
- الاسم: عداء الكرة القافزة
- الهدف: القفز فوق العقبات للبقاء على قيد الحياة لأطول فترة ممكنة.
- الميزات: زيادة السرعة، تتبع النقاط العالية، زر إعادة المحاولة، والأصوات المضحكة للإجراءات والأحداث.
- يجب أن تكون واجهة المستخدم ملونة، مع خلفيات تمرير متحركة بتقنية المنظور.
- يجب أن تبدو الحروف كرتونية وأن تكون ممتعة للمشاهدة.
- يجب أن تكون اللعبة ممتعة للجميع.
يُعدّ GPT‑5 أكثر النماذج كفاءة في مجال الكتابة حتى الآن، إذ يمكنه مساعدتك في تحويل نواة الأفكار إلى نصوص آسرة تنبض بالعمق الأدبي والإيقاع المتناغم. يتعامل النموذج بثقة أكبر مع الكتابة التي تتضمّن غموضًا بنيويًا، مثل الحفاظ على الإيقاع الشعري الحر أو الأسلوب المنثور المتدفق بسلاسة، جامعًا بين احترام البنية اللغوية ووضوح التعبير الفني. وبفضل هذه القدرات المتقدمة في الكتابة، أصبح ChatGPT أكثر فاعلية في دعم المهام اليومية كصياغة التقارير، وتحرير الرسائل الإلكترونية، والمذكرات، وغيرها. يمكن مقارنة أساليب الكتابة بين GPT‑5 وGPT‑4o في الجدول أدناه.
يُعدّ GPT‑5 أفضل نماذجنا حتى الآن في التعامل مع الأسئلة والمعلومات المتعلقة بالصحة، إذ يمنح المستخدمين القدرة على فهم أوضاعهم الصحية والدفاع عن صحتهم بثقة ومعرفة. وقد حقّق النموذج نتائج أعلى بكثير من جميع الإصدارات السابقة على مقياس HealthBench، وهو تقييم أجريناه هذا العام يعتمد على سيناريوهات واقعية ومعايير طبية محددة من قبل أطباء مختصين. وبالمقارنة مع النماذج السابقة، يعمل GPT‑5 كشريك فكري فعّال، إذ يرصد مسبقًا الجوانب التي تستدعي الانتباه، ويطرح الأسئلة التي تساعد على الوصول إلى إجابات أكثر فائدة. كما يقدّم الآن استجابات أدقّ وأكثر موثوقية، مع قدرته على التكيّف مع سياق المستخدم ومستوى معرفته وموقعه الجغرافي، ما يجعله قادرًا على تقديم إجابات أكثر أمانًا وملاءمة عبر مجموعة واسعة من المواقف. ومن المهم الإشارة إلى أنّ ChatGPT لا يُعدّ بديلاً عن الأخصائيين الطبيين، بل هو بمثابة شريك يساعدك على فهم النتائج، وطرح الأسئلة المناسبة خلال استشاراتك الطبية، وموازنة الخيارات المتاحة أمامك عند اتخاذ القرارات.
يمكنك الاطلاع على بعض الأمثلة التي توضّح كيف يتفوّق GPT‑5 على النماذج السابقة في مختلف المجالات من حيث العمق والدقة والفائدة.
GPT-4o
GPT-5
تقدّم استجابة GPT‑5 منحنى شعوريًا أوسع بنهاية أقوى وصورٍ أوضح واستعارات آسرة — مثل "الأعلام السوداء لبلاد لم تعد موجودة" و*"جرس كيوتو يدحرج المساء أسفل التل"* — ما يخلق إحساسًا حيًّا بالثقافة والمكان. أمّا إصدار GPT‑4o فيتبع بناءً أكثر تقليدية من حيث الهيكل والإيقاع، ويركّز على السرد المباشر بدل التصوير، كما في عبارة "هي تبكي ولا تقول شيئًا".
*تم اختيار استجابة بين 4o وOpenAI o3 استنادًا إلى أداء النموذج الأفضل بينهما في الطلب المعيّن.
يُظهر GPT‑5 مستوىً أعلى من الذكاء في مختلف المجالات، وهو ما تعكسه نتائجه المتميزة في الاختبارات الأكاديمية والتقييمات البشرية، خصوصًا في مجالات الرياضيات، والبرمجة، والإدراك البصري، والصحة. وقد سجّل النموذج مستوى جديدًا من الأداء المتفوق في عدد من المقاييس، منها: الرياضيات (بنسبة 94.6٪ في اختبار AIME 2025 بدون أدوات مساعدة)، والبرمجة الواقعية (بنسبة 74.9٪ في SWE-bench Verified و88٪ في Aider Polyglot)، والفهم متعدّد الوسائط (بنسبة 84.2٪ في MMMU)، والصحة (بنسبة 46.2٪ في HealthBench Hard) — وهي إنجازات تنعكس بوضوح في الاستخدامات اليومية للنموذج. ومع قدرات الاستدلال المتقدمة في GPT‑5 Pro، سجّل النموذج أيضًا رقمًا قياسيًا جديدًا في GPQA بنسبة 88.4% بدون أدوات مساعدة.
*لا ينبغي مقارنة نتائج AIME عند استخدام الأدوات مباشرةً بأداء النماذج التي لا تملك إمكانية الوصول إلى الأدوات؛ فهي تُستخدم فقط كمثال على مدى كفاءة GPT‑5 في الاستفادة من الأدوات المتاحة.
تُجرى جميع اختبارات التقييم الخاصة بـ SWE-bench باستخدام مجموعة ثابتة تتألف من 477 (n) مهمة مُتحقَّق منها، تم اعتمادها والتحقق من صحتها على البنية التحتية الداخلية لدينا.
يُظهر GPT‑5 تقدمًا ملحوظًا في الاختبارات التي تقيس قدرته على اتباع التعليمات واستخدام الأدوات بشكل ذكي ومستقل، وهي مهارات تمكّنه من تنفيذ الطلبات المتعددة المراحل بدقة، والتنسيق بين أدوات مختلفة، والتكيّف مع تغيّر السياق أثناء العمل. من الناحية العملية، يعني ذلك أنّ GPT‑5 أصبح أكثر كفاءة في التعامل مع المهام المعقدة والمتطورة، إذ يمكنه اتباع التعليمات بدقة أكبر وإتمام العمل من البداية إلى النهاية باستخدام مجموعة الأدوات المتاحة له بفعالية أعلى.
يتفوّق النموذج في مجموعة واسعة من اختبارات الفهم متعدّد الوسائط، تشمل مجالات الرؤية، والفيديو، والتحليل المكاني، والاستدلال العلمي. ويعني هذا الأداء المتقدّم أنّ ChatGPT أصبح قادرًا على الاستدلال بدقّة أكبر باستخدام الصور والمدخلات غير النصية — سواء عند تفسير المخططات البيانية، أو تلخيص صورة لعرض تقديمي، أو الإجابة عن أسئلة تتعلق برسم توضيحي.
يُعدّ GPT‑5 أيضًا أفضل نماذجنا أداءً في الاختبارات الداخلية التي تقيس كفاءته في أعمال المعرفة المعقدة ذات القيمة الاقتصادية العالية. فعند استخدام قدراته على الاستدلال، يقدّم GPT‑5 أداءً يعادل أداء الخبراء أو يتفوّق عليهم في نحو نصف الحالات، متجاوزًا كلًا من o3 وChatGPT Agent في مجموعة واسعة من المهام. وتشمل هذه المهام أكثر من 40 مجالًا مهنيًا، من بينها القانون، واللوجستيات، والمبيعات، والهندسة، ما يجعل GPT‑5 نموذجًا متكاملًا قادرًا على دعم الأعمال التي تتطلّب فهمًا عميقًا وتحليلًا دقيقًا في مختلف القطاعات الاقتصادية.
المنهجية الخاصة بالتقييمات أعلاه: تعكس نتائج GPT‑4o أحدث إصدار من النموذج في ChatGPT حتى أغسطس 2025. تم تقييم جميع النماذج ضمن إعدادات "الجهد العالي في الاستدلال". ويمكن أن يختلف مستوى الجهد في الاستدلال داخل ChatGPT، حيث يمثّل المستوى العالي الحد الأقصى لما قد يختبره المستخدم عند استخدام النموذج.
يتميّز GPT‑5 بقدرته على تحقيق نتائج أكبر في وقت تفكير أقل. ففي التقييمات التي أجريناها، أظهر GPT‑5 (عند تفعيله للتفكير) أداءً يتفوّق على نموذج OpenAI o3 مع استخدام عدد أقل من الرموز النصية بنسبة تتراوح بين 50 و80% عبر مختلف المهارات، بما في ذلك الاستدلال البصري، والبرمجة الذكية، وحل المشكلات العلمية على مستوى الدراسات العليا.
جرى تدريب GPT‑5 على حواسيب Microsoft Azure الفائقة المخصّصة للذكاء الاصطناعي.
يُظهر GPT‑5 انخفاضًا ملحوظًا في احتمال توليد معلومات غير دقيقة مقارنةً بنماذجنا السابقة. ومع تفعيل ميزة البحث على الويب باستخدام مطالبات مجهولة تمثّل استخدام ChatGPT الفعلي، كانت استجابات GPT‑5 أقل احتمالًا لاحتواء خطأ واقعي بنسبة تقارب 45% مقارنةً بـ GPT‑4o، وعند تفعيله للتفكير، تنخفض هذه النسبة إلى نحو 80% مقارنةً بنموذج OpenAI o3.
لقد استثمرنا بشكل خاص في جعل نماذجنا أكثر موثوقية عند معالجة الأسئلة المعقدة والمفتوحة. وبناءً على ذلك، أضفنا تقييمات جديدة لاختبار مدى واقعية المعلومات المفتوحة. قمنا بقياس معدل هلوسة نموذج GPT‑5 عند التفكير في الطلبات المفتوحة للبحث عن الحقائق من معيارين للوقائع العامة: LongFact(يفتح في نافذة جديدة) (المفاهيم والأشياء) و FActScore(يفتح في نافذة جديدة). عبر جميع هذه المعايير، يُظهر "GPT‑5 thinking" انخفاضًا حادًا في الهلوسات - أقل بنحو ستة أضعاف من o3 - مما يمثل قفزة واضحة إلى الأمام في إنتاج محتوى طويل دقيق باستمرار. يمكن العثور على تفاصيل التنفيذ والتقدير لتقييماتنا على هذه المعايير في بطاقة النظام.
إلى جانب دقته المحسّنة في الحقائق، أصبح GPT‑5 (عند تفعيله للتفكير) أكثر صدقًا في توضيح أفعاله وقدراته للمستخدم — خصوصًا في المهام التي تكون مستحيلة التنفيذ، أو غير محددة بما يكفي، أو تفتقر إلى الأدوات اللازمة. وخلال التدريب، قد تتعلم نماذج الاستدلال أحيانًا الإيهام بالنجاح في تنفيذ مهمة أو إظهار ثقة مفرطة في إجابة غير مؤكدة لتحقيق مكافأة أعلى. ولقياس ذلك، أزلنا جميع الصور من مطالبات اختبار CharXiv المخصص للفهم متعدد الوسائط، فوجدنا أن نموذج OpenAI o3 قدّم إجابات واثقة حول صور غير موجودة بنسبة 86.7%، مقارنةً بـ 9% فقط في GPT‑5.
عند تنفيذ مهام التفكير والاستدلال، أصبح GPT‑5 أكثر دقّة في تمييز المهام التي لا يمكن إنجازها، ويعبّر بوضوح عن حدود قدراته. لقد قمنا بتقييم معدلات الخداع في سيناريوهات شملت مهام برمجية مستحيلة أو عناصر متعددة الوسائط مفقودة، ووجدنا أن GPT‑5 (عند تفعيله للتفكير) أقل ميلاً إلى الخداع من نموذج o3 في جميع الحالات. وعند اختبار مجموعة كبيرة من المحادثات التي تمثّل الاستخدام الفعلي لـ ChatGPT، تمكّنا من خفض معدل الخداع من 4.8% في نموذج o3 إلى 2.1% في استجابات GPT‑5 عند التفكير. ورغم أن هذا يشكّل تحسّنًا ملموسًا للمستخدمين، إلا أن العمل ما يزال مستمرًا لتعزيز دقة المعلومات وصدق النماذج. يمكنك العثور على مزيد من التفاصيل في بطاقة النظام.
قبل التخفيف
بعد الحد من المخاطر
يدفع GPT‑5 حدود الأمان إلى مستوى جديد. ففي الماضي، كان ChatGPT يعتمد أساسًا على تدريب قائم على الرفض، أي أن النموذج يقرّر — بناءً على طلب المستخدم — ما إذا كان عليه الاستجابة أو الرفض. ورغم أن هذا النوع من التدريب فعّال في التعامل مع الطلبات الضارة الصريحة، إلا أنه يواجه صعوبة في المواقف التي يكون فيها قصد المستخدم مبهم، أو عندما يمكن استخدام المعلومة بشكل آمن أو ضار على حد سواء. وتتضح محدودية هذا النهج بشكل خاص في المجالات ذات الاستخدام المزدوج مثل علم الفيروسات، حيث يمكن معالجة الطلب بأمان على مستوى عام، لكنه قد يصبح خطرًا إذا نُفّذ بتفاصيل دقيقة تمكّن من إساءة استخدام المعرفة.
في GPT‑5، قدّمنا شكلًا جديدًا من التدريب على الأمان يُعرف باسم الإجابات الآمنة، يهدف إلى تعليم النموذج كيفية تقديم أكثر إجابة ممكنة فائدة مع الالتزام الكامل بحدود الأمان. وفي بعض الحالات، قد يعني ذلك تقديم إجابة جزئية أو الاكتفاء بمستوى عام من الشرح. وإذا كان من الضروري رفض الطلب، فإن GPT‑5 مُدرَّب على توضيح سبب الرفض بشفافية مع اقتراح بدائل آمنة للمستخدم. وفي كلٍ من التجارب الموجَّهة والنماذج الإنتاجية، أظهر هذا النهج الجديد قدرة أكبر على التعامل مع الأسئلة ذات الاستخدام المزدوج، ومرونة أعلى تجاه النوايا غير الواضحة، وانخفاضًا في معدلات الرفض المفرط غير المبرَّر. اقرأ المزيد عن منهجنا الجديد في تدريب الأمان، إضافةً إلى التفاصيل الكاملة حول المنهجية والمعايير والنتائج، في ورقة الإكمال الآمن.
الأمان والفائدة (استنادًا إلى الاستجابات الآمنة) مع جميع أنواع نوايا المطالبات. يُظهر نموذج GPT‑5 (مع التفكير) مستوى أعلى من الأمان والفائدة مقارنةً بالنماذج السابقة، ومع جميع أنواع نوايا المطالبات.
بشكل عام، أصبح GPT‑5 أقل ميلًا للموافقة المفرطة أو الإطراء الزائد، ويستخدم تعابير إيموجي أكثر توازنًا وأقل مبالغة، كما يتجنب الرموز التعبيرية غير الضرورية، ويقدّم تفاعلات أكثر عمقًا وهدوءًا في المتابعة مقارنةً بـ GPT‑4o. والنتيجة هي تجربة تواصل تبدو أقرب إلى محادثة مع صديق ذكي ومفيد يمتلك مستوى ذكاء أكاديمي رفيع، بدلًا من التحدث إلى نموذج ذكاء اصطناعي.
في وقت سابق من هذا العام، أطلقنا تحديثًا لنموذج GPT‑4o أدّى، من دون قصد، إلى زيادة سلوك المبالغة في المجاملة والموافقة المفرطة. وقد قمنا بسرعة بإلغاء التحديث وبدأنا بالعمل على فهم هذا السلوك والحدّ منه عبر خطوتين أساسيتين:
- تطوير تقييمات جديدة لقياس مستويات التملق
- تحسين عملية التدريب لجعل النموذج أقل تملقًا - على سبيل المثال، بإضافة حالات كان من المعتاد أن تؤدي إلى الإطراء الزائد، ثم تدريبه على تجنّب هذا السلوك.
في الاختبارات الموجهة لقياس للتملق باستخدام مطالبات مصممة خصيصًا لاستنباط إجابات متملقة، قلل نموذج GPT‑5 بشكل ملحوظ من الإجابات المتملقة (من 14.5% إلى أقل من 6%). في بعض الأحيان، قد يؤدي تقليل التملق إلى انخفاض في رضا المستخدمين، لكن التحسينات التي أجريناها قللت من التملق بأكثر من النصف مع تحقيق مكاسب أخرى قابلة للقياس، مما يتيح للمستخدمين متابعة إجراء محادثات بناءة وعالية الجودة - بما يتماشى مع هدفنا المتمثل في مساعدة الناس على استخدام ChatGPT بشكل جيد.
أصبح GPT‑5 أفضل بكثير في اتباع التعليمات، وقد انعكس ذلك بشكل مباشر على قدرته على الالتزام بالتعليمات المخصّصة.
نُطلق أيضًا تجربة بحثية لأربع شخصيات محددة مسبقًا لجميع مستخدمي ChatGPT، وذلك بفضل التحسينات في قابلية التوجيه. ستكون هذه الشخصيات متاحة في البداية للدردشة النصية، وستتوفر لاحقًا للصوت، وتتيح لك تحديد كيفية تفاعل ChatGPT — سواء كان موجزًا واحترافيًا، أو متفكّرًا وداعمًا، أو يحمل نبرة ساخرة بعض الشيء — من دون الحاجة إلى كتابة مطالبات مخصّصة. الخيارات الأربع الأولى هي: ساخر وآلي ومستمع ونيرد، وهي اختيارية ويمكن تعديلها في أي وقت من الإعدادات، وقد صُمِّمت لتتوافق مع أسلوب تواصلك الشخصي.
جميع هذه الشخصيات الجديدة تفي بمعاييرنا الداخلية — بل وتتجاوزها — في الحدّ من سلوك التملق.
ونتطلّع إلى اكتساب المزيد من الخبرات والتطوير المستمر استنادًا إلى الملاحظات الأولية من المستخدمين.
قررنا تصنيف نموذج GPT‑5 thinking على أنه عالي القدرات في المجالين البيولوجي والكيميائي، وقد قمنا بتنفيذ ضوابط أمان قوية للحد من المخاطر المرتبطة به إلى أدنى مستوى ممكن. وقد أجرينا اختبارات صارمة للنموذج ضمن إطارنا الخاص بالجاهزية (Preparedness Framework)، تضمنت 5,000 ساعة من اختبارات "اختبارات محاكاة الهجوم" بالتعاون مع شركاء مثل CAISI وUK AISI، لضمان موثوقية الأداء وسلامة الاستخدام في هذا المجال الحساس.
على غرار نهجنا المتّبع مع ChatGPT Agent، ورغم أننا لا نملك أدلّة قاطعة على أن هذا النموذج يمكن أن يساعد مستخدمًا مبتدئًا على إحداث ضرر بيولوجي جسيم — وهو الحدّ الذي نعرّفه(يفتح في نافذة جديدة) ضمن تصنيف القدرات العالية — فإننا نتّخذ منهجًا وقائيًا استباقيًا ونقوم بتفعيل الضوابط الأمنية المطلوبة منذ الآن لتعزيز الجاهزية عندما تصبح مثل هذه القدرات ممكنة. وبناءً على ذلك، يتمتّع GPT‑5 thinking بمنظومة أمان متينة تضم دفاعات متعددة الطبقات في المجال البيولوجي، تشمل: نمذجة شاملة للتهديدات، وتدريب النموذج على عدم إنتاج محتوى ضار من خلال نهجنا الجديد للإجابات الآمنة (Safe Completions)، وأنظمة تصنيف ومراقبة تفكير تعمل بشكل دائم، بالإضافة إلى قنوات تنفيذ واضحة تضمن تطبيق معايير الأمان باستمرار.
يمكنك قراءة المزيد عن منهجنا الشامل في ضمان الأمان في GPT‑5 ضمن بطاقة النظام.
لأكثر المهام تعقيدًا وصعوبة، نُطلق أيضًا GPT‑5 Pro ليحلّ محل OpenAI o3‑pro، وهو إصدار من GPT‑5 يتميّز بقدرته على التفكير لفترات أطول باستخدام قدرات حوسبة موازية فعّالة وموسّعة أثناء التنفيذ، لتقديم أعلى مستوى من الجودة وأكثر الإجابات شمولًا. يحقق GPT‑5 Pro أفضل أداء ضمن عائلة GPT‑5 في عدد من اختبارات الذكاء الصعبة، بما في ذلك أداءً رائدًا على مقياس GPQA الذي يضمّ أسئلة علمية معقّدة للغاية.
في التقييمات التي شملت أكثر من 1000 مطالبة استدلال واقعية ذات قيمة اقتصادية عالية، فضّل الخبراء الخارجيون نموذج GPT‑5 Pro على GPT‑5 thinking في 67.8% من الحالات. وقد سجّل GPT‑5 Pro انخفاضًا بنسبة 22% في معدل الأخطاء الجسيمة، وتفوّق في مجالات الصحة والعلوم والرياضيات والبرمجة، حيث قيّم الخبراء استجاباته بأنها أكثر صلة وفائدة وشمولًا.
أصبح GPT‑5 النموذج الافتراضي الجديد في ChatGPT، ليحلّ محل GPT‑4o وOpenAI o3 وOpenAI o4-mini وGPT‑4.1 وGPT‑4.5 للمستخدمين المسجّلين. كل ما عليك هو فتح ChatGPT وكتابة سؤالك، وسيتولى GPT‑5 الباقي، إذ يفعّل قدرات الاستدلال تلقائيًا عندما يرى أن الإجابة ستستفيد منها. ويمكن للمستخدمين المشتركين في الخطط المدفوعة الاستمرار في اختيار GPT‑5 Thinking من قائمة النماذج، أو كتابة عبارة مثل "فكّر بعمق في هذا" داخل الطلب لضمان استخدام الاستدلال أثناء توليد الاستجابة.
بدأ طرح GPT‑5 اليوم لجميع مستخدمي Plus وPro وTeam وFree، على أن يتم توفير الوصول لـEnterprise وEdu الأسبوع المقبل. يمكن لمستخدمي خطط Pro و Plus و Team أيضًا بدء البرمجة باستخدام نموذج GPT‑5 ضمن واجهة Codex CLI(يفتح في نافذة جديدة) من خلال تسجيل الدخول باستخدام حساب ChatGPT.
كما هو الحال مع GPT‑4o، فإن الفارق بين الوصول المجاني والمدفوع إلى GPT‑5 يتمثل في حجم الاستخدام. حيث يحصل مشتركو Pro على إمكانية وصول غير محدود إلى GPT‑5 بالإضافة إلى إمكانية استخدام GPT‑5 Pro، بينما يمكن لمستخدمي Plus استخدامه بسهولة كنموذج افتراضي للإجابة على الأسئلة اليومية، مع حدود استخدام أعلى بكثير من المستخدمين المجانيين. أما عملاء Team وEnterprise وEdu فيمكنهم أيضًا الاعتماد على GPT‑5 كنموذج افتراضي لأعمالهم اليومية، مع قيود سخية تتيح للمؤسسات بأكملها استخدامه بسلاسة. وبالنسبة لمستخدمي ChatGPT في الفئة المجانية، فقد تستغرق قدرات الاستدلال الكاملة بضعة أيام قبل أن يتم تفعيلها بالكامل، وعند بلوغهم حدود استخدام GPT‑5 سيتم الانتقال تلقائيًا إلى GPT‑5 Mini، وهو نموذج أصغر وأسرع يتمتع بقدرات عالية.
المؤلف
الهوامش
*هناك اختلاف طفيف في الأرقام مقارنةً بما ورد في منشورنا السابق على المدونة، إذ تم الحصول على تلك النتائج باستخدام إصدار أقدم من HLE.
**وجدنا أن المُقيِّم الافتراضي في MultiChallenge (GPT-4o) غالبًا ما يُخطئ في تقييم استجابات النماذج. وقد لاحظنا أن استبدال المُقيِّم بنموذج استدلال مثل o3-mini يُحسّن دقّة التقييم بشكل ملحوظ في العينات التي قمنا بمراجعتها.
***في اختبار MMMUPro، قمنا باحتساب متوسط الدرجات لكلٍّ من الإصدارين القياسي والبصري.
المساهمون
Aaditya Singh وAdam Fry وAdam Perelman وAdam Tart وAdi Ganesh وAhmed El-Kishky وAidan McLaughlin وAiden Low وAJ Ostrow وAkhila Ananthram وAkshay Nathan وAlan Luo وAlec Helyar وAleksander Madry وAleksandr Efremov وAleksandra Spyra وAlex Baker-Whitcomb وAlex Beutel وAlex Karpenko وAlex Makelov وAlex Neitz وAlex Wei وAlexandra Barr وAlexandre Kirchmeyer وAlexey Ivanov وAlexi Christakis وAlistair Gillespie وAllison Tam وAlly Bennett وAlvin Wan وAlyssa Huang وAmy McDonald Sandjideh وAmy Yang وAnanya Kumar وAndre Saraiva وAndrea Vallone وAndrei Gheorghe وAndres Garcia Garcia وAndrew Braunstein وAndrew Liu وAndrew Schmidt وAndrey Mereskin وAndrey Mishchenko وAndy Applebaum وAndy Rogerson وAnn Rajan وAnnie Wei وAnoop Kotha وAnubha Srivastava وAnushree Agrawal وArun Vijayvergiya وAshley Tyra وAshvin Nair وAvi Nayak وBen Eggers وBessie Ji وBeth Hoover وBill Chen وBlair Chen وBoaz Barak وBorys Minaiev وBotao Hao وBowen Baker وBrad Lightcap وBrandon McKinzie وBrandon Wang وBrendan Quinn وBrian Fioca وBrian Hsu وBrian Yang وBrian Yu وBrian Zhang وBrittany Brenner وCallie Riggins Zetino وCameron Raymond وCamillo Lugaresi وCarolina Paz وCary Hudson وCedric Whitney وChak Li وCharles Chen وCharlotte Cole وChelsea Voss وChen Ding وChen Shen وChengdu Huang وChris Colby وChris Hallacy وChris Koch وChris Lu وChristina Kaplan وChristina Kim وCJ Minott-Henriques وCliff Frey وCody Yu وColey Czarnecki وColin Reid وColin Wei وCory Decareaux وCristina Scheau وCyril Zhang وCyrus Forbes وDa Tang وDakota Goldberg وDan Roberts وDana Palmie وDaniel Kappler وDaniel Levine وDaniel Wright وDave Leo وDavid Lin وDavid Robinson وDeclan Grabb وDerek Chen وDerek Lim وDerek Salama وDibya Bhattacharjee وDimitris Tsipras وDinghua Li وDingli Yu وDJ Strouse وDrew Williams وDylan Hunn وEd Bayes وEdwin Arbus وEkin Akyurek وElaine Ya Le وElana Widmann وEli Yani وElizabeth Proehl وEnis Sert وEnoch Cheung وEri Schwartz وEric Han وEric Jiang وEric Mitchell وEric Sigler وEric Wallace وErik Ritter وErin Kavanaugh وEvan Mays وEvgenii Nikishin وFangyuan Li وFelipe Petroski Such وFilipe de Avila Belbute Peres وFilippo Raso وFlorent Bekerman وFoivos Tsimpourlas وFotis Chantzis وFrancis Song وFrancis Zhang وGaby Raila وGarrett McGrath وGary Briggs وGary Yang وGiambattista Parascandolo وGildas Chabot وGrace Kim وGrace Zhao وGregory Valiant وGuillaume Leclerc وHadi Salman وHanson Wang وHao Sheng وHaoming Jiang وHaoyu Wang وHaozhun Jin وHarshit Sikchi وHeather Schmidt وHenry Aspegren وHonglin Chen وHuida Qiu وHunter Lightman وIan Covert وIan Kivlichan وIan Silber وIan Sohl وIbrahim Hammoud وIgnasi Clavera وIkai Lan وIlge Akkaya وIlya Kostrikov وIrina Kofman وIsak Etinger وIshaan Singal وJackie Hehir وJacob Huh وJacqueline Pan وJake Wilczynski وJakub Pachocki وJames Lee وJames Quinn وJamie Kiros وJanvi Kalra وJasmyn Samaroo وJason Wang وJason Wolfe وJay Chen وJay Wang وJean Harb وJeffrey Han وJeffrey Wang وJennifer Zhao وJeremy Chen وJerene Yang وJerry Tworek وJesse Chand وJessica Landon وJessica Liang وJi Lin وJiancheng Liu وJianfeng Wang وJie Tang وJihan Yin وJoanne Jang وJoel Morris وJoey Flynn وJohannes Ferstad وJohannes Heidecke وJohn Fishbein وJohn Hallman وJonah Grant وJonathan Chien وJonathan Gordon وJongsoo Park وJordan Liss وJos Kraaijeveld وJoseph Guay وJoseph Mo وJosh Lawson وJosh McGrath وJoshua Vendrow وJoy Jiao وJulian Lee وJulie Steele وJulie Wang وJunhua Mao وKai Chen وKai Hayashi وKai Xiao وKamyar Salahi وKan Wu وKaran Sekhri وKaran Sharma وKaran Singhal وKaren Li وKenny Nguyen وKeren Gu-Lemberg وKevin King وKevin Liu وKevin Stone وKevin Yu وKristen Ying وKristian Georgiev وKristie Lim وKushal Tirumala وKyle Miller وLama Ahmad وLarry Lv وLaura Clare وLaurance Fauconnet وLauren Itow وLauren Yang وLaurentia Romaniuk وLeah Anise وLee Byron وLeher Pathak وLeon Maksin وLeyan Lo وLeyton Ho وLi Jing وLiang Wu وLiang Xiong وLien Mamitsuka وLin Yang وLindsay McCallum وLindsey Held وLiz Bourgeois وLogan Engstrom وLorenz Kuhn وLouis Feuvrier وLu Zhang وLucas Switzer وLukas Kondraciuk وLukasz Kaiser وManas Joglekar وMandeep Singh وMandip Shah وManuka Stratta وMarcus Williams وMark Chen وMark Sun وMarselus Cayton وMartin Li وMarvin Zhang وMarwan Aljubeh وMatt Nichols وMatthew Haines وMax Schwarzer وMayank Gupta وMeghan Shah وMelody Huang وMeng Dong وMengqing Wang وMia Glaese وMicah Carroll وMichael Lampe وMichael Malek وMichael Sharman وMichael Zhang وMichele Wang وMichelle Pokrass وMihai Florian وMikhail Pavlov وMiles Wang وMing Chen وMingxuan Wang وMinnia Feng وMo Bavarian وMolly Lin وMoose Abdool وMostafa Rohaninejad وNacho Soto وNatalie Staudacher وNatan LaFontaine وNathan Marwell وNelson Liu وNick Preston وNick Turley وNicklas Ansman وNicole Blades وNikil Pancha وNikita Mikhaylin وNiko Felix وNikunj Handa وNishant Rai وNitish Keskar وNoam Brown وOfir Nachum وOleg Boiko وOleg Murk وOlivia Watkins وOona Gleeson وPamela Mishkin وPatryk Lesiewicz وPaul Baltescu وPavel Belov وPeter Zhokhov وPhilip Pronin وPhillip Guo وPhoebe Thacker وQi Liu وQiming Yuan وQinghua Liu وRachel Dias وRachel Puckett وRahul Arora وRavi Teja Mullapudi وRaz Gaon وReah Miyara وRennie Song وRishabh Aggarwal وRJ Marsan وRobel Yemiru وRobert Xiong وRohan Kshirsagar وRohan Nuttall وRoman Tsiupa وRonen Eldan وRose Wang وRoshan James وRoy Ziv وRui Shu وRuslan Nigmatullin وSaachi Jain وSaam Talaie وSam Altman وSam Arnesen وSam Toizer وSam Toyer وSamuel Miserendino وSandhini Agarwal وSarah Yoo وSavannah Heon وScott Ethersmith وSean Grove وSean Taylor وSebastien Bubeck وSever Banesiu وShaokyi Amdo وShengjia Zhao وSherwin Wu وShibani Santurkar وShiyu Zhao وShraman Ray Chaudhuri وShreyas Krishnaswamy وShuaiqi (Tony) Xia وShuyang Cheng وShyamal Anadkat وSimón Posada Fishman وSimon Tobin وSiyuan Fu وSomay Jain وSong Mei وSonya Egoian وSpencer Kim وSpug Golden وSQ Mah وSteph Lin وStephen Imm وSteve Sharpe وSteve Yadlowsky وSulman Choudhry وSungwon Eum وSuvansh Sanjeev وTabarak Khan وTal Stramer وTao Wang وTao Xin وTarun Gogineni وTaya Christianson وTed Sanders وTejal Patwardhan وThomas Degry وThomas Shadwell وTianfu Fu وTianshi Gao وTimur Garipov وTina Sriskandarajah وToki Sherbakov وTomer Kaftan وTomo Hiratsuka وTongzhou Wang وTony Song وTony Zhao وTroy Peterson وVal Kharitonov وVictoria Chernova وVineet Kosaraju وVishal Kuo وVitchyr Pong وVivek Verma وVlad Petrov وWanning Jiang وWeixing Zhang وWenda Zhou وWenlei Xie وWenting Zhan وWes McCabe وWill DePue وWill Ellsworth وWulfie Bain وWyatt Thompson وXiangning Chen وXiangyu Qi وXin Xiang وXinwei Shi وYann Dubois وYaodong Yu وYara Khakbaz وYifan Wu وYilei Qian وYin Tat Lee وYinbo Chen وYizhen Zhang وYizhong Xiong وYonglong Tian وYoung Cha وYu Bai وYu Yang وYuan Yuan وYuanzhi Li وYufeng Zhang وYuguang Yang وYujia Jin وYun Jiang وYunyun Wang وYushi Wang وYutian Liu وZach Stubenvoll وZehao Dou وZheng Wu وZhigang Wang


