27 فبراير 2025

إطلاق GPT‑4.5

معاينة بحثية لأقوى نموذج GPT لدينا. متاح لمستخدمي Pro والمطورين في جميع أنحاء العالم.

جاري التحميل...

نحن بصدد إصدار معاينة بحثية لنموذج GPT‑4.5 وهو أكبر وأفضل نموذج للدردشة حتى الآن. يُعَد نموذج GPT‑4.5 خطوة متقدمة في توسيع نطاق التدريب المسبق والتدريب اللاحق. فمن خلال توسيع نطاق التعلم غير الخاضع للإشراف، يعزز نموذج GPT‑4.5 قدرته على التعرف على الأنماط، وإقامة الروابط، وإنشاء رؤى إبداعية دون حاجة إلى الاستدلال.

تشير الاختبارات المبكرة إلى أن التفاعل مع نموذج GPT‑4.5 يبدو أكثر طبيعية. فكلٌّ من معلوماته الأوسع، وقدرته المحسَّنة على متابعة ما يحاول المستخدم إنجازه، وذكاؤه العاطفي الأعلى يجعله مفيدًا في مهام مثل تحسين الكتابة، البرمجة، وحل المشكلات العملية. كما نتوقع أيضًا أن تقل الهلوسة في هذا النموذج.

ونشارك نموذج GPT‑4.5 كمعاينة بحثية لفهم نقاط قوته وقيوده بشكل أفضل. وما زلنا في استكشاف ما يمكن أن يفعله ونتطلع بشغف لرؤية كيف سيستخدمه الناس بطرق لم نكن نتوقعها.

توسيع التعلم غير الخاضع للإشراف

نحن نعزز قدرات الذكاء الاصطناعي من خلال توسيع نطاق منهجيتين متكاملتين: التعلم غير الخاضع للإشراف والاستدلال (التفكير المنطقي المتعمق). فهما يمثلان محورين من محاور الذكاء.

يعزز التعلم غير الخاضع للإشراف دقة النموذج العالمي والحدس. وتسهم نماذج مثل GPT‑3.5 و GPT‑4 و GPT‑4.5 في تقدم هذه المنهجية.
أما التفكير المتدرج⁠، من ناحية أخرى، فهو يُعلِّم النماذج أن تفكر وتنتج سلسلة من الأفكار قبل أن تستجيب، ما يسمح لها بمعالجة مسائل العلوم والتكنولوجيا والهندسة والرياضيات المعقدة أو المشكلات المنطقية. تسهم نماذج مثل OpenAI o1 و OpenAI o3‑mini في تقدم هذه المنهجية.

يُعد نموذج GPT‑4.5 مثالاً على توسيع نطاق التعلم غير الخاضع للإشراف من خلال زيادة قوة الحوسبة وزيادة البيانات، إلى جانب ابتكارات أخرى في البنية والتحسين. تم تدريب GPT‑4.5 على حواسيب Microsoft Azure الفائقة المخصّصة للذكاء الاصطناعي. والنتيجة هي نموذج يمتلك معلومات أوسع وفهمًا أعمق للعالم، مما أدى إلى تقليل حالات الهلوسة وزيادة الموثوقية في مجموعة كبيرة من الموضوعات.

توسيع نطاق نموذج GPT

What was the first language?

We don’t know exactly what the first language was, and scientists believe we’ll probably never know for sure because spoken languages appeared long before written records existed.

Here’s what we do know:

No single "first language": Languages likely developed gradually in different groups of humans around the same time, tens or even hundreds of thousands of years ago.
Origin in Africa: Most scientists agree that spoken language probably first emerged among humans in Africa, perhaps over 100,000 years ago.
Proto-languages: Rather than a single language, humans likely started with simple communication that evolved into more complex languages. The earliest forms of language probably included gestures, sounds, and signals to express basic ideas and emotions.
Lost to history: Because speech leaves no direct fossil record, and writing emerged relatively recently (around 5,000 years ago), we have no way to know exactly how the earliest languages sounded.

Today, linguists study existing languages to understand how they evolved over thousands of years, but the exact identity of humanity’s very first language remains—and will likely always remain—a mystery.

معلومات أعمق بالعالم

دقة SimpleQA (الأعلى هو الأفضل)

معدل الهلوسة في SimpleQA (الأقل هو الأفضل)

يقيس SimpleQA مدى الدقة الواقعية التي يتمتع بها النموذج اللغوي الكبير (LLM) في أسئلة معلومات بسيطة لكنها صعبة.

التدريب على التعاون البشري

ومع توسيع نماذجنا وقدرتها على حل مشكلات أكثر تعقيدًا، يصبح من المهم بشكل متزايد تعليم هذه النماذج كيف تفهم احتياجات البشر ونواياهم فهمًا أعمق. وبالنسبة إلى نموذج GPT‑4.5، طوَّرنا أساليب جديدة قابلة للتوسع تُمكّن من تدريب نماذج أكبر وأكثر قوة باستخدام بيانات مستمدة من نماذج أصغر. تعمل هذه الأساليب على تحسين أداء نموذج GPT‑4.5 من ناحية القدرة على التوجيه، وفهم الفروق الدقيقة، والمحادثة الطبيعية.

التقييمات المقارنة للمختبرين البشريين

على مقياس تفضيل الإنسان، يتم قياس النسبة المئوية للاستفسارات التي انحاز فيها المختبِرون إلى نموذج GPT‑4.5 بدلاً من نموذج GPT‑4o.

يؤدي الجمع بين الفهم العميق للعالم وتحسين التعاون إلى نموذج يدمج الأفكار بشكل طبيعي في محادثات دافئة وبديهية تتواءم بشكل أفضل مع التعاون البشري. يتمتع نموذج GPT‑4.5 بفهم أفضل لما يقصده البشر ويفسر الإشارات الخفية أو التوقعات الضمنية بمزيد من الفهم العميق و"الذكاء العاطفي". كما يُظهر نموذج GPT‑4.5 أيضًا حدسًا جماليًا وإبداعًا أقوى. فهو ممتاز في المساعدة على أداء مهام الكتابة والتصميم.

حالات الاستخدام

GPT-4.5

I’m going through a tough time after failing a test

Aw, I’m really sorry to hear that. Failing a test can feel pretty tough and discouraging, but remember, it’s just one moment—not a reflection of who you are or your capabilities. Want to talk about what happened, or do you just need a distraction? I’m here either way.

I’m going through a tough time after failing a test

I’m really sorry to hear that you’re going through a tough time. Here are a few things you might consider:

1. Reflect and Understand: Try to analyze what might have gone wrong. Was it a lack of preparation, time management during the test, or perhaps misunderstanding the material? Understanding the root cause can help you address it in the future.

2. Seek Support: Talk to someone you trust—friends, family, or a school counselor. They can offer a different perspective and sometimes just talking about your feelings can be alleviating.

3. Speak with Your Teacher or Professor: They can provide insights into where you might have gone wrong and offer advice on how to improve. They might also offer opportunities for make-up work or extra credit.

4. Develop a Study Plan: Based on your reflections, create a plan to improve your study habits. This might include setting regular study times, breaking down material into manageable portions, or finding new study methods that work better for you.

5. Stay Positive and Forgive Yourself: Mistakes and setbacks are a part of life. It’s important to be kind to yourself and recognize that failure is a stepping stone to success.

6. Focus on the Bigger Picture: Remember that one test is just one part of your educational journey. There will be many more opportunities to do well.

If you need further support or resources, consider reaching out to educational support services at your institution, or mental health resources if you’re feeling particularly overwhelmed. You’re not alone in this, and things can get better with time and effort.

يُظهر نموذج GPT‑4.5 ذكاءً عاطفيًا أكبر ويعرف متى يدعو إلى مزيد من المحادثة ومتى يُزوّد المستخدم بمعلومات شاملة.

استدلال أقوى يلوح في الأفق

لا يفكر نموذج GPT‑4.5 قبل أن يستجيب، مما يجعل نقاط قوته مختلفة بشكل خاص عن نماذج الاستدلال مثل نموذج OpenAI o1. وبمقارنته بنموذج OpenAI o1 و OpenAI o3‑mini، يُعَد نموذج GPT‑4.5 أكثر عمومية وذكاءً بطبيعته. ونعتقد أن الاستدلال سيكون قدرة أساسية في النماذج المستقبلية، وأن هذين النهجين في التوسع - التدريب المسبق والاستدلال - سيكمل بعضهما بعضًا. ومع ازدياد ذكاء ومعرفة نماذج مثل نموذج GPT‑4.5 من خلال التدريب المسبق؛ لذلك ستكون بمثابة أساس أقوى للاستدلال وللوكلاء الذين يستخدمون الأدوات.

السلامة

كل زيادة في قدرات النماذج تمثل أيضًا فرصة لجعل النماذج أكثر أمانًا. تم تدريب نموذج GPT‑4.5 باستخدام أساليب جديدة للإشراف يتم دمجها مع الضبط الدقيق التقليدي الخاضع للإشراف (SFT) وأساليب التعلم بالتعزيز من التغذية الراجعة البشرية (RLHF) المشابهة لتلك المستخدمة مع نموذج GPT‑4o. ونأمل أن يكون هذا العمل بمثابة أساس لبناء نماذج مستقبلية أكثر قوة.

لاختبار التحسينات التي أجريناها، أجرينا مجموعة من اختبارات السلامة قبل النشر، وفقًا لإطار الاستعداد الخاص بنا⁠(يفتح في نافذة جديدة). وقد جدنا أن توسيع نطاق نموذج GPT ساهم فعلاً في تحسين القدرات عبر تقييماتنا. وسننشر النتائج التفصيلية لهذه التقييمات في بطاقة النظام⁠ المصاحبة.

كيفية استخدام نموذج GPT-4.5 في ChatGPT

ابتداءً من اليوم، سيتمكن مستخدمو ChatGPT Pro من اختيار نموذج GPT‑4.5 في أداة اختيار النماذج على الويب والهواتف المحمولة وسطح المكتب. وسنبدأ في طرح التحديثات لمستخدمي Plus و Team الأسبوع المقبل، ثم لمستخدمي Enterprise و Edu في الأسبوع الذي يليه.

يتمتع نموذج GPT‑4.5 بإمكانية الوصول إلى أحدث المعلومات المحدَّثة عبر البحث، ويدعم تحميل الملفات والصور، ويمكنه استخدام canvas للعمل على الكتابة والبرمجة. ومع ذلك، لا يدعم نموذج GPT‑4.5 حاليًا الميزات متعددة الوسائط مثل وضع الصوت، والفيديو، ومشاركة الشاشة في ChatGPT. في المستقبل، سنعمل على تبسيط تجربة المستخدم بحيث يعمل الذكاء الاصطناعي بسلاسة من أجلكم.

كيفية استخدام نموذج GPT-4.5 في واجهة API

نقدم أيضًا معاينة لنموذج GPT‑4.5 للمعاينة في واجهة Chat Completions API، وواجهة Assistants API للمساعدين، وواجهة Batch API للمطورين في جميع مستويات الاستخدام المدفوعة⁠(يفتح في نافذة جديدة). يدعم النموذج ميزات رئيسية مثل استدعاء الوظائف، والنتائج المنظمة، والبث، ورسائل النظام. كما يدعم قدرات الرؤية من خلال إدخالات الصور.

استنادًا إلى الاختبارات المبكرة، قد يجد المطورون أن نموذج GPT‑4.5 مفيد بشكل خاص للتطبيقات التي تستفيد من ذكائه العاطفي العالي وإبداعه، مثل المساعدة على الكتابة، والتواصل، والتعلّم، والتدريب، والعصف الذهني. كما يُظهر قدرات قوية في التخطيط والتنفيذ الذاتي، بما في ذلك سير عمل البرمجة متعددة الخطوات وأتمتة المهام المعقدة.

يُعَد نموذج GPT‑4.5 نموذجًا كبيرًا جدًا ويتطلب قوة حوسبة مكثفة، مما يجعله أكثر تكلفة⁠ من نموذج GPT‑4o وليس بديلاً عنه. وبسبب ذلك، نحن مستمرون في تقييم ما إذا كان ينبغي الاستمرار في تقديمه في واجهة API على المدى الطويل بينما نعمل على موازنة دعم القدرات الحالية مع بناء النماذج المستقبلية. ونتطلع إلى معرفة المزيد عن نقاط قوته وقدراته وتطبيقاته المحتملة في بيئات العالم الحقيقي. وإذا ما قدم نموذج GPT‑4.5 قيمة فريدة لحالة الاستخدام الخاصة بكم، فإن ملاحظاتكم⁠(يفتح في نافذة جديدة) ستمثل دورًا مهمًا في توجيه قرارنا.

النتائج

مع كل زيادة جديدة في حجم الحوسبة تظهر قدرات جديدة. ويُعَد نموذج GPT‑4.5 أحد النماذج التي تأتي في مقدمة ما يمكن تحقيقه في التعلم غير الخاضع للإشراف. ولا تزال المفاجآت المدهشة تتوالى علينا مما نراه من إبداع المجتمع في اكتشاف قدرات جديدة وحالات استخدام لم تكن متوقعة من قبل. ومع نموذج GPT‑4.5، ندعوكم لاستكشاف حدود التعلم غير الخاضع للإشراف واكتشاف قدرات جديدة معنا.

الملحق

فيما يلي، نقدم نتائج GPT‑4.5 على المعايير الأكاديمية القياسية لتوضيح الأداء الحالي في المهام المرتبطة تقليديًا بالاستدلال. حتى من خلال مجرد توسيع نطاق التعلم غير الخاضع للإشراف، يُظهر نموذج GPT‑4.5 تحسينات ذات مغزى مقارنةً بما سبقه من نماذج كنموذج GPT‑4o. ومع ذلك، نتطلع إلى الحصول على صورة أكثر اكتمالاً عن قدرات نموذج GPT‑4.5 من خلال هذا الإصدار، لأننا ندرك أن المعايير الأكاديمية لا تعكس دائمًا الفائدة في العالم الحقيقي.

درجات تقييم النموذج

	GPT‑4.5	GPT‑4o	نموذج OpenAI o3‑mini (high)
اختبار GPQA لحل مسائل علمية معقدة بمستوى الدراسات العليا (في العلوم)	71.4%	53.6%	79.7%
تقييم AIME ‘24 لمسابقة AIME للمرحلة الثانوية بالولايات المتحدة لعام 2024 (الرياضيات)	36.7%	9.3%	87.3%
مجموعة اختبارات MMMLU (متعددة اللغات)	85.1%	81.5%	81.1%
مجموعة اختبارات MMMU (متعددة الوسائط)	74.4%	69.1%	-
SWE-Lancer Diamond (البرمجة)*	32.6% 186,125 دولارًا	23.3% 138,750 دولارًا	10.8% 89,625 دولارًا
تم التحقق من SWE-Bench (البرمجة)*	38.0%	30.7%	61.0%

*الأرقام المعروضة تمثل أفضل أداء داخلي.

الكاتبان

OpenAI

المساهمون الأساسيون

Adam Goucher وAlex Paino وAli Kamali وAmin Tootoonchian وAndrew Tulloch وBen Sokolowsky وClemens Winter وColin Wei وDaniel Kappler وDaniel Levy وFelipe Petroski Such وGeoff Salmon وIan O’Connell وJason Teplitz وKai Chen وNik Tezak وPrafulla Dhariwal وRapha Gontijo Lopes وSam Schoenholz وYoulong Cheng وYujia Jin وYunxing Dai

البحث

المساهمون الرئيسيون

آيدن لو، أليك رادفورد، أليكس كارني، أليكس نيكول، أليكسيس كونو، أنانيا كومار، بن وانغ، شارلوت كول، إليزابيث يانغ، غابرييل جوه، هادي سلمان، هايتانغ هو، هيوو جون، إيان سول، إيشان غولراجاني، جاكوب كوكسون، جيمس بيتكر، جيمي كيروس، جيسيكا لاندون، كايل لوثر، ليا غاي، لوكاس كوندراسيوك، ليريك دوشي، ميخائيل بافلوف، كيمينغ يوان، ريمار ليكي، روان زيلرز، شون ميتزجر، شينجيا تشاو، سبنسر باباي، تاو وانغ

المساهمون

آدم لير، أدريان إيكوفيت، أيدان ماكلولين، ألكسندر بروكوفييف، ألكساندرا بار، ألان جابري، أندرو جيبيانسكي، أندرو شميت، كايسي تشو، تشاك لي، تشيلسي فوس، كريس هالاسي، كريس كوتش، كريستين ماكلافي، ديفيد ميلي، ديميتريس تسيبراس، إريك سيغلر، إيرين كافانو، فرزاد خراساني، هويوين تشانغ، إيليا كوستريكوف، إيشان سينغال، جي لين، جياهاوي يو، جينغ يو زانغ، جون ريزو، جونغ ووك كيم، جويس لي، جونتانغ زوانغ، ليو ليو، لي جينغ، لونغ أويانغ، لويس فيوفرير، مو بافاريان، نيك ستاثاس، نيتيش كيسكار، أوليغ مورك، بريستون بومان، سكوتي يان، سكوتي ماه، تاو شو، تايلور جوردون، فاليري تشي، ويندا تشو، يو زانغ

التوسع

المساهمون الرئيسيون

أليكس تشاو، أليكس رينزين، ألكساندرا سبيرا، آفي ناياك، بن ليمبرغر، كريستوفر هيس، دوك فونغ نغوين، دينغوا لي، إريك بيترسون، فرانسيس زانج، جين أودن، كاي فريكي، كاي هاياشي، لاري لوف، ليكي زو، لين يانغ، مادلين تومبسون، مايكل بيتروف، ميغيل كاسترو، ناتاليا جيملشين، فيل تيليت، رضا زماني، ريان تشو ستانلي هسيه، ستيف لي، ستيوارت هول، توماس راو، تيانهاو تشنغ، فيشال كو، يونج جيك كيم، يوتشين زانج، زوران ليو

المساهمون

ألفين وان، أندرو كان، أندرو كوديسبوتي، أنطوان بيليس، أنوج كاليا، آرون هيرست، أفيتال أوليفر، براد بارنز، براين هسو، تشين دينغ، تشين شين، تشينج تشانج، كريستيان جيبسون، كريستوفر بيرنر، دنكان فيندلاي، فان وانغ، فانغيوان لي، جيانلوكا بوريلو، هيذر شميدت، هنريكي بوندي دي أوليفيرا بينتو، إيكاي لان، جياي ونغ، جيمس كروكس، جوس كرايجيفيلد، جونرو شاو، كيني هسو، كيني نجوين، كيفن كينغ، ليا بوركهارت، ليو تشين، ليندن لي، لو زانغ، محمود عريبي، مارات دوخان، ماتيوس ليتوين، ميكي هابرين، ناتان لافونتين، بافل بيلوف، بينغ سو، براساد تشاكا، راشيل ليم، راجكومار صامويل، رينو جوبير، روري كارمايكل، سارة دونغ، شانتانو جين، شوايكي شيا، ستيفن لوجسدون، تود أندروود، توني تشاو، ويشينغ زانغ، ويل شيو، ويي تشنغ، ينغهاي لو، يونكياو زانغ

أنظمة السلامة

Andrea Vallone وAndy Applebaum وCameron Raymond وChong Zhang وDan Mossing وElizabeth Proehl وEric Wallace وEvan Mays وGrace Zhao وIan Kivlichan وIrina Kofman وJoel Parish وKevin Liu وKeren Gu-Lemberg وKristen Ying وLama Ahmad وLilian Weng وLeon Maksin وLeyton Ho وMeghan Shah وMichael Lampe وMichele Wang وMiles Wang وOlivia Watkins وPhillip Guo وSamuel Miserendino وSam Toizer وSandhini Agarwal وTejal Patwardhan وTom Dupré la Tour وTong Mu وTyna Eloundou وYunyun Wang

النشر

Adam Brandon وAdam Perelman وAdele Li وAkshay Nathan وAlan Hayes وAlfred Xue وAlison Ben وAlec Gorge وAlex Guziel وAlex Iftimie وAlly Bennett وAndrew Chen وAndy Wang وAndy Wood وAngad Singh وAnoop Kotha وAntonia Woodford وAnuj Saharan وAshley Tyra وAtty Eleti وBen Schneider وBessie Ji وBeth Hoover وBill Chen وBlake Samic وBritney Smith وBrian Yu وCaleb Wang وCary Bassin وCary Hudson وCharlie Jatt وChengdu Huang وChris Beaumont وChristina Huang وCristina Scheau وDana Palmie وDaniel Levine وDaryl Neubieser وDave Cummings وDavid Sasaki وDibya Bhattacharjee وDylan Hunn وEdwin Arbus وElaine Ya Le وEnis Sert وEric Kramer وFred von Lohmann وFreddie Sulit وGaby Janatpour وGarrett McGrath وGarrett Ollinger وGary Yang وHao Sheng وHarold Hotelling وJanardhanan Vembunarayanan وJeff Harris وJeffrey Sabin Matsumoto وJennifer Robinson وJessica Liang وJessica Shieh وJiacheng Yang وJoel Morris وJoseph Florencio وJosh Kaplan وKan Wu وKaran Sharma وKaren Li وKatie Pypes وKendal Simon وKendra Rimbach وKevin Park وKevin Rao وLaurance Fauconnet وLauren Workman وLeher Pathak وLiang Wu وLiang Xiong وLien Mamitsuka وLindsay McCallum وLukas Gross وManoli Liodakis وMatt Nichols وMichelle Fradin وMinal Khan وMingxuan Wang وNacho Soto وNatalie Staudacher وNikunj Handa وNiko Felix وNing Liu وOlivier Godement وOona Gleeson وPhilip Pronin وRaymond Li وReah Miyara وRobert Xiong وRohan Nuttall وR.J. Marsan وSara Culver وScott Ethersmith وSean Fitzgerald وShamez Hemani وSherwin Wu وShiao Lee وShuyang Cheng وSiyuan Fu وSpug Golden وSteve Coffey وSteven Heidel وSundeep Tirumalareddy وTabarak Khan وThomas Degry وThomas Dimson وTom Stasi وTomo Hiratsuka وTrevor Creech وUzair Navid Iftikhar وVictoria Chernova وVictoria Spiegel وWanning Jiang وWenlei Xie وYaming Lin وYara Khakbaz وYilei Qian وYilong Qin وYo Shavit وZhi Bie

القيادة التنفيذية

Aidan Clark وBob McGrew وDavid Farhi وGreg Brockman وHannah Wong وJakub Pachocki وJohannes Heidecke وJoanne Jang وKate Rouch وKevin Weil وLauren Itow وLiam Fedus وMark Chen وMia Glaese وMira Murati وNick Ryder وSam Altman وSrinivas Narayanan وTal Broda

إطلاق GPT‑4.5

توسيع التعلم غير الخاضع للإشراف

توسيع نطاق نموذج GPT

نموذج GPT-4.5 (2025)

معلومات أعمق بالعالم

دقة SimpleQA (الأعلى هو الأفضل)

معدل الهلوسة في SimpleQA (الأقل هو الأفضل)

التدريب على التعاون البشري

التقييمات المقارنة للمختبرين البشريين

حالات الاستخدام

GPT-4.5

GPT-4o

استدلال أقوى يلوح في الأفق

السلامة

كيفية استخدام نموذج GPT-4.5 في ChatGPT

كيفية استخدام نموذج GPT-4.5 في واجهة API

النتائج

الملحق

درجات تقييم النموذج

الكاتبان

المساهمون الأساسيون

البحث

التوسع

أنظمة السلامة

النشر

القيادة التنفيذية