إطلاق GPT‑4.5
معاينة بحثية لأقوى نموذج GPT لدينا. متاح لمستخدمي Pro والمطورين في جميع أنحاء العالم.
نحن بصدد إصدار معاينة بحثية لنموذج GPT‑4.5 وهو أكبر وأفضل نموذج للدردشة حتى الآن. يُعَد نموذج GPT‑4.5 خطوة متقدمة في توسيع نطاق التدريب المسبق والتدريب اللاحق. فمن خلال توسيع نطاق التعلم غير الخاضع للإشراف، يعزز نموذج GPT‑4.5 قدرته على التعرف على الأنماط، وإقامة الروابط، وإنشاء رؤى إبداعية دون حاجة إلى الاستدلال.
تشير الاختبارات المبكرة إلى أن التفاعل مع نموذج GPT‑4.5 يبدو أكثر طبيعية. فكلٌّ من معلوماته الأوسع، وقدرته المحسَّنة على متابعة ما يحاول المستخدم إنجازه، وذكاؤه العاطفي الأعلى يجعله مفيدًا في مهام مثل تحسين الكتابة، البرمجة، وحل المشكلات العملية. كما نتوقع أيضًا أن تقل الهلوسة في هذا النموذج.
ونشارك نموذج GPT‑4.5 كمعاينة بحثية لفهم نقاط قوته وقيوده بشكل أفضل. وما زلنا في استكشاف ما يمكن أن يفعله ونتطلع بشغف لرؤية كيف سيستخدمه الناس بطرق لم نكن نتوقعها.
نحن نعزز قدرات الذكاء الاصطناعي من خلال توسيع نطاق منهجيتين متكاملتين: التعلم غير الخاضع للإشراف والاستدلال (التفكير المنطقي المتعمق). فهما يمثلان محورين من محاور الذكاء.
- يعزز التعلم غير الخاضع للإشراف دقة النموذج العالمي والحدس. وتسهم نماذج مثل GPT‑3.5 و GPT‑4 و GPT‑4.5 في تقدم هذه المنهجية.
- أما التفكير المتدرج، من ناحية أخرى، فهو يُعلِّم النماذج أن تفكر وتنتج سلسلة من الأفكار قبل أن تستجيب، ما يسمح لها بمعالجة مسائل العلوم والتكنولوجيا والهندسة والرياضيات المعقدة أو المشكلات المنطقية. تسهم نماذج مثل OpenAI o1 و OpenAI o3‑mini في تقدم هذه المنهجية.
يُعد نموذج GPT‑4.5 مثالاً على توسيع نطاق التعلم غير الخاضع للإشراف من خلال زيادة قوة الحوسبة وزيادة البيانات، إلى جانب ابتكارات أخرى في البنية والتحسين. تم تدريب GPT‑4.5 على حواسيب Microsoft Azure الفائقة المخصّصة للذكاء الاصطناعي. والنتيجة هي نموذج يمتلك معلومات أوسع وفهمًا أعمق للعالم، مما أدى إلى تقليل حالات الهلوسة وزيادة الموثوقية في مجموعة كبيرة من الموضوعات.
توسيع نطاق نموذج GPT
معلومات أعمق بالعالم
دقة SimpleQA (الأعلى هو الأفضل)
معدل الهلوسة في SimpleQA (الأقل هو الأفضل)
يقيس SimpleQA مدى الدقة الواقعية التي يتمتع بها النموذج اللغوي الكبير (LLM) في أسئلة معلومات بسيطة لكنها صعبة.
ومع توسيع نماذجنا وقدرتها على حل مشكلات أكثر تعقيدًا، يصبح من المهم بشكل متزايد تعليم هذه النماذج كيف تفهم احتياجات البشر ونواياهم فهمًا أعمق. وبالنسبة إلى نموذج GPT‑4.5، طوَّرنا أساليب جديدة قابلة للتوسع تُمكّن من تدريب نماذج أكبر وأكثر قوة باستخدام بيانات مستمدة من نماذج أصغر. تعمل هذه الأساليب على تحسين أداء نموذج GPT‑4.5 من ناحية القدرة على التوجيه، وفهم الفروق الدقيقة، والمحادثة الطبيعية.
التقييمات المقارنة للمختبرين البشريين
على مقياس تفضيل الإنسان، يتم قياس النسبة المئوية للاستفسارات التي انحاز فيها المختبِرون إلى نموذج GPT‑4.5 بدلاً من نموذج GPT‑4o.
يؤدي الجمع بين الفهم العميق للعالم وتحسين التعاون إلى نموذج يدمج الأفكار بشكل طبيعي في محادثات دافئة وبديهية تتواءم بشكل أفضل مع التعاون البشري. يتمتع نموذج GPT‑4.5 بفهم أفضل لما يقصده البشر ويفسر الإشارات الخفية أو التوقعات الضمنية بمزيد من الفهم العميق و"الذكاء العاطفي". كما يُظهر نموذج GPT‑4.5 أيضًا حدسًا جماليًا وإبداعًا أقوى. فهو ممتاز في المساعدة على أداء مهام الكتابة والتصميم.
حالات الاستخدام
GPT-4.5
يُظهر نموذج GPT‑4.5 ذكاءً عاطفيًا أكبر ويعرف متى يدعو إلى مزيد من المحادثة ومتى يُزوّد المستخدم بمعلومات شاملة.
لا يفكر نموذج GPT‑4.5 قبل أن يستجيب، مما يجعل نقاط قوته مختلفة بشكل خاص عن نماذج الاستدلال مثل نموذج OpenAI o1. وبمقارنته بنموذج OpenAI o1 و OpenAI o3‑mini، يُعَد نموذج GPT‑4.5 أكثر عمومية وذكاءً بطبيعته. ونعتقد أن الاستدلال سيكون قدرة أساسية في النماذج المستقبلية، وأن هذين النهجين في التوسع - التدريب المسبق والاستدلال - سيكمل بعضهما بعضًا. ومع ازدياد ذكاء ومعرفة نماذج مثل نموذج GPT‑4.5 من خلال التدريب المسبق؛ لذلك ستكون بمثابة أساس أقوى للاستدلال وللوكلاء الذين يستخدمون الأدوات.
كل زيادة في قدرات النماذج تمثل أيضًا فرصة لجعل النماذج أكثر أمانًا. تم تدريب نموذج GPT‑4.5 باستخدام أساليب جديدة للإشراف يتم دمجها مع الضبط الدقيق التقليدي الخاضع للإشراف (SFT) وأساليب التعلم بالتعزيز من التغذية الراجعة البشرية (RLHF) المشابهة لتلك المستخدمة مع نموذج GPT‑4o. ونأمل أن يكون هذا العمل بمثابة أساس لبناء نماذج مستقبلية أكثر قوة.
لاختبار التحسينات التي أجريناها، أجرينا مجموعة من اختبارات السلامة قبل النشر، وفقًا لإطار الاستعداد الخاص بنا(يفتح في نافذة جديدة). وقد جدنا أن توسيع نطاق نموذج GPT ساهم فعلاً في تحسين القدرات عبر تقييماتنا. وسننشر النتائج التفصيلية لهذه التقييمات في بطاقة النظام المصاحبة.
ابتداءً من اليوم، سيتمكن مستخدمو ChatGPT Pro من اختيار نموذج GPT‑4.5 في أداة اختيار النماذج على الويب والهواتف المحمولة وسطح المكتب. وسنبدأ في طرح التحديثات لمستخدمي Plus و Team الأسبوع المقبل، ثم لمستخدمي Enterprise و Edu في الأسبوع الذي يليه.
يتمتع نموذج GPT‑4.5 بإمكانية الوصول إلى أحدث المعلومات المحدَّثة عبر البحث، ويدعم تحميل الملفات والصور، ويمكنه استخدام canvas للعمل على الكتابة والبرمجة. ومع ذلك، لا يدعم نموذج GPT‑4.5 حاليًا الميزات متعددة الوسائط مثل وضع الصوت، والفيديو، ومشاركة الشاشة في ChatGPT. في المستقبل، سنعمل على تبسيط تجربة المستخدم بحيث يعمل الذكاء الاصطناعي بسلاسة من أجلكم.
نقدم أيضًا معاينة لنموذج GPT‑4.5 للمعاينة في واجهة Chat Completions API، وواجهة Assistants API للمساعدين، وواجهة Batch API للمطورين في جميع مستويات الاستخدام المدفوعة(يفتح في نافذة جديدة). يدعم النموذج ميزات رئيسية مثل استدعاء الوظائف، والنتائج المنظمة، والبث، ورسائل النظام. كما يدعم قدرات الرؤية من خلال إدخالات الصور.
استنادًا إلى الاختبارات المبكرة، قد يجد المطورون أن نموذج GPT‑4.5 مفيد بشكل خاص للتطبيقات التي تستفيد من ذكائه العاطفي العالي وإبداعه، مثل المساعدة على الكتابة، والتواصل، والتعلّم، والتدريب، والعصف الذهني. كما يُظهر قدرات قوية في التخطيط والتنفيذ الذاتي، بما في ذلك سير عمل البرمجة متعددة الخطوات وأتمتة المهام المعقدة.
يُعَد نموذج GPT‑4.5 نموذجًا كبيرًا جدًا ويتطلب قوة حوسبة مكثفة، مما يجعله أكثر تكلفة من نموذج GPT‑4o وليس بديلاً عنه. وبسبب ذلك، نحن مستمرون في تقييم ما إذا كان ينبغي الاستمرار في تقديمه في واجهة API على المدى الطويل بينما نعمل على موازنة دعم القدرات الحالية مع بناء النماذج المستقبلية. ونتطلع إلى معرفة المزيد عن نقاط قوته وقدراته وتطبيقاته المحتملة في بيئات العالم الحقيقي. وإذا ما قدم نموذج GPT‑4.5 قيمة فريدة لحالة الاستخدام الخاصة بكم، فإن ملاحظاتكم(يفتح في نافذة جديدة) ستمثل دورًا مهمًا في توجيه قرارنا.
مع كل زيادة جديدة في حجم الحوسبة تظهر قدرات جديدة. ويُعَد نموذج GPT‑4.5 أحد النماذج التي تأتي في مقدمة ما يمكن تحقيقه في التعلم غير الخاضع للإشراف. ولا تزال المفاجآت المدهشة تتوالى علينا مما نراه من إبداع المجتمع في اكتشاف قدرات جديدة وحالات استخدام لم تكن متوقعة من قبل. ومع نموذج GPT‑4.5، ندعوكم لاستكشاف حدود التعلم غير الخاضع للإشراف واكتشاف قدرات جديدة معنا.
فيما يلي، نقدم نتائج GPT‑4.5 على المعايير الأكاديمية القياسية لتوضيح الأداء الحالي في المهام المرتبطة تقليديًا بالاستدلال. حتى من خلال مجرد توسيع نطاق التعلم غير الخاضع للإشراف، يُظهر نموذج GPT‑4.5 تحسينات ذات مغزى مقارنةً بما سبقه من نماذج كنموذج GPT‑4o. ومع ذلك، نتطلع إلى الحصول على صورة أكثر اكتمالاً عن قدرات نموذج GPT‑4.5 من خلال هذا الإصدار، لأننا ندرك أن المعايير الأكاديمية لا تعكس دائمًا الفائدة في العالم الحقيقي.
درجات تقييم النموذج
GPT‑4.5 | GPT‑4o | نموذج OpenAI o3‑mini (high) | |
اختبار GPQA لحل مسائل علمية معقدة بمستوى الدراسات العليا (في العلوم) | 71.4% | 53.6% | 79.7% |
تقييم AIME ‘24 لمسابقة AIME للمرحلة الثانوية بالولايات المتحدة لعام 2024 (الرياضيات) | 36.7% | 9.3% | 87.3% |
مجموعة اختبارات MMMLU (متعددة اللغات) | 85.1% | 81.5% | 81.1% |
مجموعة اختبارات MMMU (متعددة الوسائط) | 74.4% | 69.1% | - |
SWE-Lancer Diamond (البرمجة)* | 32.6% 186,125 دولارًا | 23.3% 138,750 دولارًا | 10.8% 89,625 دولارًا |
تم التحقق من SWE-Bench (البرمجة)* | 38.0% | 30.7% | 61.0% |
*الأرقام المعروضة تمثل أفضل أداء داخلي.
الكاتبان
المساهمون الأساسيون
Adam Goucher وAlex Paino وAli Kamali وAmin Tootoonchian وAndrew Tulloch وBen Sokolowsky وClemens Winter وColin Wei وDaniel Kappler وDaniel Levy وFelipe Petroski Such وGeoff Salmon وIan O’Connell وJason Teplitz وKai Chen وNik Tezak وPrafulla Dhariwal وRapha Gontijo Lopes وSam Schoenholz وYoulong Cheng وYujia Jin وYunxing Dai
البحث
المساهمون الرئيسيون
آيدن لو، أليك رادفورد، أليكس كارني، أليكس نيكول، أليكسيس كونو، أنانيا كومار، بن وانغ، شارلوت كول، إليزابيث يانغ، غابرييل جوه، هادي سلمان، هايتانغ هو، هيوو جون، إيان سول، إيشان غولراجاني، جاكوب كوكسون، جيمس بيتكر، جيمي كيروس، جيسيكا لاندون، كايل لوثر، ليا غاي، لوكاس كوندراسيوك، ليريك دوشي، ميخائيل بافلوف، كيمينغ يوان، ريمار ليكي، روان زيلرز، شون ميتزجر، شينجيا تشاو، سبنسر باباي، تاو وانغ
المساهمون
آدم لير، أدريان إيكوفيت، أيدان ماكلولين، ألكسندر بروكوفييف، ألكساندرا بار، ألان جابري، أندرو جيبيانسكي، أندرو شميت، كايسي تشو، تشاك لي، تشيلسي فوس، كريس هالاسي، كريس كوتش، كريستين ماكلافي، ديفيد ميلي، ديميتريس تسيبراس، إريك سيغلر، إيرين كافانو، فرزاد خراساني، هويوين تشانغ، إيليا كوستريكوف، إيشان سينغال، جي لين، جياهاوي يو، جينغ يو زانغ، جون ريزو، جونغ ووك كيم، جويس لي، جونتانغ زوانغ، ليو ليو، لي جينغ، لونغ أويانغ، لويس فيوفرير، مو بافاريان، نيك ستاثاس، نيتيش كيسكار، أوليغ مورك، بريستون بومان، سكوتي يان، سكوتي ماه، تاو شو، تايلور جوردون، فاليري تشي، ويندا تشو، يو زانغ
التوسع
المساهمون الرئيسيون
أليكس تشاو، أليكس رينزين، ألكساندرا سبيرا، آفي ناياك، بن ليمبرغر، كريستوفر هيس، دوك فونغ نغوين، دينغوا لي، إريك بيترسون، فرانسيس زانج، جين أودن، كاي فريكي، كاي هاياشي، لاري لوف، ليكي زو، لين يانغ، مادلين تومبسون، مايكل بيتروف، ميغيل كاسترو، ناتاليا جيملشين، فيل تيليت، رضا زماني، ريان تشو ستانلي هسيه، ستيف لي، ستيوارت هول، توماس راو، تيانهاو تشنغ، فيشال كو، يونج جيك كيم، يوتشين زانج، زوران ليو
المساهمون
ألفين وان، أندرو كان، أندرو كوديسبوتي، أنطوان بيليس، أنوج كاليا، آرون هيرست، أفيتال أوليفر، براد بارنز، براين هسو، تشين دينغ، تشين شين، تشينج تشانج، كريستيان جيبسون، كريستوفر بيرنر، دنكان فيندلاي، فان وانغ، فانغيوان لي، جيانلوكا بوريلو، هيذر شميدت، هنريكي بوندي دي أوليفيرا بينتو، إيكاي لان، جياي ونغ، جيمس كروكس، جوس كرايجيفيلد، جونرو شاو، كيني هسو، كيني نجوين، كيفن كينغ، ليا بوركهارت، ليو تشين، ليندن لي، لو زانغ، محمود عريبي، مارات دوخان، ماتيوس ليتوين، ميكي هابرين، ناتان لافونتين، بافل بيلوف، بينغ سو، براساد تشاكا، راشيل ليم، راجكومار صامويل، رينو جوبير، روري كارمايكل، سارة دونغ، شانتانو جين، شوايكي شيا، ستيفن لوجسدون، تود أندروود، توني تشاو، ويشينغ زانغ، ويل شيو، ويي تشنغ، ينغهاي لو، يونكياو زانغ
أنظمة السلامة
Andrea Vallone وAndy Applebaum وCameron Raymond وChong Zhang وDan Mossing وElizabeth Proehl وEric Wallace وEvan Mays وGrace Zhao وIan Kivlichan وIrina Kofman وJoel Parish وKevin Liu وKeren Gu-Lemberg وKristen Ying وLama Ahmad وLilian Weng وLeon Maksin وLeyton Ho وMeghan Shah وMichael Lampe وMichele Wang وMiles Wang وOlivia Watkins وPhillip Guo وSamuel Miserendino وSam Toizer وSandhini Agarwal وTejal Patwardhan وTom Dupré la Tour وTong Mu وTyna Eloundou وYunyun Wang
النشر
Adam Brandon وAdam Perelman وAdele Li وAkshay Nathan وAlan Hayes وAlfred Xue وAlison Ben وAlec Gorge وAlex Guziel وAlex Iftimie وAlly Bennett وAndrew Chen وAndy Wang وAndy Wood وAngad Singh وAnoop Kotha وAntonia Woodford وAnuj Saharan وAshley Tyra وAtty Eleti وBen Schneider وBessie Ji وBeth Hoover وBill Chen وBlake Samic وBritney Smith وBrian Yu وCaleb Wang وCary Bassin وCary Hudson وCharlie Jatt وChengdu Huang وChris Beaumont وChristina Huang وCristina Scheau وDana Palmie وDaniel Levine وDaryl Neubieser وDave Cummings وDavid Sasaki وDibya Bhattacharjee وDylan Hunn وEdwin Arbus وElaine Ya Le وEnis Sert وEric Kramer وFred von Lohmann وFreddie Sulit وGaby Janatpour وGarrett McGrath وGarrett Ollinger وGary Yang وHao Sheng وHarold Hotelling وJanardhanan Vembunarayanan وJeff Harris وJeffrey Sabin Matsumoto وJennifer Robinson وJessica Liang وJessica Shieh وJiacheng Yang وJoel Morris وJoseph Florencio وJosh Kaplan وKan Wu وKaran Sharma وKaren Li وKatie Pypes وKendal Simon وKendra Rimbach وKevin Park وKevin Rao وLaurance Fauconnet وLauren Workman وLeher Pathak وLiang Wu وLiang Xiong وLien Mamitsuka وLindsay McCallum وLukas Gross وManoli Liodakis وMatt Nichols وMichelle Fradin وMinal Khan وMingxuan Wang وNacho Soto وNatalie Staudacher وNikunj Handa وNiko Felix وNing Liu وOlivier Godement وOona Gleeson وPhilip Pronin وRaymond Li وReah Miyara وRobert Xiong وRohan Nuttall وR.J. Marsan وSara Culver وScott Ethersmith وSean Fitzgerald وShamez Hemani وSherwin Wu وShiao Lee وShuyang Cheng وSiyuan Fu وSpug Golden وSteve Coffey وSteven Heidel وSundeep Tirumalareddy وTabarak Khan وThomas Degry وThomas Dimson وTom Stasi وTomo Hiratsuka وTrevor Creech وUzair Navid Iftikhar وVictoria Chernova وVictoria Spiegel وWanning Jiang وWenlei Xie وYaming Lin وYara Khakbaz وYilei Qian وYilong Qin وYo Shavit وZhi Bie
القيادة التنفيذية
Aidan Clark وBob McGrew وDavid Farhi وGreg Brockman وHannah Wong وJakub Pachocki وJohannes Heidecke وJoanne Jang وKate Rouch وKevin Weil وLauren Itow وLiam Fedus وMark Chen وMia Glaese وMira Murati وNick Ryder وSam Altman وSrinivas Narayanan وTal Broda