معرفی GPT‑4.5
پیشنمایشی تحقیقاتی از قویترین مدل GPT ما. در دسترس کاربران Pro و توسعهدهندگان در سراسر جهان است.
ما در حال انتشار یک پیشنمایش تحقیقاتی از GPT‑4.5 هستیم— بزرگترین و بهترین مدل برای گفتگو تا به امروز. GPT‑4.5 گامی به جلو در گسترش مقیاس پیشآموزش و پسآموزش است. با گسترش یادگیری بدون نظارت، GPT‑4.5 توانایی خود را در شناسایی الگوها، ایجاد ارتباطات و تولید بینشهای خلاقانه بدون نیاز به استدلال بهبود میبخشد.
آزمایشهای اولیه نشان میدهد که تعامل با GPT‑4.5 طبیعیتر به نظر میرسد. پایگاه دانش گستردهتر، توانایی بهبود یافته در دنبال کردن نیت کاربر و «EQ» بالاتر، آن را برای کارهایی مانند بهبود نوشتن، برنامهنویسی و حل مسائل عملی مفید میکند. ما همچنین انتظار داریم که کمتر دچار توهم شود.
ما GPT‑4.5 را به عنوان یک پیشنمایش تحقیقاتی به اشتراک میگذاریم تا نقاط قوت و محدودیتهای آن را بهتر درک کنیم. ما هنوز در حال بررسی قابلیتهای آن هستیم و مشتاقیم ببینیم مردم چگونه از آن به روشهایی که انتظارش را نداریم استفاده میکنند.
ما با مقیاسبندی دو الگوی مکمل، قابلیتهای هوش مصنوعی را ارتقا میدهیم: یادگیری بدون نظارت و استدلال. این ها دو محور هوش را نشان می دهند.
- یادگیری بدون نظارت، دقت و شهود مدل جهانی را افزایش میدهد. مدلهایی مانند GPT‑3.5، GPT‑4 و GPT‑4.5 این پارادایم را پیش میبرند.
- از سوی دیگر، استدلال مقیاسبندیشده به مدلها یاد میدهد که قبل از پاسخ دادن، فکر کنند و زنجیرهای از افکار را تولید کنند و به آنها اجازه میدهد تا با مسائل پیچیده STEM یا منطقی مقابله کنند. مدلهایی مانند OpenAI o1 و OpenAI o3‑mini این پارادایم را پیش میبرند.
GPT‑4.5 نمونهای از مقیاسپذیری یادگیری بدون نظارت با افزایش مقیاس محاسبات و دادهها، همراه با نوآوریهای معماری و بهینهسازی است. GPT‑4.5 بر روی ابررایانههای Microsoft Azure AI آموزش دیده است. نتیجه مدلی است که دانش گستردهتر و درک عمیقتری از جهان دارد و به کاهش توهمات و افزایش قابلیت اطمینان در طیف وسیعی از موضوعات منجر میشود.
مقیاسبندی الگوی GPT
دانش عمیقتر جهان
دقت SimpleQA (هرچه بالاتر باشد بهتر است)
میزان توهم SimpleQA (هرچه کمتر بهتر)
آزمون SimpleQA میزان واقعگرایی LLM (مدل زبان بزرگ) را در سوالات دانشی ساده اما چالشبرانگیز میسنجد.
همچنان که مدلهایمان را مقیاسبندی میکنیم و آنها مسائل پیچیدهتری را حل میکنند، آموزش درک بیشتر آنها از نیازها و مقاصد انسانی اهمیت فزایندهای پیدا میکند. برای GPT‑4.5، ما تکنیکهای جدید و مقیاسپذیری را توسعه دادیم که امکان آموزش مدلهای بزرگتر و قدرتمندتر را با دادههای مشتق شده از مدلهای کوچکتر فراهم میکند. این تکنیکها قابلیتهای GPT‑4.5 را بهبود میبخشند. هدایتپذیری، درک ظرافتها و مکالمهای طبیعی.
ارزیابیهای مقایسهای با آزمایشکنندگان انسانی
ترجیح انسانی، درصد پرسوجوهایی را اندازهگیری میکند که در آنها آزمایشکنندگان GPT‑4.5 را به GPT‑4o ترجیح دادهاند.
ترکیب درک عمیق از جهان با همکاری بهبود یافته، منجر به مدلی میشود که ایدهها را به طور طبیعی در مکالمات گرم و شهودی ادغام میکند که بیشتر با همکاری انسانی سازگار است. GPT‑4.5 درک بهتری از منظور انسانها دارد و نشانههای ظریف یا انتظارات ضمنی را با دقت و «هوش هیجانی» بیشتری تفسیر میکند. GPT‑4.5 همچنین شهود زیباییشناختی و خلاقیت بیشتری را نشان میدهد. در کمک به نوشتن و طراحی عالی عمل میکند.
موارد استفاده
GPT-4.5
GPT‑4.5 «هوش هیجانی» بیشتری نشان میدهد و میداند چه زمانی کاربر را به مکالمه بیشتر دعوت کند و چه زمانی اطلاعات گستردهای در اختیارش قرار دهد.
GPT‑4.5 قبل از پاسخ دادن فکر نمیکند، که این امر نقاط قوت آن را به طور خاص با مدلهای استدلالی مانند OpenAI o1 متفاوت میکند. در مقایسه با OpenAI o1 و OpenAI o3‑mini، GPT‑4.5 مدلی عمومیتر و ذاتاً هوشمندتر است. ما معتقدیم که استدلال، قابلیت اصلی مدلهای آینده خواهد بود و دو رویکرد مقیاسبندی - پیشآموزش و استدلال - مکمل یکدیگر خواهند بود. همانطور که مدلهایی مانند GPT‑4.5 از طریق پیشآموزش هوشمندتر و آگاهتر میشوند، به عنوان پایهای قویتر برای عاملهای استدلال و استفادهکننده از ابزار عمل خواهند کرد.
هر افزایش در قابلیتهای مدل، فرصتی برای ایمنتر کردن مدلها نیز هست. GPT‑4.5 با تکنیکهای جدید نظارتی آموزش دیده است که با روشهای سنتی تنظیم دقیق تحت نظارت (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) مانند روشهای استفاده شده برای GPT‑4o ترکیب شدهاند. امیدواریم این کار به عنوان پایهای برای هماهنگسازی مدلهای آینده با قابلیتهای بیشتر عمل کند.
برای سنجش دقیق پیشرفتهایمان، قبل از استقرار، مجموعهای از آزمایشهای ایمنی را مطابق با چارچوب آمادگی(در یک پنجره جدید باز میشود)خود انجام دادیم. ما متوجه شدیم که گسترش الگوی GPT به بهبود قابلیتها در ارزیابیهای ما کمک کرده است. ما نتایج دقیق این ارزیابیها را در کارت سیستم همراه منتشر میکنیم.
از امروز، کاربران ChatGPT Pro میتوانند GPT‑4.5 را در انتخابگر مدل در وب، موبایل و دسکتاپ انتخاب کنند. ما هفته آینده انتشار را برای کاربران Plus و Team آغاز خواهیم کرد و سپس هفته بعد برای کاربران Enterprise و Edu ادامه خواهیم داد.
GPT‑4.5 به جدیدترین اطلاعات بهروز از طریق جستجو دسترسی دارد، از آپلود فایل و تصویر پشتیبانی میکند و میتواند از canvas برای کار روی نوشتن و کدنویسی استفاده کند. با این حال، GPT‑4.5 در حال حاضر از ویژگیهای چندوجهی مانند حالت دستیار صوتی، ویدیو و اشتراکگذاری صفحه نمایش در ChatGPT پشتیبانی نمیکند. در آینده، ما برای سادهسازی تجربه کاربری تلاش خواهیم کرد تا هوش مصنوعی «فقط برای شما کار کند».
ما همچنین پیشنمایش GPT‑4.5 را در API تکمیل چت، API دستیاران و API دستهای برای توسعهدهندگان در تمام سطوح استفاده پولی(در یک پنجره جدید باز میشود) ارائه میدهیم. این مدل از ویژگیهای کلیدی مانند فراخوانی تابع، خروجیهای ساختاریافته، پخش جریانی و پیامهای سیستمی پشتیبانی میکند. همچنین از قابلیتهای بینایی از طریق ورودیهای تصویر پشتیبانی میکند.
بر اساس آزمایشهای اولیه، توسعهدهندگان ممکن است GPT‑4.5 را بهویژه برای برنامههایی که از هوش هیجانی و خلاقیت بالاتر آن بهرهمند میشوند - مانند کمک در نوشتن، ارتباطات، یادگیری، مربیگری و طوفان فکری - مفید بیابند. همچنین تواناییهای قوی در برنامهریزی و اجرای عاملمحور، شامل گردشهای کاری چند مرحلهای کدنویسی و خودکارسازی وظایف پیچیده را نشان میدهد.
GPT‑4.5 یک مدل بسیار بزرگ و محاسباتی است که آن را گرانتر از GPT‑4o میکند و جایگزینی برای آن نیست. به همین دلیل، داریم بررسی میکنیم که آیا در بلندمدت به ارائه آن در API ادامه بدهیم یا نه، چون داریم بین پشتیبانی از قابلیتهای فعلی و ساخت مدلهای آینده تعادل برقرار میکنیم. ما مشتاقیم بیشتر درباره نقاط قوت، قابلیتها و کاربردهای بالقوه آن در محیطهای واقعی یاد بگیریم. اگر GPT‑4.5 ارزش منحصر به فردی برای مورد استفادهات ارائه میدهد، بازخورد(در یک پنجره جدید باز میشود) تو نقش مهمی در هدایت تصمیم ما خواهد داشت.
با هر مرتبه جدیدی از بزرگی محاسبات، قابلیتهای جدیدی نیز به وجود میآید. GPT‑4.5 مدلی در خط مقدم امکانات یادگیری بدون نظارت است. ما همچنان از خلاقیت جامعه در کشف تواناییهای جدید و موارد استفاده غیرمنتظره شگفتزده میشویم. با GPT‑4.5، از شما دعوت میکنیم تا مرزهای یادگیری بدون نظارت را کشف کنید و قابلیتهای جدید را با ما کشف کنید.
در زیر، ما GPT‑4.5 را ارائه میکنیم. نتایج بر روی معیارهای استاندارد دانشگاهی برای نشان دادن عملکرد فعلی آن در وظایفی که به طور سنتی با استدلال مرتبط هستند. حتی با صرفاً افزایش مقیاس یادگیری بدون نظارت، GPT‑4.5 بهبودهای معناداری نسبت به مدلهای قبلی مانند GPT‑4o نشان میدهد. با این حال، مشتاقیم تصویر کاملتری از GPT‑4.5 به دست بیاوریم. قابلیتهای موجود در این نسخه، زیرا ما میدانیم که معیارهای دانشگاهی همیشه منعکسکنندهی سودمندی در دنیای واقعی نیستند.
امتیازهای ارزیابی مدل
GPT‑4.5 | GPT‑4o | OpenAI o3‑mini (بالا) | |
GPQA (علم) | 71.4% | 53.6% | 79.7% |
AIME '24 (ریاضی) | 36.7% | 9.3% | 87.3% |
MMMLU (چندزبانه) | 85.1% | 81.5% | 81.1% |
MMMU (چند منظوره) | 74.4% | 69.1% | - |
الماس SWE-Lancer (کدنویسی)* | 32.6% 186125 دلار | 23.3% 138750 دلار | 10.8% 89625 دلار |
SWE-Bench تأیید شده (کدگذاری) * | 38.0% | 30.7% | 61.0% |
*اعداد نشان داده شده نمایانگر بهترین عملکرد داخلی هستند.
نویسندگان
مشارکتکنندگان اصلی
Adam Goucher، Alex Paino، Ali Kamali، Amin Tootoonchian، Andrew Tulloch، Ben Sokolowsky، Clemens Winter، Colin Wei، Daniel Kappler، Daniel Levy، Felipe Petroski Such، Geoff Salmon، Ian O’Connell، Jason Teplitz، Kai Chen، Nik Tezak، Prafulla Dhariwal، Rapha Gontijo Lopes، Sam Schoenholz، Youlong Cheng، Yujia Jin، Yunxing Dai
تحقیق
مشارکتکنندگان اصلی
آیدن لو، الک رادفورد، الکس کارنی، الکس نیکول، الکسیس کونو، آنانیا کومار، بن وانگ، شارلوت کول، الیزابت یانگ، گابریل گو، هادی سلمان، هایتانگ هو، هیوو جون، ایان سول، ایشان گلراجانی، جیکوب کاکسون، جیمز بتکر، جیمی کیروس، جسیکا لاندن، کایل لوتر، لیا گای، لوکاس کوندراسیوک، لیریک دوشی، میخائیل پاولوف، کیمینگ یوان، ریمار لیک، روآن زلرز، شان متزگر، شنگجیا ژائو، اسپنسر پاپای، تائو وانگ
مشارکتکنندگان
آدام لرر، آدرین اکافت، آیدان مکلاکلین، الکساندر پروکوفیف، الکساندرا بار، آلن جابری، اندرو گیبیانسکی، اندرو اشمیت، کیسی چو، چاک لی، چلسی واس، کریس هالاسی، کریس کوچ، کریستین مکلیوی، دیوید ملی، دیمیتریس تسیپراس، اریک سیگلر، ارین کاوانا، فرزاد خراسانی، هویون چانگ، ایلیا کوستریکوف، ایشان سینگال، جی لین، جیاهویی یو، جینگ یو ژانگ، جان ریزو، جونگ ووک کیم، جویس لی، جونتانگ ژوانگ، لئو لیو، لی جینگ، لانگ اویانگ، لوئیس فووریه، مو باواریان، نیک استاتاس، نیتیش کسکار، اولگ مورک، پرستون بومن، اسکاتی یان، اس کیو ماه، تائو شو، تیلور گوردون، والری چی، وندا ژو، یو ژانگ
مقیاسبندی
مشارکتکنندگان اصلی
الکس چو، الکس رنزین، الکساندرا اشپایرا، آوی نایاک، بن لیمبرگر، کریستوفر هسه، دوک فونگ نگوین، دینگوا لی، اریک پترسون، فرانسیس ژانگ، جین اودن، کای فریک، کای هایاشی، لری لو، لِکی زو، لین یانگ، مادلین تامپسون، مایکل پتروف، میگل کاسترو، ناتالیا گیملشاین، فیل تیلت، رضا زمانی، رایان چو استانلی هسیه، استیو لی، استوارت هال، توماس راوکس، تیانهائو ژنگ، ویشال کو، یونگژیک کیم، یوچن ژانگ، ژوران لیو
مشارکتکنندگان
آلوین وان، اندرو کان، اندرو کودیسپاتی، آنتوان پلیس، آنوج کالیا، آرون هرست، آویتال الیور، براد بارنز، برایان هسو، چن دینگ، چن شن، چنگ چانگ، کریستین گیبسون، کریستوفر برنر، دانکن فیندلی، فن وانگ، فانگیوان لی، جیانلوکا بورلو، هدر اشمیت، هنریک پونده د اولیویرا پینتو، ایکای لان، جیای ونگ، جیمز کروکس، جوس کرایجولد، جونرو شائو، کنی هسو، کنی نگوین، کوین کینگ، لیا بورکهارت، لئو چن، لیندن لی، لو ژانگ، محمود اریبی، مارات دوخان، ماتئوس لیتوین، میکی هابرین، ناتان لافونتین، پاول بلوف، پنگ سو، پراساد چاکا، راشل لیم، راجکومار ساموئل، رنود گوبرت، روری کارمایکل، سارا دونگ، شانتانو جین، شوایچی شیا، استفن لاگزدون، تاد آندروود، تونی ژائو، ویکسینگ ژانگ، ویل شو، ویی ژنگ، ینگهای لو، یونچیاو ژانگ
سیستمهای ایمنی
Andrea Vallone، Andy Applebaum، Cameron Raymond، Chong Zhang، Dan Mossing، Elizabeth Proehl، Eric Wallace، Evan Mays، Grace Zhao، Ian Kivlichan، Irina Kofman، Joel Parish، Kevin Liu، Keren Gu-Lemberg، Kristen Ying، Lama Ahmad، Lilian Weng، Leon Maksin، Leyton Ho، Meghan Shah، Michael Lampe، Michele Wang، Miles Wang، Olivia Watkins، Phillip Guo، Samuel Miserendino، Sam Toizer، Sandhini Agarwal، Tejal Patwardhan، Tom Dupré la Tour، Tong Mu، Tyna Eloundou، Yunyun Wang
راهنمای پیادهسازی
Adam Brandon، Adam Perelman، Adele Li، Akshay Nathan، Alan Hayes، Alfred Xue، Alison Ben، Alec Gorge، Alex Guziel، Alex Iftimie، Ally Bennett، Andrew Chen، Andy Wang، Andy Wood، Angad Singh، Anoop Kotha، Antonia Woodford، Anuj Saharan، Ashley Tyra، Atty Eleti، Ben Schneider، Bessie Ji، Beth Hoover، Bill Chen، Blake Samic، Britney Smith، Brian Yu، Caleb Wang، Cary Bassin، Cary Hudson، Charlie Jatt، Chengdu Huang، Chris Beaumont، Christina Huang، Cristina Scheau، Dana Palmie، Daniel Levine، Daryl Neubieser، Dave Cummings، David Sasaki، Dibya Bhattacharjee، Dylan Hunn، Edwin Arbus، Elaine Ya Le، Enis Sert، Eric Kramer، Fred von Lohmann، Freddie Sulit، Gaby Janatpour، Garrett McGrath، Garrett Ollinger، Gary Yang، Hao Sheng، Harold Hotelling، Janardhanan Vembunarayanan، Jeff Harris، Jeffrey Sabin Matsumoto، Jennifer Robinson، Jessica Liang، Jessica Shieh، Jiacheng Yang، Joel Morris، Joseph Florencio، Josh Kaplan، Kan Wu، Karan Sharma، Karen Li، Katie Pypes، Kendal Simon، Kendra Rimbach، Kevin Park، Kevin Rao، Laurance Fauconnet، Lauren Workman، Leher Pathak، Liang Wu، Liang Xiong، Lien Mamitsuka، Lindsay McCallum، Lukas Gross، Manoli Liodakis، Matt Nichols، Michelle Fradin، Minal Khan، Mingxuan Wang، Nacho Soto، Natalie Staudacher، Nikunj Handa، Niko Felix، Ning Liu، Olivier Godement، Oona Gleeson، Philip Pronin، Raymond Li، Reah Miyara، Robert Xiong، Rohan Nuttall، R.J. Marsan، Sara Culver، Scott Ethersmith، Sean Fitzgerald، Shamez Hemani، Sherwin Wu، Shiao Lee، Shuyang Cheng، Siyuan Fu، Spug Golden، Steve Coffey، Steven Heidel، Sundeep Tirumalareddy، Tabarak Khan، Thomas Degry، Thomas Dimson، Tom Stasi، Tomo Hiratsuka، Trevor Creech، Uzair Navid Iftikhar، Victoria Chernova، Victoria Spiegel، Wanning Jiang، Wenlei Xie، Yaming Lin، Yara Khakbaz، Yilei Qian، Yilong Qin، Yo Shavit، Zhi Bie
رهبری اجرایی
Aidan Clark، Bob McGrew، David Farhi، Greg Brockman، Hannah Wong، Jakub Pachocki، Johannes Heidecke، Joanne Jang، Kate Rouch، Kevin Weil، Lauren Itow، Liam Fedus، Mark Chen، Mia Glaese، Mira Murati، Nick Ryder، Sam Altman، Srinivas Narayanan، Tal Broda