پرش به محتوای اصلی
OpenAI

۹ اسفند ۱۴۰۳

انتشارمحصول

معرفی GPT‑4.5

پیش‌نمایشی تحقیقاتی از قوی‌ترین مدل GPT ما. در دسترس کاربران Pro و توسعه‌دهندگان در سراسر جهان است.

در حال بارگذاری…

ما در حال انتشار یک پیش‌نمایش تحقیقاتی از GPT‑4.5 هستیم— بزرگترین و بهترین مدل برای گفتگو تا به امروز. GPT‑4.5 گامی به جلو در گسترش مقیاس پیش‌آموزش و پس‌آموزش است. با گسترش یادگیری بدون نظارت، GPT‑4.5 توانایی خود را در شناسایی الگوها، ایجاد ارتباطات و تولید بینش‌های خلاقانه بدون نیاز به استدلال بهبود می‌بخشد.

آزمایش‌های اولیه نشان می‌دهد که تعامل با GPT‑4.5 طبیعی‌تر به نظر می‌رسد. پایگاه دانش گسترده‌تر، توانایی بهبود یافته در دنبال کردن نیت کاربر و «EQ» بالاتر، آن را برای کارهایی مانند بهبود نوشتن، برنامه‌نویسی و حل مسائل عملی مفید می‌کند. ما همچنین انتظار داریم که کمتر دچار توهم شود.

ما GPT‑4.5 را به عنوان یک پیش‌نمایش تحقیقاتی به اشتراک می‌گذاریم تا نقاط قوت و محدودیت‌های آن را بهتر درک کنیم. ما هنوز در حال بررسی قابلیت‌های آن هستیم و مشتاقیم ببینیم مردم چگونه از آن به روش‌هایی که انتظارش را نداریم استفاده می‌کنند.

مقیاس‌بندی یادگیری بدون نظارت

ما با مقیاس‌بندی دو الگوی مکمل، قابلیت‌های هوش مصنوعی را ارتقا می‌دهیم: یادگیری بدون نظارت و استدلال. این ها دو محور هوش را نشان می دهند.

  1. یادگیری بدون نظارت، دقت و شهود مدل جهانی را افزایش می‌دهد. مدل‌هایی مانند GPT‑3.5، GPT‑4 و GPT‑4.5 این پارادایم را پیش می‌برند.
  2. از سوی دیگر، استدلال مقیاس‌بندی‌شده به مدل‌ها یاد می‌دهد که قبل از پاسخ دادن، فکر کنند و زنجیره‌ای از افکار را تولید کنند و به آنها اجازه می‌دهد تا با مسائل پیچیده STEM یا منطقی مقابله کنند. مدل‌هایی مانند OpenAI o1 و OpenAI o3‑mini این پارادایم را پیش می‌برند.

GPT‑4.5 نمونه‌ای از مقیاس‌پذیری یادگیری بدون نظارت با افزایش مقیاس محاسبات و داده‌ها، همراه با نوآوری‌های معماری و بهینه‌سازی است. GPT‑4.5 بر روی ابررایانه‌های Microsoft Azure AI آموزش دیده است. نتیجه مدلی است که دانش گسترده‌تر و درک عمیق‌تری از جهان دارد و به کاهش توهمات و افزایش قابلیت اطمینان در طیف وسیعی از موضوعات منجر می‌شود.

مقیاس‌بندی الگوی GPT

What was the first language?

We don't know exactly what the first language was, and scientists believe we'll probably never know for sure because spoken languages appeared long before written records existed.

Here's what we do know:

  • No single "first language": Languages likely developed gradually in different groups of humans around the same time, tens or even hundreds of thousands of years ago.
  • Origin in Africa: Most scientists agree that spoken language probably first emerged among humans in Africa, perhaps over 100,000 years ago.
  • Proto-languages: Rather than a single language, humans likely started with simple communication that evolved into more complex languages. The earliest forms of language probably included gestures, sounds, and signals to express basic ideas and emotions.
  • Lost to history: Because speech leaves no direct fossil record, and writing emerged relatively recently (around 5,000 years ago), we have no way to know exactly how the earliest languages sounded.

Today, linguists study existing languages to understand how they evolved over thousands of years, but the exact identity of humanity’s very first language remains—and will likely always remain—a mystery.

دانش عمیق‌تر جهان

دقت SimpleQA (هرچه بالاتر باشد بهتر است)
62.5%38.2%47%15%دقت
میزان توهم SimpleQA (هرچه کمتر بهتر)
37.1%61.8%44%80.3%میزان توهم

آزمون SimpleQA میزان واقع‌گرایی LLM (مدل زبان بزرگ) را در سوالات دانشی ساده اما چالش‌برانگیز می‌سنجد.

آموزش برای همکاری انسانی

همچنان که مدل‌هایمان را مقیاس‌بندی می‌کنیم و آنها مسائل پیچیده‌تری را حل می‌کنند، آموزش درک بیشتر آنها از نیازها و مقاصد انسانی اهمیت فزاینده‌ای پیدا می‌کند. برای GPT‑4.5، ما تکنیک‌های جدید و مقیاس‌پذیری را توسعه دادیم که امکان آموزش مدل‌های بزرگ‌تر و قدرتمندتر را با داده‌های مشتق شده از مدل‌های کوچک‌تر فراهم می‌کند. این تکنیک‌ها قابلیت‌های GPT‑4.5 را بهبود می‌بخشند. هدایت‌پذیری، درک ظرافت‌ها و مکالمه‌ای طبیعی.

ارزیابی‌های مقایسه‌ای با آزمایش‌کنندگان انسانی
56.8%63.2%57.0%نرخ برد GPT-4.5 در مقابل GPT-4o

ترجیح انسانی، درصد پرس‌وجوهایی را اندازه‌گیری می‌کند که در آن‌ها آزمایش‌کنندگان GPT‑4.5 را به GPT‑4o ترجیح داده‌اند.

ترکیب درک عمیق از جهان با همکاری بهبود یافته، منجر به مدلی می‌شود که ایده‌ها را به طور طبیعی در مکالمات گرم و شهودی ادغام می‌کند که بیشتر با همکاری انسانی سازگار است. GPT‑4.5 درک بهتری از منظور انسان‌ها دارد و نشانه‌های ظریف یا انتظارات ضمنی را با دقت و «هوش هیجانی» بیشتری تفسیر می‌کند. GPT‑4.5 همچنین شهود زیبایی‌شناختی و خلاقیت بیشتری را نشان می‌دهد. در کمک به نوشتن و طراحی عالی عمل می‌کند.

موارد استفاده

GPT-4.5

I’m going through a tough time after failing a test

Aw, I'm really sorry to hear that. Failing a test can feel pretty tough and discouraging, but remember, it's just one moment—not a reflection of who you are or your capabilities. Want to talk about what happened, or do you just need a distraction? I'm here either way.

I’m going through a tough time after failing a test

I'm really sorry to hear that you're going through a tough time. Here are a few things you might consider:

1. Reflect and Understand: Try to analyze what might have gone wrong. Was it a lack of preparation, time management during the test, or perhaps misunderstanding the material? Understanding the root cause can help you address it in the future.

2. Seek Support: Talk to someone you trust—friends, family, or a school counselor. They can offer a different perspective and sometimes just talking about your feelings can be alleviating.

3. Speak with Your Teacher or Professor: They can provide insights into where you might have gone wrong and offer advice on how to improve. They might also offer opportunities for make-up work or extra credit.

4. Develop a Study Plan: Based on your reflections, create a plan to improve your study habits. This might include setting regular study times, breaking down material into manageable portions, or finding new study methods that work better for you.

5. Stay Positive and Forgive Yourself: Mistakes and setbacks are a part of life. It’s important to be kind to yourself and recognize that failure is a stepping stone to success.

6. Focus on the Bigger Picture: Remember that one test is just one part of your educational journey. There will be many more opportunities to do well.

If you need further support or resources, consider reaching out to educational support services at your institution, or mental health resources if you’re feeling particularly overwhelmed. You’re not alone in this, and things can get better with time and effort.

GPT‑4.5 «هوش هیجانی» بیشتری نشان می‌دهد و می‌داند چه زمانی کاربر را به مکالمه بیشتر دعوت کند و چه زمانی اطلاعات گسترده‌ای در اختیارش قرار دهد.

استدلال قوی‌تر در راه است

GPT‑4.5 قبل از پاسخ دادن فکر نمی‌کند، که این امر نقاط قوت آن را به طور خاص با مدل‌های استدلالی مانند OpenAI o1 متفاوت می‌کند. در مقایسه با OpenAI o1 و OpenAI o3‑mini، GPT‑4.5 مدلی عمومی‌تر و ذاتاً هوشمندتر است. ما معتقدیم که استدلال، قابلیت اصلی مدل‌های آینده خواهد بود و دو رویکرد مقیاس‌بندی - پیش‌آموزش و استدلال - مکمل یکدیگر خواهند بود. همان‌طور که مدل‌هایی مانند GPT‑4.5 از طریق پیش‌آموزش هوشمندتر و آگاه‌تر می‌شوند، به عنوان پایه‌ای قوی‌تر برای عامل‌های استدلال و استفاده‌کننده از ابزار عمل خواهند کرد.

ایمنی

هر افزایش در قابلیت‌های مدل، فرصتی برای ایمن‌تر کردن مدل‌ها نیز هست. GPT‑4.5 با تکنیک‌های جدید نظارتی آموزش دیده است که با روش‌های سنتی تنظیم دقیق تحت نظارت (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) مانند روش‌های استفاده شده برای GPT‑4o ترکیب شده‌اند. امیدواریم این کار به عنوان پایه‌ای برای هماهنگ‌سازی مدل‌های آینده با قابلیت‌های بیشتر عمل کند.

برای سنجش دقیق پیشرفت‌هایمان، قبل از استقرار، مجموعه‌ای از آزمایش‌های ایمنی را مطابق با چارچوب آمادگی(در یک پنجره جدید باز می‌شود)خود انجام دادیم. ما متوجه شدیم که گسترش الگوی GPT به بهبود قابلیت‌ها در ارزیابی‌های ما کمک کرده است. ما نتایج دقیق این ارزیابی‌ها را در کارت سیستم همراه منتشر می‌کنیم.

نحوه استفاده از GPT-4.5 در ChatGPT

از امروز، کاربران ChatGPT Pro می‌توانند GPT‑4.5 را در انتخابگر مدل در وب، موبایل و دسکتاپ انتخاب کنند. ما هفته آینده انتشار را برای کاربران Plus و Team آغاز خواهیم کرد و سپس هفته بعد برای کاربران Enterprise و Edu ادامه خواهیم داد.

GPT‑4.5 به جدیدترین اطلاعات به‌روز از طریق جستجو دسترسی دارد، از آپلود فایل و تصویر پشتیبانی می‌کند و می‌تواند از canvas برای کار روی نوشتن و کدنویسی استفاده کند. با این حال، GPT‑4.5 در حال حاضر از ویژگی‌های چندوجهی مانند حالت دستیار صوتی، ویدیو و اشتراک‌گذاری صفحه نمایش در ChatGPT پشتیبانی نمی‌کند. در آینده، ما برای ساده‌سازی تجربه کاربری تلاش خواهیم کرد تا هوش مصنوعی «فقط برای شما کار کند».

نحوه استفاده از GPT-4.5 در API

ما همچنین پیش‌نمایش GPT‑4.5 را در API تکمیل چت، API دستیاران و API دسته‌ای برای توسعه‌دهندگان در تمام سطوح استفاده پولی(در یک پنجره جدید باز می‌شود) ارائه می‌دهیم. این مدل از ویژگی‌های کلیدی مانند فراخوانی تابع، خروجی‌های ساختاریافته، پخش جریانی و پیام‌های سیستمی پشتیبانی می‌کند. همچنین از قابلیت‌های بینایی از طریق ورودی‌های تصویر پشتیبانی می‌کند.

بر اساس آزمایش‌های اولیه، توسعه‌دهندگان ممکن است GPT‑4.5 را به‌ویژه برای برنامه‌هایی که از هوش هیجانی و خلاقیت بالاتر آن بهره‌مند می‌شوند - مانند کمک در نوشتن، ارتباطات، یادگیری، مربیگری و طوفان فکری - مفید بیابند. همچنین توانایی‌های قوی در برنامه‌ریزی و اجرای عامل‌محور، شامل گردش‌های کاری چند مرحله‌ای کدنویسی و خودکارسازی وظایف پیچیده را نشان می‌دهد.

GPT‑4.5 یک مدل بسیار بزرگ و محاسباتی است که آن را گران‌تر از GPT‑4o می‌کند و جایگزینی برای آن نیست. به همین دلیل، داریم بررسی می‌کنیم که آیا در بلندمدت به ارائه آن در API ادامه بدهیم یا نه، چون داریم بین پشتیبانی از قابلیت‌های فعلی و ساخت مدل‌های آینده تعادل برقرار می‌کنیم. ما مشتاقیم بیشتر درباره نقاط قوت، قابلیت‌ها و کاربردهای بالقوه آن در محیط‌های واقعی یاد بگیریم. اگر GPT‑4.5 ارزش منحصر به فردی برای مورد استفاده‌ات ارائه می‌دهد، بازخورد(در یک پنجره جدید باز می‌شود) تو نقش مهمی در هدایت تصمیم ما خواهد داشت.

نتیجه‌گیری

با هر مرتبه جدیدی از بزرگی محاسبات، قابلیت‌های جدیدی نیز به وجود می‌آید. GPT‑4.5 مدلی در خط مقدم امکانات یادگیری بدون نظارت است. ما همچنان از خلاقیت جامعه در کشف توانایی‌های جدید و موارد استفاده غیرمنتظره شگفت‌زده می‌شویم. با GPT‑4.5، از شما دعوت می‌کنیم تا مرزهای یادگیری بدون نظارت را کشف کنید و قابلیت‌های جدید را با ما کشف کنید.

ضمیمه

در زیر، ما GPT‑4.5 را ارائه می‌کنیم. نتایج بر روی معیارهای استاندارد دانشگاهی برای نشان دادن عملکرد فعلی آن در وظایفی که به طور سنتی با استدلال مرتبط هستند. حتی با صرفاً افزایش مقیاس یادگیری بدون نظارت، GPT‑4.5 بهبودهای معناداری نسبت به مدل‌های قبلی مانند GPT‑4o نشان می‌دهد. با این حال، مشتاقیم تصویر کامل‌تری از GPT‑4.5 به دست بیاوریم. قابلیت‌های موجود در این نسخه، زیرا ما می‌دانیم که معیارهای دانشگاهی همیشه منعکس‌کننده‌ی سودمندی در دنیای واقعی نیستند.

امتیازهای ارزیابی مدل

GPT‑4.5

GPT‑4o

OpenAI o3‑mini (بالا)

GPQA (علم)

71.4%

53.6%

79.7%

AIME '24 (ریاضی)

36.7%

9.3%

87.3%

MMMLU (چندزبانه)

85.1%

81.5%

81.1%

MMMU (چند منظوره)

74.4%

69.1%

-

الماس SWE-Lancer (کدنویسی)*

32.6%

186125 دلار

23.3%

138750 دلار

10.8%

89625 دلار

SWE-Bench تأیید شده (کدگذاری) *

38.0%

30.7%

61.0%

*اعداد نشان داده شده نمایانگر بهترین عملکرد داخلی هستند.

نویسندگان

OpenAI

مشارکت‌کنندگان اصلی

Adam Goucher،‏ Alex Paino،‏ Ali Kamali،‏ Amin Tootoonchian،‏ Andrew Tulloch،‏ Ben Sokolowsky،‏ Clemens Winter،‏ Colin Wei،‏ Daniel Kappler،‏ Daniel Levy،‏ Felipe Petroski Such،‏ Geoff Salmon،‏ Ian O’Connell،‏ Jason Teplitz،‏ Kai Chen،‏ Nik Tezak،‏ Prafulla Dhariwal،‏ Rapha Gontijo Lopes،‏ Sam Schoenholz،‏ Youlong Cheng،‏ Yujia Jin،‏ Yunxing Dai

تحقیق

مشارکت‌کنندگان اصلی

آیدن لو، الک رادفورد، الکس کارنی، الکس نیکول، الکسیس کونو، آنانیا کومار، بن وانگ، شارلوت کول، الیزابت یانگ، گابریل گو، هادی سلمان، هایتانگ هو، هیوو جون، ایان سول، ایشان گلراجانی، جیکوب کاکسون، جیمز بتکر، جیمی کیروس، جسیکا لاندن، کایل لوتر، لیا گای، لوکاس کوندراسیوک، لیریک دوشی، میخائیل پاولوف، کیمینگ یوان، ریمار لیک، روآن زلرز، شان متزگر، شنگجیا ژائو، اسپنسر پاپای، تائو وانگ

مشارکت‌کنندگان

آدام لرر، آدرین اکافت، آیدان مک‌لاکلین، الکساندر پروکوفیف، الکساندرا بار، آلن جابری، اندرو گیبیانسکی، اندرو اشمیت، کیسی چو، چاک لی، چلسی واس، کریس هالاسی، کریس کوچ، کریستین مک‌لیوی، دیوید ملی، دیمیتریس تسیپراس، اریک سیگلر، ارین کاوانا، فرزاد خراسانی، هویون چانگ، ایلیا کوستریکوف، ایشان سینگال، جی لین، جیاهویی یو، جینگ یو ژانگ، جان ریزو، جونگ ووک کیم، جویس لی، جونتانگ ژوانگ، لئو لیو، لی جینگ، لانگ اویانگ، لوئیس فووریه، مو باواریان، نیک استاتاس، نیتیش کسکار، اولگ مورک، پرستون بومن، اسکاتی یان، اس کیو ماه، تائو شو، تیلور گوردون، والری چی، وندا ژو، یو ژانگ

مقیاس‌بندی

مشارکت‌کنندگان اصلی

الکس چو، الکس رنزین، الکساندرا اشپایرا، آوی نایاک، بن لیمبرگر، کریستوفر هسه، دوک فونگ نگوین، دینگوا لی، اریک پترسون، فرانسیس ژانگ، جین اودن، کای فریک، کای هایاشی، لری لو، لِکی زو، لین یانگ، مادلین تامپسون، مایکل پتروف، میگل کاسترو، ناتالیا گیملشاین، فیل تیلت، رضا زمانی، رایان چو استانلی هسیه، استیو لی، استوارت هال، توماس راوکس، تیانهائو ژنگ، ویشال کو، یونگژیک کیم، یوچن ژانگ، ژوران لیو

مشارکت‌کنندگان

آلوین وان، اندرو کان، اندرو کودیسپاتی، آنتوان پلیس، آنوج کالیا، آرون هرست، آویتال الیور، براد بارنز، برایان هسو، چن دینگ، چن شن، چنگ چانگ، کریستین گیبسون، کریستوفر برنر، دانکن فیندلی، فن وانگ، فانگیوان لی، جیانلوکا بورلو، هدر اشمیت، هنریک پونده د اولیویرا پینتو، ایکای لان، جیای ونگ، جیمز کروکس، جوس کرایجولد، جونرو شائو، کنی هسو، کنی نگوین، کوین کینگ، لیا بورکهارت، لئو چن، لیندن لی، لو ژانگ، محمود اریبی، مارات دوخان، ماتئوس لیتوین، میکی هابرین، ناتان لافونتین، پاول بلوف، پنگ سو، پراساد چاکا، راشل لیم، راجکومار ساموئل، رنود گوبرت، روری کارمایکل، سارا دونگ، شانتانو جین، شوایچی شیا، استفن لاگزدون، تاد آندروود، تونی ژائو، ویکسینگ ژانگ، ویل شو، ویی ژنگ، ینگهای لو، یونچیاو ژانگ

سیستم‌های ایمنی

Andrea Vallone،‏ Andy Applebaum،‏ Cameron Raymond،‏ Chong Zhang،‏ Dan Mossing،‏ Elizabeth Proehl،‏ Eric Wallace،‏ Evan Mays،‏ Grace Zhao،‏ Ian Kivlichan،‏ Irina Kofman،‏ Joel Parish،‏ Kevin Liu،‏ Keren Gu-Lemberg،‏ Kristen Ying،‏ Lama Ahmad،‏ Lilian Weng،‏ Leon Maksin،‏ Leyton Ho،‏ Meghan Shah،‏ Michael Lampe،‏ Michele Wang،‏ Miles Wang،‏ Olivia Watkins،‏ Phillip Guo،‏ Samuel Miserendino،‏ Sam Toizer،‏ Sandhini Agarwal،‏ Tejal Patwardhan،‏ Tom Dupré la Tour،‏ Tong Mu،‏ Tyna Eloundou،‏ Yunyun Wang

راهنمای پیاده‌سازی

Adam Brandon،‏ Adam Perelman،‏ Adele Li،‏ Akshay Nathan،‏ Alan Hayes،‏ Alfred Xue،‏ Alison Ben،‏ Alec Gorge،‏ Alex Guziel،‏ Alex Iftimie،‏ Ally Bennett،‏ Andrew Chen،‏ Andy Wang،‏ Andy Wood،‏ Angad Singh،‏ Anoop Kotha،‏ Antonia Woodford،‏ Anuj Saharan،‏ Ashley Tyra،‏ Atty Eleti،‏ Ben Schneider،‏ Bessie Ji،‏ Beth Hoover،‏ Bill Chen،‏ Blake Samic،‏ Britney Smith،‏ Brian Yu،‏ Caleb Wang،‏ Cary Bassin،‏ Cary Hudson،‏ Charlie Jatt،‏ Chengdu Huang،‏ Chris Beaumont،‏ Christina Huang،‏ Cristina Scheau،‏ Dana Palmie،‏ Daniel Levine،‏ Daryl Neubieser،‏ Dave Cummings،‏ David Sasaki،‏ Dibya Bhattacharjee،‏ Dylan Hunn،‏ Edwin Arbus،‏ Elaine Ya Le،‏ Enis Sert،‏ Eric Kramer،‏ Fred von Lohmann،‏ Freddie Sulit،‏ Gaby Janatpour،‏ Garrett McGrath،‏ Garrett Ollinger،‏ Gary Yang،‏ Hao Sheng،‏ Harold Hotelling،‏ Janardhanan Vembunarayanan،‏ Jeff Harris،‏ Jeffrey Sabin Matsumoto،‏ Jennifer Robinson،‏ Jessica Liang،‏ Jessica Shieh،‏ Jiacheng Yang،‏ Joel Morris،‏ Joseph Florencio،‏ Josh Kaplan،‏ Kan Wu،‏ Karan Sharma،‏ Karen Li،‏ Katie Pypes،‏ Kendal Simon،‏ Kendra Rimbach،‏ Kevin Park،‏ Kevin Rao،‏ Laurance Fauconnet،‏ Lauren Workman،‏ Leher Pathak،‏ Liang Wu،‏ Liang Xiong،‏ Lien Mamitsuka،‏ Lindsay McCallum،‏ Lukas Gross،‏ Manoli Liodakis،‏ Matt Nichols،‏ Michelle Fradin،‏ Minal Khan،‏ Mingxuan Wang،‏ Nacho Soto،‏ Natalie Staudacher،‏ Nikunj Handa،‏ Niko Felix،‏ Ning Liu،‏ Olivier Godement،‏ Oona Gleeson،‏ Philip Pronin،‏ Raymond Li،‏ Reah Miyara،‏ Robert Xiong،‏ Rohan Nuttall،‏ R.J. Marsan،‏ Sara Culver،‏ Scott Ethersmith،‏ Sean Fitzgerald،‏ Shamez Hemani،‏ Sherwin Wu،‏ Shiao Lee،‏ Shuyang Cheng،‏ Siyuan Fu،‏ Spug Golden،‏ Steve Coffey،‏ Steven Heidel،‏ Sundeep Tirumalareddy،‏ Tabarak Khan،‏ Thomas Degry،‏ Thomas Dimson،‏ Tom Stasi،‏ Tomo Hiratsuka،‏ Trevor Creech،‏ Uzair Navid Iftikhar،‏ Victoria Chernova،‏ Victoria Spiegel،‏ Wanning Jiang،‏ Wenlei Xie،‏ Yaming Lin،‏ Yara Khakbaz،‏ Yilei Qian،‏ Yilong Qin،‏ Yo Shavit،‏ Zhi Bie

رهبری اجرایی

Aidan Clark،‏ Bob McGrew،‏ David Farhi،‏ Greg Brockman،‏ Hannah Wong،‏ Jakub Pachocki،‏ Johannes Heidecke،‏ Joanne Jang،‏ Kate Rouch،‏ Kevin Weil،‏ Lauren Itow،‏ Liam Fedus،‏ Mark Chen،‏ Mia Glaese،‏ Mira Murati،‏ Nick Ryder،‏ Sam Altman،‏ Srinivas Narayanan،‏ Tal Broda