27 лютого 2025 р.

Представляємо GPT‑4.5

Попередній огляд нашої найпотужнішої моделі GPT. Доступно для користувачів Pro та розробників у всьому світі.

Завантаження…

Ми випускаємо попередню версію GPT‑4.5 — нашої найбільшої та найкращої моделі для чату на сьогодні. GPT‑4.5 — це крок уперед у масштабуванні попереднього навчання та постнавчання. Масштабуючи неконтрольоване навчання, GPT‑4.5 покращує здатність розпізнавати закономірності, встановлювати зв'язки та створювати творчі ідеї без міркувань.

Ранні тести показують, що взаємодія з GPT‑4.5 відчувається більш природною. Його ширша база знань, покращена здатність слідувати за намірами користувача та вищий EQ роблять його корисним для таких завдань, як покращення написання тексту, програмування та розв'язання практичних задач. Ми також очікуємо, що він буде менше спотворювати факти.

Ми надаємо GPT‑4.5 для попереднього доступу, аби краще зрозуміти його сильні та слабкі сторони. Ми все ще досліджуємо, на що він здатний, і нам уже цікаво побачити, як люди використовуватимуть його таким чином, про який ми, можливо, і не здогадувалися.

Масштабування неконтрольованого навчання

Ми вдосконалюємо можливості ШІ, масштабуючи дві взаємодоповнюючі парадигми: неконтрольоване навчання та аргументацію. Це представляє дві осі інтелекту.

Неконтрольоване навчання підвищує точність моделей світу та інтуїцію. Такі моделі, як GPT‑3.5, GPT‑4 і GPT‑4.5, просувають цю парадигму.
Масштабування міркувань⁠, навпаки, навчає моделі думати і створювати ланцюг міркувань перед тим, як вони відреагують, що дозволяє їм вирішувати складні STEM або логічні проблеми. Такі моделі, як OpenAI o1 та OpenAI o3‑mini, просувають цю парадигму вперед.

GPT‑4.5 є прикладом масштабування неконтрольованого навчання шляхом збільшення обчислювальних потужностей і даних, а також завдяки інноваціям в архітектурі та оптимізації. GPT‑4.5 навчали на суперкомп’ютерах Microsoft Azure AI. Результатом стала модель, яка має ширші знання та глибше розуміння світу, що призводить до зменшення галюцинацій і більшої надійності в широкому спектрі тем.

Масштабування парадигми GPT

What was the first language?

We don’t know exactly what the first language was, and scientists believe we’ll probably never know for sure because spoken languages appeared long before written records existed.

Here’s what we do know:

No single "first language": Languages likely developed gradually in different groups of humans around the same time, tens or even hundreds of thousands of years ago.
Origin in Africa: Most scientists agree that spoken language probably first emerged among humans in Africa, perhaps over 100,000 years ago.
Proto-languages: Rather than a single language, humans likely started with simple communication that evolved into more complex languages. The earliest forms of language probably included gestures, sounds, and signals to express basic ideas and emotions.
Lost to history: Because speech leaves no direct fossil record, and writing emerged relatively recently (around 5,000 years ago), we have no way to know exactly how the earliest languages sounded.

Today, linguists study existing languages to understand how they evolved over thousands of years, but the exact identity of humanity’s very first language remains—and will likely always remain—a mystery.

Глибші знання про світ

Точність SimpleQA (вищий — краще)

Рівень галюцинацій SimpleQA (нижчий — краще)

SimpleQA оцінює фактичність LLM (велика мовна модель) на простих, але складних питаннях стосовно знань.

Навчання для людської співпраці

Коли ми масштабуємо наші моделі, і вони вирішують більш складні проблеми, стає все важливішим навчити їх кращому розумінню людських потреб та намірів. Для GPT‑4.5 ми розробили нові масштабовані методи, які увімкнули навчання більших і потужніших моделей на основі даних, отриманих із менших моделей. Ці методи покращують можливості GPT‑4.5 у плані керованості, розуміння нюансів і природної розмови.

Порівняльні оцінки за участю людських тестувальників

Людські вподобання вимірюють відсоток запитів, у яких тестувальники віддавали перевагу GPT‑4.5 над GPT‑4o.

Поєднання глибокого розуміння світу з покращеною співпрацею призвело до створення моделі, яка природно інтегрує ідеї у теплі та інтуїтивні розмови, що краще налаштовані на людську співпрацю. GPT‑4.5 краще розуміє, що мають на увазі люди, і інтерпретує тонкі підказки або неявні очікування більш тонко та з «емоційним інтелектом». GPT‑4.5 також демонструє сильнішу естетичну інтуїцію та креативність. Він чудово допомагає з написанням тексту та дизайном.

Варіанти використання

GPT-4.5

I’m going through a tough time after failing a test

Aw, I’m really sorry to hear that. Failing a test can feel pretty tough and discouraging, but remember, it’s just one moment—not a reflection of who you are or your capabilities. Want to talk about what happened, or do you just need a distraction? I’m here either way.

I’m going through a tough time after failing a test

I’m really sorry to hear that you’re going through a tough time. Here are a few things you might consider:

1. Reflect and Understand: Try to analyze what might have gone wrong. Was it a lack of preparation, time management during the test, or perhaps misunderstanding the material? Understanding the root cause can help you address it in the future.

2. Seek Support: Talk to someone you trust—friends, family, or a school counselor. They can offer a different perspective and sometimes just talking about your feelings can be alleviating.

3. Speak with Your Teacher or Professor: They can provide insights into where you might have gone wrong and offer advice on how to improve. They might also offer opportunities for make-up work or extra credit.

4. Develop a Study Plan: Based on your reflections, create a plan to improve your study habits. This might include setting regular study times, breaking down material into manageable portions, or finding new study methods that work better for you.

5. Stay Positive and Forgive Yourself: Mistakes and setbacks are a part of life. It’s important to be kind to yourself and recognize that failure is a stepping stone to success.

6. Focus on the Bigger Picture: Remember that one test is just one part of your educational journey. There will be many more opportunities to do well.

If you need further support or resources, consider reaching out to educational support services at your institution, or mental health resources if you’re feeling particularly overwhelmed. You’re not alone in this, and things can get better with time and effort.

GPT‑4.5 демонструє більший EQ і знає, коли слід запрошувати подальшу розмову, а коли — надати користувачеві детальну інформацію.

Сильніші міркування в майбутньому

GPT‑4.5 не думає перед тим, як відповідати, що робить його сильні сторони особливо відмінними від моделей, таких як OpenAI o1. Порівняно з OpenAI o1 та OpenAI o3‑mini, GPT‑4.5 є більш універсальною та інтелектуально розвиненою моделлю. Ми віримо, що міркування стане основною здатністю майбутніх моделей, і що два підходи до масштабування — попереднє навчання та міркування — доповнюватимуть один одного. Такі моделі, як GPT‑4.5, стають розумнішими та більш обізнаними завдяки попередньому навчанню, і пізніше вони слугуватимуть ще міцнішою основою для агентів, які використовують логіку та інструменти.

Безпека

Кожне збільшення можливостей моделі є також можливістю зробити моделі безпечнішими. GPT‑4.5 був навчений новими методами нагляду, які поєднуються з традиційним додатковим навчанням під наглядом (SFT) та навчання з підкріпленням на основі людського відгуку (RLHF), подібними до тих, що використовуються для GPT‑4o. Ми сподіваємося, що ця робота стане основою для узгодження ще більш спроможних майбутніх моделей.

Для стрес-тестування наших покращень ми провели комплекс тестів безпеки перед розгортанням відповідно до програми готовності⁠(відкривається у новому вікні). Ми виявили, що масштабування парадигми GPT сприяло покращенню можливостей у наших оцінках. Ми публікуємо детальні результати цих оцінок у супровідній системній картці⁠.

Як користуватися GPT-4.5 у ChatGPT

Відсьогодні користувачі ChatGPT Pro зможуть обирати GPT‑4.5 при виборі моделі на веб-сайті, мобільних пристроях та настільних комп'ютерах. Ми почнемо впровадження для користувачів Plus і Team наступного тижня, а для користувачів Enterprise та Edu — через тиждень.

GPT‑4.5 має доступ до найсвіжішої інформації з пошуком, підтримку завантаження файлів і зображень, а також може використовувати полотно для роботи над написанням тексту й коду. Однак наразі GPT‑4.5 не підтримує мультимодальні функції, такі як голосовий режим, відео та спільне використання екрану в ChatGPT. У майбутньому ми працюватимемо над спрощенням користувацького досвіду, щоб штучний інтелект «просто працював» для вас.

Як використовувати GPT-4.5 в API

Ми також пропонуємо попередній доступ до GPT‑4.5 в Chat Completions API, Assistants API та Batch API для розробників на всіх платних рівнях використання⁠(відкривається у новому вікні). Модель має підтримку ключових особливостей, таких як виклик функцій, структуровані виводи, потокове передавання та системні повідомлення. Вона також підтримує можливості роботи з зображеннями.

На основі результатів ранніх тестувань розробники можуть вважати GPT‑4.5 особливо корисним для програм, які виграють від його вищого емоційного інтелекту та креативності — таких як допомога у написанні, комунікація, навчання, коучинг і мозковий штурм. Він також демонструє потужні можливості в агентному плануванні та виконанні, включаючи багатоступеневі робочі процеси кодування та складну автоматизацію завдань.

GPT‑4.5 — це дуже велика та обчислювально інтенсивна модель, що робить її дорожчою⁠; до того ж, вона не є заміною для GPT‑4o. У зв'язку з цим ми оцінюємо, чи варто продовжити надавати доступ до неї в API у довгостроковій перспективі, балансуючи між підтримкою поточних можливостей і створенням майбутніх моделей. Ми з нетерпінням чекаємо можливості дізнатися більше про його сильні сторони, можливості та потенційні програми в реальних умовах. Якщо GPT‑4.5 надає унікальну цінність для вашого сценарію використання, ваш відгук⁠(відкривається у новому вікні) відіграватиме важливу роль у прийнятті нашого рішення.

Висновок

Із кожним новим порядком величини обчислень з'являються нові можливості. GPT‑4.5 — це передова модель можливостей у неконтрольованому навчанні. Ми досі дивуємося креативності спільноти у виявленні нових можливостей і несподіваних сценаріїв використання. Із GPT‑4.5 ми запрошуємо вас ознайомитися з межами неконтрольованого навчання та відкрити нові можливості разом із нами.

Додаток

Нижче наведено можливості GPT‑4.5 у стандартних академічних тестах для ілюстрації поточної продуктивності у виконанні завдань, традиційно пов'язаних із міркуванням. Навіть при простому масштабуванні неконтрольованого навчання GPT‑4.5 демонструє значні покращення порівняно з попередніми моделями, такими як GPT‑4o. Проте ми з нетерпінням чекаємо на отримання більш повної картини можливостей GPT‑4.5 у цьому релізі: ми усвідомлюємо, що академічні орієнтири не завжди відображають реальну корисність.

Результати оцінювання моделей

	GPT‑4.5	GPT‑4o	OpenAI o3‑mini (high)
GPQA (наука)	71,4%	53,6%	79,7%
AIME ‘24 (математика)	36,7%	9,3%	87,3%
MMMLU (багатомовний)	85,1%	81,5%	81,1%
MMMU (мультимодальний)	74,4%	69,1%	-
SWE-Lancer Diamond (кодинг)*	32,6% $186–125	23,3% $138 750	10,8% $89 625
SWE-Bench Verified (кодинг)*	38,0%	30,7%	61,0%

*Наведені цифри представляють найкращі внутрішні результати.

Автори

OpenAI

Основні учасники

Adam Goucher, Alex Paino, Ali Kamali, Amin Tootoonchian, Andrew Tulloch, Ben Sokolowsky, Clemens Winter, Colin Wei, Daniel Kappler, Daniel Levy, Felipe Petroski Such, Geoff Salmon, Ian O’Connell, Jason Teplitz, Kai Chen, Nik Tezak, Prafulla Dhariwal, Rapha Gontijo Lopes, Sam Schoenholz, Youlong Cheng, Yujia Jin, Yunxing Dai

Дослідження

Ключові учасники

Айден Лоу, Алек Редфорд, Алекс Карні, Алекс Нікол, Алексіс Конно, Ананья Кумар, Бен Ван, Шарлотта Коул, Елізабет Ян, Габріель Го, Хаді Салман, Хайтанг Ху, Хіву Джун, Ян Соль, Ішан Гулраджані, Джейкоб Коксон, Джеймс Беткер, Джеймі Кірос, Джессіка Лендон, Кайл Лютер, Ліа Гай, Лукас Кондрацюк, Лірік Доші, Михайло Павлов, Цимін Юань, Реймар Лейке, Роуен Зеллерс, Шон Мецгер, Шенджа Чжао, Спенсер Папай, Тао Ван

Учасники

Адам Лерер, Едрієн Екоффет, Ейдан МакЛафлін, Олександр Прокоф'єв, Александра Барр, Аллан Джабрі, Ендрю Гібіанскі, Ендрю Шмідт, Кейсі Чу, Чак Лі, Челсі Восс, Кріс Галласі, Кріс Кох, Крістін МакЛіві, Девід Мелі, Дімітріс Ціпрас, Ерік Сіглер, Ерін Кавано, Фарзад Хорасані, Хуйвен Чанг, Ілля Костріков, Ішаан Сінгал, Джи Лін, Цзяхуей Юй, Цзін Юй Чжан, Джон Ріццо, Чон Ук Кім, Джойс Лі, Джунтанг Чжуан, Лео Лю, Лі Цзін, Лонг Оуян, Луї Февріє, Мо Баваріан, Нік Статас, Нітіш Кескар, Олег Мурк, Престон Боумен, Скотті Ян, С.К. Ма, Тао Сюй, Тейлор Гордон, Валері Ці, Венда Чжоу, Ю Чжан

Масштабування

Ключові учасники

Алекс Чоу, Алекс Рензін, Александра Спіра, Аві Наяк, Бен Леймбергер, Крістофер Гессе, Дук Фонг Нгуєн, Дінхуа Лі, Ерік Петерсон, Френсіс Чжан, Джин Оден, Кай Фріке, Кай Хаяші, Ларрі Лв, Лекі Цзоу, Лін Ян, Мадлен Томпсон, Майкл Петров, Мігель Кастро, Наталія Гімельшейн, Філ Тійєт, Реза Замані, Раян Чеу Стенлі Сі, Стів Лі, Стюарт Холл, Томас Рау, Тяньхао Чжен, Вішал Куо, Йонджік Кім, Юйчен Чжан, Чжуоран Лю

Учасники

Елвін Ван, Ендрю Канн, Ендрю Кодіспоті, Антуан Пелісс, Анудж Калія, Аарон Херст, Авітал Олівер, Бред Барнс, Брайан Хсу, Чен Дінг, Чен Шен, Чен Чанг, Крістіан Гібсон, Крістофер Бернер, Дункан Фіндлі, Фан Ван, Фанюань Лі, Джанлука Борелло, Хізер Шмідт, Енріке Понде де Олівейра Пінто, Ікай Лан, Цзяі Венг, Джеймс Крукс, Йос Краайджевелд, Джунру Шао, Кенні Хсу, Кенні Нгуєн, Кевін Кінг, Лія Буркхардт, Лео Чен, Лінден Лі, Лу Чжан, Махмуд Ерібі, Марат Духан, Матеуш Літвін, Мікі Хабрин, Натан Лафонтен, Павло Бєлов, Пенг Су, Прасад Чакка, Рейчел Лім, Раджкумар Семюель, Рено Гобер, Рорі Кармайкл, Сара Донг, Шантану Джайн, Шуайці Ся, Стівен Логсдон, Тодд Андервуд, Тоні Чжао, Вейсін Чжан, Вілл Шей, Вейі Чжен, Інгхай Лу, Юнкао Чжан

Системи безпеки

Andrea Vallone, Andy Applebaum, Cameron Raymond, Chong Zhang, Dan Mossing, Elizabeth Proehl, Eric Wallace, Evan Mays, Grace Zhao, Ian Kivlichan, Irina Kofman, Joel Parish, Kevin Liu, Keren Gu-Lemberg, Kristen Ying, Lama Ahmad, Lilian Weng, Leon Maksin, Leyton Ho, Meghan Shah, Michael Lampe, Michele Wang, Miles Wang, Olivia Watkins, Phillip Guo, Samuel Miserendino, Sam Toizer, Sandhini Agarwal, Tejal Patwardhan, Tom Dupré la Tour, Tong Mu, Tyna Eloundou, Yunyun Wang

Впровадження

Adam Brandon, Adam Perelman, Adele Li, Akshay Nathan, Alan Hayes, Alfred Xue, Alison Ben, Alec Gorge, Alex Guziel, Alex Iftimie, Ally Bennett, Andrew Chen, Andy Wang, Andy Wood, Angad Singh, Anoop Kotha, Antonia Woodford, Anuj Saharan, Ashley Tyra, Atty Eleti, Ben Schneider, Bessie Ji, Beth Hoover, Bill Chen, Blake Samic, Britney Smith, Brian Yu, Caleb Wang, Cary Bassin, Cary Hudson, Charlie Jatt, Chengdu Huang, Chris Beaumont, Christina Huang, Cristina Scheau, Dana Palmie, Daniel Levine, Daryl Neubieser, Dave Cummings, David Sasaki, Dibya Bhattacharjee, Dylan Hunn, Edwin Arbus, Elaine Ya Le, Enis Sert, Eric Kramer, Fred von Lohmann, Freddie Sulit, Gaby Janatpour, Garrett McGrath, Garrett Ollinger, Gary Yang, Hao Sheng, Harold Hotelling, Janardhanan Vembunarayanan, Jeff Harris, Jeffrey Sabin Matsumoto, Jennifer Robinson, Jessica Liang, Jessica Shieh, Jiacheng Yang, Joel Morris, Joseph Florencio, Josh Kaplan, Kan Wu, Karan Sharma, Karen Li, Katie Pypes, Kendal Simon, Kendra Rimbach, Kevin Park, Kevin Rao, Laurance Fauconnet, Lauren Workman, Leher Pathak, Liang Wu, Liang Xiong, Lien Mamitsuka, Lindsay McCallum, Lukas Gross, Manoli Liodakis, Matt Nichols, Michelle Fradin, Minal Khan, Mingxuan Wang, Nacho Soto, Natalie Staudacher, Nikunj Handa, Niko Felix, Ning Liu, Olivier Godement, Oona Gleeson, Philip Pronin, Raymond Li, Reah Miyara, Robert Xiong, Rohan Nuttall, R.J. Marsan, Sara Culver, Scott Ethersmith, Sean Fitzgerald, Shamez Hemani, Sherwin Wu, Shiao Lee, Shuyang Cheng, Siyuan Fu, Spug Golden, Steve Coffey, Steven Heidel, Sundeep Tirumalareddy, Tabarak Khan, Thomas Degry, Thomas Dimson, Tom Stasi, Tomo Hiratsuka, Trevor Creech, Uzair Navid Iftikhar, Victoria Chernova, Victoria Spiegel, Wanning Jiang, Wenlei Xie, Yaming Lin, Yara Khakbaz, Yilei Qian, Yilong Qin, Yo Shavit, Zhi Bie

Керівництво вищого рівня

Aidan Clark, Bob McGrew, David Farhi, Greg Brockman, Hannah Wong, Jakub Pachocki, Johannes Heidecke, Joanne Jang, Kate Rouch, Kevin Weil, Lauren Itow, Liam Fedus, Mark Chen, Mia Glaese, Mira Murati, Nick Ryder, Sam Altman, Srinivas Narayanan, Tal Broda

Представляємо GPT‑4.5

Масштабування неконтрольованого навчання

Масштабування парадигми GPT

GPT-4.5 (2025)

Глибші знання про світ

Точність SimpleQA (вищий — краще)

Рівень галюцинацій SimpleQA (нижчий — краще)

Навчання для людської співпраці

Порівняльні оцінки за участю людських тестувальників

Варіанти використання

GPT-4.5

GPT-4o

Сильніші міркування в майбутньому

Безпека

Як користуватися GPT-4.5 у ChatGPT

Як використовувати GPT-4.5 в API

Висновок

Додаток

Результати оцінювання моделей

Автори

Основні учасники

Дослідження

Масштабування

Системи безпеки

Впровадження

Керівництво вищого рівня