GPT‑4.5 が登場
OpenAI 最強の GPT モデルの研究プレビュー。世界中の Pro ユーザーと開発者の皆さまにご利用いただけます。
これまでで最大かつ最高のチャット モデル、GPT‑4.5 の研究プレビューをリリースいたします。GPT‑4.5 は、事前学習と事後学習のスケールアップへの一歩です。教師なし学習を拡張することで、パターンを認識し、つながりを引き出し、推論なしで独創的な洞察を生み出す能力が向上しています。
初期テストは、GPT‑4.5 とのやり取りがより自然に感じられることを示しています。より幅広い知識ベース、ユーザーの意図をつかむ能力の向上、そして「EQ」の向上が、文章力アップ、プログラミング、実用的な問題の解決などのタスクに役立ちます。事実誤認の低減も期待されます。
当社では、GPT‑4.5 の長所と制限をより深く理解していただくために、研究プレビューとして GPT‑4.5 を共有しています。これによって何ができるかを模索しているところですが、ユーザーが予想を超える方法で使用してくださるのを楽しみにしています。
当社では、教師なし学習と推論という 2 つの補完的パラダイムを拡張することで AI 機能の進化を図っています。これらはインテリジェンスの 2 つの軸を表すものです。
- 教師なし学習が、世界モデルの精度と直感性を向上します。GPT‑3.5、GPT‑4、GPT‑4.5 などのモデルは、このパラダイムを進化させます。
- 一方、スケーリング推論は、回答する前に考え、思考の連鎖を生み出すことをモデルに教え、複雑な STEM 問題やロジックの問題に取り組めるようにします。OpenAI o1 や OpenAI o3‑mini などのモデルは、このパラダイムを進化させます。
GPT‑4.5 は、アーキテクチャと最適化の革新とともに、コンピューティングとデータのスケールアップによって教師なし学習を拡大する一例です。GPT‑4.5 の学習は Microsoft Azure AI スーパーコンピューターで実施されました。結果として、さらに広い知識と世界に対する、より深い理解を持つモデルとなり、誤認が減り、幅広いトピックにわたる信頼性が高まっています。
GPT パラダイムのスケーリング
世界の知識を深める
簡易 QA 精度(高いほど良い)
簡易 QA ハルシネーション率(低いほど良い)
SimpleQA は、直接的ながら挑戦的な知識を求める質問で LLM(大規模言語モデル)の正確性を測定します。
モデルを拡大し、より複雑な課題を解決するようになると、人間のニーズと意図をより深く理解できるようにモデルを教えることが重要になってきます。GPT‑4.5 では、より小規模なモデルから得られたデータを使用して、より大規模で強力なモデルの学習を可能にする、スケーラブルな新手法を開発しました。これらの手法が、GPT‑4.5 の操作性、ニュアンスの理解、自然な会話が向上させます。
人間のテスターとの比較評価
テスターが GPT‑4o よりも GPT‑4.5 を好んだクエリの割合を測定した「人の好み」です。
世界に対する深い理解と改善されたコラボレーションの組み合わせにより、人間とのコラボレーションに適した温かく直感的な会話でアイデアを自然に統合するモデルが生まれます。GPT‑4.5 は、人間の意味するところをよりよく理解し、微妙な合図や暗黙の期待などを、ニュアンスのより深い理解と「EQ」で解釈します。GPT‑4.5 はまた、より強い美的感覚と創造性を発揮します。また、文章作成とデザインの支援にも優れています。
ユースケース
GPT-4.5
GPT‑4.5 はより高い「EQ」を示し、さらなる会話を促すべきか、それともユーザーに詳細な情報を提供すべきかを理解します。
GPT‑4.5 は回答する前に思考しない点で、OpenAI o1 などの推論モデルとは特に異なる強みをもっています。OpenAI o1 や OpenAI o3‑mini と比較して、GPT‑4.5 はより汎用的で、よりスマートな本質のモデルです。当社は、推論が将来のモデルの中核機能となり、スケーリングに対する 2 つのアプローチ(事前学習と推論)が互いに補完し合うようになると考えています。GPT‑4.5 のようなモデルは、事前学習によってよりスマートに、そして知識が豊富になるため、推論およびツールを使用するエージェントのさらに強力な基盤として機能します。
モデルの機能向上は、モデルの安全性を高める機会でもあります。GPT‑4.5 では、GPT‑4o で使用されているような従来の教師ありファインチューニング(SFT)と人間によるフィードバックによる強化学習(RLHF)の手法を組み合わせた新しい監督手法を使用して学習が行われました。この学習が、より高性能な将来のモデルを調整するための基礎となるよう願っています。
改善点をストレステストするため、デプロイ前に当社の Preparedness Framework(新しいウィンドウで開く) に従って一連の安全性テストを実施しました。そして GPT パラダイムのスケーリングが、評価全体の機能向上に寄与していることを発見しました。これらの評価の詳細な結果は、付随する System Card に掲載されます。
本日より、ChatGPT Pro ユーザーは、ウェブ、モバイル、デスクトップのモデル ピッカーで GPT‑4.5 を選択できます。来週には Plus および Team ユーザーへのロールアウト、またその翌週には Enterprise および Edu ユーザーへのロールアウトを開始します。
GPT‑4.5 は、検索機能を使用して最新の情報にアクセスし、ファイルや画像のアップロードのサポート、またキャンバスを使用して書き込みやコードの作業を行うことができます。ただし、現在のところ、GPT‑4.5 は ChatGPT の音声モード、ビデオ、画面共有などのマルチモーダル機能をサポートしていません。今後、ユーザー エクスペリエンスを簡素化し、AI が「スムーズに機能」できるように取り組んでいきます。
OpenAI では、すべての有料利用ティア(新しいウィンドウで開く)の開発者向けに、Chat Completions API、Assistants API、Batch API の GPT‑4.5 のプレビューも実施しています。このモデルは、Function Calling、Structured Outputs、ストリーミング、システムメッセージなどの主要な機能をサポートしています。画像入力による視覚機能もサポートに含まれます。
初期テストによると、GPT‑4.5 が文章作成支援、コミュニケーション、学習、コーチング、ブレーンストーミングなど、高い感情的な知能と創造性が必要なアプリケーションに特に役立つことを発見している開発者もいます。また、マルチステップのコーディング ワークフローや複雑なタスクの自動化など、エージェントによる計画と実行においても高い能力を発揮します。
GPT‑4.5 は計算に集約する非常に大規模なモデルであるため、GPT‑4o よりも高価であり、GPT‑4o の代替にはなりません。こののために、現在の機能のサポートと今後のモデル構築とのバランスを取りながら、長期的に API で提供し続けるかどうかを評価中です。強みと機能、そして現実世界における潜在的な応用についてさらに学んでいけることを楽しみにしています。GPT‑4.5 がユーザーのユースケースに独自の価値をもたらす場合、そのようなユーザーからのフィードバック(新しいウィンドウで開く)は当社のこれからの決定に重要な役割を果たします。
コンピューティングの規模が新たな域に達するたびに、新しい機能が生まれます。GPT‑4.5 は、教師なし学習で実現できることに関する最先端モデルです。私たちは、新しい機能や予想もしなかったユースケースを発見するコミュニティの創造性に驚かされ続けています。GPT‑4.5 で教師なし学習の最前線を模索し、私たちとともに新たな機能を発見してください。
以下に、従来は推論に関連付けられていたタスクでの現在のパフォーマンスをご覧いただけるよう、標準的な学術的なベンチマークにおける GPT‑4.5 の結果を示します。教師なし学習を純粋にスケールアップした点のみにおいても、GPT‑4.5 は GPT‑4o などの以前のモデルに比べ、意味深い改善を示しています。とはいえ、学術的なベンチマークが必ずしも現実世界の有用性を反映しているわけではないことも確かであり、今回のリリースを通じて GPT‑4.5 の機能をより完全に把握できるよう期待しています。
モデル評価スコア
GPT‑4.5 | GPT‑4o | OpenAI o3‑mini (high) | |
GPQA(科学) | 71.4% | 53.6% | 79.7% |
AIME ‘24(数学) | 36.7% | 9.3% | 87.3% |
MMMLU(多言語) | 85.1% | 81.5% | 81.1% |
MMMU(マルチモーダル) | 74.4% | 69.1% | - |
WE-Lancer Diamond(コーディング)* | 32.6% $186,125 | 23.3% $138,750 | 10.8% $89,625 |
SWE-Bench Verified(コーディング)* | 38.0% | 30.7% | 61.0% |
*表示の数値は最高の内部パフォーマンスを表しています。
著者
基礎分野の貢献者
Adam Goucher、Alex Paino、Ali Kamali、Amin Tootoonchian、Andrew Tulloch、Ben Sokolowsky、Clemens Winter、Colin Wei、Daniel Kappler、Daniel Levy、Felipe Petroski Such、Geoff Salmon、Ian O’Connell、Jason Teplitz、Kai Chen、Nik Tezak、Prafulla Dhariwal、Rapha Gontijo Lopes、Sam Schoenholz、Youlong Cheng、Yujia Jin、Yunxing Dai
研究
主力貢献者
Aiden Low、Alec Radford、Alex Carney、Alex Nichol、Alexis Conneau、Ananya Kumar、Ben Wang、Charlotte Cole、Elizabeth Yang、Gabriel Goh、Hadi Salman、Haitang Hu、Heewoo Jun、Ian Sohl、Ishaan Gulrajani、Jacob Coxon、James Betker、Jamie Kiros、Jessica Landon、Kyle Luther、Lia Guy、Lukas Kondraciuk、Lyric Doshi、Mikhail Pavlov、Qiming Yuan、Reimar Leike、Rowan Zellers、Sean Metzger、Shengjia Zhao、Spencer Papay、Tao Wang
貢献者
Adam Lerer、Adrien Ecoffet、Aidan McLaughlin、Alexander Prokofiev、Alexandra Barr、Allan Jabri、Andrew Gibiansky、Andrew Schmidt、Casey Chu、Chak Li、Chelsea Voss、Chris Hallacy、Chris Koch、Christine McLeavey、David Mely、Dimitris Tsipras、Eric Sigler、Erin Kavanaugh、Farzad Khorasani、Huiwen Chang、Ilya Kostrikov、Ishaan Singal、Ji Lin、Jiahui Yu、Jing Yu Zhang、John Rizzo、Jong Wook Kim、Joyce Lee、Juntang Zhuang、Leo Liu、Li Jing、Long Ouyang、Louis Feuvrier、Mo Bavarian、Nick Stathas、Nitish Keskar、Oleg Murk、Preston Bowman、Scottie Yan、SQ Mah、Tao Xu、Taylor Gordon、Valerie Qi、Wenda Zhou、Yu Zhang
スケーリング
主力貢献者
Alex Chow、Alex Renzin、Aleksandra Spyra、Avi Nayak、Ben Leimberger、Christopher Hesse、Duc Phong Nguyen、Dinghua Li、Eric Peterson、Francis Zhang、Gene Oden、Kai Fricke、Kai Hayashi、Larry Lv、Leqi Zou、Lin Yang、Madeleine Thompson、Michael Petrov、Miguel Castro、Natalia Gimelshein、Phil Tillet、Reza Zamani、Ryan Cheu Stanley Hsieh、Steve Lee、Stewart Hall、Thomas Raoux、Tianhao Zheng、Vishal Kuo、Yongjik Kim、Yuchen Zhang、Zhuoran Liu
貢献者
Alvin Wan、Andrew Cann、Andrew Codispoti、Antoine Pelisse、Anuj Kalia、Aaron Hurst、Avital Oliver、Brad Barnes、Brian Hsu、Chen Ding、Chen Shen、Cheng Chang、Christian Gibson、Christopher Berner、Duncan Findlay、Fan Wang、Fangyuan Li、Gianluca Borello、Heather Schmidt、Henrique Ponde de Oliveira Pinto、Ikai Lan、Jiayi Weng、James Crooks、Jos Kraaijeveld、Junru Shao、Kenny Hsu、Kenny Nguyen、Kevin King、Leah Burkhardt、Leo Chen、Linden Li、Lu Zhang、Mahmoud Eariby、Marat Dukhan、Mateusz Litwin、Miki Habryn、Natan LaFontaine、Pavel Belov、Peng Su、Prasad Chakka、Rachel Lim、Rajkumar Samuel、Renaud Gaubert、Rory Carmichael、Sarah Dong、Shantanu Jain、Shuaiqi Xia、Stephen Logsdon、Todd Underwood、Tony Zhao、Weixing Zhang、Will Sheu、Weiyi Zheng、Yinghai Lu、Yunqiao Zhang
Safety Systems
Andrea Vallone、Andy Applebaum、Cameron Raymond、Chong Zhang、Dan Mossing、Elizabeth Proehl、Eric Wallace、Evan Mays、Grace Zhao、Ian Kivlichan、Irina Kofman、Joel Parish、Kevin Liu、Keren Gu-Lemberg、Kristen Ying、Lama Ahmad、Lilian Weng、Leon Maksin、Leyton Ho、Meghan Shah、Michael Lampe、Michele Wang、Miles Wang、Olivia Watkins、Phillip Guo、Samuel Miserendino、Sam Toizer、Sandhini Agarwal、Tejal Patwardhan、Tom Dupré la Tour、Tong Mu、Tyna Eloundou、Yunyun Wang
展開
Adam Brandon、Adam Perelman、Adele Li、Akshay Nathan、Alan Hayes、Alfred Xue、Alison Ben、Alec Gorge、Alex Guziel、Alex Iftimie、Ally Bennett、Andrew Chen、Andy Wang、Andy Wood、Angad Singh、Anoop Kotha、Antonia Woodford、Anuj Saharan、Ashley Tyra、Atty Eleti、Ben Schneider、Bessie Ji、Beth Hoover、Bill Chen、Blake Samic、Britney Smith、Brian Yu、Caleb Wang、Cary Bassin、Cary Hudson、Charlie Jatt、Chengdu Huang、Chris Beaumont、Christina Huang、Cristina Scheau、Dana Palmie、Daniel Levine、Daryl Neubieser、Dave Cummings、David Sasaki、Dibya Bhattacharjee、Dylan Hunn、Edwin Arbus、Elaine Ya Le、Enis Sert、Eric Kramer、Fred von Lohmann、Freddie Sulit、Gaby Janatpour、Garrett McGrath、Garrett Ollinger、Gary Yang、Hao Sheng、Harold Hotelling、Janardhanan Vembunarayanan、Jeff Harris、Jeffrey Sabin Matsumoto、Jennifer Robinson、Jessica Liang、Jessica Shieh、Jiacheng Yang、Joel Morris、Joseph Florencio、Josh Kaplan、Kan Wu、Karan Sharma、Karen Li、Katie Pypes、Kendal Simon、Kendra Rimbach、Kevin Park、Kevin Rao、Laurance Fauconnet、Lauren Workman、Leher Pathak、Liang Wu、Liang Xiong、Lien Mamitsuka、Lindsay McCallum、Lukas Gross、Manoli Liodakis、Matt Nichols、Michelle Fradin、Minal Khan、Mingxuan Wang、Nacho Soto、Natalie Staudacher、Nikunj Handa、Niko Felix、Ning Liu、Olivier Godement、Oona Gleeson、Philip Pronin、Raymond Li、Reah Miyara、Robert Xiong、Rohan Nuttall、R.J. Marsan、Sara Culver、Scott Ethersmith、Sean Fitzgerald、Shamez Hemani、Sherwin Wu、Shiao Lee、Shuyang Cheng、Siyuan Fu、Spug Golden、Steve Coffey、Steven Heidel、Sundeep Tirumalareddy、Tabarak Khan、Thomas Degry、Thomas Dimson、Tom Stasi、Tomo Hiratsuka、Trevor Creech、Uzair Navid Iftikhar、Victoria Chernova、Victoria Spiegel、Wanning Jiang、Wenlei Xie、Yaming Lin、Yara Khakbaz、Yilei Qian、Yilong Qin、Yo Shavit、Zhi Bie
エグゼクティブリーダーシップ
Aidan Clark、Bob McGrew、David Farhi、Greg Brockman、Hannah Wong、Jakub Pachocki、Johannes Heidecke、Joanne Jang、Kate Rouch、Kevin Weil、Lauren Itow、Liam Fedus、Mark Chen、Mia Glaese、Mira Murati、Nick Ryder、Sam Altman、Srinivas Narayanan、Tal Broda