Bỏ qua nội dung chính
OpenAI

Giới thiệu GPT‑4.5

Bản xem trước nghiên cứu của mô hình GPT mạnh nhất của chúng tôi. Được cung cấp cho người dùng và nhà phát triển sử dụng phiên bản Pro trên toàn thế giới.

Đang tải…

Chúng tôi đang phát hành bản xem trước nghiên cứu của GPT‑4.5—mô hình trò chuyện lớn nhất và tốt nhất của chúng tôi cho đến nay. GPT‑4.5 là bước tiến trong việc mở rộng quy mô trước khi huấn luyện và sau khi huấn luyện. Bằng cách cải thiện khả năng học không cần giám sát, GPT‑4.5 cải thiện khả năng nhận dạng các mẫu, nhận diện liên kết và tạo ra những hiểu biết sáng tạo mà không cần suy luận.

Các thử nghiệm ban đầu cho thấy GPT‑4.5 mang lại cảm giác tự nhiên hơn khi tương tác với người dùng. Cơ sở kiến ​​thức rộng hơn, khả năng theo sát ý định của người dùng tốt hơn và “EQ” cao hơn giúp AI trở nên hữu ích trong các nhiệm vụ như cải thiện bài viết, lập trình và giải quyết các vấn đề thực tế. Chúng tôi cũng mong đợi phiên bản này sẽ gặp ít trường hợp ảo giác hơn.

Chúng tôi chia sẻ GPT‑4.5 như một bản xem trước nghiên cứu nhằm hiểu rõ hơn về điểm mạnh và hạn chế của mô hình này. Chúng tôi vẫn đang khám phá khả năng của nó và rất mong muốn được thấy mọi người sẽ sử dụng nó theo những cách nào mà chúng tôi có thể không ngờ tới.

Mở rộng khả năng học tập không cần giám sát

Chúng tôi nâng cao năng lực AI bằng cách mở rộng hai mô hình bổ sung: học không cần giám sát và suy luận. Hai mô hình này đại diện cho hai khía cạnh của trí tuệ.

  1. Học không giám sát làm tăng độ chính xác và dự đoán của mô hình toàn cầu. Các mô hình như GPT‑3.5, GPT‑4 và GPT‑4.5 tập trung vào mô hình này.
  2. Ngược lại, mở rộng suy luận dạy các mô hình cách suy nghĩ và tạo ra một chuỗi tư duy trước khi phản hồi, cho phép chúng giải quyết các vấn đề STEM hoặc logic phức tạp. Các mô hình như OpenAI o1 và OpenAI o3‑mini tập trung vào mô hình này.

GPT‑4.5 là một ví dụ về việc mở rộng quy mô học không giám sát bằng cách mở rộng khả năng tính toán và dữ liệu, cùng với những cải tiến về kiến ​​trúc và tối ưu hóa. GPT‑4.5 được đào tạo trên siêu máy tính AI Azure của Microsoft. Kết quả là một mô hình có kiến ​​thức rộng hơn cũng như hiểu biết sâu sắc hơn về thế giới, giúp giảm tỷ lệ ảo giác và tăng độ tin cậy trên nhiều chủ đề.

Mở rộng mô hình GPT

What was the first language?

We don't know exactly what the first language was, and scientists believe we'll probably never know for sure because spoken languages appeared long before written records existed.

Here's what we do know:

  • No single "first language": Languages likely developed gradually in different groups of humans around the same time, tens or even hundreds of thousands of years ago.
  • Origin in Africa: Most scientists agree that spoken language probably first emerged among humans in Africa, perhaps over 100,000 years ago.
  • Proto-languages: Rather than a single language, humans likely started with simple communication that evolved into more complex languages. The earliest forms of language probably included gestures, sounds, and signals to express basic ideas and emotions.
  • Lost to history: Because speech leaves no direct fossil record, and writing emerged relatively recently (around 5,000 years ago), we have no way to know exactly how the earliest languages sounded.

Today, linguists study existing languages to understand how they evolved over thousands of years, but the exact identity of humanity’s very first language remains—and will likely always remain—a mystery.

Kiến thức chuyên sâu hơn về thế giới

Độ chính xác SimpleQA (càng cao càng tốt)
62.5%38.2%47%15%Độ chính xác
Tỷ lệ ảo giác SimpleQA (càng thấp càng tốt)
37.1%61.8%44%80.3%Tỷ lệ ảo giác

SimpleQA đo lường tính chân thực của LLM (mô hình ngôn ngữ lớn) đối với các câu hỏi kiến ​​thức đơn giản nhưng đầy thử thách.

Huấn luyện để cộng tác với con người

Khi chúng ta mở rộng mô hình và giải quyết các vấn đề phức tạp hơn, việc dạy cho các mô hình này hiểu rõ hơn về nhu cầu và ý định của con người ngày càng trở nên quan trọng. Đối với GPT‑4.5, chúng tôi đã phát triển các kỹ thuật mới, có khả năng mở rộng để có thể đào tạo các mô hình lớn hơn và mạnh hơn bằng dữ liệu thu được từ các mô hình nhỏ hơn. Các kỹ thuật này cải thiện khả năng điều khiển, hiểu biết về sắc thái và khả năng giao tiếp tự nhiên của GPT‑4.5.

Đánh giá so sánh với người thử nghiệm
56.8%63.2%57.0%Tỷ lệ thắng của GPT-4.5 so với GPT-4o

Sở thích của con người đo lường tỷ lệ truy vấn khiến người thử nghiệm ưa chuộng GPT‑4.5 hơn GPT‑4o.

Kết hợp sự hiểu biết sâu sắc về thế giới với sự cộng tác hiệu quả hơn sẽ tạo ra một mô hình tích hợp các ý tưởng một cách tự nhiên trong các cuộc trò chuyện thân thiết và trực quan, phù hợp hơn để cộng tác với con người. GPT‑4.5 hiểu rõ hơn ý định của con người và diễn giải những tín hiệu tinh tế hoặc kỳ vọng ngầm với sắc thái và “EQ” cao hơn. GPT‑4.5 cũng cho thấy trực giác thẩm mỹ và khả năng sáng tạo tốt hơn. Mô hình này rất hữu ích trong việc hỗ trợ viết lách và thiết kế.

Trường hợp sử dụng

GPT-4.5

I’m going through a tough time after failing a test

Aw, I'm really sorry to hear that. Failing a test can feel pretty tough and discouraging, but remember, it's just one moment—not a reflection of who you are or your capabilities. Want to talk about what happened, or do you just need a distraction? I'm here either way.

I’m going through a tough time after failing a test

I'm really sorry to hear that you're going through a tough time. Here are a few things you might consider:

1. Reflect and Understand: Try to analyze what might have gone wrong. Was it a lack of preparation, time management during the test, or perhaps misunderstanding the material? Understanding the root cause can help you address it in the future.

2. Seek Support: Talk to someone you trust—friends, family, or a school counselor. They can offer a different perspective and sometimes just talking about your feelings can be alleviating.

3. Speak with Your Teacher or Professor: They can provide insights into where you might have gone wrong and offer advice on how to improve. They might also offer opportunities for make-up work or extra credit.

4. Develop a Study Plan: Based on your reflections, create a plan to improve your study habits. This might include setting regular study times, breaking down material into manageable portions, or finding new study methods that work better for you.

5. Stay Positive and Forgive Yourself: Mistakes and setbacks are a part of life. It’s important to be kind to yourself and recognize that failure is a stepping stone to success.

6. Focus on the Bigger Picture: Remember that one test is just one part of your educational journey. There will be many more opportunities to do well.

If you need further support or resources, consider reaching out to educational support services at your institution, or mental health resources if you’re feeling particularly overwhelmed. You’re not alone in this, and things can get better with time and effort.

GPT‑4.5 có “EQ” cao hơn và biết khi nào nên tiếp tục trò chuyện và khi nào nên cung cấp cho người dùng thông tin bổ sung.

Suy luận mạnh mẽ hơn trong tương lai

GPT‑4.5 không suy nghĩ trước khi phản hồi, điều này khiến điểm mạnh của nó trở nên vô cùng khác biệt so với các mô hình suy luận như OpenAI o1. So với OpenAI o1 và OpenAI o3‑mini, GPT‑4.5 là mô hình thông minh hơn, có mục đích chung hơn. Chúng tôi tin rằng khả năng suy luận sẽ là khả năng cốt lõi của các mô hình trong tương lai và hai phương pháp mở rộng quy mô - trước khi huấn luyện và suy luận sẽ bù đắp lẫn nhau. Khi các mô hình như GPT‑4.5 trở nên thông minh hơn và hiểu biết hơn sau khi trải quả quá trình trước khi huấn luyện, chúng sẽ đóng vai trò là nền tảng vững chắc hơn cho suy luận và các trợ lý ảo thao tác công cụ.

An toàn

Mỗi lần phát triển của mô hình cũng là một cơ hội để khiến các mô hình trở nên an toàn hơn. GPT‑4.5 được đào tạo bằng các kỹ thuật giám sát mới kết hợp với phương pháp tinh chỉnh được giám sát (SFT) truyền thống và phương pháp học củng cố từ phản hồi của con người (RLHF) giống như những phương pháp được sử dụng cho GPT‑4o. Chúng tôi hy vọng điều này sẽ đóng vai trò là nền tảng cho việc xây dựng các mô hình mạnh mẽ hơn trong tương lai.

Để kiểm tra thực tế những cải tiến của chúng tôi, chúng tôi đã tiến hành một loạt các thử nghiệm an toàn trước khi triển khai, theo Khung Chuẩn Bị(mở trong cửa sổ mới) của chúng tôi. Chúng tôi nhận thấy rằng việc mở rộng mô hình GPT đã góp phần cải thiện năng lực trong các đánh giá của chúng tôi. Chúng tôi sẽ công bố kết quả chi tiết từ những đánh giá này trong thẻ thông tin hệ thống đi kèm.

Cách sử dụng GPT-4.5 trong ChatGPT

Bắt đầu từ hôm nay, người dùng ChatGPT Pro sẽ có thể chọn GPT‑4.5 trong trình chọn mô hình trên web, thiết bị di động và máy tính để bàn. Chúng tôi sẽ bắt đầu triển khai cho người dùng Plus và Team vào tuần tới, sau đó là người dùng Enterprise và Edu vào tuần tiếp theo.

GPT‑4.5 có khả năng truy cập thông tin mới nhất thông qua chức năng tìm kiếm, hỗ trợ tải tệp và hình ảnh, và có thể sử dụng canvas để viết và lập trình. Tuy nhiên, GPT‑4.5 hiện không hỗ trợ các tính năng đa phương thức như Chế Độ Giọng nói, video và chia sẻ màn hình trong ChatGPT. Trong tương lai, chúng tôi sẽ nỗ lực đơn giản hóa trải nghiệm của người dùng để AI "chỉ phục vụ" bạn.

Cách sử dụng GPT-4.5 trong API

Chúng tôi cũng đang xem trước GPT‑4.5 trong API hoàn thiện hội thoại, API Trợ lý và Batch API cho các nhà phát triển trên tất cả các bậc sử dụng trả phí(mở trong cửa sổ mới). Mô hình này hỗ trợ các tính năng chính như gọi hàm, Dữ liệu đầu ra Cấu trúc, phát trực tuyến và thông báo hệ thống. Nó cũng hỗ trợ khả năng hình ảnh thông qua dữ liệu đầu vào là hình ảnh.

Dựa trên thử nghiệm ban đầu, các nhà phát triển có thể thấy GPT‑4.5 đặc biệt hữu ích cho các ứng dụng được hưởng lợi từ trí tuệ cảm xúc và khả năng sáng tạo cao hơn của nó—chẳng hạn như hỗ trợ viết, giao tiếp, học tập, hướng dẫn và lên ý tưởng. Nó cũng cho thấy khả năng mạnh mẽ trong việc lập kế hoạch và thực hiện bằng trợ lý ảo, bao gồm quy trình mã hóa nhiều bước và tự động hóa nhiệm vụ phức tạp.

GPT‑4.5 là một mô hình rất lớn và đòi hỏi nhiều tài nguyên tính toán, khiến nó trở nên đắt hơn và không phải là giải pháp thay thế cho GPT‑4o. Vì lý do này, chúng tôi đang đánh giá xem có nên tiếp tục cung cấp mô hình này trong API lâu dài hay không khi chúng tôi cân bằng giữa việc hỗ trợ các khả năng hiện tại với việc xây dựng các mô hình trong tương lai. Chúng tôi mong muốn tìm hiểu thêm về điểm mạnh, khả năng và ứng dụng tiềm năng của nó trong bối cảnh thực tế. Nếu GPT‑4.5 mang lại giá trị chuyên biệt cho trường hợp sử dụng của bạn, phản hồi(mở trong cửa sổ mới) của bạn sẽ đóng vai trò quan trọng trong định hướng quyết định của chúng tôi.

Kết luận

Với mỗi cấp độ tính toán mới, lại xuất hiện những khả năng mới. GPT‑4.5 là mô hình đi đầu tìm kiếm những khả năng có thể đạt được trong quá trình học tập không giám sát. Chúng tôi tiếp tục ngạc nhiên trước sức sáng tạo của cộng đồng trong việc khám phá những khả năng mới và các trường hợp sử dụng bất ngờ. Với GPT‑4.5, chúng tôi mời bạn khám phá ranh giới của việc học không giám sát và cùng chúng tôi khám phá những khả năng mới lạ.

Phụ lục

Dưới đây là kết quả của GPT‑4.5 theo các điểm chuẩn học thuật tiêu chuẩn để minh họa hiệu suất hiện tại của nó đối với các nhiệm vụ thường liên quan đến suy luận. Ngay cả khi chỉ mở rộng quy mô học không giám sát, GPT‑4.5 vẫn đạt được cải tiến có ý nghĩa so với các mô hình trước đó như GPT‑4o. Tuy nhiên, chúng tôi mong muốn có được cái nhìn hoàn thiện hơn về khả năng của GPT‑4.5 thông qua bản phát hành này, vì chúng tôi nhận ra rằng các điểm chuẩn học thuật không phải lúc nào cũng phản ánh sự hữu ích thực tế.

Điểm đánh giá mô hình

GPT‑4.5

GPT‑4o

OpenAI o3‑mini (cao)

GPQA (khoa học)

71,4%

53,6%

79,7%

AIME ‘24 (toán)

36,7%

9,3%

87,3%

MMMLU (đa ngôn ngữ)

85,1%

81,5%

81,1%

MMMU (đa phương thức)

74,4%

69,1%

-

SWE-Lancer Diamond (lập trình)*

32,6%

186.125 USD

23,3%

138.750 USD

10,8%

89.625 USD

SWE-Bench Đã Xác Minh (lập trình)*

38,0%

30,7%

61,0%

*Các con số cho biết hiệu suất nội bộ tốt nhất.

Tác giả

OpenAI

Người đóng góp chủ chốt

Adam Goucher, Alex Paino, Ali Kamali, Amin Tootoonchian, Andrew Tulloch, Ben Sokolowsky, Clemens Winter, Colin Wei, Daniel Kappler, Daniel Levy, Felipe Petroski Such, Geoff Salmon, Ian O’Connell, Jason Teplitz, Kai Chen, Nik Tezak, Prafulla Dhariwal, Rapha Gontijo Lopes, Sam Schoenholz, Youlong Cheng, Yujia Jin, Yunxing Dai

Nghiên cứu

Người đóng góp chính

Aiden Low, Alec Radford, Alex Carney, Alex Nichol, Alexis Conneau, Ananya Kumar, Ben Wang, Charlotte Cole, Elizabeth Yang, Gabriel Goh, Hadi Salman, Haitang Hu, Heewoo Jun, Ian Sohl, Ishaan Gulrajani, Jacob Coxon, James Betker, Jamie Kiros, Jessica Landon, Kyle Luther, Lia Guy, Lukas Kondraciuk, Lyric Doshi, Mikhail Pavlov, Qiming Yuan, Reimar Leike, Rowan Zellers, Sean Metzger, Shengjia Zhao, Spencer Papay, Tao Wang

Người đóng góp

Adam Lerer, Adrien Ecoffet, Aidan McLaughlin, Alexander Prokofiev, Alexandra Barr, Allan Jabri, Andrew Gibiansky, Andrew Schmidt, Casey Chu, Chak Li, Chelsea Voss, Chris Hallacy, Chris Koch, Christine McLeavey, David Mely, Dimitris Tsipras, Eric Sigler, Erin Kavanaugh, Farzad Khorasani, Huiwen Chang, Ilya Kostrikov, Ishaan Singal, Ji Lin, Jiahui Yu, Jing Yu Zhang, John Rizzo, Jong Wook Kim, Joyce Lee, Juntang Zhuang, Leo Liu, Li Jing, Long Ouyang, Louis Feuvrier, Mo Bavarian, Nick Stathas, Nitish Keskar, Oleg Murk, Preston Bowman, Scottie Yan, SQ Mah, Tao Xu, Taylor Gordon, Valerie Qi, Wenda Zhou, Yu Zhang

Mở rộng quy mô

Người đóng góp chính

Alex Chow, Alex Renzin, Aleksandra Spyra, Avi Nayak, Ben Leimberger, Christopher Hesse, Duc Phong Nguyen, Dinghua Li, Eric Peterson, Francis Zhang, Gene Oden, Kai Fricke, Kai Hayashi, Larry Lv, Leqi Zou, Lin Yang, Madeleine Thompson, Michael Petrov, Miguel Castro, Natalia Gimelshein, Phil Tillet, Reza Zamani, Ryan Cheu Stanley Hsieh, Steve Lee, Stewart Hall, Thomas Raoux, Tianhao Zheng, Vishal Kuo, Yongjik Kim, Yuchen Zhang, Zhuoran Liu

Người đóng góp

Alvin Wan, Andrew Cann, Andrew Codispoti, Antoine Pelisse, Anuj Kalia, Aaron Hurst, Avital Oliver, Brad Barnes, Brian Hsu, Chen Ding, Chen Shen, Cheng Chang, Christian Gibson, Christopher Berner, Duncan Findlay, Fan Wang, Fangyuan Li, Gianluca Borello, Heather Schmidt, Henrique Ponde de Oliveira Pinto, Ikai Lan, Jiayi Weng, James Crooks, Jos Kraaijeveld, Junru Shao, Kenny Hsu, Kenny Nguyen, Kevin King, Leah Burkhardt, Leo Chen, Linden Li, Lu Zhang, Mahmoud Eariby, Marat Dukhan, Mateusz Litwin, Miki Habryn, Natan LaFontaine, Pavel Belov, Peng Su, Prasad Chakka, Rachel Lim, Rajkumar Samuel, Renaud Gaubert, Rory Carmichael, Sarah Dong, Shantanu Jain, Shuaiqi Xia, Stephen Logsdon, Todd Underwood, Tony Zhao, Weixing Zhang, Will Sheu, Weiyi Zheng, Yinghai Lu, Yunqiao Zhang

Hệ thống an toàn

Andrea Vallone, Andy Applebaum, Cameron Raymond, Chong Zhang, Dan Mossing, Elizabeth Proehl, Eric Wallace, Evan Mays, Grace Zhao, Ian Kivlichan, Irina Kofman, Joel Parish, Kevin Liu, Keren Gu-Lemberg, Kristen Ying, Lama Ahmad, Lilian Weng, Leon Maksin, Leyton Ho, Meghan Shah, Michael Lampe, Michele Wang, Miles Wang, Olivia Watkins, Phillip Guo, Samuel Miserendino, Sam Toizer, Sandhini Agarwal, Tejal Patwardhan, Tom Dupré la Tour, Tong Mu, Tyna Eloundou, Yunyun Wang

Triển khai

Adam Brandon, Adam Perelman, Adele Li, Akshay Nathan, Alan Hayes, Alfred Xue, Alison Ben, Alec Gorge, Alex Guziel, Alex Iftimie, Ally Bennett, Andrew Chen, Andy Wang, Andy Wood, Angad Singh, Anoop Kotha, Antonia Woodford, Anuj Saharan, Ashley Tyra, Atty Eleti, Ben Schneider, Bessie Ji, Beth Hoover, Bill Chen, Blake Samic, Britney Smith, Brian Yu, Caleb Wang, Cary Bassin, Cary Hudson, Charlie Jatt, Chengdu Huang, Chris Beaumont, Christina Huang, Cristina Scheau, Dana Palmie, Daniel Levine, Daryl Neubieser, Dave Cummings, David Sasaki, Dibya Bhattacharjee, Dylan Hunn, Edwin Arbus, Elaine Ya Le, Enis Sert, Eric Kramer, Fred von Lohmann, Freddie Sulit, Gaby Janatpour, Garrett McGrath, Garrett Ollinger, Gary Yang, Hao Sheng, Harold Hotelling, Janardhanan Vembunarayanan, Jeff Harris, Jeffrey Sabin Matsumoto, Jennifer Robinson, Jessica Liang, Jessica Shieh, Jiacheng Yang, Joel Morris, Joseph Florencio, Josh Kaplan, Kan Wu, Karan Sharma, Karen Li, Katie Pypes, Kendal Simon, Kendra Rimbach, Kevin Park, Kevin Rao, Laurance Fauconnet, Lauren Workman, Leher Pathak, Liang Wu, Liang Xiong, Lien Mamitsuka, Lindsay McCallum, Lukas Gross, Manoli Liodakis, Matt Nichols, Michelle Fradin, Minal Khan, Mingxuan Wang, Nacho Soto, Natalie Staudacher, Nikunj Handa, Niko Felix, Ning Liu, Olivier Godement, Oona Gleeson, Philip Pronin, Raymond Li, Reah Miyara, Robert Xiong, Rohan Nuttall, R.J. Marsan, Sara Culver, Scott Ethersmith, Sean Fitzgerald, Shamez Hemani, Sherwin Wu, Shiao Lee, Shuyang Cheng, Siyuan Fu, Spug Golden, Steve Coffey, Steven Heidel, Sundeep Tirumalareddy, Tabarak Khan, Thomas Degry, Thomas Dimson, Tom Stasi, Tomo Hiratsuka, Trevor Creech, Uzair Navid Iftikhar, Victoria Chernova, Victoria Spiegel, Wanning Jiang, Wenlei Xie, Yaming Lin, Yara Khakbaz, Yilei Qian, Yilong Qin, Yo Shavit, Zhi Bie

Lãnh đạo điều hành

Aidan Clark, Bob McGrew, David Farhi, Greg Brockman, Hannah Wong, Jakub Pachocki, Johannes Heidecke, Joanne Jang, Kate Rouch, Kevin Weil, Lauren Itow, Liam Fedus, Mark Chen, Mia Glaese, Mira Murati, Nick Ryder, Sam Altman, Srinivas Narayanan, Tal Broda