Giới thiệu về nghiên cứu sâu
Một tác nhân sử dụng khả năng suy luận để tổng hợp lượng lớn thông tin trực tuyến và hoàn thành các nhiệm vụ nghiên cứu đa bước cho bạn. Có sẵn cho người dùng Pro ngay hôm nay, tiếp theo là người dùng Plus và Team.
Cập nhật ngày 10 tháng 2 năm 2026: Giờ đây, bạn có thể kết nối nghiên cứu sâu với bất kỳ MCP hoặc ứng dụng nào và hạn chế tìm kiếm trên web đối với các trang web đáng tin cậy, vì vậy bạn có thể tập trung vào các nguồn được xác thực, tiêu chuẩn công nghiệp. Giờ đây, bạn cũng có thể theo dõi tiến trình trong thời gian thực và ngắt để tinh chỉnh bằng lời nhắc tiếp theo hoặc các nguồn mới. Chúng tôi đã cập nhật trải nghiệm hình ảnh để dễ dàng bắt đầu, theo dõi và xem xét nghiên cứu của bạn từ đầu đến cuối dễ dàng hơn.
Cập nhật ngày 17 tháng 7 năm 2025: Nghiên cứu sâu giờ đây có thể đi sâu hơn và rộng hơn với quyền truy cập vào trình duyệt trực quan như một phần của tác nhân ChatGPT. Để truy cập các khả năng cập nhật này, chỉ cần chọn “chế độ tác nhân” từ menu thả xuống trong trình soạn nhạc và nhập truy vấn của bạn trực tiếp. Chức năng nghiên cứu sâu ban đầu vẫn có sẵn thông qua tùy chọn “nghiên cứu sâu” trong menu công cụ.
Cập nhật ngày 24 tháng 4 năm 2025: Chúng tôi đang tăng đáng kể tần suất bạn có thể sử dụng nghiên cứu sâu — Người dùng Plus, Team, Enterprise và Edu hiện nhận được 25 truy vấn mỗi tháng, người dùng Pro nhận được 250 và người dùng Miễn phí nhận được 5 truy vấn. Điều này được thực hiện thông qua một phiên bản nghiên cứu sâu nhẹ mới được hỗ trợ bởi phiên bản o4-mini, được thiết kế để tiết kiệm chi phí hơn trong khi vẫn giữ được chất lượng cao. Khi bạn đạt đến giới hạn cho phiên bản đầy đủ, truy vấn của bạn sẽ tự động chuyển sang phiên bản nhẹ.
Cập nhật ngày 25 tháng 2 năm 2025: Tất cả người dùng Plus hiện có thể sử dụng nghiên cứu sâu.
Cập nhật ngày 5 tháng 2 năm 2025: Nghiên cứu sâu hiện đã có sẵn cho người dùng Pro tại Vương quốc Anh, Thụy Sĩ và Khu vực kinh tế Châu Âu.
Hôm nay, chúng tôi ra mắt tính năng Nghiên cứu sâu trong ChatGPT, một năng lực mới mang tính tự chủ cao giúp thực hiện nghiên cứu đa bước trên internet cho các nhiệm vụ phức tạp. Chỉ với mười phút, tính năng này sẽ hoàn tất những gì con người phải mất nhiều giờ.
Tính năng Nghiên cứu sâu là tác nhân kế tiếp của OpenAI có thể tự chủ thực hiện công việc cho bạn, chỉ cần đưa ra lời nhắc và ChatGPT sẽ tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một báo cáo toàn diện, ngang tầm với một chuyên viên phân tích nghiên cứu. Được trang bị phiên bản mô hình OpenAI o3 sắp ra mắt, vốn được tối ưu hóa để duyệt web và phân tích dữ liệu, tính năng này tận dụng khả năng suy luận để tìm kiếm, diễn giải và phân tích khối lượng lớn các văn bản, hình ảnh và tệp PDF trên internet, linh hoạt điều chỉnh khi cần phản hồi với thông tin thu được.
Khả năng tổng hợp kiến thức là điều kiện tiên quyết để tạo ra kiến thức mới. Vì lý do này, tính năng nghiên cứu sâu đánh dấu một bước tiến quan trọng hướng tới mục tiêu lớn hơn của chúng tôi là phát triển AGI (Trí tuệ nhân tạo tổng quát), mà chúng tôi từ lâu đã hình dung là có khả năng thực hiện nghiên cứu khoa học mới.
Tính năng Nghiên cứu sâu được xây dựng cho những người làm công việc đòi hỏi kiến thức chuyên sâu trong các lĩnh vực như tài chính, khoa học, chính sách và kỹ thuật và cần đến hoạt động nghiên cứu kỹ lưỡng, chính xác và đáng tin cậy. Ngoài ra tính năng này có thể hữu ích không kém cho những người mua sắm sành điệu đang tìm kiếm các đề xuất đặc thù về mua sắm thường đòi hỏi phải nghiên cứu cẩn thận, như xe hơi, thiết bị và đồ nội thất. Mỗi kết quả đều được ghi chép đầy đủ, với các trích dẫn rõ ràng và tóm tắt quá trình suy nghĩ, giúp bạn dễ dàng tham khảo và xác minh thông tin. Tính năng này đặc biệt hiệu quả trong việc tìm kiếm thông tin chuyên biệt, khó suy luận trực tiếp mà sẽ đòi hỏi phải duyệt xem rất nhiều trang web. Nghiên cứu sâu sẽ tiết kiệm thời gian quý giá nhờ giúp bạn giảm khối lượng công việc, đẩy nhanh việc nghiên cứu trên web phức tạp, tốn kém thời gian chỉ bằng một lệnh truy vấn.
Tính năng Nghiên cứu sâu sẽ phát hiện, suy luận và tổng hợp những phân tích chuyên sâu một cách độc lập từ khắp các nguồn trên web. Để thực hiện điều này, mô hình đã được huấn luyện về các nhiệm vụ thực tế đòi hỏi sử dụng công cụ trình duyệt và Python, áp dụng cùng những phương pháp học củng cố là nền tảng cho OpenAI o1, mô hình suy luận đầu tiên của chúng tôi. Mặc dù o1 thể hiện khả năng ấn tượng trong viết mã, toán học và các lĩnh vực kỹ thuật khác, nhưng nhiều thách thức trong thực tế đòi hỏi bối cảnh rộng lớn và thu thập thông tin từ nhiều nguồn trực tuyến khác nhau. Nghiên cứu sâu dựa trên các khả năng suy luận này nhằm thu hẹp khoảng cách đó, giúp đảm nhận các loại vấn đề mà mọi người gặp phải trong công việc và cuộc sống hàng ngày.
Trong ChatGPT, chọn ‘nghiên cứu sâu’ trong trình soạn thảo tin nhắn và nhập truy vấn của bạn. Cho ChatGPT biết bạn cần gì – cho dù đó là bản phân tích cạnh tranh trên các nền tảng truyền phát trực tuyến hay một báo cáo cá nhân hóa về chiếc xe đạp đi lại hàng ngày tốt nhất. Bạn có thể đính kèm các tệp hoặc bảng tính để bổ sung bối cảnh cho câu hỏi của mình. Sau khi bắt đầu chạy, một thanh bên xuất hiện cùng với bản tóm tắt các bước được thực hiện và các nguồn được sử dụng.
Nghiên cứu sâu có thể mất từ 5 đến 30 phút để hoàn tất công việc, dành thời gian cần thiết để tìm hiểu kỹ lưỡng trên web. Trong khi đó, bạn có thể rời đi hoặc làm các nhiệm vụ khác – bạn sẽ nhận được thông báo sau khi nghiên cứu hoàn tất. Kết quả cuối cùng sẽ có dưới dạng một báo cáo trong đoạn chat – trong vài tuần tiếp theo, chúng tôi cũng sẽ thêm hình ảnh nhúng, trực quan hóa dữ liệu và các kết quả phân tích khác trong những báo cáo này giúp làm rõ thêm và nắm vững bối cảnh.
So với nghiên cứu sâu, GPT‑4o rất lý tưởng cho các cuộc trò chuyện đa phương thức ở thời gian thực. Với các truy vấn nhiều khía cạnh, cụ thể theo lĩnh vực, trong đó mức độ chuyên sâu và chi tiết có ý nghĩa rất quan trọng, khả năng để tính năng nghiên cứu sâu này tiến hành khám phá thông tin sâu rộng và trích dẫn nguồn cho từng luận điểm chính là yếu tố tạo nên sự khác biệt giữa một bản tóm tắt nhanh và một câu trả lời được xác minh, dẫn chứng đầy đủ, có thể dùng làm sản phẩm công việc.
GPT-4o
Nghiên cứu sâu
Tính năng Nghiên cứu sâu sẽ phản hồi lời nhắc một cách rất chi tiết, cung cấp dữ liệu theo quốc gia cụ thể song song cho cả danh sách Top 10 quốc gia phát triển và Top 10 quốc gia đang phát triển để dễ dàng tham khảo và so sánh. Nghiên cứu sâu sẽ sử dụng thông tin đó để đưa ra các đề xuất thâm nhập thị trường chi tiết, vừa có cơ sở thông tin vững chắc vừa mang tính ứng dụng cao.
Nghiên cứu sâu đã được huấn luyện bằng phương pháp học củng cố đầu-cuối trên các nhiệm vụ duyệt tìm và suy luận phức tạp ở khắp các lĩnh vực khác nhau. Thông qua việc huấn luyện đó, mô hình này đã học cách lập kế hoạch và thực thi một lộ trình gồm nhiều bước để tìm kiếm dữ liệu cần thiết, quay lui và phản hồi với thông tin ở thời gian thực khi cần thiết. Mô hình này cũng có thể duyệt qua các tệp đã tải lên của người dùng, vẽ và lặp lại trên biểu đồ bằng công cụ Python, nhúng cả đồ thị và hình ảnh được tạo từ các trang web trong câu trả lời và trích dẫn các câu hoặc đoạn cụ thể từ các nguồn của nó. Kết quả của quá trình huấn luyện này là mô hình đã đạt được những thành tựu vượt trội mới trong nhiều bài đánh giá công khai tập trung vào các vấn đề thực tế.
Trong Bài kiểm tra cuối cùng của con người(mở trong cửa sổ mới), một bài đánh giá được công bố gần đây nhằm kiểm tra năng lực AI trên nhiều lĩnh vực khác nhau qua các câu hỏi ở cấp độ chuyên gia, mô hình trang bị tính năng nghiên cứu sâu đã đạt được kỷ lục mới với độ chính xác 26,6%. Thử nghiệm này bao gồm hơn 3.000 câu hỏi trắc nghiệm và trả lời ngắn, trải rộng trên hơn 100 lĩnh vực khác nhau, từ ngôn ngữ học đến khoa học tên lửa, từ văn học kinh điển đến sinh thái học. So với OpenAI o1, tiến bộ vượt trội lớn nhất xuất hiện trong lĩnh vực hóa học, nhân văn, khoa học xã hội và toán học. Mô hình hỗ trợ nghiên cứu sâu đã thể hiện một cách tiếp cận tương tự con người bằng cách tìm kiếm thông tin chuyên ngành một cách hiệu quả khi cần thiết.
| Mô hình | Độ chính xác (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (trung bình)* | 10,5 |
| OpenAI o3-mini (cao)* | 13,0 |
| Nghiên cứu sâu của OpenAI** | 26,6 |
Trên GAIA(mở trong cửa sổ mới)1, một bộ tiêu chuẩn công khai nhằm đánh giá năng lực AI về các câu hỏi trong thực tế, mô hình hỗ trợ nghiên cứu sâu này đã đạt được trình độ tiên tiến (SOTA) mới, dẫn đầu bảng xếp hạng(mở trong cửa sổ mới) bên ngoài. Bao gồm các câu hỏi ở ba cấp độ khó khác nhau, việc hoàn tất thành công những nhiệm vụ này đòi hỏi các khả năng bao gồm: suy luận, sự thành thạo khi xử lý đa phương thức, khả năng duyệt web và mức độ thông thạo khi sử dụng công cụ.
| GAIA | ||||
|---|---|---|---|---|
| Cấp 1 | Cấp 2 | Cấp 3 | Trung bình | |
| SOTA trước(mở trong cửa sổ mới) | 67,92 | 67,44 | 42,31 | 63,64 |
| Nghiên cứu sâu (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Nghiên cứu sâu (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Ví dụ về nhiệm vụ GAIA
Trong một đánh giá nội bộ về các nhiệm vụ cấp độ chuyên gia trên nhiều lĩnh vực, các chuyên gia trong ngành đã nhìn nhận rằng tính năng nghiên cứu sâu đã tự động hóa được nhiều giờ nghiên cứu thủ công vốn rất khó khăn.
Tỷ lệ thành công và Số lệnh gọi công cụ tối đa
Ví dụ về nhiệm vụ cấp độ chuyên gia
Tỷ lệ thành công với các tác vụ cấp độ chuyên gia theo giá trị kinh tế ước tính
Tỷ lệ thành công với các tác vụ cấp độ chuyên gia theo số giờ ước tính
Nghiên cứu sâu sẽ mở ra nhiều năng lực mới đáng kể, nhưng hiện vẫn còn ở giai đoạn sơ khai và tồn tại nhiều hạn chế. Đôi khi tính năng này có thể "bịa đặt" thông tin trong các phản hồi hoặc đưa ra suy luận không chính xác, dù theo đánh giá nội bộ, tỷ lệ này thấp hơn đáng kể so với các mô hình ChatGPT hiện có. Tính năng này có thể gặp khó khăn trong việc phân biệt thông tin đáng tin cậy với tin đồn, và hiện đang thể hiện điểm yếu trong việc hiệu chuẩn độ tin cậy, thường không thể truyền tải sự không chắc chắn một cách chính xác. Vào thời điểm ra mắt, có thể xuất hiện một số lỗi định dạng nhỏ trong báo cáo và trích dẫn, đồng thời các tác vụ có thể cần nhiều thời gian hơn để khởi động. Chúng tôi kỳ vọng tất cả những vấn đề này sẽ nhanh chóng được cải thiện theo thời gian và khi tính năng được sử dụng nhiều hơn.
Tính năng nghiên cứu sâu trong ChatGPT đòi hỏi năng lực tính toán rất cao. Thời gian xử lý truy vấn nghiên cứu càng dài, càng cần nhiều tài nguyên tính toán. Hôm nay, chúng tôi sẽ bắt đầu với phiên bản được tối ưu hóa cho người dùng Pro, với giới hạn lên đến 100 truy vấn mỗi tháng. Tiếp theo, người dùng Plus và Team sẽ được quyền truy cập, sau đó là người dùng Enterprise. Chúng tôi vẫn đang nỗ lực để cung cấp quyền truy cập cho người dùng tại Vương quốc Anh, Thụy Sĩ và Khu vực Kinh tế Châu Âu (EEA).
Tất cả người dùng trả phí sẽ sớm nhận được hạn mức sử dụng cao hơn đáng kể khi chúng tôi ra mắt phiên bản nghiên cứu sâu nhanh hơn, hiệu quả hơn về chi phí, được vận hành bởi một mô hình nhỏ gọn hơn nhưng vẫn đảm bảo kết quả chất lượng cao.
Trong những tuần và tháng tới, chúng tôi sẽ tiếp tục hoàn thiện cơ sở hạ tầng kỹ thuật, theo dõi sát phiên bản hiện tại và tiến hành các thử nghiệm nghiêm ngặt hơn. Điều này phù hợp với nguyên tắc triển khai lặp của chúng tôi. Nếu mọi khâu kiểm tra an toàn tiếp tục đáp ứng tiêu chuẩn phát hành, chúng tôi dự kiến sẽ cung cấp tính năng nghiên cứu sâu cho người dùng Plus sau khoảng một tháng nữa.
Tính năng Nghiên cứu sâu hiện đã có mặt trên phiên bản web của ChatGPT và sẽ được triển khai cho các ứng dụng di động cũng như máy để bàn trong tháng này. Hiện tại, Nghiên cứu sâu có thể truy cập web mở và tệp bất kỳ do người dùng tải lên. Trong tương lai, bạn sẽ có thể kết nối với nhiều nguồn dữ liệu chuyên biệt hơn—mở rộng khả năng truy cập của tính năng này tới các tài nguyên yêu cầu gói đăng ký trả phí hoặc tài nguyên nội bộ—nhằm giúp kết quả đầu ra thậm chí còn mạnh mẽ và được cá nhân hóa hơn nữa.
Hướng đến tương lai xa hơn, chúng tôi hình dung những trải nghiệm của tác nhân kết hợp với nhau trong ChatGPT để nghiên cứu và thực thi không đồng bộ, trong đời thực. Sự kết hợp giữa Nghiên cứu sâu, với khả năng điều tra trực tuyến không đồng bộ, và Operator, có khả năng thực hiện hành động thực tế, sẽ cho phép ChatGPT đảm nhận các tác vụ ngày càng phức tạp hơn.
Phụ lục ngày 3 tháng 2 năm 2025: Chúng tôi đã tiến hành kiểm thử an toàn nghiêm ngặt, đánh giá mức độ sẵn sàng và xem xét về quản trị đối với phiên bản đầu của o3 (trang bị nghiên cứu sâu), và xác định mức độ rủi ro ở mức Trung bình(mở trong cửa sổ mới). Chúng tôi cũng đã thực hiện thêm các kiểm thử an toàn bổ sung để hiểu rõ hơn về những rủi ro gia tăng liên quan đến khả năng duyệt web của Nghiên cứu sâu, đồng thời đã bổ sung các biện pháp giảm thiểu mới. Chúng tôi sẽ tiếp tục kiểm thử kỹ lưỡng và giám sát chặt chẽ phiên bản phát hành giới hạn hiện tại. Chúng tôi sẽ chia sẻ những phân tích chuyên sâu về an toàn cũng như các biện pháp bảo vệ cho nghiên cứu sâu trong một thẻ thông tin hệ thống khi mở rộng quyền truy cập cho người dùng Plus.
Ghi chú cuối trang
- 1
Chúng tôi thấy rằng các câu trả lời dựa trên sự thật cho bộ dữ liệu này đã bị rò rỉ rộng rãi trên mạng và đã chặn một số trang web hoặc URL tương ứng để đảm bảo đánh giá công bằng của mô hình.
Tác giả
Trưởng nhóm nghiên cứu
Isa Fulford, Zhiqing Sun
Người đóng góp chủ chốt
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Người đóng góp chính
Nghiên cứu
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Triển khai
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Người đóng góp
Nghiên cứu
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ tất cả người đóng góp cho o3.
Hệ thống an toàn
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Triển khai
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Lãnh đạo
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba