Pagpapakilala ng malalimang pananaliksik
Agent na gumagamit ng pangangatwiran para ma-synthesize ang malaking bilang ng online na impormasyon at kumpletuhin ang mga multi-step na gawain sa pananaliksik para sa iyo. Available sa mga user ng Pro ngayon, susunod ang Plus at Team.
Update noong Pebrero 10, 2026: Maaari mo nang ikonekta ang malalimang pananaliksik sa anumang MCP o app at limitahan ang mga paghahanap sa web sa mga pinagkakatiwalaang site, upang makapagpokus ka sa mga sangguniang na-authenticate at pasok sa pamantayang pang-industriya. Maaari mo na ring subaybayan ang pag-usad sa real-time at huminto upang magpahusay pa gamit ang mga follow-up na prompt o mga bagong sanggunian. In-update namin ang biswal na karanasan upang mas madali nang simulan, subaybayan, at suriin ang iyong pananaliksik mula simula hanggang dulo.
Update noong Hulyo 17, 2025: Puwede na ngayong maging mas malalim at mas malawak ang malalimang pananaliksik sa pamamagitan ng pag-access sa visual browser bilang bahagi ng agent ng ChatGPT. Para ma-access ang mga na-update na kakayahan na ito, piliin lang ang "agent mode" mula sa dropdown sa composer at ilagay ang iyong query nang direkta. Ang orihinal na functionality ng malalimang pananaliksik ay nananatiling available sa pamamagitan ng opsyong "malalimang pananaliksik" sa menu ng mga tool.
Update noong Abril 24, 2025: Malaki ang pagtaas ng dalas ng paggamit natin ng malalimang pananaliksik—Makakakuha na ngayon ang mga user ng Plus, Team, Enterprise, at Edu ng 25 na query bawat buwan, makakakuha ang mga user ng Pro ng 250, at makakakuha ang mga user ng Free ng 5. Posible ito sa pamamagitan ng bagong magaan na bersyon ng malalimang pananaliksik na pinapagana ng bersyon ng o4-mini, na idinisenyo para maging mas matipid sa gastos habang pinapanatili ang mataas na kalidad. Kapag naabot mo na ang iyong limitasyon para sa buong bersyon, awtomatikong lilipat ang iyong mga query sa magaan na bersyon.
Update noong Pebrero 25, 2025: Lahat ng user ng Plus ay puwede nang gumamit ng malalimang pananaliksik.
Update ng Pebrero 5, 2025: Available na ngayon ang malalimang pananaliksik sa mga user ng Pro sa United Kingdom, Switzerland, at European Economic Area.
Ngayon, inilulunsad namin ang malalimang pananaliksik sa ChatGPT, isang bagong agentic na kakayahan na kayang magsagawa ng multi-step na pananaliksik sa internet para sa mga kumplikadong gawain. Nagagawa nito sa loob ng sampung minuto ang mga bagay na aabutin ng maraming oras ng isang tao.
Ang malalimang pananaliksik ang susunod na agent ng OpenAI na kayang gumawa ng trabaho para sa iyo nang independent—ibigay mo lang ang prompt, at hahanapin, susuriin, at pagsasama-samahin ng ChatGPT ang daan-daang online na sanggunian para makabuo ng komprehensibong report sa antas ng research analyst. Pinapagana ng bersyon ng paparating na modelo ng OpenAI o3 na na-optimize para sa pag-browse sa web at pagsusuri ng data, ginagamit nito ang pangangatwiran para maghanap, mag-interpret, at mag-analisa ng napakaraming text, mga larawan, at mga PDF sa internet, na inaangkop kung kinakailangan bilang tugon sa impormasyong nakakasalamuha nito.
Ang kakayahang magsagawa ng pagse-senthesize ng kaalaman ay kinakailangan para gumawa ng bagong kaalaman. Dahil sa dahilan na ito, ang malalimang pananaliksik ay nagmamarka ng makabuluhang hakbang patungo sa aming mas malawak na layunin ng pagbuo ng AGI, na matagal na naming inisip na may kakayahang gumawa ng bagong siyentipikong pananaliksik.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Sinasanay ang malalimang pananaliksik gamit ang end-to-end pagpapatibay ng pag-aaral sa mga mahihirap na gawain sa pag-browse at pangangatwiran sa iba't ibang domain. Sa pamamagitan ng pagsasanay na iyon, natutunan nitong planuhin at isagawa ang multi-step na landas para mahanap ang data na kailangan nito, nagba-backtrack at tumutugon sa real-time na impormasyon kung kinakailangan. Kaya rin ng modelo na mag-browse sa mga file na in-upload ng user, mag-plot at mag-iterate sa mga graph gamit ang tool na Python, i-embed ang parehong mga binuong graph at mga larawan mula sa mga website sa mga tugon nito, at banggitin ang mga partikular na pangungusap o talata mula sa mga pinagmulan nito. Dahil sa pagsasanay na ito, naabot nito ang mga bagong antas sa bilang ng pampublikong pagsusuri na nakatuon sa mga totoong problema sa mundo.
Sa Huling Pagsusulit sa Humanity(magbubukas sa bagong window), ang kamakailang inilabas na ebalwasyon na sumusubok sa AI sa malawak na hanay ng mga paksa sa mga tanong sa antas ng eksperto, ang modelong nagpapagana ng malalim na pananaliksik ay nakakuha ng bagong pinakamataas na marka sa 26.6% na katumpakan. Ang pagsusulit na ito ay binubuo ng mahigit 3,000 tanong na may maraming pagpipilian at maikling sagot sa mahigit 100 asignatura mula sa lingguwistika hanggang sa siyensiya na may mataas na antas, mga klasiko hanggang sa ekolohiya. Kung ikukumpara sa OpenAI o1, lumitaw ang pinakamalaking pagsulong sa chemistry, humanities at social science, at mathematics. Ang modelong nagpapagana sa malalimang pananaliksik ay nagpakita ng isang mala-tao na pamamaraan sa pamamagitan ng epektibong paghahanap ng espesyal na impormasyon kung kinakailangan.
| Modelo | Katumpakan (%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Claude 3.5 Sonnet | 4.3 |
| Gemini Thinking | 6.2 |
| OpenAI o1 | 9.1 |
| DeepSeek-R1* | 9.4 |
| OpenAI o3-mini (medium)* | 10.5 |
| OpenAI o3-mini (mataas)* | 13.0 |
| Malalimang pananaliksik sa OpenAI** | 26.6 |
Sa GAIA(magbubukas sa bagong window)1, ang pampublikong benchmark na sumusuri sa AI gamit ang mga katanungan sa totoong mundo, ang modelo na nagpapalakas sa malalimang pananaliksik ay umabot sa bagong antas ng kahusayan (SOTA), nangunguna sa panlabas na leaderboard(magbubukas sa bagong window). Dahil sumasaklaw ito sa tatlong antas ng kahirapan, ang matagumpay na pagkumpleto ng mga gawaing ito ay nangangailangan ng mga kakayahan kabilang ang pangangatwiran, kahusayan sa iba't ibang modal, pag-browse sa web, at kahusayan sa paggamit ng mga tool.
| GAIA | ||||
|---|---|---|---|---|
| Antas 1 | Antas 2 | Antas 3 | Avg. | |
| Nakaraang SOTA(magbubukas sa bagong window) | 67.92 | 67.44 | 42.31 | 63.64 |
| Malalimang Pananaliksik (pass@1) | 74.29 | 69.06 | 47.6 | 67.36 |
| Malalimang Pananaliksik (cons@64) | 78.66 | 73.21 | 58.03 | 72.57 |
Mga halimbawa ng mga gawain ng GAIA
Sa panloob na pagsusuri ng mga gawain sa antas ng eksperto sa iba't ibang larangan, ang malalimang pananaliksik ay na-rate ng mga eksperto sa domain na nag-automate ng maraming oras ng mahirap at manu-manong pagsisiyasat.
Antas ng Pagpasa Kumpara sa Pinakamataas na Tawag sa Tool
Mga halimbawa ng gawain sa antas ng eksperto
Antas ng Pagpasa sa mga Gawain sa Antas ng Eksperto Batay sa Tinatayang Halaga ng Ekonomiya
Antas ng pagpasa sa mga gawain sa antas ng eksperto batay sa tinatayang oras
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Available ngayon ang malalimang pananaliksik sa ChatGPT web, at ilalabas sa mga mobile at desktop app sa loob ng buwang ito. Sa kasalukuyan, puwedeng ma-access ng malalimang pananaliksik ang bukas na web at anumang i-upload na mga file. Sa hinaharap, magagawa mong kumonekta sa mas dalubhasang mga mapagkukunan ng data—palalawakin ang pag-access nito sa mga mapagkukunan na nakabatay sa subscription o panloob—para gawing mas matatag at naka-personalize ang output nito.
Sa hinaharap, nakikita namin na magsasama-sama ang mga agentic na karanasan sa ChatGPT para sa asynchronous na pananaliksik at aktwal na pagpapatupad sa totoong buhay. Ang kombinasyon ng malalimang pananaliksik, na kayang magsagawa ng asynchronous na online na pananaliksik, at ng Operator, na kayang gumawa ng aksyon sa totoong mundo, ay magbibigay-daan sa ChatGPT na isakatuparan ang mas sopistikadong mga gawain para sa iyo.
Pebrero 3, 2025 addendum: Nagsagawa kami ng mahigpit na pagsubok sa kaligtasan, mga pagsusuri sa kahandaan, at mga pagsusuri sa pamamahala sa naunang bersyon ng o3 na nagpapagana sa malalimang pananaliksik, na kinikilala ito bilang Katamtamang(magbubukas sa bagong window) panganib. Nagsagawa rin kami ng karagdagang pagsubok sa kaligtasan para mas maunawaan ang mga karagdagang panganib na nauugnay sa kakayahan ng malalimang pananaliksik na mag-browse sa web, at nagdagdag kami ng mga bagong pagpapagaan. Patuloy naming susubukin nang lubusan at susubaybayan nang mabuti ang kasalukuyang limitadong paglabas. Ibabahagi namin ang aming mga insight sa kaligtasan at mga pananggalang para sa malalimang pananaliksik sa system card kapag pinalawak namin ang access sa mga user ng Plus.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford, Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba