Bemutatkozik a mély kutatás
Egy olyan ügynök, amely indoklással szintetizál nagy mennyiségű online információt, és többlépéses kutatási feladatokat végez el számodra. Mától elérhető a Pro felhasználók számára, később pedig a Plus és a Team felhasználóknak is.
2026. február 10-i frissítés : Most már csatlakoztathatod a mély kutatás funkciót bármely MCP-hez vagy alkalmazáshoz, és a webes kereséseket megbízható webhelyekre korlátozhatod, így a hitelesített, iparági szabványoknak megfelelő forrásokra összpontosíthatsz. Emellett valós időben követheted a folyamat előrehaladását, amelyet bármikor megszakíthatsz, hogy kiegészítő utasításokkal vagy új forrásokkal finomítsd a kutatást. Frissítettük a vizuális felhasználói élményt is, így egyszerűbbé vált a kutatás elindítása, nyomon követése és teljes körű áttekintése.
2025. július 17-i frissítés: A mély kutatás mostantól még mélyebbre és szélesebb körbe juthat el a ChatGPT ügynök részeként elérhető vizuális böngészővel. A frissített képességek eléréséhez egyszerűen válaszd ki az „ügynök mód” lehetőséget a szerkesztő legördülő menüjéből, és írd be közvetlenül a lekérdezést. Az eredeti mély kutatási funkció továbbra is elérhető az eszközök menü „mély kutatás” opcióján keresztül.
2025. április 24-i frissítés: Jelentősen megnöveljük a mély kutatás használatának gyakoriságát—a Plus, Team, Enterprise és Edu felhasználók mostantól havi 25 lekérdezést kapnak, a Pro csomagot használók 250-et, az ingyenes felhasználók pedig 5-öt. Ezt egy új, könnyített mély kutatás verzió teszi lehetővé, amely egy o4-mini verzióra épül, és amit költséghatékonyabbra terveztünk, miközben megőrzi a magas minőséget. Amint eléred a teljes funkcionalitású verzió limitjét, a lekérdezéseid automatikusan a könnyített verzióra váltanak.
2025. február 25-i frissítés: Mostantól minden Plus felhasználó használhatja a mély kutatást.
2025. február 5-i frissítés: A mély kutatás mostantól elérhető a Pro felhasználók számára az Egyesült Királyságban, Svájcban és az Európai Gazdasági Térségben.
Ma elindítjuk a mély kutatás funkciót a ChatGPT‑ben, ezt az új ügynöki képességet, amely többlépéses kutatást végez az interneten összetett feladatok megoldásához. Percek alatt elvégzi azt, ami egy embernek órákig tartana.
A mély kutatás az OpenAI következő ügynöke, amely önállóan képes dolgozni helyetted—ha adsz neki egy utasítást, a ChatGPT több száz online forrást talál, elemez és szintetizál, hogy átfogó jelentést készítsen kutatóelemzői szinten. A hamarosan megjelenő OpenAI o3 modell egy, webböngészésre és adatelemzésre optimalizált verziójára épül, amely az érvelést kihasználva képes az interneten található hatalmas mennyiségű szöveg, kép és PDF keresésére, értelmezésére és elemzésére, és szükség szerint alkalmazkodik a talált információkhoz.
Az új ismeretek létrehozásának előfeltétele a tudás szintetizálásának képessége. Emiatt a mély kutatás jelentős lépést jelent azon szélesebb körű célunk felé, hogy kifejlesszük az AGI-t, amelyről régóta úgy gondoljuk, hogy képes lesz új, eredeti tudományos kutatások létrehozására.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
A mély kutatást végponttól végpontig megerősítéses tanulással képezték nehéz böngészési és érvelési feladatok során, különböző domainokon. A betanítás során megtanulta megtervezni és végrehajtani egy többlépcsős pályát, hogy megtalálja a szükséges adatokat, szükség esetén visszalépve és reagálva a valós idejű információkra. A modell képes böngészni a felhasználók által feltöltött fájlok között, grafikonokat generálni és iterálni a Python eszközzel, beágyazni a válaszaiba a weboldalakról származó generált grafikonokat és képeket, valamint konkrét mondatokat vagy részleteket idézni a forrásokból. Ennek a betanításnak az eredményeként számos, valós problémákra fókuszáló nyilvános értékelésen minden korábbinál jobb eredményt ér el.
A Humanity’s Last Exam(új ablakban nyílik meg), a a mesterséges intelligenciát széles témakörökben, szakértői szintű kérdésekkel tesztelő új értékelésen, a mély kutatást támogató modell új rekordot ért el 26,6%-os pontossággal. Ez a teszt több mint 3000 feleletválasztós és rövid választ igénylő kérdésből áll, több mint 100 témát ölel fel, a nyelvészettől a rakétatudományig, a klasszikusoktól az ökológiáig. Az OpenAI o1‑hez képest a legnagyobb pozitív hatások a kémia, a humán- és társadalomtudományok, valamint a matematika területén jelentkeztek. A mély kutatást támogató modell emberszerű megközelítést mutatott be azáltal, hogy szükség esetén hatékonyan keresett speciális információkat.
| Modell | Pontosság (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| OpenAI mély kutatás** | 26,6 |
GAIA(új ablakban nyílik meg)1 platformon, amely egy nyilvános tesztelés, és valós kérdésekben értékeli a mesterséges intelligenciát, a mély kutatást támogató modell új csúcsot (SOTA) ért el, és a külső ranglista(új ablakban nyílik meg) élére került. A feladatok három nehézségi szintet ölelnek fel, és ezek sikeres teljesítése olyan képességeket igényel, mint a logikus gondolkodás, a multimodális folyékonyság, a webes böngészés és az eszközhasználati jártasság.
| GAIA | ||||
|---|---|---|---|---|
| 1. szint | 2. szint | 3. szint | Átl. | |
| Előző SOTA(új ablakban nyílik meg) | 67,92 | 67,44 | 42,31 | 63,64 |
| Mély kutatás (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Mély kutatás (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
GAIA feladatpéldák
Egy belső értékelés során, amely szakértői szintű feladatokat vizsgált különböző domain területeken, a mély kutatást a domain szakértők úgy ítélték meg, hogy több órányi nehéz, manuális utánajárást automatizált.
Sikerességi arány a maximális eszközhívásokkal szemben
Példák szakértői szintű feladatokra
Szakértői szintű feladatok sikerességi aránya a becsült gazdasági érték alapján
Szakértői szintű feladatok teljesítési aránya becsült órák alapján
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
A mély kutatás mától elérhető a ChatGPT weben, és a hónap folyamán bevezetésre kerül a mobil- és asztali appokba. Jelenleg a mély kutatás a nyílt webhez és bármely feltöltött fájlhoz hozzáférhet. A jövőben képes leszel csatlakozni speciálisabb adatforrásokhoz—bővítve ezzel a hozzáférést előfizetéses vagy belső erőforrásokhoz—, hogy a kimenet még robusztusabb és személyre szabottabb legyen.
A távolabbi jövőbe tekintve azt tervezzük, hogy az ügynöki élmények a ChatGPT‑ben egyesülnek az aszinkron, valós kutatás és végrehajtás céljából. Az aszinkron online keresést végző mély kutatás és a valós világban műveletet végző Operator kombinációja lehetővé teszi, hogy a ChatGPT egyre kifinomultabb feladatokat hajtson végre számodra.
2025. február 3-i kiegészítés: Szigorú biztonsági teszteket, felkészültségi értékeléseket és irányítási felülvizsgálatokat végeztünk az o3 korai verzióján, amely a mély kutatást végzi, és Medium(új ablakban nyílik meg) kockázatként azonosítottuk. Emellett további biztonsági teszteket is futtattunk, hogy jobban megértsük a mély kutatás webes böngészési képességéhez kapcsolódó többletkockázatokat, és új védelmi mechanizmusokat vezettünk be. A jelenlegi, korlátozott bevezetést továbbra is alaposan tesztelni és szorosan monitorozni fogjuk. A mély kutatással kapcsolatos biztonsági tapasztalatainkat és védelmi intézkedéseinket akkor osztjuk meg rendszerkártyában, amikor szélesebb körben elérhetővé tesszük a Plus felhasználók számára.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford és Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney és Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman és Wojciech Zaremba