Představujeme hluboký výzkum
Agent, který využívá uvažování k syntéze velkého množství online informací a plnění vícestupňových výzkumných úkolů za tebe. Dnes k dispozici pro uživatele Pro, následovat budou uživatelé Plus a Team.
Aktualizace z 10. února 2026 : Nyní lze připojit hloubkový výzkum k libovolnému MCP nebo aplikaci a omezit vyhledávání na důvěryhodné weby s cílem zaměřit se na ověřené a standardní zdroje. Nyní lze také sledovat postup v reálném čase a přerušit práci za účelem zpřesnění pomocí navazujících promptů nebo nových zdrojů. Aktualizovali jsme vizuální prostředí, takže je snazší začít, sledovat a kontrolovat svůj výzkum od začátku až do konce.
17. července 2025, aktualizace: Hluboký výzkum dokáže nyní jít ještě do větší hloubky a šířky díky přístupu k vizuálnímu prohlížeči jako součásti agenta ChatGPT. Pro přístup k těmto aktualizovaným funkcím jednoduše vyberte „režim agenta“ z rozbalovací nabídky v editoru a zadejte svůj dotaz přímo. Původní funkce hlubokého výzkumu zůstává dostupná prostřednictvím možnosti „hluboký výzkum“ v nabídce nástrojů.
24. dubna 2025, aktualizace: Výrazně rozšiřujeme, jak často můžete používat hloubkový výzkum – uživatelé Plus, Team, Enterprise a Edu nyní mají k dispozici 25 dotazů měsíčně, uživatelé Pro 250 a uživatelé Free 5. To nám umožňuje nová odlehčená verze hlubokého výzkumu využívající verzi o4-mini, která je navržena tak, aby byla levnější při zachování vysoké kvality. Jakmile dosáhnete limitu pro plnou verzi, vaše dotazy se automaticky přepnou na odlehčenou verzi.
25. února 2025, aktualizace: Všichni uživatelé Plus teď mohou používat hluboký výzkum.
5. února 2025, aktualizace: Hluboký výzkum je nyní k dispozici uživatelům Pro ve Spojeném království, Švýcarsku a Evropském hospodářském prostoru.
Dnes v ChatGPT spouštíme hluboký výzkum, což je nová agentská funkce, která u složitých úkolů provádí vícestupňový výzkum na internetu. To, co by člověku trvalo mnoho hodin, zvládne za desítky minut.
Hluboký výzkum je dalším agentem OpenAI, který dokáže pracovat samostatně za tebe – zadáš mu prompt a ChatGPT najde, analyzuje a syntetizuje stovky online zdrojů, aby vytvořil komplexní zprávu na úrovni výzkumného analytika. Využívá verzi připravovaného modelu OpenAI o3, který je optimalizován pro prohlížení webu a analýzu dat, využívá uvažování k vyhledávání, interpretaci a analýze obrovského množství textu, obrázků a PDF souborů na internetu a podle potřeby se přizpůsobuje informacím, se kterými se setká.
Schopnost syntetizovat znalosti je nezbytná k vytvoření nových znalostí. Z tohoto důvodu představuje hluboký výzkum významný krok směrem k našemu širšímu cíli rozvoje AGI, u kterého si dlouhodobě představujeme, že bude schopen produkovat originální vědecký výzkum.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Hluboký výzkum byl trénován pomocí kompletního posilovacího trénování na náročných úkolech prohlížení a uvažování v různých doménách. Prostřednictvím tohoto trénování se naučil plánovat a provádět vícestupňovou trajektorii k nalezení potřebných dat, zpětně sledovat a reagovat na informace v reálném čase, kde je to nutné. Model je také schopen procházet soubory nahrané uživateli, vykreslovat a iterovat grafy pomocí nástroje Python, vkládat jak vytvořené grafy, tak obrázky z webů do svých odpovědí a citovat konkrétní věty nebo pasáže ze svých zdrojů. V důsledku tohoto natrénování dosahuje lepších hodnot v několika veřejných hodnoceních zaměřených na problémy reálného světa.
V nedávno zveřejněném hodnocení Humanity’s Last Exam(otevře se v novém okně), které testuje umělou inteligenci v široké škále témat na expertní úrovni, model, na kterém stojí hluboký výzkum, dosahuje nového maxima s přesností 26,6 %. Tento test obsahuje více než 3000 otázek s výběrem odpovědí a krátkých odpovědí z více než 100 předmětů, od lingvistiky po raketovou vědu, od klasiky po ekologii. Ve srovnání s OpenAI o1 se největší pokroky objevily v chemii, humanitních a společenských vědách a matematice. Model, na kterém stojí hluboký výzkum, ukázal lidský přístup tím, že účinně vyhledával specializované informace, když to bylo nutné.
| Model | Přesnost (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| Hloubkový výzkum OpenAI** | 26,6 |
Na veřejném benchmarku GAIA(otevře se v novém okně)1, který hodnotí umělou inteligenci na reálných otázkách, model, na kterém stojí hluboký výzkum, dosahuje nového vrcholu (SOTA) a vede externí žebříček(otevře se v novém okně). Úspěšné splnění těchto úkolů, které zahrnují otázky tří úrovní obtížnosti, vyžaduje schopnosti jako uvažování, multimodální přechody, prohlížení webu a zručnost v používání nástrojů.
| GAIA | ||||
|---|---|---|---|---|
| Úroveň 1 | Úroveň 2 | Úroveň 3 | Prům. | |
| Předchozí SOTA(otevře se v novém okně) | 67,92 | 67,44 | 42,31 | 63,64 |
| Hluboký výzkum (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Hluboký výzkum (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Příklady úkolů GAIA
Při interním hodnocení úkolů na úrovni odborníka v různých doménách odborníci na danou doménu hluboký výzkum hodnotili tak, že automatizoval několik hodin obtížného manuálního zkoumání.
Míra úspěšnosti vs maximální počet volání nástrojů
Příklady úkolů na úrovni odborníka
Úspěšnost u úkolů na úrovni odborníka podle odhadované ekonomické hodnoty
Míra úspěšnosti u úkolů na úrovni odborníka podle odhadovaného počtu hodin
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Hluboký výzkum je dnes k dispozici na webu ChatGPT a během měsíce bude zaveden do mobilních a desktopových aplikací. V současné době může hluboký výzkum přistupovat k otevřenému webu a jakýmkoli nahraným souborům. V budoucnu se budeš moci připojit ke specializovanějším zdrojům dat – rozšiřovat přístup k předplaceným nebo interním zdrojům – aby byl jejich výstup ještě robustnější a personalizovanější.
Do budoucna si představujeme, že se prostředí agenta v ChatGPT spojí pro asynchronní výzkum a vykonávání v reálném světě. Kombinace hlubokého výzkumu, který může provádět asynchronní online šetření, a Operatora, který může provádět reálné akce, umožní ChatGPT provádět stále sofistikovanější úkoly za tebe.
3. února 2025, dodatek: Provedli jsme přísné testování bezpečnosti, hodnocení připravenosti a kontroly správy na rané verzi modelu o3, na kterém stojí hluboký výzkum, a určili jsme střední riziko(otevře se v novém okně). Provedli jsme také další bezpečnostní testy, abychom lépe porozuměli zvyšujícím se rizikům spojeným se schopností hluboký výzkumu procházet web, a přidali jsme nová opatření ke zmírnění rizik. Budeme i nadále důkladně testovat a pečlivě sledovat aktuální omezené vydání. Když rozšíříme přístup k uživatelům Plus, budeme bezpečnostní poznatky a záruky pro hluboký výzkum sdílet na systémové kartě.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford, Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba