Predstavljamo podrobno raziskovanje
Agent, ki uporablja sklepanje za sintezo velikih količin spletnih informacij in za izvajanje večkoračnih raziskovalnih nalog namesto vas. Danes na voljo uporabnikom Pro, kmalu zatem še uporabnikom Plus in Team.
Posodobitev 10. februarja 2026: Zdaj lahko poglobljeno raziskovanje povežete s katerim koli protokolom za modelni kontekst (MCP) ali aplikacijo in omejite spletna iskanja na zaupanja vredna spletna mesta, da se lahko osredotočite na preverjene vire, skladne z industrijskimi standardi. Prav tako lahko zdaj v realnem času spremljate napredek in kadar koli prekinete postopek, da ga z nadaljnjimi pozivi ali novimi viri natančneje prilagodite. Posodobili smo vizualno izkušnjo, da je lažje začeti, spremljati in pregledati raziskovanje od začetka do konca.
Posodobitev z dne 17. julija 2025: Poglobljeno raziskovanje je zdaj mogoče še bolj poglobiti in razširiti z dostopom do vizualnega brskalnika kot dela agenta ChatGPT. Za dostop do teh posodobljenih zmogljivosti preprosto izberite »način agenta« v spustnem meniju v sestavljalcu in neposredno vnesite poizvedbo. Prvotna funkcionalnost poglobljenega raziskovanja ostaja na voljo prek možnosti »poglobljeno raziskovanje« v meniju orodij.
Posodobitev 24. aprila 2025: povečujemo pogostost uporabe poglobljenega raziskovanja. Uporabniki Plus, Team, Enterprise in Edu imajo zdaj na voljo 25 poizvedb na mesec, uporabniki Pro 250, uporabniki Free pa 5. To bo možno zaradi nove, lažje različice Deep Research, ki ga poganja različica o4-mini, ki je stroškovno učinkovitejša in visoke kakovosti. Ko dosežete omejitev na polni različici, se vaše poizvedbe samodejno preklopijo na lažjo različico.
Posodobitev 25. februarja 2025: vsi uporabniki Plus lahko zdaj uporabljajo poglobljeno raziskovanje.
Posodobitev 5. februarja 2025: Poglobljeno raziskovanje je zdaj na voljo uporabnikom Pro v Združenem kraljestvu, Švici in Evropskem gospodarskem prostoru.
Danes v ChatGPT‑ju lansiramo poglobljeno raziskovanje, novo agentno zmožnost, ki za zahtevne naloge na internetu izvaja večkoračne raziskave. V nekaj deset minutah opravi tisto, za kar bi človek potreboval več ur.
Deep Research je naslednji agent OpenAI, ki lahko samostojno opravlja delo namesto vas. Podate mu poziv, ChatGPT pa poišče, analizira in sintetizira stotine spletnih virov ter pripravi obsežno poročilo na ravni raziskovalnega analitika. Poganja ga različica prihajajočega modela OpenAI o3, optimizirana za brskanje po spletu in analizo podatkov. Uporablja sklepanje, da na internetu išče, interpretira in analizira ogromne količine besedil, slik in datotek PDF ter se po potrebi prilagaja glede na informacije, na katere naleti.
Sposobnost sinteze znanja je predpogoj za ustvarjanje novega znanja. Zato poglobljeno raziskovanje predstavlja pomemben korak k našemu širšemu cilju razviti AGI, ki si ga že dolgo predstavljamo kot sistem, zmožen ustvarjati izvirne znanstvene raziskave.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Poglobljeno raziskovanje je bilo trenirano z metodo učenja s procesom prilagajanja od začetka do konca na zahtevnih nalogah brskanja in sklepanje v različnih domenah. S tem treningom se je naučilo načrtovati in izvajati večkoračno pot iskanja podatkov, ki jih potrebuje, po potrebi pa se vračati nazaj in se sproti odzivati na nove informacije. Model lahko brska tudi po uporabnikovo naloženih datotekah, riše in iterira grafe z uporabo orodja python, v svoje odzive vdeluje tako ustvarjene grafe kot slike s spletnih mest ter navaja točno določene stavke ali odlomke iz svojih virov. Zaradi tega treninga dosega nove najvišje rezultate na številnih javnih evalvacijah, osredotočenih na resnične probleme.
Na testu »Humanity’s Last Exam«(odpre se v novem oknu), nedavno objavljeni evalvaciji, ki UI testira na strokovni ravni vprašanj iz širokega obsega področij, je model, ki poganja poglobljeno raziskovanje, dosegel nov rekord s 26,6 % natančnostjo. Ta test vsebuje več kot 3.000 vprašanj izbirnega tipa in s kratkimi odgovori z več kot 100 področij od jezikoslovja do raketne znanosti in antičnih študij do ekologije. V primerjavi z OpenAI o1 so se največji napredki pokazali v kemiji, humanistiki in družboslovju ter matematiki. Model, ki poganja poglobljeno raziskovanje, je pokazal človeški pristop s tem, da je po potrebi uspešno našel specializirane informacije.
| Model | Natančnost (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| OpenAI poglobljeno raziskovanje** | 26,6 |
Na GAIA(odpre se v novem oknu)1, javnem merilu učinkovitosti, ki ocenjuje UI na vprašanjih iz resničnega sveta, model, ki poganja poglobljeno raziskovanje, dosega novo stanje najvišje zmogljivosti (SOTA) in se uvršča na vrh zunanje lestvice(odpre se v novem oknu). Ker zajema vprašanja treh ravni zahtevnosti, uspešno reševanje teh nalog zahteva zmožnosti, kot so sklepanje, multimodalno razumevanje, brskanje po spletu in veščine uporabe orodij.
| GAIA | ||||
|---|---|---|---|---|
| Raven 1 | 2. stopnja | Raven 3 | Povp. | |
| Predhodna vrhunska tehnologija(odpre se v novem oknu) | 67,92 | 67,44 | 42,31 | 63,64 |
| Poglobljeno raziskovanje (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Poglobljeno raziskovanje (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Primeri nalog GAIA
Pri interni evalvaciji strokovnih nalog na več področjih so strokovnjaki ocenili, da je poglobljeno raziskovanje avtomatiziralo več ur zahtevnega ročnega raziskovanja.
Stopnja uspešnosti v primerjavi z največjim številom priklicev orodja
Primeri nalog na strokovni ravni
Stopnja uspešnosti pri nalogah na strokovni ravni glede na ocenjeno ekonomsko vrednost
Stopnja uspešnosti pri nalogah na strokovni ravni glede na predviden čas
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Poglobljeno raziskovanje je danes na voljo v spletnem ChatGPT‑ju, v roku meseca pa bo uvedeno tudi v mobilnih in namiznih aplikacijah. Trenutno ima poglobljeno raziskovanje dostop do odprtega spleta in vseh naloženih datotek. V prihodnje ga boste lahko povezali z bolj specializiranimi viri podatkov, kar bo razširilo njegov dostop do naročniških ali internih virov in s tem naredilo njegov izhod še bolj robusten in prilagojen.
Naša vizija prihodnosti je, da bodo agentni sistemi v ChatGPT‑ju poenoteno omogočali asinhrono raziskovanje resničnega sveta. Kombinacija poglobljenega raziskovanja, ki izvaja asinhrono spletno preiskovanje, in Operatorja, ki deluje v resničnem svetu, bo ChatGPT omogočila, da bo namesto vas opravljal vse bolj zapletene naloge.
Dodatek z dne 3. februarja 2025: Izvedli smo stroge varnostne preizkuse, ocene pripravljenosti in preglede upravljanja zgodnje različice o3, ki omogoča poglobljeno raziskovanje, in jo opredelili kot srednje(odpre se v novem oknu) tveganje. Izvedli smo tudi dodatne varnostne preizkuse, da bi bolje razumeli dodatna tveganja, povezana z zmožnostjo poglobljenega raziskovanja brskanja po spletu, in dodali smo nove blažilne ukrepe. Še naprej bomo temeljito testirali in pozorno spremljali trenutno omejeno izdajo. Naše varnostne vpoglede in zaščitne ukrepe za poglobljeno raziskovanje bomo delili v sistemski kartici, ko bomo razširili dostop na uporabnike Plus.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford in Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney in Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman in Wojciech Zaremba