Predstavljamo dubinsko istraživanje
Agent koji upotrebom zaključivanja sažima velike količine mrežnih informacija i za vas obavlja istraživačke zadatke u više koraka. Dostupno korisnicima plana Pro već danas, a naknadno i korisnicima planova Plus i Team.
Ažuriranje od 10. veljače 2026.: Sada možete povezati dubinsko istraživanje s bilo kojim MCP-om ili aplikacijom i ograničiti internetska pretraživanja na pouzdane mrežne lokacije, kako biste se mogli usredotočiti na provjerene, industrijski standardne izvore. Također možete pratiti napredak u stvarnom vremenu i prekinuti kako biste istraživanje doradili uz naknadne upite ili nove izvore. Ažurirali smo vizualno iskustvo kako bi vam bilo lakše započeti, pratiti i pregledati vaše istraživanje od početka do kraja.
Dodatak od 17. srpnja 2025.: Dubinsko istraživanje sad može ići još dublje i šire zahvaljujući vizualnom pregledniku kao dijelu funkcije agenta ChatGPT. Da biste pristupili tim proširenim mogućnostima, jednostavno u padajućem izborniku u sastavljaču poruke odaberite „način rada agenta” i izravno unesite svoj upit. Izvorna funkcionalnost dubinskog istraživanja i dalje je dostupna putem opcije „dubinsko istraživanje” u izborniku alata.
Ažuriranje 24. travnja 2025.: značajno povećavamo učestalost korištenja dubinskog istraživanja — Team, Enterprise, Edu i Plus korisnici sada dobivaju 25 upita mjesečno, Pro korisnici 250, a Free korisnici 5. Ovo je omogućeno novom 'laganom' verzijom dubinskog istraživanja pokretanom verzijom o4-mini, dizajniranom da bude isplativija, ali uz očuvanje visoke kvalitete. Kada dosegnete svoje ograničenje za punu verziju, vaši će se upiti automatski prebaciti na laganu verziju.
Dodatak od 25. veljače 2025.: Svi korisnici plana Plus sad mogu koristiti dubinsko istraživanje.
Dodatak od 5. veljače 2025.: Dubinsko istraživanje sad je dostupno korisnicima plana Pro u Ujedinjenom Kraljevstvu, Švicarskoj i Europskom gospodarskom prostoru.
Danas pokrećemo dubinsko istraživanje u ChatGPT‑u, novu mogućnost agenta koja provodi istraživanje na internetu u više faza kako bi obavila složenije zadatke. Ono postiže u nekoliko desetaka minuta ono što bi čovjeku oduzelo mnogo sati. U nekoliko desetaka minuta postiže ono što bi čovjeku oduzelo mnogo sati.
Dubinsko istraživanje novi je agent OpenAI-ja koji može samostalno odraditi posao umjesto vas – zadate mu upit, a ChatGPT će pronaći, analizirati i objediniti stotine mrežnih izvora kako bi izradio sveobuhvatno izvješće na razini istraživačkog analitičara. Pokreće ga inačica nadolazećeg modela OpenAI o3, optimizirana za pregledavanje weba i analizu podataka, koja koristi rezoniranje kako bi pretraživala, tumačila i analizirala goleme količine teksta, slika i PDF-ova na internetu te se pritom po potrebi prilagođavala informacijama na koje nailazi.
Sposobnost sinteze znanja preduvjet je za stvaranje novog znanja. Iz tog razloga, dubinsko istraživanje predstavlja značajan korak prema našem širem cilju razvoja AGI, koju smo dugo zamišljali kao sposobnu za stvaranje novih znanstvenih istraživanja.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Dubinsko istraživanje trenirano je korištenjem end-to-end učenja putem povratnih informacija na zahtjevnim zadacima pretraživanja i rezoniranja u različitim domenama. Kroz tu obuku naučilo je izraditi i izvršiti plan u više koraka kako bi pronašlo potrebne podatke, vraćajući se i reagirajući na informacije u stvarnom vremenu gdje je to potrebno. Model također može pregledavati datoteke koje prenesete, izraditi i uređivati grafove pomoću alata python, ugraditi izrađene grafove i slike s web-stranica u svoje odgovore te navoditi konkretne rečenice ili odlomke iz svojih izvora. Kao rezultat ove obuke, doseže nove vrhunce u brojnim javnim evaluacijama usmjerenim na probleme iz stvarnog svijeta.
Na Humanity’s Last Exam(otvara se u novom prozoru), nedavno objavljenoj evaluaciji koja testira umjetnu inteligenciju u širokom rasponu tema na stručnim pitanjima, model koji pokreće dubinska istraživanja postiže novi rekord s točnošću od 26,6 %. Taj se test sastoji od preko 3000 pitanja s višestrukim izborom i kratkim odgovorima iz više od 100 tema, od lingvistike do raketne znanosti, od klasika do ekologije. U usporedbi s modelom OpenAI o1, najveći napredak zabilježen je u kemiji, humanističkim i društvenim znanostima te matematici. Model koji pokreće dubinska istraživanja pokazao je pristup sličan ljudskom, učinkovito tražeći specijalizirane informacije kad je to potrebno.
| Model | Točnost (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (visoko)* | 13,0 |
| OpenAI dubinsko istraživanje** | 26,6 |
Na GAIA(otvara se u novom prozoru)1, javnom referentnom testu koji procjenjuje umjetnu inteligenciju na stvarnim pitanjima, model koji pokreće dubinska istraživanja doseže novi vrhunac (SOTA), zauzimajući prvo mjesto na vanjskoj ljestvici(otvara se u novom prozoru). Obuhvaćajući pitanja na tri razine težine, uspješno izvršavanje ovih zadataka zahtijeva sposobnosti poput rezoniranja, multimodalne fluentnosti, pretraživanja interneta i vještine korištenja alata.
| GAIA | ||||
|---|---|---|---|---|
| Razina 1 | Razina 2 | Razina 3 | Prosj. | |
| Prethodna SOTA(otvara se u novom prozoru) | 67,92 | 67,44 | 42,31 | 63,64 |
| Duboko istraživanje (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Dubinsko istraživanje (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Primjeri zadataka GAIA
U internom vrednovanju zadataka na stručnoj razini iz različitih područja, stručnjaci su procijenili dubinsko istraživanje kao rješenje koje automatizira višesatno, zahtjevno ručno istraživanje.
Stopa prolaza u odnosu na maksimalni broj poziva alata
Primjeri zadataka na razini stručnjaka
Stopa prolaznosti na zadacima na ekspertnoj razini prema procijenjenoj ekonomskoj vrijednosti
Stopa prolaza na zadacima stručne razine prema procijenjenim satima
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Dubinsko istraživanje dostupno je već danas na web-stranici ChatGPT‑a, a bit će uvedeno u mobilne i desktop aplikacije unutar mjesec dana. Trenutačno, dubinsko istraživanje može pristupiti otvorenom webu i bilo kojim prenesenim datotekama. U budućnosti ćete se moći povezati s više specijaliziranim izvorima podataka – proširujući pristup resursima temeljenim na pretplati ili internim resursima – kako biste njegov izlaz učinili još robusnijim i personaliziranijim.
Gledajući dalje u budućnost, predviđamo da će se iskustva izvršitelja spojiti u ChatGPT‑u za asinkrono istraživanje i izvršavanje u stvarnom svijetu. Kombinacija dubinskog istraživanja, koje može provoditi asinkrono internetsko istraživanje, i Operatora, koji može poduzimati stvarne radnje, omogućit će ChatGPT‑u da za vas obavlja sve složenije zadatke.
Dodatak od 3. veljače 2025.: Proveli smo rigorozna sigurnosna testiranja, procjene spremnosti i preglede upravljanja za ranu verziju modela o3 koja omogućuje dubinsko istraživanje, pri čemu je ta verzija ocijenjena kao srednji(otvara se u novom prozoru) rizik. Također smo proveli dodatna sigurnosna testiranja kako bismo bolje razumjeli dodatne rizike povezane s mogućnošću dubinskog istraživanja da pregledava web, i uveli smo nove zaštitne mjere. Nastavit ćemo temeljito testirati i pomno nadzirati trenutačno ograničeno izdanje. Svoja sigurnosna saznanja i zaštitne mjere za dubinsko istraživanje podijelit ćemo u dokumentu o sustavu kad proširimo pristup korisnicima paketa Plus.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford i Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney i Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman i Wojciech Zaremba