Prezantimi i kërkimit të thellë
Një agjent që përdor arsyetimin për të sintetizuar sasi të mëdha informacioni në internet dhe për të përfunduar detyra kërkimore me shumë hapa për ty. Në dispozicion për përdoruesit Pro sot, si dhe më pas për ata të Plus dhe Team.
Përditësimi i 10 shkurtit 2026: Tani mund të lidhësh kërkimin e thelluar me çdo MCP ose aplikacion dhe të kufizosh kërkimet në ueb te faqet e besuara, që të mund të përqendrohesh te burime të autentikuara, standarde të sektorit. Tani mund të ndjekësh gjithashtu ecurinë në kohë reale dhe të ndërpresësh për ta përmirësuar me kërkesa pasuese ose burime të reja. Kemi përditësuar përvojën vizuale që të jetë më e lehtë të nisësh, të ndjekësh dhe të rishikosh kërkimin tënd nga fillimi në fund.
Përditësimi i 17 korrikut 2025: Kërkimi i thellë tani mund të shkojë edhe më thellë dhe më gjerë me qasje në një shfletues vizual si pjesë e agjentit të ChatGPT. Për të hyrë në këto aftësi të përditësuara, thjesht zgjidh “modalitetin e agjentit” nga lista zbritëse në kompozitor dhe fut pyetjen tënde direkt. Funksionaliteti origjinal i kërkimit të thellë mbetet i disponueshëm përmes opsionit “kërkim i thellë” në meny.
Përditësimi i 24 prillit 2025: Po e rrisim ndjeshëm shpeshtësinë e përdorimit të kërkimit të thellë — Përdoruesit e planeve Plus, Team, Enterprise dhe Edu tani marrin 25 kërkesa në muaj, përdoruesit e planit Pro marrin 250 dhe përdoruesit e planit Free marrin 5. Kjo është bërë e mundur përmes një versioni të ri të thjeshtuar të kërkimit të thellë të mundësuar nga një version i o4-mini, i projektuar për të qenë më ekonomik duke ruajtur cilësinë e lartë. Pasi të arrini limitin tuaj për versionin e plotë, kërkesat tuaja do të kalojnë automatikisht në versionin e thjeshtuar.
Përditësimi i 25 shkurtit 2025: Të gjithë përdoruesit e plannit Plus tani mund të përdorin kërkim të thellë.
Përditësimi i 5 shkurtit 2025: Kërkimi i thellë tani është në dispozicion për përdoruesit e planit Pro në Mbretërinë e Bashkuar, Zvicër dhe Zonën Ekonomike Evropiane.
Sot po lançojmë kërkimin e thellë në ChatGPT, një aftësi e re agjentike që kryen kërkime me shumë hapa në internet për detyra komplekse. Ai e përfundon për dhjetëra minuta atë që do t'i merrte një njeriu shumë orë.
Kërkimi i thellë është agjenti i ardhshëm i OpenAI që mund të bëjë punë për ty në mënyrë të pavarur - i jep një kërkesë dhe ChatGPT do të gjejë, analizojë dhe sintetizojë qindra burime online për të krijuar një raport gjithëpërfshirës në nivelin e një analisti kërkimor. I mundësuar nga një version i modelit të ardhshëm OpenAI o3 që është optimizuar për shfletimin e uebit dhe analizën e të dhënave, ai përdor arsyetimin për të kërkuar, interpretuar dhe analizuar sasi të mëdha tekstesh, imazhesh dhe PDF në internet, duke ndryshuar sipas nevojës në reagimin ndaj informacionit që has.
Aftësia për të sintetizuar njohuritë është një parakusht për krijimin e njohurive të reja. Për këtë arsye, kërkimi i thellë shënon një hap të rëndësishëm drejt qëllimit tonë më të gjerë për zhvillimin e AGI, të cilin e kemi parashikuar prej kohësh si të aftë për të prodhuar kërkime të reja shkencore.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Kërkimi i thellë është trajnuar duke përdorur të mësuarit përforcues nga fillimi në fund në detyra të vështira të shfletimit dhe arsyetimit në një gamë të gjerë fushash. Përmes atij trajnimi, ai ka mësuar të planifikojë dhe të ekzekutojë një trajektore me shumë hapa për të gjetur të dhënat që i duhen, duke u tërhequr dhe duke reaguar ndaj informacionit në kohë reale kur është e nevojshme. Modeli është gjithashtu në gjendje të shfletojë skedarët e ngarkuar nga përdoruesit, të vizatojë dhe të përsërisë në grafikë duke përdorur mjetin Python, të fusë si grafikët e gjeneruar ashtu edhe imazhet nga faqet e internetit në përgjigjet e tij, dhe të citojë fjali ose pjesë specifike nga burimet e tij. Si rezultat i këtij trajnimi, ai arrin nivele të reja në disa vlerësime publike të fokusuara në probleme reale.
Në Provimin e Fundit të Njerëzimit(hapet në një dritare të re), një vlerësim i publikuar së fundmi që teston IA në një gamë të gjerë lëndësh me pyetje në nivel eksperti, modeli që mundëson kërkimin e thellë shënon një rekord të ri me saktësi prej 26.6%. Ky test përbëhet nga mbi 3,000 pyetje me zgjedhje të shumëfishta dhe përgjigje të shkurtra në më shumë se 100 lëndë, nga gjuhësia te shkenca raketore, nga klasikët te ekologjia. Krahasuar me OpenAI o1, përparimet më të mëdha u arritën në kimi, shkencat humane dhe shoqërore, si dhe në matematikë. Modeli që mundëson kërkimin e thellë tregoi një qasje të ngjashme me atë njerëzore duke kërkuar në mënyrë efektive informacion të specializuar kur ishte e nevojshme.
| Modeli | Saktësia (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| Kërkim i thellë me OpenAI** | 26,6 |
Në GAIA(hapet në një dritare të re)1, një pikë referimi publike që vlerëson IA mbi pyetje të botës reale, modeli që mundëson kërkimin e thellë arrin një gjendje të re të artit (SOTA), duke kryesuar klasifikimet e(hapet në një dritare të re)jashtme. Duke përfshirë pyetje në tre nivele vështirësie, përfundimi i suksesshëm i këtyre detyrave kërkon aftësi si arsyetimi, rrjedhshmëria multimodale, shfletimi në internet dhe aftësia për përdorimin e mjeteve.
| GAIA | ||||
|---|---|---|---|---|
| Niveli 1 | Niveli 2 | Niveli 3 | Mesat. | |
| SOTA e mëparshme(hapet në një dritare të re) | 67,92 | 67,44 | 42,31 | 63,64 |
| Kërkim i thellë (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Kërkim i thellë (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Shembuj të detyrave të GAIA
Në një vlerësim të brendshëm të detyrave të nivelit të ekspertëve në një gamë të gjerë fushash, kërkimi i thellë u vlerësua nga ekspertët e fushës për të automatizuar disa orë të hetimit të vështirë manual.
Norma e kalueshmërisë vs Nr. maks. i përdorimit të mjetit
Shembuj detyrash të nivelit ekspert
Norma e kalueshmërisë në detyrat e nivelit ekspert sipas vlerës ekonomike të vlerësuar
Norma e kalueshmërisë në detyrat e nivelit ekspert sipas orëve të vlerësuara
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Kërkimi i thellë është i disponueshëm sot në uebin e ChatGPT dhe do të shfaqet në aplikacionin celular dhe atë desktop brenda muajit. Aktualisht, kërkimi i thellë mund të ketë qasje në uebin e hapur dhe çdo skedar të ngarkuar. Në të ardhmen, do të mund të lidhesh me burime më të specializuara të të dhënave - duke zgjeruar aksesin në burime të bazuara në abonim ose të brendshme - për ta bërë rezultatin edhe më të qëndrueshëm dhe të personalizuar.
Duke parë më tej në të ardhmen, ne parashikojmë që përvojat agjentike të bashkohen në ChatGPT për kërkime dhe ekzekutime asinkrone në botën reale. Kombinimi i kërkimit të thellë, që mund të kryejë kërkime asinkrone në internet, dhe Operatorit, që mund të ndërmarrë veprim në botën reale, do t'i mundësojë ChatGPT të kryejë detyra gjithnjë e më të sofistikuara për ty.
Shtojca e 3 shkurtit 2025: Ne kryem testime rigoroze të sigurisë, vlerësime të gatishmërisë dhe shqyrtime të qeverisjes në versionin e hershëm të o3 që fuqizon kërkime të thella, duke e identifikuar atë si rrezik mesatar(hapet në një dritare të re). Ne gjithashtu kryem testime shtesë të sigurisë për të kuptuar më mirë rreziqet e shtuara që lidhen me aftësinë e kërkimit të thellë për të shfletuar uebin dhe kemi shtuar masa të reja mbrojtëse. Ne do të vazhdojmë të testojmë plotësisht dhe të monitorojmë nga afër publikimin aktual të kufizuar. Ne do të ndajmë njohuritë tona të sigurisë dhe masat mbrojtëse për kërkime të thella në një kartë sistemi kur të zgjerojmë qasjen tek përdoruesit e planit Plus.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford dhe Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney dhe Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman dhe Wojciech Zaremba