Ներկայացնում ենք խորքային ուսումնասիրությունը
Ագենտ, որն օգտագործում է հիմնավորում՝ մեծ քանակությամբ առցանց տեղեկատվություն սինթեզելու և ձեզ համար բազմափուլ հետազոտական առաջադրանքներ կատարելու համար։ Այսօր հասանելի է Pro օգտատերերի համար, հետագայում՝ Plus և Team օգտատերերի համար:
Փետրվարի 10, 2026 թարմացում: Այժմ կարող եք կապակցել խորքահին ուսումնասիրությունը ցանկացած MCP-ի կամ հավելվածի հետ և սահմանափակել վեբ որոնումները վստահելի կայքերով, որպեսզի կենտրոնանաք վավերացված, ոլորտային ստանդարտ աղբյուրների վրա։ Այժմ կարող եք նաև իրական ժամանակում հետևել առաջընթացին և ընդհատել՝ ճշգրտելու համար հետագա հարցումներով կամ նոր աղբյուրներով։ Մենք թարմացրել ենք տեսողական փորձառությունը, որպեսզի ավելի հեշտ լինի սկսել, հետևել և վերանայել ձեր ուսումնասիրությունը սկզբից մինչև վերջ։
2025 թվականի հուլիսի 17-ի թարմացում. Խորքային ուսումնասիրությունը այժմ կարող է ավելի խորը և լայնածավալ լինել՝ ChatGPT ագենտի շրջանակներում դիտարկչին հասանելիության շնորհիվ: Այս թարմացված հնարավորություններին մուտք գործելու համար պարզապես ընտրեք «ագենտի ռեժիմ» կոմպոզիտորի ցանկից և անմիջապես մուտքագրեք ձեր հարցումը: Խորքային ուսումնասիրության սկզբնական ֆունկցիոնալությունը մնում է հասանելի գործիքների ցանկի «խորքային ուսումնասիրություն» տարբերակի միջոցով:
2025 թվականի ապրիլի 24-ի թարմացում: Մենք զգալիորեն մեծացնում ենք խորքային ուսումնասիրության օգտագործման հաճախականությունը՝ Plus, Team, Enterprise և Edu օգտատերերը այժմ ստանում են 25 հարցում ամսական, Pro օգտատերերը՝ 250, իսկ Free օգտատերերը՝ 5։ Սա հնարավոր է դարձել o4-mini տարբերակով հզորացված խորը հետազոտության նոր թեթև տարբերակի շնորհիվ, որը նախագծված է ավելի մատչելի լինելու և բարձր որակը պահպանելու համար։ Երբ հասնեք ամբողջական տարբերակի համար ձեր սահմանաչափին, ձեր հարցումները ավտոմատ կերպով կանցնեն թեթև տարբերակի։
Փետրվարի 25, 2025 թարմացում: Բոլոր Plus օգտատերերը այժմ կարող են օգտագործել խորքային ուսումնասիրություն։
2025 թվականի փետրվարի 5-ի թարմացում. Խորքային ուսումնասիրությունն այժմ հասանելի է Pro օգտատերերին Միացյալ Թագավորությունում, Շվեյցարիայում և Եվրոպական տնտեսական տարածքում։
Այսօր մենք գործարկում ենք ChatGPT‑ի խորքային ուսումնասիրությունը, նոր ագենտային հնարավորություն, որը բազմափուլ հետազոտություններ է անցկացնում ինտերնետում բարդ առաջադրանքների համար։ Այն տասնյակ րոպեների ընթացքում կատարում է այն, ինչ մարդուն կպահանջվեր բազմաթիվ ժամեր։
Խորքային ուսումնասիրությունը OpenAI-ի հաջորդ ագենտն է, որը կարող է ինքնուրույն աշխատանք կատարել ձեզ համար. դուք տալիս եք հարցում, և ChatGPT‑ն կգտնի, կվերլուծի և կսինթեզի հարյուրավոր առցանց աղբյուրներ՝ հետազոտական վերլուծաբանի մակարդակով համապարփակ զեկույց ստեղծելու համար։ Աշխատում է OpenAI o3 մոդելի առաջիկա տարբերակի հիման վրա, որը օպտիմալացված է վեբ զննարկման և տվյալների վերլուծության համար, այն օգտագործում է հիմնավորումը՝ ինտերնետում մեծ քանակությամբ տեքստեր, պատկերներ և PDF ֆայլեր որոնելու, մեկնաբանելու և վերլուծելու համար՝ անհրաժեշտության դեպքում փոփոխվելով իր հանդիպած տեղեկատվությանը արձագանքելու համար։
Տեղեկությունների սինթեզման ունակությունը նախապայման է նոր տեղեկություններ ստեղծելու համար։ Այս պատճառով խորը հետազոտությունը նշանակալի քայլ է դեպի մեր ավելի լայն նպատակը՝ զարգացնել AGI-ն, որը մենք վաղուց պատկերացնում էինք որպես նորարարական գիտական հետազոտություններ իրականացնելու ունակ։
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Խորքային ուսումնասիրությունը վերապատրաստվել է վերջնական ամրապնդումով ուսուցմամբ մի շարք տիրույթներում բարդ զննարկման և տրամաբանության առաջադրանքների վրա։ Այդ ուսուցման միջոցով այն սովորեց պլանավորել և իրականացնել բազմաքայլ ընթացք՝ անհրաժեշտ տվյալները գտնելու համար՝ հետ գնալով և արձագանքելով իրական ժամանակի տեղեկատվությանը, երբ դա անհրաժեշտ է։ Մոդելը նաև կարող է դիտարկել օգտատիրոջ վերբեռնած ֆայլերը, գծագրել և կրկնել գրաֆիկները՝ օգտագործելով Python գործիքը, իր պատասխաններում ներմուծել և՛ գեներացված գրաֆիկներ, և՛ պատկերներ կայքերից, և մեջբերել իր աղբյուրներից կոնկրետ նախադասություններ կամ հատվածներ։ Այս ուսուցման արդյունքում այն հասնում է նոր բարձունքների մի շարք հանրային գնահատումներում, որոնք կենտրոնացած են իրական աշխարհի խնդիրների վրա։
«Մարդկության վերջին քննություն»(բացվում է նոր պատուհանում)-ում, վերջերս հրապարակված գնահատական, որը փորձարկում է արհեստական բանականությունը տարբեր առարկաների շրջանակներում փորձագիտական մակարդակի հարցերով, խորքային ուսումնասիրություն իրականացնող մոդելը գրանցել է նոր բարձր ցուցանիշ՝ 26,6% ճշգրտությամբ։ Այս թեստը բաղկացած է ավելի քան 3000 բազմակի ընտրության և կարճ պատասխանով հարցերից՝ ավելի քան 100 առարկաներից՝ լեզվաբանությունից մինչև հրթիռային գիտություն, դասական գրականությունից մինչև էկոլոգիա։ OpenAI o1‑ի համեմատ, ամենամեծ առաջընթացը գրանցվել է քիմիայի, հումանիտար և հասարակական գիտությունների, ինչպես նաև մաթեմատիկայի ոլորտներում։ Խորքային ուսումնասիրության մոդելը ցուցադրեց մարդանման մոտեցում՝ անհրաժեշտության դեպքում արդյունավետորեն փնտրելով մասնագիտացված տեղեկատվություն։
| Մոդել | Ճշգրտություն (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (միջին)* | 10,5 |
| OpenAI o3-mini (բարձր)* | 13,0 |
| OpenAI խորքային ուսումնասիրություն** | 26,6 |
GAIA(բացվում է նոր պատուհանում)-ում 1, որը հանրային չափանիշ է, որը գնահատում է արհեստական բանականությունը իրական աշխարհի հարցերի վրա, խորքային ուսումնասիրությանը խթանող մոդելը հասնում է նորագույն մակարդակի (SOTA)՝ գլխավորելով արտաքին վարկանիշային աղյուսակը(բացվում է նոր պատուհանում)։ Երեք դժվարության մակարդակների հարցեր ներառող այս առաջադրանքների հաջող ավարտը պահանջում է այնպիսի ունակություններ, ինչպիսիք են հիմնավորումը, բազմամոդալ սահունությունը, վեբ զննումը և գործիքների օգտագործման հմտությունը։
| GAIA | ||||
|---|---|---|---|---|
| Մակարդակ 1 | Մակարդակ 2 | Մակարդակ 3 | Միջին | |
| Նախորդ SOTA(բացվում է նոր պատուհանում) | 67,92 | 67,44 | 42,31 | 63,64 |
| Խորքային ուսումնասիրություն (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Խորքային ուսումնասիրություն (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
GAIA առաջադրանքների օրինակներ
Փորձագիտական մակարդակի առաջադրանքների տարբեր ոլորտներում ներքին գնահատման ժամանակ, տիրույթի փորձագետները խորքային ուսումնասիրությունը գնահատեցին որպես ավտոմատացված մի քանի ժամ տևող դժվար, ձեռքով կատարված հետազոտություն։
Անցման ցուցանիշը և գործիքի առավելագույն կանչերի
Փորձագիտական մակարդակի առաջադրանքների օրինակներ
Փորձագիտական մակարդակի առաջադրանքների անցման ցուցանիշը՝ ըստ գնահատված տնտեսական արժեքի
Փորձագետի մակարդակի առաջադրանքների անցման ցուցանիշը՝ ըստ գնահատված ժամերի
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Խորքային ուսումնասիրությունը հասանելի է այսօր ChatGPT կայքում, և այն կգործարկվի բջջային և աշխատասեղանի հավելվածներում ամսվա ընթացքում։ Ներկայումս խորքային ուսումնասիրությունը կարող է մուտք գործել բաց վեբ և ցանկացած վերբեռնված ֆայլ։ Ապագայում դուք կկարողանաք կապել ավելի մասնագիտացված տվյալների աղբյուրներին՝ ընդլայնելով դրանց հասանելիությունը բաժանորդագրության վրա հիմնված կամ ներքին ռեսուրսների համար, որպեսզի արդյունքը լինի ավելի ամուր և անհատականացված։
Ապագային նայելով՝ մենք պատկերացնում ենք, որ ագենտային փորձառությունները միավորվում են ChatGPT‑ում՝ ասինխրոն, իրական աշխարհի հետազոտությունների և իրականացման համար։ Խորքային ուսումնասիրության, որը կարող է իրականացնել ասինխրոն առցանց հետաքննություն, և Operator-ի, որը կարող է իրական աշխարհի գործողություններ ձեռնարկել, համադրությունը ChatGPT‑ին հնարավորություն կտա ձեզ համար կատարել ավելի ու ավելի բարդ առաջադրանքներ։
2025 թվականի փետրվարի 3-ի հավելված: Մենք խիստ անվտանգության փորձարկումներ, պատրաստվածության գնահատումներ և կառավարման ստուգումներ ենք անցկացրել o3‑ի վաղ տարբերակի վրա, որը խորքային ուսումնասիրություն է կատարում՝ այն գնահատելով որպես միջին(բացվում է նոր պատուհանում) ռիսկ: Մենք նաև լրացուցիչ անվտանգության փորձարկումներ ենք անցկացրել՝ ավելի լավ հասկանալու համար խորքային ուսումնասիրության դիտարկելու ունակության հետ կապված աստիճանական ռիսկերը, և ավելացրել ենք նոր մեղմացումներ: Մենք կշարունակենք մանրակրկիտ փորձարկել և սերտորեն հետևել ընթացիկ սահմանափակ թողարկմանը: Մենք կկիսվենք մեր անվտանգության պատկերացումներով և երաշխիքներով համակարգային քարտում խորքային ուսումնասիրության համար, երբ ընդլայնենք հասանելիությունը Plus օգտատերերին:
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford, Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba