معرفی پژوهش عمیق
عاملی که با استفاده از استدلال، حجم زیادی از اطلاعات آنلاین را ترکیب میکند و وظایف پژوهشی چندمرحلهای را برای شما انجام میدهد. امروز برای کاربران Pro در دسترس است، و بعد از آن برای کاربران Plus و Team.
بهروز رسانی ۱۰ فوریه ۲۰۲۶: اکنون میتوانید تحقیق عمیق را به هر MCP یا برنامهای متصل کنید و جستجوهای وب را به سایتهای مورد اعتماد محدود کنید، تا بتوانید روی منابع احراز هویتشده و استانداردِ صنعت تمرکز کنید. همچنین اکنون میتوانید پیشرفت را به صورت لحظهای پیگیری کنید و برای دقیقتر کردن کار با اعلانهای پیگیری یا منابع جدید، آن را متوقف کنید. ما تجربه بصری را بهروزرسانی کردهایم تا شروع کردن، پیگیری و بازبینی تحقیق شما از ابتدا تا انتها آسانتر شود.
بهروزرسانی ۱۷ ژوئیه ۲۰۲۵: اکنون میتوانید با دسترسی به مرورگر بصری به عنوان بخشی از عامل ChatGPT، تحقیقات عمیقتری انجام دهید. برای دسترسی به این قابلیتهای جدید، کافی است «حالت عاملی» را از منوی کشویی در آهنگساز انتخاب کرده و درخواست خود را به طور مستقیم وارد کنید. قابلیت اصلی تحقیق عمیق همچنان از طریق گزینه «تحقیق عمیق» در منوی ابزارها در دسترس است.
بهروزرسانی 24 آوریل 2025: ما تعداد دفعات استفاده از قابلیت تحقیق عمیق را بهطور قابلتوجهی افزایش دادهایم—اکنون کاربران Plus، Team، Enterprise و Edu میتوانند ماهانه ۲۵ بار از آن استفاده کنند، کاربران Pro تا ۲۵۰ بار، و کاربران Free ۵ بار. این امکان به لطف نسخهای سبکتر از قابلیت تحقیق عمیق فراهم شده که با نسخهای از مدل o4-mini اجرا میشود و برای صرفهجویی در هزینه طراحی شده، در حالی که کیفیت بالای خود را حفظ میکند. پس از رسیدن به سقف استفاده از نسخه کامل، درخواستهای شما بهطور خودکار به نسخه سبکتر منتقل میشود.
به روز رسانی 25 فوریه 2025: همه کاربران Plus اکنون می توانند از تحقیقات عمیق استفاده کنند.
بهروزرسانی 5 فوریه 2025: تحقیقات عمیق اکنون برای کاربران Pro در بریتانیا، سوئیس و منطقه اقتصادی اروپا در دسترس میباشد.
امروز تحقیقات عمیقی را در ChatGPT راهاندازی میکنیم، یک قابلیت جدید عاملمحور که تحقیقات چند مرحلهای را در اینترنت برای وظایف پیچیده انجام میدهد. کاری را در چند ده دقیقه انجام میدهد که برای یک انسان ساعتها زمان میبرد.
تحقیقات عمیق، عامل بعدی OpenAI است که میتواند به طور مستقل برایت کار کند—به آن یک دستور بده، و ChatGPT صدها منبع آنلاین را پیدا، تحلیل و ترکیب میکند تا گزارشی جامع در سطح یک تحلیلگر تحقیق ایجاد کند. این سیستم با نسخهای از مدل آینده OpenAI o3 که برای مرور وب و تحلیل دادهها بهینه شده است، قدرت میگیرد و از استدلال برای جستجو، تفسیر و تحلیل حجم عظیمی از متن، تصاویر و فایلهای PDF در اینترنت استفاده میکند و در صورت نیاز، در واکنش به اطلاعاتی که با آن مواجه میشود، تغییر جهت میدهد.
توانایی ترکیب دانش، پیشنیازی برای خلق دانش جدید است. به همین دلیل، تحقیقات عمیق گامی مهم به سوی هدف گستردهتر ما برای توسعه AGI است، که مدتهاست آن را به عنوان ابزاری برای تولید تحقیقات علمی جدید تصور کردهایم.
تحقیق عمیق برای افرادی طراحی شده که در حوزههایی مانند امور مالی، علوم، سیاستگذاری و مهندسی مشغول به کارهای دانشی فشرده هستند و به تحقیقاتی جامع، دقیق و قابل اتکا نیاز دارند. همچنین میتواند برای خریداران دقیق که به دنبال پیشنهادهای فوقالعاده شخصیسازیشده برای خریدهایی مانند خودرو، لوازم خانگی و مبلمان که معمولاً نیازمند بررسی دقیق هستند، بسیار مفید باشد. هر خروجی کاملاً مستند ارائه میشود، با ارجاعات شفاف و خلاصهای از فرایند تحلیل، که ارجاع دادن و راستیآزمایی اطلاعات را آسان میکند. این ابزار بهویژه در یافتن اطلاعات خاص و غیر بدیهی که نیاز به مرور وبسایتهای متعدد دارد، بسیار مؤثر است. تحقیق عمیق با امکان واگذار کردن و تسریع تحقیقات پیچیده و وقتگیر از طریق تنها یک پرسش، زمان ارزشمند شما را آزاد میسازد.
تحقیق عمیق بهطور مستقل بینشها را از سراسر وب کشف، تحلیل و تلفیق میکند. برای رسیدن به این توانایی، این سیستم با استفاده از وظایف واقعی آموزش دیده که نیازمند بهکارگیری ابزار مرورگر و پایتون بودهاند، و با همان روشهای تقویت یادگیری توسعه یافته که در مدل استدلالی نخست OpenAI، یعنی o1، به کار گرفته شدهاند. در حالی که o1 تواناییهای چشمگیری در برنامهنویسی، ریاضی و دیگر حوزههای فنی از خود نشان داده، اما بسیاری از چالشهای دنیای واقعی نیازمند درک گسترده و گردآوری اطلاعات از منابع متنوع آنلاین هستند. تحقیق عمیق با تکیه بر این قابلیتهای استدلالی، این فاصله را پر میکند و توانایی حل مسائل پیچیدهای را که افراد در محیط کار یا زندگی روزمره با آن مواجهاند، فراهم میسازد.
در ChatGPT، گزینه «تحقیق عمیق» را در بخش نوشتار پیام انتخاب کنید و پرسش خود را وارد نمایید. به ChatGPT بگویید دقیقاً چه نیاز دارید—چه یک تحلیل رقابتی درباره پلتفرمهای استریم باشد یا گزارشی شخصیسازیشده درباره بهترین دوچرخه برای رفتوآمد روزانه. میتوانید فایلها یا صفحات گسترده را برای افزودن زمینه بیشتر به پرسش خود ضمیمه کنید. بهمحض آغاز فرایند، یک نوار کناری ظاهر میشود که خلاصهای از مراحل انجامشده و منابع مورد استفاده را نمایش میدهد.
تحقیق عمیق ممکن است بین 5 تا 30 دقیقه طول بکشد تا کار خود را به پایان برساند و زمان لازم برای کاوش عمیق در وب را صرف کند. در این فاصله، میتوانید از سیستم فاصله بگیرید یا روی کارهای دیگر تمرکز کنید—بهمحض اتمام تحقیق، اعلان دریافت خواهید کرد. خروجی نهایی بهصورت یک گزارش در داخل گفتوگو ارائه میشود—و در چند هفته آینده، تصاویر جاسازیشده، نمودارهای داده، و سایر خروجیهای تحلیلی نیز به این گزارشها اضافه خواهند شد تا وضوح و زمینه بیشتری فراهم شود.
در مقایسه با تحقیق عمیق، GPT‑4o برای مکالمات بلادرنگ و چندوجهی ایدهآل است. اما برای پرسشهای چندلایه و تخصصمحور که در آنها عمق و جزئیات حیاتیاند، توانایی تحقیق عمیق در انجام کاوش گسترده و استناد به هر ادعا، تفاوت میان یک خلاصه سریع و پاسخی مستند، تأییدشده و قابل استفاده در محیط کاری را رقم میزند.
GPT-4o
پژوهش عمیق
تحقیقات عمیق به طور مفصل به درخواست پاسخ میدهد و دادههای خاص هر کشور را برای 10 کشور برتر توسعهیافته و 10 کشور برتر در حال توسعه، به صورت کنار هم برای ارجاع و مقایسه آسان ارائه میکند. از این اطلاعات برای ارائه توصیههای دقیق و قابل استفاده برای ورود به بازار استفاده میکند.
تحقیقات عمیق با استفاده از یادگیری تقویتی سرتاسری در مرور سخت و وظایف استدلال در طیف وسیعی از حوزهها آموزش داده شد. از طریق آن آموزش، یاد گرفت که یک مسیر چندمرحلهای را برای یافتن دادههای مورد نیاز خود برنامهریزی و اجرا کند، و در صورت لزوم به عقب برگردد و به اطلاعات لحظهای واکنش نشان دهد. این مدل همچنین قادر است فایلهای بارگذاریشده توسط کاربر را مرور کند، با استفاده از ابزار پایتون نمودار رسم کرده و روی آنها تکرار انجام دهد، هم نمودارهای تولیدشده و هم تصاویر استخراجشده از وبسایتها را در پاسخهای خود جای دهد، و جملات یا بخشهای خاصی از منابع خود را نقل قول کند. در نتیجه این آموزش، مدل به رکوردهای جدیدی در شماری از ارزیابیهای عمومی که بر مسائل دنیای واقعی تمرکز دارند، دست مییابد.
در آخرین آزمون بشریت(در یک پنجره جدید باز میشود)، یک ارزیابی که به تازگی منتشر شده و هوش مصنوعی را در طیف گستردهای از موضوعات با سوالات سطح کارشناسی ارزیابی میکند، مدل تقویتکننده تحقیقات عمیق به دقت جدید 26.6٪ دست یافته است. این آزمون شامل بیش از 3٬000 پرسش چهارگزینهای و پاسخ کوتاه در بیش از 100 موضوع، از زبانشناسی تا علم موشک، و از مطالعات کلاسیک تا بومشناسی است. در مقایسه با OpenAI o1، بیشترین پیشرفتها در شیمی، علوم انسانی، علوم اجتماعی و ریاضیات مشاهده شد. مدلی که به تحقیقات عمیق قدرت میبخشید، با جستجوی مؤثر اطلاعات تخصصی در مواقع ضروری، رویکردی شبیه به انسان را به نمایش گذاشت.
| مدل | دقت (%) |
|---|---|
| GPT-4o | ۳٫۳ |
| Grok-2 | ۳٫۸ |
| Claude 3.5 Sonnet | ۴٫۳ |
| Gemini Thinking | ۶٫۲ |
| OpenAI o1 | ۹٫۱ |
| DeepSeek-R1* | ۹٫۴ |
| OpenAI o3-mini (متوسط)* | ۱۰٫۵ |
| OpenAI o3-mini (سطح بالا)* | ۱۳٫۰ |
| پژوهش عمیق OpenAI | ۲۶٫۶ |
در GAIA(در یک پنجره جدید باز میشود)1، یک معیار عمومی که هوش مصنوعی را بر اساس سوالات دنیای واقعی ارزیابی میکند، مدل تقویتکننده تحقیقات عمیق به یک وضعیت جدید از هنر (SOTA) رسیده و در صدر جدول امتیازات(در یک پنجره جدید باز میشود) خارجی قرار گرفته است. شامل سوالاتی در سه سطح دشواری، تکمیل موفقیتآمیز این وظایف نیازمند تواناییهایی از جمله استدلال، تسلط چندوجهی، مرور وب و مهارت استفاده از ابزارها است.
| GAIA | ||||
|---|---|---|---|---|
| سطح 1 | سطح 2 | سطح 3 | میانگین | |
| SOTA قبلی(در یک پنجره جدید باز میشود) | ۶۷٫۹۲ | ۶۷٫۴۴ | ۴۲٫۳۱ | ۶۳٫۶۴ |
| Deep Research (pass@1) | ۷۴٫۲۹ | ۶۹٫۰۶ | ۴۷٫۶ | ۶۷٫۳۶ |
| پژوهش عمیق (cons@64) | ۷۸٫۶۶ | ۷۳٫۲۱ | ۵۸٫۰۳ | ۷۲٫۵۷ |
نمونههایی از وظایف GAIA
در یک ارزیابی داخلی از وظایف سطح کارشناسی در حوزههای مختلف، تحقیقات عمیق توسط کارشناسان حوزه به عنوان ابزاری ارزیابی شد که چندین ساعت کار دشوار و دستی را خودکار کرده است.
نرخ قبولی در مقابل حداکثر فراخوانی ابزار
نمونههایی از وظایف در سطح کارشناسی
نرخ قبولی در وظایف سطح کارشناسی بر اساس ارزش اقتصادی تخمینی
نرخ قبولی در وظایف سطح کارشناسی بر اساس ساعات تخمینی
تحقیقات عمیق قابلیتهای جدید و قابل توجهی را قفلگشایی میکند، اما هنوز در مراحل اولیه است و محدودیتهایی دارد. گاهی ممکن است در پاسخها دچار توهمِ واقعیت شود یا استنتاجهای نادرست انجام دهد، هرچند طبق ارزیابیهای داخلی، این موارد بهطور قابلتوجهی کمتر از مدلهای کنونی ChatGPT است. ممکن است در تشخیص اطلاعات معتبر از شایعات دچار مشکل شود و در حال حاضر در کالیبراسیون اعتماد نیز ضعف نشان میدهد و اغلب نمیتواند میزان عدم قطعیت را بهدرستی منتقل کند. در زمان راهاندازی، ممکن است خطاهای جزئی در قالببندی گزارشها و استنادها وجود داشته باشد و شروع وظایف ممکن است بیشتر طول بکشد. ما انتظار داریم همه این مسائل با استفاده بیشتر و گذر زمان بهسرعت بهبود پیدا کنند.
تحقیقات عمیق در ChatGPT در حال حاضر نیازمند محاسبات بسیار سنگین است. هرچه زمان بیشتری برای تحقیق یک پرسش صرف شود، توان محاسباتی استنتاج بیشتری مورد نیاز خواهد بود. امروز با نسخهای آغاز میکنیم که برای کاربران Pro بهینهسازی شده است و تا 100 پرسش در ماه را پشتیبانی میکند. کاربران Plus و Team در مرحله بعد و پس از آن Enterprise به این نسخه دسترسی خواهند داشت. ما همچنان در حال کار روی فراهم کردن دسترسی برای کاربران در بریتانیا، سوئیس و منطقه اقتصادی اروپا هستیم.
به زودی، با انتشار نسخهی سریعتر و مقرونبهصرفهتر تحقیقات عمیق که توسط مدل کوچکتری ارائه میشود و همچنان نتایج با کیفیتی را ارائه میدهد، تمامی کاربران پولی محدودیتهای نرخ بسیار بالاتری را دریافت خواهند کرد.
در هفتهها و ماههای آینده، ما روی زیرساخت فنی کار خواهیم کرد، نسخه فعلی را از نزدیک نظارت خواهیم کرد و آزمایشهای حتی دقیقتری انجام خواهیم داد. این با اصل استقرار تدریجی ما همخوانی دارد. اگر تمامی بررسیهای ایمنی همچنان با استانداردهای انتشار ما مطابقت داشته باشند، انتظار داریم تحقیقات عمیق را حدود یک ماه دیگر برای کاربران Plus منتشر کنیم.
تحقیقات عمیق امروز در وب ChatGPT در دسترس است و طی ماه جاری به اپلیکیشنهای موبایل و دسکتاپ نیز عرضه خواهد شد. در حال حاضر، تحقیقات عمیق میتواند به وب باز و هر فایل آپلود شدهای دسترسی داشته باشد. در آینده، شما قادر خواهید بود به منابع داده تخصصیتری متصل شوید - و دسترسی آن را به منابع مبتنی بر اشتراک یا داخلی گسترش دهید - تا خروجی آن را قویتر و شخصیسازیشدهتر کنید.
با نگاهی به آینده، ما تصور میکنیم که تجربیات عاملمحور در ChatGPT برای تحقیق و اجرای ناهمزمان و در دنیای واقعی به هم بپیوندند. با ترکیب تحقیقات عمیق که میتواند تحقیقات آنلاین ناهمزمان انجام دهد، و اپراتور که میتواند اقدامات دنیای واقعی را انجام دهد، ChatGPT را قادر میسازد تا وظایف پیچیدهتری را برایت انجام دهد.
افزودنی 3 فوریه 2025: ما آزمایشهای ایمنی دقیق، ارزیابیهای آمادگی و بررسیهای حاکمیتی را بر روی نسخه اولیه o3 که تحقیقات عمیق را تقویت میکند، انجام دادیم و آن را به عنوان خطر متوسط(در یک پنجره جدید باز میشود) شناسایی کردیم. همچنین آزمایشهای ایمنی اضافی برای درک بهتر خطرات افزایشی مرتبط با توانایی تحقیقات عمیق در مرور وب انجام دادیم و کاهشهای جدیدی را اضافه کردیم. ما به آزمایش کامل و نظارت دقیق بر نسخه محدود فعلی ادامه خواهیم داد. هنگامی که دسترسی به کاربران Plus را گسترش دهیم، بینشها و محافظتهای ایمنی خود را برای تحقیقات عمیق در یک کارت سیستم به اشتراک خواهیم گذاشت.
پاورقی
- 1
ما متوجه شدیم که پاسخهای واقعی این مجموعه دادهها به طور گستردهای به صورت آنلاین فاش شدهاند و به همین دلیل چندین وبسایت یا URL را مسدود کردهایم تا ارزیابی مدل به صورت منصفانه انجام شود.
نویسندهها
سرپرستان تحقیق
Isa Fulford، Zhiqing Sun
مشارکتکنندگان اصلی
Alex Tachard Passos، Alexandra Barr، Allison Tam، Charlotte Cole، Hyung Won Chung، Jason Wei، Jon Blackman، Scott Mayer McKinney، Valerie Qi
مشارکتکنندگان اصلی
تحقیق
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
راهنمای پیادهسازی
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
مشارکتکنندگان
تحقیق
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ همه مشارکتکنندگان در o3.
سیستمهای ایمنی
آدام کالای، الکس بیوتل، آندریا والونه، اندی اپلبام، دیوید رابینسون، الیزابت پروهل، ایوان میس، گریس ژائو، ایرینا کوفمن، جیسون فانگ، واکین کینونرو کاندلا، جوئل پریش، کوین لیو، کریستن یینگ، لاما احمد، لئون مکسین، لیتون هو، مگان شاه، میشل وانگ، مایلز وانگ، فیلیپ گو، اولیویا واتکینز، اوون کمپبل-مور، پاتریک چائو، سم تویزر، ساموئل میسرندینو، ساندینی آگاروال، تجال پاتواردان، تینا سریسکنداراجاه، تروی پیترسون، یائودونگ یو، یون یون وانگ
راهنمای پیادهسازی
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
رهبری
Akshay Nathan، Greg Brockman، Hannah Wong، Jakub Pachocki، Jerry Tworek، Johannes Heidecke، Josh Tobin، Liam Fedus، Mark Chen، Mia Glaese، Nick Turley، Sam Altman، Wojciech Zaremba