Впровадження глибоких досліджень
Агент, який використовує логіку, щоб узагальнювати великі обсяги онлайн-інформації та виконувати за вас багатокрокові дослідницькі завдання. Сьогодні доступний для користувачів Pro, згодом — для Plus і Team.
Оновлення від 10 лютого 2026 року: Тепер ви можете підключати Deep Research до будь-якого MCP або програми та обмежувати веб-пошук довіреними сайтами, дозволивши брати інформацію лише з підтверджених джерел, що відповідають галузевим стандартам. Ви також можете відстежувати прогрес у реальному часі та переривати процес, щоб уточнити його за допомогою наступних запитів або нових джерел. Крім того, ми оновили візуальне оформлення, щоб вам було простіше розпочинати, відстежувати та переглядати ваше дослідження.
Оновлення від 17 липня 2025 р.: Глибокі дослідження тепер можуть бути ще глибшими та ширшими завдяки доступу до візуального браузера як частини агента ChatGPT. Щоб отримати доступ до цих оновлених можливостей, просто виберіть «режим агента» у випадаючому меню редактора та введіть свій запит напряму. Оригінальна функція глибокого дослідження залишається доступною через опцію «deep research» в меню інструментів.
Оновлення від 24 квітня 2025 року: Ми суттєво збільшуємо частоту використання глибокого дослідження — користувачі Plus, Team, Enterprise та Edu тепер отримують 25 запитів на місяць, Pro — 250, а Free — 5. Це стало можливим завдяки новій полегшеній версії глибокого дослідження на основі o4-mini, створеній для більшої економічності за збереження високої якості. Після досягнення ліміту на повну версію запити автоматично перемикатимуться на полегшену.
Оновлення від 25 лютого 2025 року: Усі користувачі Plus тепер можуть використовувати глибоке дослідження.
Оновлення від 5 лютого 2025 року: Глибоке дослідження стало доступним користувачам Pro у Сполученому Королівстві, Швейцарії та Європейській економічній зоні.
Сьогодні ми запускаємо глибоке дослідження в ChatGPT — нову агентну можливість, яка виконує багатокрокові дослідження в інтернеті для складних завдань. Воно виконує за десятки хвилин те, на що людині знадобилися б багато годин.
Глибоке дослідження — це наступний агент OpenAI, який може самостійно виконувати роботу для вас: ви задаєте запит, і ChatGPT знаходить, аналізує та синтезує сотні онлайн-джерел, щоб створити комплексний звіт на рівні аналітика-дослідника. Працюючи на версії майбутньої моделі OpenAI o3, оптимізованої для вебперегляду та аналізу даних, воно використовує міркування для пошуку, інтерпретації та аналізу великих обсягів текстів, зображень і PDF-файлів в інтернеті, коригуючи хід роботи відповідно до нової інформації.
Здатність структурувати знання є передумовою для створення нових знань. Із цієї причини Deep Research є важливим кроком до нашої ширшої мети — розвитку AGI, якого ми давно уявляємо здатним до нових наукових досліджень.
Глибоке дослідження створено для людей, які працюють з інтенсивним обсягом знань — у сферах фінансів, науки, політики та інженерії — і потребують ретельних, точних і надійних досліджень. Воно може бути однаково корисним і для вибагливих покупців, які шукають максимально персоналізовані рекомендації щодо товарів, купівля яких зазвичай потребує ретельного аналізу, як-от автомобілі, побутова техніка чи меблі. Кожен результат повністю задокументований, із чіткими цитуваннями та підсумком міркувань, що полегшує перевірку та використання інформації. Воно особливо ефективне у пошуку нішевої, неочевидної інформації, яка зазвичай потребує перегляду численних сайтів. Глибоке дослідження звільняє цінний час, дозволяючи передати складну, тривалу роботу з вебдосліджень всього одним запитом.
Глибоке дослідження самостійно виявляє, аналізує та узагальнює дані з усього інтернету. Щоб реалізувати це, його навчали на реальних завданнях, що потребували браузера та інструментів Python, використовуючи ті самі методи навчання з підкріпленням, що й у OpenAI o1 — нашій першій моделі міркування. Хоча o1 демонструє вражаючі здібності в програмуванні, математиці та інших технічних галузях, багато реальних задач вимагають широкого контексту та збору інформації з різних онлайн-джерел. Глибоке дослідження розширює ці можливості міркування, щоб перекрити цю прогалину, дозволяючи моделі працювати з задачами, які люди зустрічають у роботі та повсякденному житті.
У ChatGPT виберіть «Deep Research» в редакторі повідомлень і введіть ваш запит. Скажіть ChatGPT, що вам потрібно — скажімо, конкурентний аналіз потокових платформ, або персоналізований звіт про найкращий велосипед для поїздок на роботу. Ви можете прикріпити файли або електронні таблиці, щоб додати контекст до вашого запитання. Після запуску з'являється бічна панель із зведенням виконаних кроків і використаних джерел.
Глибоке дослідження може займати від 5 до 30 хвилин, залежно від складності, заглиблюючись у вебпростір. У цей час ви можете відійти або зайнятися іншими справами — ви отримаєте сповіщення, коли дослідження буде завершено. Фінальний результат надходить у вигляді звіту в чаті — а протягом наступних кількох тижнів ми також додамо вбудовані зображення, візуалізації даних і додаткові аналітичні матеріали для більшої ясності та контексту.
Порівняно з Deep Research, GPT‑4o ідеально підходить для мультимодальних розмов у реальному часі. Для багатогранних, специфічних для галузі запитів, де глибина й деталізація є критично важливими, здатність Deep Research проводити всебічне дослідження та цитувати кожне твердження є різницею між швидким зведенням і добре задокументованою, перевіреною відповіддю, яку можна використовувати як готовий робочий продукт.
GPT-4o
Глибоке дослідження
Deep Research відповідає на запит дуже детально, надаючи паралельні дані для 10 розвинених країн і 10 країн, що розвиваються, для зручного порівняння та довідки. Він використовує цю інформацію, щоб запропонувати детальні рекомендації щодо виходу на ринок, які є обґрунтованими та корисними.
Deep Research було навчено за допомогою наскрізного навчання підкріпленням на складних завданнях з перегляду та міркувань у різних галузях. Завдяки цьому навчанню він навчився планувати та виконувати багатоетапні дії з пошуку необхідних даних, повертаючись назад і реагуючи на інформацію в реальному часі, де це необхідно. Модель також здатна переглядати файли, завантажені користувачами, будувати та взаємодіяти з графіками за допомогою інструменту Python, вбудовувати як створені графіки, так і зображення з вебсайтів у свої відповіді, а також цитувати конкретні речення або уривки з джерел. Внаслідок цього навчання досягаються нові вершини у низці публічних оцінок, зосереджених на реальних проблемах.
У Humanity’s Last Exam(відкривається у новому вікні) — нещодавно опублікованому оцінюванні, що перевіряє ШІ на експертному рівні в широкому спектрі дисциплін — модель, яка забезпечує роботу глибокого дослідження, досягла нового максимуму: 26,6% точності. Цей тест складається з понад 3000 запитань з вибором відповіді та коротких відповідей більш ніж у 100 галузях — від лінгвістики до ракетобудування, від класичних студій до екології. Порівняно з OpenAI o1 найбільший прогрес спостерігався в хімії, гуманітарних і соціальних науках та математиці. Модель, яка забезпечує роботу глибокого дослідження, продемонструвала наближений до людського підхід, ефективно знаходячи спеціалізовану інформацію за потреби.
| Модель | Точність (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| Глибоке дослідження OpenAI** | 26,6 |
У GAIA(відкривається у новому вікні)1, публічному бенчмарку, який оцінює ШІ за реальними запитаннями, модель, що забезпечує роботу глибокого дослідження, досягає нового найвищого результату (SOTA), очолюючи зовнішню таблицю лідерів(відкривається у новому вікні). Охоплюючи питання трьох рівнів складності, успішне виконання цих завдань вимагає таких навичок, як міркування, мультимодальна обізнаність, вебперегляд і вміння працювати з інструментами.
| GAIA | ||||
|---|---|---|---|---|
| Рівень 1 | Рівень 2 | Рівень 3 | Середнє | |
| Попередній SOTA(відкривається у новому вікні) | 67,92 | 67,44 | 42,31 | 63,64 |
| Deep Research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Глибоке дослідження (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Приклади завдань GAIA
Внутрішня оцінка експертних завдань у різних сферах показала, що глибоке дослідження, за оцінками профільних експертів, автоматизувало багато годин складної ручної роботи.
Рівень успішності порівняно з максимальною кількістю викликів інструментів
Приклади завдань експертного рівня
Рівень успішності у виконанні експертних завдань за оціночною економічною цінністю
Рівень успішності виконання експертних завдань за годинами
Глибоке дослідження відкриває значні нові можливості, проте це все ще рання версія з певними обмеженнями. Інколи воно може вигадувати факти або робити неправильні висновки, хоча значно рідше, ніж попередні моделі ChatGPT, згідно з внутрішніми оцінками. Йому може бути важко розрізняти авторитетну інформацію та чутки, і наразі воно демонструє слабкість у калібруванні впевненості, часто неточно передаючи рівень невизначеності. На старті можливі незначні помилки форматування у звітах і цитуваннях, а запуск деяких задач може займати більше часу. Ми очікуємо, що всі ці аспекти швидко покращаться з накопиченням використання та часу.
Глибоке дослідження в ChatGPT наразі є дуже ресурсомістким. Чим довше триває опрацювання запиту, тим більше обчислювальних ресурсів потрібно. Ми запускаємо версію, оптимізовану для користувачів Pro, із лімітом до 100 запитів на місяць. Користувачі Plus і Team отримають доступ наступними, після них — Enterprise. Ми все ще працюємо над наданням доступу користувачам у Сполученому Королівстві, Швейцарії та Європейській економічній зоні.
Усі платні користувачі невдовзі отримають суттєво вищі ліміти завдяки швидшій і економнішій версії глибокого дослідження на основі меншої моделі, яка все ще забезпечує високу якість результатів.
У найближчі тижні та місяці ми працюватимемо над технічною інфраструктурою, уважно стежитимемо за поточним релізом та проводитимемо ще ретельніше тестування. Це узгоджується з нашим принципом поетапного розгортання. Якщо всі перевірки безпеки й надалі відповідатимуть нашим вимогам до релізу, ми плануємо надати глибоке дослідження користувачам Plus приблизно за місяць.
Deep Research відсьогодні доступний у веб-версії ChatGPT і буде впроваджений у мобільні та десктопні програми протягом місяця. Наразі Deep Research може отримати доступ до відкритого вебу та будь-яких завантажуваних файлів. У майбутньому ви зможете підключитися до більш спеціалізованих джерел даних — розширюючи доступ до ресурсів на основі передплати або внутрішніх ресурсів — щоб зробити його результати ще більш надійними та персоналізованими.
Дивлячись у майбутнє, ми уявляємо, як агентні можливості поєднаються в ChatGPT, забезпечуючи асинхронні дослідження та виконання завдань у реальних сценаріях. Поєднання «Глибокого дослідження», яке може асинхронно проводити онлайн-пошук, та системи Operator, яка здатна виконувати дії у реальному світі, дасть змогу ChatGPT виконувати для вас дедалі складніші завдання.
Додаток від 3 лютого 2025 року: Ми провели ретельне тестування безпеки, оцінку готовності та перегляд механізмів управління для ранньої версії o3, на якій працює «Глибоке дослідження», і визначили її як ризик середнього рівня(відкривається у новому вікні). Ми також провели додаткове тестування безпеки, щоб краще зрозуміти можливі додаткові ризики, пов’язані зі здатністю «Глибокого дослідження» переглядати веб-сторінки, та впровадили нові запобіжні заходи. Ми й надалі ретельно тестуватимемо й уважно відстежуватимемо поточний обмежений реліз. Коли ми розширимо доступ для користувачів Plus, ми опублікуємо систему-картку з нашими висновками щодо безпеки та впровадженими захисними механізмами для «Глибокого дослідження».
Виноски
- 1
Ми з’ясували, що відповіді-«істинні значення» для цього датасету були широко злиті в інтернеті, і відповідно заблокували низку сайтів або URL, щоб забезпечити чесну оцінку моделі.
Автори
Дослідницькі керівники
Isa Fulford, Zhiqing Sun
Основні учасники
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Ключові учасники
Дослідження
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Впровадження
Карпус Чанг, Гаррі Чжао, Джозеф Трасатті, Джошуа Дікенс, Метт Кауфер, Майк Трпсік, Міннія Фенг, Ніл Аджарапу, Пітер Відані, Шон Фіцджеральд
Учасники
Дослідження
Ахмед Ель-Кішкі, Ей Джей Остров, Александр Вей, Андрій Георге, Ендрю Кондріч, Андрій Міщенко, Ануй Наїр, Бехруз Горбані, Брайдон Істман, Чак Лі, Фойвос Цимпурлас, Френсіс Сонг, Джамбаттіста Параскандоло, Гілдас Шабо, Гессам Багерінежад, Хайтан Ху, Хонг'ю Рен, Генрі Аспегрен, Гантер Лайтман, Ілля Костріков, Ілге Аккая, Джеймс Леннон, Жан Харб, Джонатан Ворд, Кай Чен, Кеті Ші, Кевін Лю, Кевін Ю, Манука Стратта, Марвін Чжан, Меньюань Ян, Мостафа Роханінежад, Ноам Браун, Фібі Текер, Раз Гоан, Реа Міяра, Спенсер Папай, Тейлор Гордон, Венда Чжоу, Венлей Сє, Яш Патіл, Ян Дюбуа, Юлун Ченг, Юші Ванг, Вайатт Томпсон
+ усі учасники команди o3.
Системи безпеки
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Розгортання
Адам Коппел, Адам Веллс, Адель Лі, Енді Епплбаум, Андрій Малевич, Ендрю Дуберстайн, Ендрю Гауелл, Антон Тананаєв, Ешлі Тайра, Брендон Волкін, Браян Ешлі, Кері Басін, Кері Гадсон, Корі Декаро, Крістіна Шо, Дерек Чен, Дібія Бхаттачарджі, Дреа Лопес, Ерік Антонов, Ерік Берк, Філіппо Расо, Фотіс Чантзіс, Фредді Суліт, Гарріс Коен, Гізер Вітні, Джей Діксіт, Джеффрі Хан, Джен Робінсон, Джессіка Шіє, Джоел Паріш, Кан Ву, Кевін Гладстон, Кшитідж Вадхва, Лео Вандріел, Лейтон Хо, Лян Чен, Мадлен Крістіан, Меймі Рейнголд, Метт Джонс, Мішель Фрадін, Майк МакКлей, Мінксуан Ванг, Начо Сото, Ніко Фелікс, Патрік Делані, Пол Макміллан, Філіп Пронін, Родріго Ріаза Перес, Самуель Місерендіно, Скотт Етерсміт, Стівен Болдуін, Томас Дімсон, Томо Хірацука, Ямінг Лін, Яра Хакбаз, Їнін Чен
Лідерство
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba