Представяне на задълбочени проучвания
Агент, който използва разсъждения, за да синтезира големи количества онлайн информация и да изпълнява многоетапни изследователски задачи вместо вас. Наличен е за потребителите на Pro днес, а след това за Plus и Team.
Актуализация от 10 февруари 2026 г.: Вече можете да свържете дълбоко проучване към всеки MCP или приложение и да ограничите уеб търсенията до доверени сайтове, за да се фокусирате върху удостоверени, индустриални стандартни източници. Вече можете също така да проследявате напредъка в реално време и да прекъсвате, за да прецизирате с последващи подкани или нови източници. Актуализирахме визуалното изживяване, така че да е по-лесно да започнете, да проследявате и да преглеждате проучването си от начало до край.
Актуализация от 17 юли 2025 г.: Задълбочените проучвания вече могат да бъдат още по-дълбоки и по-широки с достъпа до визуален браузър като част от агента ChatGPT. За да получите достъп до тези актуализирани възможности, просто изберете „агентски режим“ от падащото меню в композитора и въведете директно заявката си. Първоначалната функционалност за задълбочено проучване остава достъпна чрез опцията „задълбочено проучване“ в менюто с инструменти.
Актуализация от 24 април 2025 г.: Значително увеличаваме честотата на използване на задълбочени проучвания – потребителите на Plus, Team, Enterprise и Edu вече получават 25 заявки на месец, Pro потребителите – 250, а Free – 5. Това е възможно благодарение на нова олекотена версия на задълбочените проучвания, задвижвана от версия на o4-mini, проектирана така, че да е по-икономична, като същевременно запазва високото качество. След като достигнете лимита си за пълната версия, заявките ви автоматично ще преминат към олекотената версия.
Актуализация от 25 февруари 2025 г.: Всички потребители на Plus вече могат да използват задълбочено проучване.
Актуализация от 5 февруари 2025 г.: Задълбочено проучване вече е на разположение на потребителите на Pro в Обединеното кралство, Швейцария и Европейското икономическо пространство.
Днес стартираме задълбочени проучвания в ChatGPT – нова агентна способност, която извършва многоетапни изследвания в интернет за сложни задачи. За десетки минути те извършват това, което на човек би отнело много часове.
Задълбоченото проучване е следващият агент на OpenAI, който може да върши работа вместо вас самостоятелно – дайте му подкана и ChatGPT ще намери, анализира и синтезира стотици онлайн източници, за да създаде изчерпателен доклад на нивото на анализатор. Задвижван от версия на предстоящия модел OpenAI o3, която е оптимизирана за сърфиране в интернет и анализ на данни, той използва разсъждения за търсене, интерпретиране и анализ на огромни количества текст, изображения и PDF файлове в интернет, като при необходимост се променя в зависимост от информацията, с която се сблъсква.
Способността за синтезиране на знания е предпоставка за създаване на нови знания. Поради тази причина задълбочените проучвания са важна стъпка към по-широката ни цел за разработване на AGI, която отдавна си представяме като способна да доведе до нови научни изследвания.
Задълбочените проучвания са създадени за хора, които извършват интензивна работа, свързана със знания, в области като финанси, наука, политика и инженерство и се нуждаят от задълбочени, прецизни и надеждни проучвания. Могат да бъдат еднакво полезни и за взискателни купувачи, които търсят хиперперсонализирани препоръки за покупки, които обикновено изискват внимателно проучване, като автомобили, уреди и мебели. Всеки изход е напълно документиран, с ясни цитати и резюме на разсъжденията, което улеснява позоваването и проверката на информацията. Те са особено ефективни при намирането на нишова, неинтуитивна информация, която би изисквала преглеждане на множество уеб сайтове. Задълбочените проучвания освобождават ценно време, като ви позволяват да разтоварите и ускорите сложни, времеемки уеб проучвания само с едно запитване.
Задълбоченото проучване самостоятелно открива, разсъждава и консолидира информация от цялата мрежа. За да се постигне това, то беше обучено върху реални задачи, изискващи използване на браузър и инструменти на Python, използвайки същите методи на подсилващо обучение, които стоят зад OpenAI o1, нашия първи модел на разсъждаване. Въпреки че o1 демонстрира впечатляващи способности в областта на кодирането, математиката и други технически домейни, много предизвикателства в реалния свят изискват обширен контекст и събиране на информация от различни онлайн източници. Задълбоченото проучване се основава на тези възможности за разсъждаване, за да преодолее тази пропаст, позволявайки му да се справи с видовете проблеми, с които хората се сблъскват в работата и ежедневието си.
В ChatGPT изберете „задълбочено проучване“ в съставителя на съобщения и въведете вашата заявка. Кажете на ChatGPT от какво се нуждаете – независимо дали става дума за анализ на конкуренцията в платформите за поточно предаване или за персонализиран доклад за най-добрия велосипед за пътуване до работа. Можете да прикачите файлове или електронни таблици, за да добавите контекст към въпроса си. След като започне да работи, се появява странична лента с резюме на предприетите стъпки и използваните източници.
Задълбоченото проучване може да отнеме от 5 до 30 минути, за да завърши работата си, като отделя необходимото време за задълбочено проучване в интернет. Междувременно можете да се оттеглите или да работите по други задачи – ще получите уведомление, когато проучването приключи. Крайният резултат пристига като доклад в чата – през следващите няколко седмици ще добавяме в тези доклади вградени изображения, визуализации на данни и други аналитични изходи за допълнителна яснота и контекст.
В сравнение със задълбочено проучване GPT‑4o е идеален за мултимодални разговори в реално време. При многостранните запитвания, специфични за домейна, при които дълбочината и детайлите са от решаващо значение, способността на задълбоченото проучване да извършва обширно проучване и да цитира всяко твърдение е разликата между бързото резюме и добре документирания, проверен отговор, който може да се използва като работен продукт.
GPT-4o
Задълбочено проучване
Задълбоченото проучване отговаря на подканата по много подробен начин, като предоставя данни за отделните държави, както за топ 10 развити държави, така и за топ 10 развиващи се държави, за да може лесно да се направи справка и сравнение. То употребява тази информация, за да предложи подробни препоръки за навлизане на пазара, които са добре обосновани и приложими.
Задълбоченото проучване беше обучено с помощта на цялостно подсилващо обучение за трудни задачи за сърфиране и разсъждаване в различни домейни. По време на това обучение то се научи да планира и изпълнява многоетапна траектория за намиране на необходимите данни, като при необходимост се връща назад и реагира на информация в реално време. Моделът също така може да разглежда файлове, качени от потребители, да начертава и итерира графики с помощта на инструмента Python, да вгражда както генерирани графики, така и изображения от уеб сайтове в своите отговори и да цитира конкретни изречения или пасажи от своите източници. В резултат на това обучение, то достига нови върхове в редица публични оценки, насочени към проблеми от реалния свят.
В „Последният изпит на човечеството“(отваря се в нов прозорец), наскоро публикувана оценка, която тества ИИ в широк спектър от теми с въпроси на експертно ниво, моделът, който захранва задълбочени проучвания, постига нов рекорд с точност от 26,6%. Този тест се състои от над 3000 въпроса с избираем и кратък отговор по повече от 100 предмета – от лингвистика до ракетостроене, от класика до екология. В сравнение с OpenAI o1, най-големите подобрения се появиха в химията, хуманитарните и социалните науки, както и в математиката. Моделът, който захранва задълбочени проучвания, демонстрира човешки подход, като ефективно търси специализирана информация, когато е необходимо.
| Модел | Точност (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (средно)* | 10,5 |
| OpenAI o3-mini (високо)* | 13,0 |
| OpenAI задълбочено проучване | 26,6 |
На GAIA(отваря се в нов прозорец)1, публичен еталон, който оценява ИИ по въпроси от реалния свят, моделът, захранващ задълбочени проучвания, достига ново най-съвременно (SOTA) ниво, оглавявайки външната класация(отваря се в нов прозорец). Обхващайки въпроси на три нива на трудност, успешното изпълнение на тези задачи изисква способности, включително разсъждение, многомодална плавност, сърфиране в интернет и владеене на инструменти.
| GAIA | ||||
|---|---|---|---|---|
| Ниво 1 | Ниво 2 | Ниво 3 | Средно | |
| Предишна версия на SOTA(отваря се в нов прозорец) | 67,92 | 67,44 | 42,31 | 63,64 |
| Задълбочено проучване (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Задълбочено проучване (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Примери за задачи на GAIA
При вътрешна оценка на задачите на експертно ниво в редица области експертите в домейна оцениха, че задълбочените проучвания са автоматизирали много часове трудно ръчно проучване.
Процент на успешно преминаване спрямо макс. извиквания на инструменти
Примери за задачи на експертно ниво
Процент на успешно преминаване на задачи на експертно ниво според очакваната икономическа стойност
Процент на успешно преминаване на задачи на експертно ниво по очаквани часове
Задълбоченото проучване отключва значителни нови възможности, но все още е в ранен етап и има ограничения. Понякога може да халюцинира факти в отговорите или да прави грешни заключения, макар че според вътрешните оценки това е в значително по-малка степен от съществуващите модели на ChatGPT. Възможно е да изпитва затруднения при разграничаването на достоверна информация от слухове и понастоящем показва слабости при калибрирането на доверието, като често не успява да предаде точно несигурността. При стартиране може да има малки грешки при форматирането на отчети и цитати, а стартирането на задачите да отнеме повече време. Очакваме всички тези проблеми бързо да се подобрят с по-дълго използване и време.
Задълбочените проучвания в ChatGPT в момента са много изчислително интензивни. Колкото повече време отнема проучването на дадена заявка, толкова повече изчислителна мощност за извод е необходима. Започваме с версия, оптимизирана за Pro потребители днес, с до 100 заявки на месец. Потребителите на Plus и Team ще получат достъп след това, а след това и на Enterprise. Все още работим за осигуряване на достъп на потребителите в Обединеното кралство, Швейцария и Европейското икономическо пространство.
Всички платени потребители скоро ще получат значително по-високи тарифни лимити, когато пуснем по-бърза и по-рентабилна версия на задълбочените проучвания, задвижвана от по-малък модел, който все още осигурява висококачествени резултати.
През следващите седмици и месеци ще работим върху техническата инфраструктура, ще следим отблизо текущото издание и ще провеждаме още по-строги тестове. Това е в съответствие с нашия принцип на итеративно внедряване. Ако всички проверки за безопасност продължат да отговарят на стандартите ни за пускане в експлоатация, очакваме да пуснем задълбоченото проучване за потребителите на Plus след около месец.
Задълбоченото проучване е налично от днес в уеб сайта на ChatGPT, а до месец ще бъде пуснато и в мобилните и настолните приложения. Понастоящем задълбочените проучвания имат достъп до отворената мрежа и до всички качени файлове. В бъдеще ще можете да се свързвате с по-специализирани източници на данни – ще разширите достъпа до абонаментни или вътрешни ресурси – за да направите изходите още по-стабилни и персонализирани.
С поглед към бъдещето, ние си представяме как агентните преживявания се обединяват в ChatGPT за асинхронни изследвания и изпълнение в реалния свят. Комбинацията от задълбочени проучвания, които могат да извършват асинхронно онлайн разследване, и Operator, който може да предприема реални действия, ще активира ChatGPT да изпълнява все по-сложни задачи за вас.
Допълнение от 3 февруари 2025 г.: Проведохме строги тестове за безопасност, оценки на готовността и прегледи на управлението на ранната версия на o3, която захранва задълбочените проучвания, идентифицирайки я като среден(отваря се в нов прозорец) риск. Проведохме и допълнителни тестове за безопасност, за да разберем по-добре постепенните рискове, свързани със способността на задълбочените проучвания да разглеждат мрежата, и добавихме нови мерки за смекчаване. Ще продължим да тестваме задълбочено и внимателно да наблюдаваме текущото ограничено издание. Ще споделим нашите прозрения за безопасността и предпазни мерки за задълбочените проучвания в картата на системата, когато разширим достъпа до потребителите на Plus.
Бележки под линия
- 1
Установихме, че достоверните отговори за този набор от данни бяха широко разпространени онлайн и съответно блокирахме няколко уеб сайта или URL адреса, за да осигурим справедлива оценка на модела.
Автори
Ръководители на изследвания
Isa Fulford, Zhiqing Sun
Основополагащи сътрудници
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney и Valerie Qi
Основни сътрудници
Проучване
Илейн Я Ле, Ерик Мичъл, Ерик Уолъс, Хьонг Уон Чунг, Игнаси Клавера, Лео Лиу, Лоренц Кун, Луи Фьоврие, Макс Шварцер, Саачи Джаин, Скоти Ян, Шуню Яо, Витчир Понг
Внедряване
Карпус Чанг, Хари Джао, Джоузеф Трасати, Джошуа Дикенс, Мат Кауфер, Майк Трпчич, Миния Фенг, Нийл Аджарапу, Питър Видани, Шон Фицджералд
Сътрудници
Проучване
Ахмед Ел-Кишки, Ей Джей Остроу, Александър Вей, Андрей Георге, Андрю Кондрич, Андрей Мишченко, Ануж Наир, Бехруз Горбани, Брайдън Истман, Чак Ли, Фойвос Цимпурлас, Франсис Сонг, Джамбатиста Параскандоло, Гилдас Шабо, Хесам Багеринеждад, Хайтан Ху, Хонгю Рен, Хенри Аспегрен, Хънтър Лайтман, Иля Костриков, Илге Аккая, Джеймс Ленън, Жан Харб, Джонатан Уорд, Кай Чен, Кати Ши, Кевин Лиу, Кевин Ю, Манука Страта, Марвин Джан, Менгюан Ян, Мостафа Роханинеджад, Ноам Браун, Фийби Тъкър, Раз Гоан, Риа Мияра, Спенсър Папай, Тейлър Гордън, Венда Джоу, Уенлей Сие, Яш Патил, Ян Дюбоа, Юлонг Ченг, Юши Ванг, Уайът Томпсън
+ всички сътрудници към o3.
Системи за безопасност
Адам Калай, Алекс Бойтел, Андреа Валоне, Анди Апълбаум, Дейвид Робинсън, Елизабет Проел, Евън Мейс, Грейс Жао, Ирина Кофман, Джейсън Фанг, Хоакин Куинонеро Кандела, Джоел Париш, Кевин Лиу, Кристен Инг, Лама Ахмад, Леон Максин, Лейтън Хо, Меган Шах, Мишел Уанг, Майлс Уанг, Филип Гуо, Оливия Уоткинс, Оуен Кембъл-Мур, Патрик Чао, Сам Тойзер, Самюел Мисерендино, Сандхини Агарвал, Теджал Патвардхан, Тина Срискандараджа, Трой Петерсън, Яодун Ю, Юнюн Уанг
Внедряване
Адам Копел, Адам Уелс, Адел Ли, Анди Апълбаум, Андрей Малевич, Андрю Дюберщайн, Андрю Хауел, Антон Тананаев, Ашли Тайра, Брандън Уокин, Брайън Ашли, Кари Басин, Кари Хъдсън, Кори Декаро, Кристина Шо, Дерек Чен, Дибя Бхаттачарджи, Дреа Лопес, Ерик Антонов, Ерик Бърк, Филипо Расо, Фотис Чанцис, Фреди Сулит, Харис Коен, Хедър Уитни, Джей Диксит, Джефри Хан, Джен Робинсън, Джесика Шие, Джоел Париш, Кан Ву, Кевин Гладстон, Кшитидж Вадхва, Лео Вандриел, Лейтън Хо, Лианг Чен, Маделин Кристиан, Мами Рейнголд, Мат Джоунс, Мишел Фрадин, Майк МакКлей, Минксуан Ванг, Начо Сото, Нико Феликс, Патрик Дилейни, Пол Макмилън, Филип Пронин, Родриго Риаза Перес, Самуел Мисерендино, Скот Етърсмит, Стивън Болдуин, Томас Димсън, Томо Хирацука, Ямин Лин, Яра Хакбаз, Йининг Чен
Лидерство
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman и Wojciech Zaremba