Перейти до основного вмісту
OpenAI

2 лютого 2025 р.

Випуск

Впровадження глибоких досліджень

Агент, який використовує логіку, щоб узагальнювати великі обсяги онлайн-інформації та виконувати за вас багатокрокові дослідницькі завдання. Сьогодні доступний для користувачів Pro, згодом — для Plus і Team.

Завантаження…

Оновлення від 10 лютого 2026 року: Тепер ви можете підключати Deep Research до будь-якого MCP або програми та обмежувати веб-пошук довіреними сайтами, дозволивши брати інформацію лише з підтверджених джерел, що відповідають галузевим стандартам. Ви також можете відстежувати прогрес у реальному часі та переривати процес, щоб уточнити його за допомогою наступних запитів або нових джерел. Крім того, ми оновили візуальне оформлення, щоб вам було простіше розпочинати, відстежувати та переглядати ваше дослідження.


Оновлення від 17 липня 2025 р.: Глибокі дослідження тепер можуть бути ще глибшими та ширшими завдяки доступу до візуального браузера як частини агента ChatGPT. Щоб отримати доступ до цих оновлених можливостей, просто виберіть «режим агента» у випадаючому меню редактора та введіть свій запит напряму. Оригінальна функція глибокого дослідження залишається доступною через опцію «deep research» в меню інструментів.


Оновлення від 24 квітня 2025 року: Ми суттєво збільшуємо частоту використання глибокого дослідження — користувачі Plus, Team, Enterprise та Edu тепер отримують 25 запитів на місяць, Pro — 250, а Free — 5. Це стало можливим завдяки новій полегшеній версії глибокого дослідження на основі o4-mini, створеній для більшої економічності за збереження високої якості. Після досягнення ліміту на повну версію запити автоматично перемикатимуться на полегшену.


Оновлення від 25 лютого 2025 року: Усі користувачі Plus тепер можуть використовувати глибоке дослідження.


Оновлення від 5 лютого 2025 року: Глибоке дослідження стало доступним користувачам Pro у Сполученому Королівстві, Швейцарії та Європейській економічній зоні.


Сьогодні ми запускаємо глибоке дослідження в ChatGPT — нову агентну можливість, яка виконує багатокрокові дослідження в інтернеті для складних завдань. Воно виконує за десятки хвилин те, на що людині знадобилися б багато годин.

Глибоке дослідження — це наступний агент OpenAI, який може самостійно виконувати роботу для вас: ви задаєте запит, і ChatGPT знаходить, аналізує та синтезує сотні онлайн-джерел, щоб створити комплексний звіт на рівні аналітика-дослідника. Працюючи на версії майбутньої моделі OpenAI o3, оптимізованої для вебперегляду та аналізу даних, воно використовує міркування для пошуку, інтерпретації та аналізу великих обсягів текстів, зображень і PDF-файлів в інтернеті, коригуючи хід роботи відповідно до нової інформації.

Здатність структурувати знання є передумовою для створення нових знань. Із цієї причини Deep Research є важливим кроком до нашої ширшої мети — розвитку AGI, якого ми давно уявляємо здатним до нових наукових досліджень.

Для чого ми створили Deep Research

Глибоке дослідження створено для людей, які працюють з інтенсивним обсягом знань — у сферах фінансів, науки, політики та інженерії — і потребують ретельних, точних і надійних досліджень. Воно може бути однаково корисним і для вибагливих покупців, які шукають максимально персоналізовані рекомендації щодо товарів, купівля яких зазвичай потребує ретельного аналізу, як-от автомобілі, побутова техніка чи меблі. Кожен результат повністю задокументований, із чіткими цитуваннями та підсумком міркувань, що полегшує перевірку та використання інформації. Воно особливо ефективне у пошуку нішевої, неочевидної інформації, яка зазвичай потребує перегляду численних сайтів. Глибоке дослідження звільняє цінний час, дозволяючи передати складну, тривалу роботу з вебдосліджень всього одним запитом.

Глибоке дослідження самостійно виявляє, аналізує та узагальнює дані з усього інтернету. Щоб реалізувати це, його навчали на реальних завданнях, що потребували браузера та інструментів Python, використовуючи ті самі методи навчання з підкріпленням, що й у OpenAI o1 — нашій першій моделі міркування. Хоча o1 демонструє вражаючі здібності в програмуванні, математиці та інших технічних галузях, багато реальних задач вимагають широкого контексту та збору інформації з різних онлайн-джерел. Глибоке дослідження розширює ці можливості міркування, щоб перекрити цю прогалину, дозволяючи моделі працювати з задачами, які люди зустрічають у роботі та повсякденному житті.

Як використовувати Deep Research

У ChatGPT виберіть «Deep Research» в редакторі повідомлень і введіть ваш запит. Скажіть ChatGPT, що вам потрібно — скажімо, конкурентний аналіз потокових платформ, або персоналізований звіт про найкращий велосипед для поїздок на роботу. Ви можете прикріпити файли або електронні таблиці, щоб додати контекст до вашого запитання. Після запуску з'являється бічна панель із зведенням виконаних кроків і використаних джерел.

Глибоке дослідження може займати від 5 до 30 хвилин, залежно від складності, заглиблюючись у вебпростір. У цей час ви можете відійти або зайнятися іншими справами — ви отримаєте сповіщення, коли дослідження буде завершено. Фінальний результат надходить у вигляді звіту в чаті — а протягом наступних кількох тижнів ми також додамо вбудовані зображення, візуалізації даних і додаткові аналітичні матеріали для більшої ясності та контексту.

Порівняно з Deep Research, GPT‑4o ідеально підходить для мультимодальних розмов у реальному часі. Для багатогранних, специфічних для галузі запитів, де глибина й деталізація є критично важливими, здатність Deep Research проводити всебічне дослідження та цитувати кожне твердження є різницею між швидким зведенням і добре задокументованою, перевіреною відповіддю, яку можна використовувати як готовий робочий продукт.

GPT-4o

Help me find iOS and android adoption rates, % who want to learn another language, and change in mobile penetration, over the past 10 years, for top 10 developed and top 10 developing countries by GDP. Lay this info out in a table and separate stats into columns, and include recommendations on markets to target for a new iOS translation app from ChatGPT, focusing on markets ChatGPT is currently active in.

Compiling comprehensive data on iOS and Android adoption rates, the percentage of populations interested in learning another language, and changes in mobile penetration over the past decade for the top 10 developed and developing countries by GDP is challenging due to data limitations. However, based on available information, we can provide insights and recommendations for targeting markets with a new iOS translation app powered by ChatGPT.

Top 10 Developed Countries by GDP:

  1. United States
  2. Japan
  3. Germany
  4. United Kingdom
  5. France
  6. Italy
  7. Canada
  8. South Korea
  9. Australia
  10. Spain

Top 10 Developing Countries by GDP:

  1. China
  2. India
  3. Brazil
  4. Russia
  5. Indonesia
  6. Mexico
  7. Turkey
  8. Saudi Arabia
  9. Argentina
  10. South Africa

Insights:

  • iOS and Android Adoption Rates: Globally, Android holds a dominant market share of approximately 70.93%, while iOS accounts for about 28.32% as of 2024. In the United States, iOS leads with a 58.81% market share. Other developed countries like Japan, Canada, Australia, and the United Kingdom also show a higher preference for iOS devices. In contrast, developing countries such as India and Brazil have a higher prevalence of Android devices.
  • Interest in Language Learning: While specific percentages of populations interested in learning another language are not readily available, the global popularity of language learning apps like Duolingo, which had approximately 14.3 million downloads in July 2024, indicates a significant interest. This interest is likely higher in countries with diverse linguistic landscapes or where English is not the primary language.
  • Mobile Penetration Over the Past Decade: Mobile phone ownership has seen substantial growth globally. In the United States, smartphone ownership increased from 35% in 2011 to 91% in 2024. Developing countries have also experienced significant growth in mobile penetration, contributing to increased access to digital services.

Recommendations:

Considering the available data and focusing on markets where ChatGPT is currently active, the following developed countries are promising targets for a new iOS translation app:

  • United States: High iOS market share and significant interest in language learning.
  • United Kingdom: Substantial iOS user base and a multicultural population with diverse language needs.
  • Canada: Notable iOS adoption and a bilingual population (English and French), increasing the demand for translation services.

Among developing countries, the following are noteworthy:

  • China: Despite Android's dominance, the large population and growing interest in English and other languages present a significant opportunity.
  • India: High Android usage, but a growing middle class with increasing iOS adoption and a strong interest in language learning, especially English.
  • Brazil: Predominantly Android users, but with a sizable market for language learning apps, particularly for English and Spanish.

Focusing on these markets aligns with ChatGPT's current availability and leverages existing mobile adoption trends and language learning interests.

Глибоке дослідження

Help me find iOS and android adoption rates, % who want to learn another language, and change in mobile penetration, over the past 10 years, for top 10 developed and top 10 developing countries by GDP. Lay this info out in a table and separate stats into columns, and include recommendations on markets to target for a new iOS translation app from ChatGPT, focusing on markets ChatGPT is currently active in.

Top 10 Developed Economies (by GDP)Smartphone OS Share, Language-Learning Interest, and Mobile Penetration Growth

Country

iOS Market Share

Android Market Share

Interest in New Language

(% of population)

Mobile Penetration Change (2013→2023)

United States

(USA)

~58% iOS vs 42% Android

(see left)

High:

70% regret losing foreign-language ability (indicating strong desire to improve)

56%→82%

smartphone penetration (↑26 pp)

Japan

~69% iOS vs 31% Android

(see left)

High:

Over 50% want to learn English

~30%→79%

(approx.) (↑~50 pp)

Germany

~39% iOS vs 60% Android

(see left)

High:

86% of Europeans say everyone should speak ≥1 foreign language (strong pro-language attitude)

40%→82%

(↑42 pp)

United Kingdom

(UK)

~52% iOS vs 47% Android

(see left)

Moderate-High:

~73% have some interest (only 27% “no interest” in new languages)

62%→82%

(↑20 pp)

France

~35% iOS vs 64% Android

(see left)

High:

86% (EU average) favor multilingualism; English widely seen as important

42%→83%

(↑40 pp)

Italy

~30% iOS vs 69% Android

(see left)

High:

86% (EU avg.) favor language learning; 1 in 4 regret not learning another

41%→85%

(↑44 pp)

Canada

~60% iOS vs 40% Android

(see left)

Moderate:

Many bilingual (English/French); rising interest in third languages (no recent % data)

56%→~80%

(↑ ~24 pp) (est., similar to US)

South Korea

~24% iOS vs 76% Android

(see left)

Moderate:

Strong English education focus; ~40% of teens are learning English

73%→~95%

(↑ ~22 pp) – already very high by 2013 (near saturation now)

Australia

~55% iOS vs 45% Android

(see left)

Moderate:

~70% see learning languages as valuable (English dominant but interest in Asian languages growing)

65%→~85%

(↑ ~20 pp) (est., high smartphone use)

Spain

~20% iOS vs 79% Android

(see left)

High:

88% of Spaniards learned a foreign language in school (e.g. English); strong cultural interest

55%→~85%

(↑ ~30 pp) (est., nearing Western Europe peers)

Top 10 Developing/Emerging Economies (by GDP)(ChatGPT availability considered)

Country

iOS Market Share

Android Market Share

Interest in New Language

(notable stats)

Mobile Penetration Change (2013→2023)

China

^(ChatGPT restricted)

~24% iOS vs 75% Android

(see left)

Very High:

Hundreds of millions learning English (but ChatGPT not officially accessible)

47%→68%

(↑21 pp)

India

~4% iOS vs 95% Android

(see left)

High:

English compulsory in many schools; strong economic motivation (80% link English to higher income)

~5%→46%

(↑ ~41 pp) (huge jump in smartphone adoption)

Brazil

~18% iOS vs 82% Android

(see left)

High:

Great demand for English – only ~5% speak it, but most see it as key skill

26%→67%

(↑40 pp)

Russia

^(ChatGPT limited)

~30% iOS vs 69% Android

(see left)

Moderate:

English learning common (compulsory in school); interest exists but ChatGPT availability is uncertain

36%→74%

(↑38 pp)

Mexico

~24% iOS vs 76% Android

(see left)

High:

Strong desire to learn English for US job/migration; ~50% of students study English in school (est.)

37%→62%

(↑25 pp)

Indonesia

~12% iOS vs 88% Android

(see left)

High:

English seen as gateway skill; government programs to improve English proficiency

<30%→68%

(↑ ~40 pp)

Turkey

~15% iOS vs 85% Android (est.)

(see left)

High:

English highly valued (universal in education);

80%

link English to better jobs

30%→75%

(↑45 pp)

Saudi Arabia

~24% iOS vs 76% Android

(see left)

Moderate:

English widely taught; 92% smartphone ownership (many already bilingual in English/Arabic)

73%→~95%

(↑ ~22 pp) (early adopter; near saturation now)

South Africa

~16% iOS vs 83% Android

(see left)

High:

Multilingual society; English and Afrikaans taught alongside native languages – cultural impetus to learn others

40%→~60%

(↑ ~20 pp) (est., steady growth)

Argentina

~12% iOS vs 88% Android

(see left)

High:

Strong interest in English (Argentina leads Latin America in English proficiency)

31%→~70%

(↑ ~39 pp) (est., sharp rise with smartphone adoption)

Sources: Smartphone OS shares are from StatCounter/Statista data (2023–24). Language-interest metrics come from surveys by Preply, Eurobarometer, Babbel, etc. (e.g. UK 73% interest; US 70% regret lack of languages; Japan >50% want English; Pearson global survey). Mobile penetration is measured as smartphone ownership percentage – dramatic growth is noted in developing markets (e.g. Brazil +40 points) and high saturation in developed ones (e.g. UK ~82%) over the last decade.


Recommendations: Based on the above, prime targets for a new ChatGPT‑powered iOS translation app would be countries with large iOS user bases and strong language-learning demand, where ChatGPT is accessible. Notably, Japan, the U.S., UK, Canada, and Australia emerge as top choices. These markets pair high iOS adoption (50–60%+ share) with significant enthusiasm for language learning – for example, Japan’s iPhone dominance and widespread desire to learn English make it ideal. English-speaking countries like the US, UK, Canada, and Australia, despite being monolingual societies, show substantial interest in learning other languages (e.g. Spanish or French), and all have over 80% smartphone penetration and millions of iPhone users.

Among emerging economies, Mexico and Brazil stand out as secondary targets: although Android prevails, their sheer population sizes mean tens of millions of iPhone users exist, and interest in English is very high for career and education reasons. These Latin American markets (where ChatGPT is active) could yield strong adoption for an iOS-only app, especially given the motivation to learn English. Conversely, China and Russia are less feasible – China’s OS split skews Android and ChatGPT is not officially available there, and Russia faces access and regulatory uncertainties.

In summary, focus on iOS-heavy, pro-learning markets: Japan and Western countries (US, UK, Canada, Australia, plus high-income Europe like Germany and France to a lesser degree) should be the first-tier targets. They combine robust iOS usage with favorable language-learning attitudes. A second tier includes large-population developing markets (Mexico, Brazil, perhaps Saudi Arabia for its historically high iPhone uptake) where interest in English is strong – these can be approached once the app gains traction in the primary markets. Such a strategy ensures the app launches where it has the greatest alignment of platform (iOS) presence and user demand for translation/language tools, maximizing the likelihood of adoption and growth.

Deep Research відповідає на запит дуже детально, надаючи паралельні дані для 10 розвинених країн і 10 країн, що розвиваються, для зручного порівняння та довідки. Він використовує цю інформацію, щоб запропонувати детальні рекомендації щодо виходу на ринок, які є обґрунтованими та корисними.

Як це працює

Deep Research було навчено за допомогою наскрізного навчання підкріпленням на складних завданнях з перегляду та міркувань у різних галузях. Завдяки цьому навчанню він навчився планувати та виконувати багатоетапні дії з пошуку необхідних даних, повертаючись назад і реагуючи на інформацію в реальному часі, де це необхідно. Модель також здатна переглядати файли, завантажені користувачами, будувати та взаємодіяти з графіками за допомогою інструменту Python, вбудовувати як створені графіки, так і зображення з вебсайтів у свої відповіді, а також цитувати конкретні речення або уривки з джерел. Внаслідок цього навчання досягаються нові вершини у низці публічних оцінок, зосереджених на реальних проблемах.

Humanity's Last Exam

У Humanity’s Last Exam(відкривається у новому вікні) — нещодавно опублікованому оцінюванні, що перевіряє ШІ на експертному рівні в широкому спектрі дисциплін — модель, яка забезпечує роботу глибокого дослідження, досягла нового максимуму: 26,6% точності. Цей тест складається з понад 3000 запитань з вибором відповіді та коротких відповідей більш ніж у 100 галузях — від лінгвістики до ракетобудування, від класичних студій до екології. Порівняно з OpenAI o1 найбільший прогрес спостерігався в хімії, гуманітарних і соціальних науках та математиці. Модель, яка забезпечує роботу глибокого дослідження, продемонструвала наближений до людського підхід, ефективно знаходячи спеціалізовану інформацію за потреби.

МодельТочність (%)
GPT-4o3,3
Grok-23,8
Claude 3.5 Sonnet4,3
Gemini Thinking6,2
OpenAI o19,1
DeepSeek-R1*9,4
OpenAI o3-mini (medium)*10,5
OpenAI o3-mini (high)*13,0
Глибоке дослідження OpenAI**26,6
* Модель не є мультимодальною, оцінювалася лише на текстовій підмножині.
**з пошуком + інструментами Python

GAIA

У GAIA(відкривається у новому вікні)1, публічному бенчмарку, який оцінює ШІ за реальними запитаннями, модель, що забезпечує роботу глибокого дослідження, досягає нового найвищого результату (SOTA), очолюючи зовнішню таблицю лідерів(відкривається у новому вікні). Охоплюючи питання трьох рівнів складності, успішне виконання цих завдань вимагає таких навичок, як міркування, мультимодальна обізнаність, вебперегляд і вміння працювати з інструментами.

GAIA
Рівень 1Рівень 2Рівень 3Середнє
Попередній SOTA(відкривається у новому вікні)67,9267,4442,3163,64
Deep Research (pass@1)74,2969,0647,667,36
Глибоке дослідження (cons@64)78,6673,2158,0372,57

Приклади завдань GAIA

In Nature journal's Scientific Reports conference proceedings from 2012, in the article that did not mention plasmons or plasmonics, what nano-compound is studied? Don't use the prefix nano in your answer if there is one.

[The remaining Chain-of-Thought messages and the final answer are hidden to protect the benchmark's ground truth answer.]

Уточнення пошуку

Я узагальнюю запит на статтю 2012 року у Scientific Reports, яка описує наносполуку, виключаючи всі, що стосуються плазмоніки. Ймовірно, це передбачає фільтрування за конкретними темами або сполуками, такими як срібло чи графен.

Узагальнення деталей

Я роблю підзапит «Scientific Reports 2012 nanoparticle», ймовірно шукаючи наносполуки. Цікавить відсівання плазмонних тем, можливо зосередження на сріблі, графені або квантових точках.

[пошукова дія]

Навігація фільтрами пошуку

Я досліджую розширені фільтри пошуку на nature.com і Scientific Reports за 2012 рік, намагаючись знайти статті про аморфні наночастинки вуглецю в харчових карамелях.

Виявлення матеріалів конференції

Результати пошуку показують матеріал конференції під назвою «2D quasiperiodic plasmonic crystals» за 2012 рік, імовірно у розділі «Conference Proceedings» у Scientific Reports.

[пошук]

Роздуми про можливі проблеми

Я розглядаю причини неправильного відображення вебсторінки, ймовірно через застарілий тип агента або випадкове блокування.

[пошук]

Розгляд динамічних опцій

Я думаю про сайт із динамічним контентом або кешованою версією. Як варіант, спробую пошукати конкретні фрази, це може допомогти.

[пошукова дія]

Визначення ключових характеристик

Гаразд, я визначаю чотири матеріали конференції 2012 року у Sci Rep. Деякі з них згадують «plasmonic», і їх слід виключити.

[пошук]

Узагальнення висновків

Я збираю інформацію про доступ до кешованих версій або розширень фрагментів для конкретних заголовків, щоб забезпечити всебічний аналіз.

[пошукова дія]

Узагальнення деталей

Я фіксую логіку переходу від весняної конференції European Materials Research Society 2012 року до наукової публікації, зосереджуючись на матеріалах конференції. Це допомагає встановити контекст і релевантність.

[пошукова дія]

Відстеження журналів

Намагаюся пов’язати матеріали конференції кінця 2012 року з журналом «Scientific Reports», зосереджуючись на плазмонних 2D квазиперіодичних матеріалах. Підхід виглядає методичним і точним.

[пошукова дія]

Аналізування деталей події

Зазначаю, що результати пошуку [8] містять сторінку, яка, ймовірно, підсумовує весняну зустріч Європейського товариства досліджень матеріалів 2012 року, включаючи 25 симпозіумів.

[пошук]

Узагальнення дослідження

Я досліджую ймовірну сторінку збірки з чотирма статтями, розглядаючи плазмонні та метаматеріальні теми, і визначаю ключові посилання з весняної конференції European Materials Research Society 2012 року.

[пошук]

Визначення фокусу

Я зосереджуюся на матеріалах конференції 2012 року в «Scientific Reports» від E-MRS, ймовірно, на темах «2D квазіперіодичні плазмонні кристали» та «Багатошарові плазмонні плащі для налаштування оптичного розсіювання на нанорівні».

[пошук]

Оцінювання бібліотечних джерел

Обмірковую спеціальний випуск E-MRS 2012 Sci Rep, запрошену статтю Monticone і лабораторію метаматеріалів у розділі News Archives – 2012.

[пошук]

Оцінювання доступності

Я збираю інформацію про потенційні проблеми з доступом до сайту, оцінюючи застарілість або блокування. Також оцінюю сайт Monticone на предмет переліку джерел.

[пошук]

Складання E-MRS 2012

Я намагаюся пов’язати «Layered Plasmonic Cloaks» з E-MRS 2012. Розглядаю інші можливі теми, як-от графен і каталіз.

[пошук]

Визначення відповідних тем

Я збираю інформацію про теми на кшталт графену, фотоелектрики й наноструктурованих сполук, виключаючи плазмонні теми. Це спрямовує мене на ширші нанотехнологічні аспекти.

[пошук]

Коригування фокусу

Я розширюю параметри пошуку, вводячи конкретні ідентифікатори сайтів та наукових ресурсів, щоб знайти статті про 2D квазиперіодичні плазмонні кристали в Nature Scientific Reports за 2012 рік.

[пошукова дія]

Визначення неплазмонних можливостей

Я звужую пошук, щоб визначити статті зі спеціального випуску E-MRS 2012 у Scientific Reports. Це включає перевірку назв на предмет неприсутності плазмонних тем, наприклад графену або функціональних оксидів. Прогрес очевидний завдяки цілеспрямованим пошукам та виключенню плазмонних статей.

[пошукова дія]

Узагальнення підказок

Я аналізую взаємодії в графеновій суперрешітці, ймовірно, зі статті Sci Rep. Розглядаю назви творів за авторами, такими як Падору, Яковлев, Чен і Алу.

[пошукова дія]

Складання всіх частин воєдино

Я збираю інформацію про матеріали Sci Rep весняної зустрічі E-MRS 2012, зосереджуючись на запрошених доповідях, без тих, що про плазмонні явища. Розглядаються такі типи матеріалів, як графен, каталіз, енергетичні матеріали, наномедицина та сенсори.

[пошукова дія]

Завдання експертного рівня

Внутрішня оцінка експертних завдань у різних сферах показала, що глибоке дослідження, за оцінками профільних експертів, автоматизувало багато годин складної ручної роботи.

Рівень успішності порівняно з максимальною кількістю викликів інструментів
Рівень успішностіМаксимальна кількість викликів інструментів
Чим більше модель переглядає і думає над тим, що вона переглядає, тим краще вона це робить, тому важливо дати їй час на роздуми.
Приклади завдань експертного рівня
Час, зекономлений на завданні: 4 години

I am a researcher interested in bringing mixed-gas sorption capabilities to my lab. Please discuss the differences between pure- and mixed-gas sorption for glassy polymers, how the dual-mode sorption model can be used to predict mixed-gas sorption behavior in glassy polymers (include equations where applicable), and what challenges there are in accurately predicting pure- and mixed-gas sorption using the dual-mode sorption model. Only include open-source information as of October 1, 2024.

Pure vs. mixed-gas sorption in glassy polymers: In a glassy polymer (below TgT_g), a single gas typically exhibits a concave sorption isotherm: uptake rises sublinearly with pressure, unlike the linear Henry’s-law behavior above TgT_g. This is attributed to “dual-mode” sorption: some penetrant dissolves in the dense polymer matrix (obeying Henry’s law) while additional penetrant saturates specific microvoid “sites” (a Langmuir-type adsorption in the polymer’s nonequilibrium free volume). By contrast, when two or more gases are present, they compete for those limited Langmuir sorption sites. As a result, each component’s sorbed concentration in a mixture is generally lower than it would be at the same partial pressure alone. In particular the less soluble (lower-affinity) gas tends to be more strongly suppressed, often causing the mixed-gas solubility selectivity (ratio of concentrations) to exceed the ideal value predicted from pure-gas isotherms. For example, in CO₂/CH₄ mixtures both components sorb less than in their pure-gas cases (especially CH₄), so the CO₂/CH₄ sorption selectivity is higher under mixture conditions. In extreme cases, mixed-gas effects can even reverse performance trends observed with single gases. (We note that unlike competitive sorption, synergistic sorption – where one gas increases the sorption of another via polymer swelling – is usually minor in rigid high-free-volume polymers under moderate pressures.)

Dual-mode sorption model and mixed-gas prediction: The dual-mode sorption (DMS) model quantitatively captures glassy polymer sorption by superposing a Henry’s-law term and a Langmuir term. For a single gas, the sorbed concentration CC (e.g. in cm³(STP) gas per cm³ polymer) is written as:

C(p)=kDp  +  CHbp1+bp.C(p) = k_D\,p \;+\; \frac{C'_H\,b\,p}{\,1 + b\,p\,}\,.

Here kDk_D is the Henry’s law coefficient for dissolution, CHC'_H is the Langmuir capacity constant (proportional to the polymer’s unrelaxed free-volume or “hole” capacity), and bb is the Langmuir affinity constant. This empirical formula yields the characteristic concave isotherm of glassy polymers and reduces to simple Henry’s law at the glass-transition (since CH0C'_H \to 0 as TTgT \to T_g). The same three parameters (kD,CH,bk_D, C'_H, b) are obtained by fitting pure-gas sorption data and are then used to predict mixture sorption. For a binary mixture of gases A and B (with partial pressures pA,pBp_A, p_B), the DMS model assumes each gas obeys its own Henry’s term and that both compete for the same Langmuir sites. One convenient form is to write the total sorbed concentration as the sum of contributions from each gas:

Ctot=kD,ApA+kD,BpB  +  CH,AbApA  +  CH,BbBpB1+bApA+bBpB,C_{\text{tot}} = k_{D,A}p_A + k_{D,B}p_B \;+\; \frac{\,C'_{H,A}\,b_A\,p_A \;+\; C'_{H,B}\,b_B\,p_B\,}{\,1 + b_A p_A + b_B p_B\,}\,,

which implicitly means the concentration of component i in the mixture is Ci=kD,ipi+CH,ibipi1+jbjpjC_i = k_{D,i} p_i + \frac{C'_{H,i} b_i p_i}{\,1+\sum_j b_j p_j\,}. This reduces to the single-gas formula when the other component’s pressure is zero. In practice, partial pressure in these equations is often replaced by fugacity for accuracy at high pressures, though using fugacities or pressures gives nearly the same results if applied consistently. The DMS mixed-gas model predicts the competitive sorption effect observed experimentally – namely, each gas’s uptake is depressed relative to its pure-gas sorption isotherm.

Challenges and limitations: Although the dual-mode model is widely successful in correlating sorption data, it has notable limitations in predicting sorption behavior. First, the DMS model is empirical – its fitted parameters are not universal constants but can vary with polymer formation history, physical aging, and temperature/pressure range. This means a parameter set obtained under one set of conditions may lack predictive power outside its calibration range. For instance, sorption isotherms measured only over a limited pressure range can be fit well by DMS, but extrapolating beyond that (especially approaching plasticization pressures) may be unreliable. Indeed, multiple distinct combinations of kDk_D, CHC'_H, bb can sometimes fit the same pure-gas isotherm almost equally well – yet they yield markedly different mixed-gas predictions. This sensitivity undermines confidence in mixture forecasts, as one study showed that using different pure-gas fit sets led to only qualitative agreement with some mixed-CO₂/CH₄ data.

Furthermore, DMS inherently assumes a fixed population of Langmuir sites (microvoids) and ignores polymer relaxation or swelling induced by sorbate. In reality, penetrant-induced swelling (plasticization) can increase free volume and sorption capacity, especially for highly condensable gases at high activity – an effect the basic DMS model cannot capture. In binary sorption, this means any synergistic increase in sorption due to a second gas (or due to polymer dilation) is unaccounted for in the standard model. Conversely, the model also cannot describe sorption isotherm shapes that deviate from concave Langmuir-type behavior (e.g. sigmoidal isotherms caused by specific polymer-penetrant interactions or clustering). For example, glassy polymers absorbing polar molecules like alcohols can show sigmoidal sorption isotherms, which the simple dual-mode framework fails to represent. Finally, accurately measuring mixed-gas sorption itself is challenging, and discrepancies between idealized model assumptions (e.g. truly zero downstream pressure, no competitive diffusion limitations) and experimental realities can add to prediction error. Despite these challenges, the dual-mode sorption model – with appropriate care – remains a valuable first approximation for interpreting sorption in glassy polymers, and it highlights the key role of competitive site occupancy in mixed-gas environments. Researchers often turn to more elaborate models (e.g. non-equilibrium lattice fluid or thermodynamic theories) when the dual-mode model’s assumptions break down, but such models come at the cost of additional parameters or complexity. In summary, dual-mode sorption provides a useful baseline for pure- and mixed-gas sorption in glassy polymers, but one must be mindful of its empirical nature and the above limitations when predicting multicomponent sorption behavior in practice.

Sources: Dual-mode sorption model and mixed-gas extension; competitive sorption effects in mixtures; model equations and parameters; limitations of DMS model; parameter sensitivity and predictivity issues.

Розуміння моделей сорбції

Я збираю інформацію про сорбцію чистих і змішаних газів у склоподібних полімерів, зосереджуючись на моделі dual-mode та викликах моделювання прогнозів.

[пошукова дія]

Оцінювання відкритого доступу

Гаразд, подивимось. Результати MDPI щодо сорбції змішаних газів у склоподібних полімерах, ймовірно, є відкритими для доступу.

[пошук]

[пошук]

Дослідження розділів
Я узагальнюю висновки з моделі Dual Mode Sorption і її розширеного аналізу в статті MDPI.

[пошук]

Уточнення ключових властивостей

Я вивчаю лабораторний звіт, щоб зрозуміти константу закону Генрі, константу спорідненості Ленгмюра та константу ємності Ленгмюра, які описують сорбцію газу.

[пошук]

Узагальнення

Я розглядаю можливість, що «Рівняння (3)» та «Рівняння (4)» можуть бути зображеннями або формулами, і думаю звернутися до PDF або пошукати попередні згадки, щоб зрозуміти їх краще.

[пошук]

Підтвердження релевантності назви

Я перевіряю, чи документ Фрімена та Короса (1980) точно відповідає посиланню «Модель сорбції змішаних газів у склоподібних полімерах», перевіряючи його анотацію та назву.

[пошукова дія]

Дослідження зв’язків між статтями

Я помітив, що результат пошуку з «pmc.ncbi.nlm.nih.gov», ймовірно, є тією ж статтею MDPI, і мені цікаво, чи відображається текст, чи спрощена версія.

[пошук]

[пошук]

[пошук]

Збирання інформації

Я збираю інформацію про сорбцію чистих і змішаних газів у склоподібних полімерів. Це критично важливий етап для розуміння поведінки матеріалу в різних газових середовищах.

[пошукова дія]

Порівняння сорбції газу

Я помітив, що присутність вуглекислого газу в суміші впливає на сорбцію метану в полімері, зменшуючи сорбцію метану порівняно зі сценарієм з чистим газом.

[пошук]

Пов'язування концепцій

Я розмірковую, як термін «розширена суміш рівнянь подвійного режиму» може стосуватися рівнянь надпровідних кабелів із подвійним режимом. Це демонструє потенціал для поєднання концепцій між різними галузями.

[пошукова дія]

Запит на перегляд деталей

Я беру до уваги запит на перегляд статті «Теорії сорбції та транспорту в полімерних мембранах».

[пошук]

Перевірка посилання на PDF

Мені цікаво дізнатися про Результат [2] і ознайомитися з фрагментом, що передбачає розширення дворежимної моделі сорбції на бінарну суміш та вираження концентрації A через парціальні тиски та константи.

[пошукова дія]

Прогнозування поведінки сорбції

Дворежимна модель передбачає, що додавання другого газу зменшує сорбцію при постійному парціальному тиску, на відміну від сценаріїв із чистим газом.

[пошук]

Завантаження PDF-файлу

Я збираю інформацію з PDF-файлу на nature.com, можливо, зі старої статті Ямпольського, але думаю про альтернативні джерела, такі як репозиторій Техаського університету в Остіні, для фрагмента тексту.

[пошук]

Оцінювання варіантів репозиторію

Я виявив, що результат репозиторію UT може відображатися неправильно. Пошук у ньому є невизначеним. Результат [3] містить фрагмент, що описує модель сорбції суміші з двома режимами, пояснюючи конкурентні ефекти та її адекватність для моделювання експериментальних даних.

[пошукова дія]

Уточнення фокусу

Я коригую свій підхід, щоб пошук був спрямований у потрібний контекст.

[пошукова дія]

Розуміння моделей сорбції

Я детально описую модель дворежимної сорбції для чистих газів: розчинення за Генрі та заповнення мікропорожнин за Ленгмюром. Для змішаних газів підкреслюється конкурентна сорбція та неідеальність.

[пошукова дія]

Дослідження hero.epa.gov

Обмірковую матеріали сайту hero.epa.gov можливий анотаційний опис або зміст.

[пошук]

Удосконалення моделі

Я збираю інформацію про сорбцію чистих та змішаних газів, враховуючи такі фактори, як конкуренція, пластифікація та стабільність параметрів. Включаю дані про змішані гази для точніших прогнозів.

[пошук]

Усунення викликів моделі подвійної сорбції

Прогнози впливу параметричного зв'язку та неунікальності. Відсутність змін у стані полімеру може призвести до помилок.

[пошук]

Кількісне визначення відхилення

Я оцінюю неідеальну розчинність CO2–CH4 у 6FDA-mPDA, демонструючи вплив змішаних газів на розчинність. Конкурентна сорбція не є єдиною причиною зниження вибірковості проникності.

[пошук]

Інтеграція посилань

Я збираю цитати, зосереджуючись на відкритих джерелах, таких як MDPI 2019 та Vopicka 2014, щоб підтримати обговорення відмінностей і проблем у дворежимній моделі сорбції газу в полімерних мембранах.

[пошук]

Формування розділів

Я організовую розділи про сорбцію чистих та змішаних газів, досліджую модель дворежимної сорбції та детально описую такі проблеми, як невизначеність параметрів та прогнозування поведінки змішаних газів.

Організація контенту

Я зосереджуюся на моделі сорбції dual-mode, докладно описую поведінку сорбції чистих і змішаних газів та виділяю ключові відмінності й виклики, подаючи їх маркерами та у структурованих розділах для зручності сприйняття.

[пошукова дія]

Вибір джерел

Гаразд, подивимось. Я спираюся на [3], [20], [22] та [21], оскільки вони дають чітке розуміння дворежимної сорбції та газових сумішей.

Визначення параметрів

Я складаю імена параметрів, щоб уникнути плутанини. Для ясності дотримуємося (k), (C_H') та (b). Рівняння для чистого газу та суміші детальні та чітко оформлені.

Розв’язання складнощів

Я опрацьовую підбори параметрів із кількома розв’язками, пластифікацію полімеру та часові ефекти. Ці тонкощі ускладнюють прогнозування сорбції чистих і змішаних газів.

Узагальнення

Я структурую розділи про відмінності сорбції, модель подвійного режиму для чистих газів, її розширення на змішані гази та пов'язані з цим виклики. Цей розвиток видається логічним та ефективним.

Рівень успішності у виконанні експертних завдань за оціночною економічною цінністю
Рівень успішностіОрієнтовна економічна вартість
Рівень успішності виконання експертних завдань за годинами
Рівень успішностіОрієнтовна тривалість
Оціночна економічна цінність завдання більше корелює з рівнем успішності, ніж з кількістю годин, які знадобилися б людині — складнощі моделей не завжди збігаються зі складнощами для людини.

Обмеження

Глибоке дослідження відкриває значні нові можливості, проте це все ще рання версія з певними обмеженнями. Інколи воно може вигадувати факти або робити неправильні висновки, хоча значно рідше, ніж попередні моделі ChatGPT, згідно з внутрішніми оцінками. Йому може бути важко розрізняти авторитетну інформацію та чутки, і наразі воно демонструє слабкість у калібруванні впевненості, часто неточно передаючи рівень невизначеності. На старті можливі незначні помилки форматування у звітах і цитуваннях, а запуск деяких задач може займати більше часу. Ми очікуємо, що всі ці аспекти швидко покращаться з накопиченням використання та часу.

Доступ

Глибоке дослідження в ChatGPT наразі є дуже ресурсомістким. Чим довше триває опрацювання запиту, тим більше обчислювальних ресурсів потрібно. Ми запускаємо версію, оптимізовану для користувачів Pro, із лімітом до 100 запитів на місяць. Користувачі Plus і Team отримають доступ наступними, після них — Enterprise. Ми все ще працюємо над наданням доступу користувачам у Сполученому Королівстві, Швейцарії та Європейській економічній зоні.

Усі платні користувачі невдовзі отримають суттєво вищі ліміти завдяки швидшій і економнішій версії глибокого дослідження на основі меншої моделі, яка все ще забезпечує високу якість результатів.

У найближчі тижні та місяці ми працюватимемо над технічною інфраструктурою, уважно стежитимемо за поточним релізом та проводитимемо ще ретельніше тестування. Це узгоджується з нашим принципом поетапного розгортання. Якщо всі перевірки безпеки й надалі відповідатимуть нашим вимогам до релізу, ми плануємо надати глибоке дослідження користувачам Plus приблизно за місяць.

Що далі?

Deep Research відсьогодні доступний у веб-версії ChatGPT і буде впроваджений у мобільні та десктопні програми протягом місяця. Наразі Deep Research може отримати доступ до відкритого вебу та будь-яких завантажуваних файлів. У майбутньому ви зможете підключитися до більш спеціалізованих джерел даних — розширюючи доступ до ресурсів на основі передплати або внутрішніх ресурсів — щоб зробити його результати ще більш надійними та персоналізованими.

Дивлячись у майбутнє, ми уявляємо, як агентні можливості поєднаються в ChatGPT, забезпечуючи асинхронні дослідження та виконання завдань у реальних сценаріях. Поєднання «Глибокого дослідження», яке може асинхронно проводити онлайн-пошук, та системи Operator, яка здатна виконувати дії у реальному світі, дасть змогу ChatGPT виконувати для вас дедалі складніші завдання.


Додаток від 3 лютого 2025 року: Ми провели ретельне тестування безпеки, оцінку готовності та перегляд механізмів управління для ранньої версії o3, на якій працює «Глибоке дослідження», і визначили її як ризик середнього рівня(відкривається у новому вікні). Ми також провели додаткове тестування безпеки, щоб краще зрозуміти можливі додаткові ризики, пов’язані зі здатністю «Глибокого дослідження» переглядати веб-сторінки, та впровадили нові запобіжні заходи. Ми й надалі ретельно тестуватимемо й уважно відстежуватимемо поточний обмежений реліз. Коли ми розширимо доступ для користувачів Plus, ми опублікуємо систему-картку з нашими висновками щодо безпеки та впровадженими захисними механізмами для «Глибокого дослідження».

Виноски

  1. 1

    Ми з’ясували, що відповіді-«істинні значення» для цього датасету були широко злиті в інтернеті, і відповідно заблокували низку сайтів або URL, щоб забезпечити чесну оцінку моделі.

Автори

OpenAI

Дослідницькі керівники

Isa Fulford, Zhiqing Sun

Основні учасники

Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi

Ключові учасники

Дослідження

Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong

Впровадження

Карпус Чанг, Гаррі Чжао, Джозеф Трасатті, Джошуа Дікенс, Метт Кауфер, Майк Трпсік, Міннія Фенг, Ніл Аджарапу, Пітер Відані,  Шон Фіцджеральд

Учасники

Дослідження

Ахмед Ель-Кішкі, Ей Джей Остров, Александр Вей, Андрій Георге, Ендрю Кондріч, Андрій Міщенко, Ануй Наїр, Бехруз Горбані, Брайдон Істман, Чак Лі, Фойвос Цимпурлас, Френсіс Сонг, Джамбаттіста Параскандоло, Гілдас Шабо, Гессам Багерінежад, Хайтан Ху, Хонг'ю Рен, Генрі Аспегрен, Гантер Лайтман, Ілля Костріков, Ілге Аккая, Джеймс Леннон, Жан Харб, Джонатан Ворд, Кай Чен, Кеті Ші, Кевін Лю, Кевін Ю, Манука Стратта, Марвін Чжан, Меньюань Ян,  Мостафа Роханінежад, Ноам Браун, Фібі Текер, Раз Гоан, Реа Міяра, Спенсер Папай, Тейлор Гордон, Венда Чжоу, Венлей Сє, Яш Патіл, Ян Дюбуа, Юлун Ченг, Юші Ванг, Вайатт Томпсон

+ усі учасники команди o3.

Системи безпеки

Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang

Розгортання

Адам Коппел, Адам Веллс, Адель Лі, Енді Епплбаум, Андрій Малевич, Ендрю Дуберстайн, Ендрю Гауелл, Антон Тананаєв, Ешлі Тайра, Брендон Волкін, Браян Ешлі, Кері Басін, Кері Гадсон, Корі Декаро, Крістіна Шо, Дерек Чен, Дібія Бхаттачарджі, Дреа Лопес, Ерік Антонов, Ерік Берк, Філіппо Расо, Фотіс Чантзіс, Фредді Суліт, Гарріс Коен, Гізер Вітні, Джей Діксіт, Джеффрі Хан, Джен Робінсон, Джессіка Шіє, Джоел Паріш, Кан Ву, Кевін Гладстон, Кшитідж Вадхва, Лео Вандріел, Лейтон Хо, Лян Чен, Мадлен Крістіан, Меймі Рейнголд, Метт Джонс, Мішель Фрадін, Майк МакКлей, Мінксуан Ванг, Начо Сото, Ніко Фелікс, Патрік Делані, Пол Макміллан, Філіп Пронін, Родріго Ріаза Перес, Самуель Місерендіно, Скотт Етерсміт, Стівен Болдуін, Томас Дімсон, Томо Хірацука, Ямінг Лін, Яра Хакбаз, Їнін Чен

Лідерство

Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba