Преминаване към основното съдържание
OpenAI

2 февруари 2025 г.

Пускане

Представяне на задълбочени проучвания

Агент, който използва разсъждения, за да синтезира големи количества онлайн информация и да изпълнява многоетапни изследователски задачи вместо вас. Наличен е за потребителите на Pro днес, а след това за Plus и Team.

Зареждане…

Актуализация от 10 февруари 2026 г.: Вече можете да свържете дълбоко проучване към всеки MCP или приложение и да ограничите уеб търсенията до доверени сайтове, за да се фокусирате върху удостоверени, индустриални стандартни източници. Вече можете също така да проследявате напредъка в реално време и да прекъсвате, за да прецизирате с последващи подкани или нови източници. Актуализирахме визуалното изживяване, така че да е по-лесно да започнете, да проследявате и да преглеждате проучването си от начало до край.


Актуализация от 17 юли 2025 г.: Задълбочените проучвания вече могат да бъдат още по-дълбоки и по-широки с достъпа до визуален браузър като част от агента ChatGPT. За да получите достъп до тези актуализирани възможности, просто изберете „агентски режим“ от падащото меню в композитора и въведете директно заявката си. Първоначалната функционалност за задълбочено проучване остава достъпна чрез опцията „задълбочено проучване“ в менюто с инструменти.


Актуализация от 24 април 2025 г.: Значително увеличаваме честотата на използване на задълбочени проучвания – потребителите на Plus, Team, Enterprise и Edu вече получават 25 заявки на месец, Pro потребителите – 250, а Free – 5. Това е възможно благодарение на нова олекотена версия на задълбочените проучвания, задвижвана от версия на o4-mini, проектирана така, че да е по-икономична, като същевременно запазва високото качество. След като достигнете лимита си за пълната версия, заявките ви автоматично ще преминат към олекотената версия.


Актуализация от 25 февруари 2025 г.: Всички потребители на Plus вече могат да използват задълбочено проучване.


Актуализация от 5 февруари 2025 г.: Задълбочено проучване вече е на разположение на потребителите на Pro в Обединеното кралство, Швейцария и Европейското икономическо пространство.


Днес стартираме задълбочени проучвания в ChatGPT – нова агентна способност, която извършва многоетапни изследвания в интернет за сложни задачи. За десетки минути те извършват това, което на човек би отнело много часове.

Задълбоченото проучване е следващият агент на OpenAI, който може да върши работа вместо вас самостоятелно – дайте му подкана и ChatGPT ще намери, анализира и синтезира стотици онлайн източници, за да създаде изчерпателен доклад на нивото на анализатор. Задвижван от версия на предстоящия модел OpenAI o3, която е оптимизирана за сърфиране в интернет и анализ на данни, той използва разсъждения за търсене, интерпретиране и анализ на огромни количества текст, изображения и PDF файлове в интернет, като при необходимост се променя в зависимост от информацията, с която се сблъсква.

Способността за синтезиране на знания е предпоставка за създаване на нови знания. Поради тази причина задълбочените проучвания са важна стъпка към по-широката ни цел за разработване на AGI, която отдавна си представяме като способна да доведе до нови научни изследвания.

Защо изградихме задълбочено проучване

Задълбочените проучвания са създадени за хора, които извършват интензивна работа, свързана със знания, в области като финанси, наука, политика и инженерство и се нуждаят от задълбочени, прецизни и надеждни проучвания. Могат да бъдат еднакво полезни и за взискателни купувачи, които търсят хиперперсонализирани препоръки за покупки, които обикновено изискват внимателно проучване, като автомобили, уреди и мебели. Всеки изход е напълно документиран, с ясни цитати и резюме на разсъжденията, което улеснява позоваването и проверката на информацията. Те са особено ефективни при намирането на нишова, неинтуитивна информация, която би изисквала преглеждане на множество уеб сайтове. Задълбочените проучвания освобождават ценно време, като ви позволяват да разтоварите и ускорите сложни, времеемки уеб проучвания само с едно запитване.

Задълбоченото проучване самостоятелно открива, разсъждава и консолидира информация от цялата мрежа. За да се постигне това, то беше обучено върху реални задачи, изискващи използване на браузър и инструменти на Python, използвайки същите методи на подсилващо обучение, които стоят зад OpenAI o1, нашия първи модел на разсъждаване. Въпреки че o1 демонстрира впечатляващи способности в областта на кодирането, математиката и други технически домейни, много предизвикателства в реалния свят изискват обширен контекст и събиране на информация от различни онлайн източници. Задълбоченото проучване се основава на тези възможности за разсъждаване, за да преодолее тази пропаст, позволявайки му да се справи с видовете проблеми, с които хората се сблъскват в работата и ежедневието си.

Как да използвате задълбоченото проучване

В ChatGPT изберете „задълбочено проучване“ в съставителя на съобщения и въведете вашата заявка. Кажете на ChatGPT от какво се нуждаете – независимо дали става дума за анализ на конкуренцията в платформите за поточно предаване или за персонализиран доклад за най-добрия велосипед за пътуване до работа. Можете да прикачите файлове или електронни таблици, за да добавите контекст към въпроса си. След като започне да работи, се появява странична лента с резюме на предприетите стъпки и използваните източници.

Задълбоченото проучване може да отнеме от 5 до 30 минути, за да завърши работата си, като отделя необходимото време за задълбочено проучване в интернет. Междувременно можете да се оттеглите или да работите по други задачи – ще получите уведомление, когато проучването приключи. Крайният резултат пристига като доклад в чата – през следващите няколко седмици ще добавяме в тези доклади вградени изображения, визуализации на данни и други аналитични изходи за допълнителна яснота и контекст.

В сравнение със задълбочено проучване GPT‑4o е идеален за мултимодални разговори в реално време. При многостранните запитвания, специфични за домейна, при които дълбочината и детайлите са от решаващо значение, способността на задълбоченото проучване да извършва обширно проучване и да цитира всяко твърдение е разликата между бързото резюме и добре документирания, проверен отговор, който може да се използва като работен продукт.

GPT-4o

Help me find iOS and android adoption rates, % who want to learn another language, and change in mobile penetration, over the past 10 years, for top 10 developed and top 10 developing countries by GDP. Lay this info out in a table and separate stats into columns, and include recommendations on markets to target for a new iOS translation app from ChatGPT, focusing on markets ChatGPT is currently active in.

Compiling comprehensive data on iOS and Android adoption rates, the percentage of populations interested in learning another language, and changes in mobile penetration over the past decade for the top 10 developed and developing countries by GDP is challenging due to data limitations. However, based on available information, we can provide insights and recommendations for targeting markets with a new iOS translation app powered by ChatGPT.

Top 10 Developed Countries by GDP:

  1. United States
  2. Japan
  3. Germany
  4. United Kingdom
  5. France
  6. Italy
  7. Canada
  8. South Korea
  9. Australia
  10. Spain

Top 10 Developing Countries by GDP:

  1. China
  2. India
  3. Brazil
  4. Russia
  5. Indonesia
  6. Mexico
  7. Turkey
  8. Saudi Arabia
  9. Argentina
  10. South Africa

Insights:

  • iOS and Android Adoption Rates: Globally, Android holds a dominant market share of approximately 70.93%, while iOS accounts for about 28.32% as of 2024. In the United States, iOS leads with a 58.81% market share. Other developed countries like Japan, Canada, Australia, and the United Kingdom also show a higher preference for iOS devices. In contrast, developing countries such as India and Brazil have a higher prevalence of Android devices.
  • Interest in Language Learning: While specific percentages of populations interested in learning another language are not readily available, the global popularity of language learning apps like Duolingo, which had approximately 14.3 million downloads in July 2024, indicates a significant interest. This interest is likely higher in countries with diverse linguistic landscapes or where English is not the primary language.
  • Mobile Penetration Over the Past Decade: Mobile phone ownership has seen substantial growth globally. In the United States, smartphone ownership increased from 35% in 2011 to 91% in 2024. Developing countries have also experienced significant growth in mobile penetration, contributing to increased access to digital services.

Recommendations:

Considering the available data and focusing on markets where ChatGPT is currently active, the following developed countries are promising targets for a new iOS translation app:

  • United States: High iOS market share and significant interest in language learning.
  • United Kingdom: Substantial iOS user base and a multicultural population with diverse language needs.
  • Canada: Notable iOS adoption and a bilingual population (English and French), increasing the demand for translation services.

Among developing countries, the following are noteworthy:

  • China: Despite Android's dominance, the large population and growing interest in English and other languages present a significant opportunity.
  • India: High Android usage, but a growing middle class with increasing iOS adoption and a strong interest in language learning, especially English.
  • Brazil: Predominantly Android users, but with a sizable market for language learning apps, particularly for English and Spanish.

Focusing on these markets aligns with ChatGPT's current availability and leverages existing mobile adoption trends and language learning interests.

Задълбочено проучване

Help me find iOS and android adoption rates, % who want to learn another language, and change in mobile penetration, over the past 10 years, for top 10 developed and top 10 developing countries by GDP. Lay this info out in a table and separate stats into columns, and include recommendations on markets to target for a new iOS translation app from ChatGPT, focusing on markets ChatGPT is currently active in.

Top 10 Developed Economies (by GDP)Smartphone OS Share, Language-Learning Interest, and Mobile Penetration Growth

Country

iOS Market Share

Android Market Share

Interest in New Language

(% of population)

Mobile Penetration Change (2013→2023)

United States

(USA)

~58% iOS vs 42% Android

(see left)

High:

70% regret losing foreign-language ability (indicating strong desire to improve)

56%→82%

smartphone penetration (↑26 pp)

Japan

~69% iOS vs 31% Android

(see left)

High:

Over 50% want to learn English

~30%→79%

(approx.) (↑~50 pp)

Germany

~39% iOS vs 60% Android

(see left)

High:

86% of Europeans say everyone should speak ≥1 foreign language (strong pro-language attitude)

40%→82%

(↑42 pp)

United Kingdom

(UK)

~52% iOS vs 47% Android

(see left)

Moderate-High:

~73% have some interest (only 27% “no interest” in new languages)

62%→82%

(↑20 pp)

France

~35% iOS vs 64% Android

(see left)

High:

86% (EU average) favor multilingualism; English widely seen as important

42%→83%

(↑40 pp)

Italy

~30% iOS vs 69% Android

(see left)

High:

86% (EU avg.) favor language learning; 1 in 4 regret not learning another

41%→85%

(↑44 pp)

Canada

~60% iOS vs 40% Android

(see left)

Moderate:

Many bilingual (English/French); rising interest in third languages (no recent % data)

56%→~80%

(↑ ~24 pp) (est., similar to US)

South Korea

~24% iOS vs 76% Android

(see left)

Moderate:

Strong English education focus; ~40% of teens are learning English

73%→~95%

(↑ ~22 pp) – already very high by 2013 (near saturation now)

Australia

~55% iOS vs 45% Android

(see left)

Moderate:

~70% see learning languages as valuable (English dominant but interest in Asian languages growing)

65%→~85%

(↑ ~20 pp) (est., high smartphone use)

Spain

~20% iOS vs 79% Android

(see left)

High:

88% of Spaniards learned a foreign language in school (e.g. English); strong cultural interest

55%→~85%

(↑ ~30 pp) (est., nearing Western Europe peers)

Top 10 Developing/Emerging Economies (by GDP)(ChatGPT availability considered)

Country

iOS Market Share

Android Market Share

Interest in New Language

(notable stats)

Mobile Penetration Change (2013→2023)

China

^(ChatGPT restricted)

~24% iOS vs 75% Android

(see left)

Very High:

Hundreds of millions learning English (but ChatGPT not officially accessible)

47%→68%

(↑21 pp)

India

~4% iOS vs 95% Android

(see left)

High:

English compulsory in many schools; strong economic motivation (80% link English to higher income)

~5%→46%

(↑ ~41 pp) (huge jump in smartphone adoption)

Brazil

~18% iOS vs 82% Android

(see left)

High:

Great demand for English – only ~5% speak it, but most see it as key skill

26%→67%

(↑40 pp)

Russia

^(ChatGPT limited)

~30% iOS vs 69% Android

(see left)

Moderate:

English learning common (compulsory in school); interest exists but ChatGPT availability is uncertain

36%→74%

(↑38 pp)

Mexico

~24% iOS vs 76% Android

(see left)

High:

Strong desire to learn English for US job/migration; ~50% of students study English in school (est.)

37%→62%

(↑25 pp)

Indonesia

~12% iOS vs 88% Android

(see left)

High:

English seen as gateway skill; government programs to improve English proficiency

<30%→68%

(↑ ~40 pp)

Turkey

~15% iOS vs 85% Android (est.)

(see left)

High:

English highly valued (universal in education);

80%

link English to better jobs

30%→75%

(↑45 pp)

Saudi Arabia

~24% iOS vs 76% Android

(see left)

Moderate:

English widely taught; 92% smartphone ownership (many already bilingual in English/Arabic)

73%→~95%

(↑ ~22 pp) (early adopter; near saturation now)

South Africa

~16% iOS vs 83% Android

(see left)

High:

Multilingual society; English and Afrikaans taught alongside native languages – cultural impetus to learn others

40%→~60%

(↑ ~20 pp) (est., steady growth)

Argentina

~12% iOS vs 88% Android

(see left)

High:

Strong interest in English (Argentina leads Latin America in English proficiency)

31%→~70%

(↑ ~39 pp) (est., sharp rise with smartphone adoption)

Sources: Smartphone OS shares are from StatCounter/Statista data (2023–24). Language-interest metrics come from surveys by Preply, Eurobarometer, Babbel, etc. (e.g. UK 73% interest; US 70% regret lack of languages; Japan >50% want English; Pearson global survey). Mobile penetration is measured as smartphone ownership percentage – dramatic growth is noted in developing markets (e.g. Brazil +40 points) and high saturation in developed ones (e.g. UK ~82%) over the last decade.


Recommendations: Based on the above, prime targets for a new ChatGPT‑powered iOS translation app would be countries with large iOS user bases and strong language-learning demand, where ChatGPT is accessible. Notably, Japan, the U.S., UK, Canada, and Australia emerge as top choices. These markets pair high iOS adoption (50–60%+ share) with significant enthusiasm for language learning – for example, Japan’s iPhone dominance and widespread desire to learn English make it ideal. English-speaking countries like the US, UK, Canada, and Australia, despite being monolingual societies, show substantial interest in learning other languages (e.g. Spanish or French), and all have over 80% smartphone penetration and millions of iPhone users.

Among emerging economies, Mexico and Brazil stand out as secondary targets: although Android prevails, their sheer population sizes mean tens of millions of iPhone users exist, and interest in English is very high for career and education reasons. These Latin American markets (where ChatGPT is active) could yield strong adoption for an iOS-only app, especially given the motivation to learn English. Conversely, China and Russia are less feasible – China’s OS split skews Android and ChatGPT is not officially available there, and Russia faces access and regulatory uncertainties.

In summary, focus on iOS-heavy, pro-learning markets: Japan and Western countries (US, UK, Canada, Australia, plus high-income Europe like Germany and France to a lesser degree) should be the first-tier targets. They combine robust iOS usage with favorable language-learning attitudes. A second tier includes large-population developing markets (Mexico, Brazil, perhaps Saudi Arabia for its historically high iPhone uptake) where interest in English is strong – these can be approached once the app gains traction in the primary markets. Such a strategy ensures the app launches where it has the greatest alignment of platform (iOS) presence and user demand for translation/language tools, maximizing the likelihood of adoption and growth.

Задълбоченото проучване отговаря на подканата по много подробен начин, като предоставя данни за отделните държави, както за топ 10 развити държави, така и за топ 10 развиващи се държави, за да може лесно да се направи справка и сравнение. То употребява тази информация, за да предложи подробни препоръки за навлизане на пазара, които са добре обосновани и приложими.

Как работи

Задълбоченото проучване беше обучено с помощта на цялостно подсилващо обучение за трудни задачи за сърфиране и разсъждаване в различни домейни. По време на това обучение то се научи да планира и изпълнява многоетапна траектория за намиране на необходимите данни, като при необходимост се връща назад и реагира на информация в реално време. Моделът също така може да разглежда файлове, качени от потребители, да начертава и итерира графики с помощта на инструмента Python, да вгражда както генерирани графики, така и изображения от уеб сайтове в своите отговори и да цитира конкретни изречения или пасажи от своите източници. В резултат на това обучение, то достига нови върхове в редица публични оценки, насочени към проблеми от реалния свят.

Последният изпит на човечеството

В „Последният изпит на човечеството“(отваря се в нов прозорец), наскоро публикувана оценка, която тества ИИ в широк спектър от теми с въпроси на експертно ниво, моделът, който захранва задълбочени проучвания, постига нов рекорд с точност от 26,6%. Този тест се състои от над 3000 въпроса с избираем и кратък отговор по повече от 100 предмета – от лингвистика до ракетостроене, от класика до екология. В сравнение с OpenAI o1, най-големите подобрения се появиха в химията, хуманитарните и социалните науки, както и в математиката. Моделът, който захранва задълбочени проучвания, демонстрира човешки подход, като ефективно търси специализирана информация, когато е необходимо.

МоделТочност (%)
GPT-4o3,3
Grok-23,8
Claude 3.5 Sonnet4,3
Gemini Thinking6,2
OpenAI o19,1
DeepSeek-R1*9,4
OpenAI o3-mini (средно)*10,5
OpenAI o3-mini (високо)*13,0
OpenAI задълбочено проучване26,6
* Моделът не е многомодален, а се оценява само върху текстово подмножество.
**с преглед в интернет + инструменти на Python

GAIA

На GAIA(отваря се в нов прозорец)1, публичен еталон, който оценява ИИ по въпроси от реалния свят, моделът, захранващ задълбочени проучвания, достига ново най-съвременно (SOTA) ниво, оглавявайки външната класация(отваря се в нов прозорец). Обхващайки въпроси на три нива на трудност, успешното изпълнение на тези задачи изисква способности, включително разсъждение, многомодална плавност, сърфиране в интернет и владеене на инструменти.

GAIA
Ниво 1Ниво 2Ниво 3Средно
Предишна версия на SOTA(отваря се в нов прозорец)67,9267,4442,3163,64
Задълбочено проучване (pass@1)74,2969,0647,667,36
Задълбочено проучване (cons@64)78,6673,2158,0372,57

Примери за задачи на GAIA

In Nature journal's Scientific Reports conference proceedings from 2012, in the article that did not mention plasmons or plasmonics, what nano-compound is studied? Don't use the prefix nano in your answer if there is one.

[The remaining Chain-of-Thought messages and the final answer are hidden to protect the benchmark's ground truth answer.]

Изясняване на търсенето

Сглобявам заявка за статия от 2012 г. в Scientific Reports, която описва нано-съединение, с изключение на тези, свързани с плазмониката. Вероятно това включва филтриране на специфични теми или съединения, като сребро или графен.

Сглобяване на детайли

Извършвам под-търсене на „Scientific Reports 2012 наночастици“, вероятно търся наносъединения. Интересувам се от филтриране на теми, свързани с плазмони, евентуално с фокус върху сребро, графен или квантови точки.

[търсене на действие]

Навигация на филтрите за търсене

Проучвам как да филтрирам разширено търсене в nature.com и Scientific Reports за 2012 г., опитвайки се да открия статии за аморфни въглеродни наночастици в хранителни карамели.

Идентифициране на материалите от конференцията

Резултатите от търсенето разкриват сборник с доклади от конференция, озаглавен „2D квазипериодични плазмонични кристали“ от 2012 г., вероятно намерен в категорията „Сборник с доклади от конференции“ в Scientific Reports.

[разглеждане на действие]

Обмисляне на потенциални проблеми

Обмислям причините за погрешното разбиране на уеб страницата, което вероятно се дължи на остарял тип агент или неволно блокиране.

[разглеждане на действие]

Обмисляне на динамични опции

Обмислям сайт за природата с динамично съдържание или кеширана версия. Като алтернатива, може да помогне търсенето на конкретни фрази.

[търсене на действие]

Идентифициране на ключови характеристики

OK, идентифицирам четири доклада от конференции от 2012 г. в Scientific Reports. Забележително е, че някои споменават „плазмони“ и трябва да бъдат изключени.

[разглеждане на действие]

Сглобяване на прозрения

Събирам информация за достъп до кеширани версии или разширения на фрагменти за конкретни заглавия, за да осигуря цялостен анализ.

[търсене на действие]

Събиране на подробностите

Отбелязвам напредъка от пролетната среща на Европейското дружество за изследване на материалите през 2012 г. към научния доклад, като се фокусирам върху материалите от конференцията. Този подход ми помага да установя контекста и релевантността.

[търсене на действие]

Проследяване на улики в дневника

Опитвам се да се свържа с материалите от конференциите от края на 2012 г. със списание Scientific Reports, като се фокусирам върху плазмонични двумерни квазипериодични материали. Този подход се усеща методичен и прецизен.

[търсене на действие]

Анализ на подробностите на събитието

Отбелязвам, че резултатите от търсенето [8] включват страница, вероятно обобщаваща Пролетната среща на Европейското дружество за изследване на материалите през 2012 г., включително 25 симпозиума.

[разглеждане на действие]

Сглобяване на изследвания

Проучвам вероятна страница от колекция с 4 статии, разглеждащи теми, свързани с плазмони и метаматериали, и определям ключови референции от пролетната среща на Европейското дружество за изследване на материалите през 2012 г.

[разглеждане на действие]

Точно определяне на фокуса

Фокусирам се върху материалите от конференцията от 2012 г. в Scientific Reports на E-MRS, вероятно свързани с теми като „2D квазипериодични плазмонични кристали“ и „Слоести плазмонични наметала за адаптиране на оптичното разсейване на наномащаб“.

[разглеждане на действие]

Оценяване на библиотечни източници

Размишлявам за специалния брой на E-MRS 2012, поканената статия на Scientific Reports от Monticone и лабораторията за метаматериали в News Archives – 2012.

[разглеждане на действие]

Оценяване на достъпността

Събирам информация за потенциални проблеми с достъпа до сайта, като вземам предвид остарял статус или блокажи. Също така оценявам сайта на Monticone за списък с референция.

[разглеждане на действие]

Сглобяване на E-MRS 2012

Опитвам се да направя връзка между Layered Plasmonic Cloaks и E-MRS 2012. Разглеждам други възможни теми като графен и катализа.

[разглеждане на действие]

Идентифициране на релевантни теми

Събирам информация по теми като графен, фотоволтаици и наноструктурирани съединения, като изключвам тези, свързани с плазмонични. Това ме кара да се съсредоточа върху аспектите на нанотехнологиите в по-широк план.

[разглеждане на действие]

Настройване на моя фокус

Разширявам параметрите за търсене, като въвеждам специфични идентификатори на сайтове и учени, за да открия статии за 2D квазипериодични плазмонични кристали в Nature Scientific Reports от 2012 г.

[търсене на действие]

Идентифициране на неплазмонични възможности

Ограничавам търсенето, за да идентифицирам статии от специалния брой на E-MRS от 2012 г. в Scientific Reports. Това включва проверка на заглавията за неплазмонични теми, като графен или функционални оксиди. Напредъкът е очевиден чрез целенасочено търсене и изключване на плазмонични статии.

[търсене на действие]

Сглобяване на улики

Анализирам взаимодействията в графенова суперрешетка, вероятно от статия в Sci Rep. Разглеждам заглавия от автори като Padooru, Yakovlev, Chen и Alu.

[търсене на действие]

Сглобяване на пъзела

Събирам информация за сборника с доклади от пролетната среща на E-MRS 2012, като се фокусирам върху поканените доклади, без плазмоничните явления. Типовете, които се преглеждат, са графен, катализа, енергийни материали, наномедицина и сензори.

[търсене на действие]

Задачи на експертно ниво

При вътрешна оценка на задачите на експертно ниво в редица области експертите в домейна оцениха, че задълбочените проучвания са автоматизирали много часове трудно ръчно проучване. 

Процент на успешно преминаване спрямо макс. извиквания на инструменти
Процент на успешно преминаванеМакс. извиквания на инструменти
Колкото повече моделът разглежда и мисли за това, което преглежда, толкова по-добре се справя, затова е важно да му дадете време да помисли.
Примери за задачи на експертно ниво
Спестено време по задачата: 4 часа

I am a researcher interested in bringing mixed-gas sorption capabilities to my lab. Please discuss the differences between pure- and mixed-gas sorption for glassy polymers, how the dual-mode sorption model can be used to predict mixed-gas sorption behavior in glassy polymers (include equations where applicable), and what challenges there are in accurately predicting pure- and mixed-gas sorption using the dual-mode sorption model. Only include open-source information as of October 1, 2024.

Pure vs. mixed-gas sorption in glassy polymers: In a glassy polymer (below TgT_g), a single gas typically exhibits a concave sorption isotherm: uptake rises sublinearly with pressure, unlike the linear Henry’s-law behavior above TgT_g. This is attributed to “dual-mode” sorption: some penetrant dissolves in the dense polymer matrix (obeying Henry’s law) while additional penetrant saturates specific microvoid “sites” (a Langmuir-type adsorption in the polymer’s nonequilibrium free volume). By contrast, when two or more gases are present, they compete for those limited Langmuir sorption sites. As a result, each component’s sorbed concentration in a mixture is generally lower than it would be at the same partial pressure alone. In particular the less soluble (lower-affinity) gas tends to be more strongly suppressed, often causing the mixed-gas solubility selectivity (ratio of concentrations) to exceed the ideal value predicted from pure-gas isotherms. For example, in CO₂/CH₄ mixtures both components sorb less than in their pure-gas cases (especially CH₄), so the CO₂/CH₄ sorption selectivity is higher under mixture conditions. In extreme cases, mixed-gas effects can even reverse performance trends observed with single gases. (We note that unlike competitive sorption, synergistic sorption – where one gas increases the sorption of another via polymer swelling – is usually minor in rigid high-free-volume polymers under moderate pressures.)

Dual-mode sorption model and mixed-gas prediction: The dual-mode sorption (DMS) model quantitatively captures glassy polymer sorption by superposing a Henry’s-law term and a Langmuir term. For a single gas, the sorbed concentration CC (e.g. in cm³(STP) gas per cm³ polymer) is written as:

C(p)=kDp  +  CHbp1+bp.C(p) = k_D\,p \;+\; \frac{C'_H\,b\,p}{\,1 + b\,p\,}\,.

Here kDk_D is the Henry’s law coefficient for dissolution, CHC'_H is the Langmuir capacity constant (proportional to the polymer’s unrelaxed free-volume or “hole” capacity), and bb is the Langmuir affinity constant. This empirical formula yields the characteristic concave isotherm of glassy polymers and reduces to simple Henry’s law at the glass-transition (since CH0C'_H \to 0 as TTgT \to T_g). The same three parameters (kD,CH,bk_D, C'_H, b) are obtained by fitting pure-gas sorption data and are then used to predict mixture sorption. For a binary mixture of gases A and B (with partial pressures pA,pBp_A, p_B), the DMS model assumes each gas obeys its own Henry’s term and that both compete for the same Langmuir sites. One convenient form is to write the total sorbed concentration as the sum of contributions from each gas:

Ctot=kD,ApA+kD,BpB  +  CH,AbApA  +  CH,BbBpB1+bApA+bBpB,C_{\text{tot}} = k_{D,A}p_A + k_{D,B}p_B \;+\; \frac{\,C'_{H,A}\,b_A\,p_A \;+\; C'_{H,B}\,b_B\,p_B\,}{\,1 + b_A p_A + b_B p_B\,}\,,

which implicitly means the concentration of component i in the mixture is Ci=kD,ipi+CH,ibipi1+jbjpjC_i = k_{D,i} p_i + \frac{C'_{H,i} b_i p_i}{\,1+\sum_j b_j p_j\,}. This reduces to the single-gas formula when the other component’s pressure is zero. In practice, partial pressure in these equations is often replaced by fugacity for accuracy at high pressures, though using fugacities or pressures gives nearly the same results if applied consistently. The DMS mixed-gas model predicts the competitive sorption effect observed experimentally – namely, each gas’s uptake is depressed relative to its pure-gas sorption isotherm.

Challenges and limitations: Although the dual-mode model is widely successful in correlating sorption data, it has notable limitations in predicting sorption behavior. First, the DMS model is empirical – its fitted parameters are not universal constants but can vary with polymer formation history, physical aging, and temperature/pressure range. This means a parameter set obtained under one set of conditions may lack predictive power outside its calibration range. For instance, sorption isotherms measured only over a limited pressure range can be fit well by DMS, but extrapolating beyond that (especially approaching plasticization pressures) may be unreliable. Indeed, multiple distinct combinations of kDk_D, CHC'_H, bb can sometimes fit the same pure-gas isotherm almost equally well – yet they yield markedly different mixed-gas predictions. This sensitivity undermines confidence in mixture forecasts, as one study showed that using different pure-gas fit sets led to only qualitative agreement with some mixed-CO₂/CH₄ data.

Furthermore, DMS inherently assumes a fixed population of Langmuir sites (microvoids) and ignores polymer relaxation or swelling induced by sorbate. In reality, penetrant-induced swelling (plasticization) can increase free volume and sorption capacity, especially for highly condensable gases at high activity – an effect the basic DMS model cannot capture. In binary sorption, this means any synergistic increase in sorption due to a second gas (or due to polymer dilation) is unaccounted for in the standard model. Conversely, the model also cannot describe sorption isotherm shapes that deviate from concave Langmuir-type behavior (e.g. sigmoidal isotherms caused by specific polymer-penetrant interactions or clustering). For example, glassy polymers absorbing polar molecules like alcohols can show sigmoidal sorption isotherms, which the simple dual-mode framework fails to represent. Finally, accurately measuring mixed-gas sorption itself is challenging, and discrepancies between idealized model assumptions (e.g. truly zero downstream pressure, no competitive diffusion limitations) and experimental realities can add to prediction error. Despite these challenges, the dual-mode sorption model – with appropriate care – remains a valuable first approximation for interpreting sorption in glassy polymers, and it highlights the key role of competitive site occupancy in mixed-gas environments. Researchers often turn to more elaborate models (e.g. non-equilibrium lattice fluid or thermodynamic theories) when the dual-mode model’s assumptions break down, but such models come at the cost of additional parameters or complexity. In summary, dual-mode sorption provides a useful baseline for pure- and mixed-gas sorption in glassy polymers, but one must be mindful of its empirical nature and the above limitations when predicting multicomponent sorption behavior in practice.

Sources: Dual-mode sorption model and mixed-gas extension; competitive sorption effects in mixtures; model equations and parameters; limitations of DMS model; parameter sensitivity and predictivity issues.

Разбиране на моделите на сорбция

Събирам информация за сорбцията на чисти и смесени газове в стъкловидни полимери, като се фокусирам върху модела на двурежимна сорбция и разглеждам предизвикателствата при предсказване чрез моделиране.

[търсене на действие]

Оценяване на отворения достъп

Добре, нека да видим. Резултатът от MDPI за сорбция на смесени газове в стъклени полимери вероятно е с отворен достъп.

[разглеждане на действие]

[разглеждане на действие]

Разглеждане на разделите
Събирам прозренията от модела за двурежимна сорбция и неговия разширен анализ в рамките на статията на MDPI.

[разглеждане на действие]

Разясняване на ключови свойства

Разглеждам лабораторния доклад, за да разбера константата на закона на Хенри, константата на афинитета на Лангмюр и константата на капацитета на Лангмюр, които описват сорбцията на газ.

[разглеждане на действие]

Сглобяване

Разглеждам възможността „Уравнение (3)“ и „Уравнение (4)“ да са изображения или формули и обмислям да се консултирам с PDF файла или да потърся по-ранни референции, за да ги разбера по-добре.

[разглеждане на действие]

Потвърждаване на релевантността на заглавието

Проверявам дали документът на Фрийман и Корос (1980 г.) съответства конкретно на позоваването „Модел за сорбция на смесени газове в стъклени полимери“, като проверявам неговото резюме и заглавие.

[търсене на действие]

Изследване на връзките между статиите

Забелязах, че резултатът от „pmc.ncbi.nlm.nih.gov“ вероятно е същата статия на MDPI и ми е любопитно да видя дали представя текста или опростена версия.

[разглеждане на действие]

[разглеждане на действие]

[разглеждане на действие]

Събиране на информация

Събирам информация за сорбцията на чисти и смесени газове в стъкловидни полимери. Това е критична стъпка в разбирането на поведението на материала в различни газови среди.

[търсене на действие]

Сравняване на сорбцията на газ

Забелязах, че наличието на въглероден диоксид в смес влияе върху сорбцията на метан в полимер, като намалява сорбцията на метан в сравнение със сценарий с чист газ.

[разглеждане на действие]

Свързване на концепции

Обмислям как терминът „разширена смес от двурежимни уравнения“ може да се отнася до двурежимните уравнения на свръхпроводящи кабели. Това показва потенциал за свързване на концепции в различни области.

[търсене на действие]

Заявяване на подробности за прегледа

Отбелязвам искането за преглед на „Теории за сорбция и транспорт в полимерна мембрана.“

[разглеждане на действие]

Проверка на PDF връзка

Интересувам се от резултат [2] и изследването на фрагмента, който включва разширяване на модела на двурежимната сорбция към бинарна смес и изразяване на концентрацията на A чрез парциални налягания и константи.

[търсене на действие]

Прогнозиране на сорбционното поведение

Двурежимният модел предвижда, че добавянето на втори газ намалява сорбцията при постоянно парциално налягане, за разлика от сценариите с чист газ.

[разглеждане на действие]

Извличане на PDF файл

Събирам информация за PDF файл от nature.com, вероятно по-стара статия на Ямполски, но обмислям алтернативни източници като хранилището на Университета на Тексас в Остин за текстов фрагмент.

[разглеждане на действие]

Оценяване на опциите за хранилище

Открих, че резултатът от хранилището на UT може да не се показва правилно. Търсенето в него е несигурно. Алтернативно, резултат [3] съдържа откъс, описващ модела на двурежимната сорбция на смеси, обясняващ конкурентните ефекти и неговата адекватност при моделирането на експериментални данни.

[търсене на действие]

Прецизиране на фокуса

Коригирам подхода си, за да гарантирам, че търсенето е насочено към правилния контекст.

[търсене на действие]

Разбиране на моделите на сорбция

Подробно описвам модела на двурежимната сорбция за чисти газове: разтваряне по Хенри и запълване на микрокухини по Лангмюр. При смесени газове се акцентира върху конкурентната сорбция и неидеалностите.

[търсене на действие]

Изследване на hero.epa.gov

Обмисляне на потенциалното резюме или съдържание на hero.epa.gov.

[разглеждане на действие]

Усъвършенстване на модела

Събирам информация за сорбцията на чисти и смесени газове, като вземам предвид фактори като конкуренция, пластифициране и стабилност на параметрите. Инкорпориране на данни за смесени газове за по-точни прогнози.

[разглеждане на действие]

Справяне с предизвикателствата на модела за двойна сорбция

Прогнози за свързване на параметри и въздействие на неуникалност. Липсата на промени в състоянието на полимера може да доведе до пропуски.

[разглеждане на действие]

Количествено определяне на отклонението

Извършвам количествено определяне на неидеалната разтворимост на CO2-CH4 в 6FDA-mPDA, като показвам ефектите на смесения газ върху разтворимостта. Конкурентната сорбция не е единствената причина за намаляване на селективността на пропускливостта.

[разглеждане на действие]

Включване на референции

Събирам цитати, като се фокусирам върху материали с отворен код като MDPI 2019 и Vopicka 2014, за да подкрепя дискусията относно разликите и предизвикателствата в двурежимния модел за сорбция на газ в полимерни мембрани.

[разглеждане на действие]

Предлагане на раздели

Организирам раздели за сорбция на чисти и смесени газове, изследвам модела на двурежимната сорбция и описвам предизвикателства като неопределеност на параметрите и прогнозиране на смесени газове.

Организиране на съдържание

Фокусирам се върху модела на двурежимна сорбция, като подробно описвам поведението при сорбция на чисти и смесени газове и подчертавам ключовите разлики и предизвикателства с помощта на точки и структурирани раздели за яснота.

[търсене на действие]

Избор на цитати

Добре, нека да видим. Разчитам на [3], [20], [22] и [21] заради техните ясни прозрения относно двурежимната сорбция и газовите смеси.

Картографиране на параметрите

Събирам имената на параметрите, за да избегна объркване. За яснота ще се придържаме към (k), (C_H') и (b). Уравненията за чист газ и смеси са подробно и ясно форматирани.

Справяне с предизвикателства

Занимавам се с напасване на параметри за множество решения, пластифициране на полимери и времеви ефекти. Тези тънкости правят предвиждането на сорбцията на чисти и смесени газове сложно.

Сглобяване

Структурирам разделите за разликите в сорбцията, двурежимния модел за чисти газове, неговото разширение за смесени газове и свързаните с това предизвикателства. Тази прогресия изглежда логична и ефективна.

Процент на успешно преминаване на задачи на експертно ниво според очакваната икономическа стойност
Процент на успешно преминаванеОчаквана икономическа стойност
Процент на успешно преминаване на задачи на експертно ниво по очаквани часове
Процент на успешно преминаванеОчаквани часове
Очакваната икономическа стойност на задачата е по-скоро свързана с процента на преминаване, отколкото с броя часове, които биха отнели на човек – нещата, които моделите намират за трудни, се различават от тези, които хората намират за отнемащи време.

Ограничения

Задълбоченото проучване отключва значителни нови възможности, но все още е в ранен етап и има ограничения. Понякога може да халюцинира факти в отговорите или да прави грешни заключения, макар че според вътрешните оценки това е в значително по-малка степен от съществуващите модели на ChatGPT. Възможно е да изпитва затруднения при разграничаването на достоверна информация от слухове и понастоящем показва слабости при калибрирането на доверието, като често не успява да предаде точно несигурността. При стартиране може да има малки грешки при форматирането на отчети и цитати, а стартирането на задачите да отнеме повече време. Очакваме всички тези проблеми бързо да се подобрят с по-дълго използване и време.

Достъп

Задълбочените проучвания в ChatGPT в момента са много изчислително интензивни. Колкото повече време отнема проучването на дадена заявка, толкова повече изчислителна мощност за извод е необходима. Започваме с версия, оптимизирана за Pro потребители днес, с до 100 заявки на месец. Потребителите на Plus и Team ще получат достъп след това, а след това и на Enterprise. Все още работим за осигуряване на достъп на потребителите в Обединеното кралство, Швейцария и Европейското икономическо пространство. 

Всички платени потребители скоро ще получат значително по-високи тарифни лимити, когато пуснем по-бърза и по-рентабилна версия на задълбочените проучвания, задвижвана от по-малък модел, който все още осигурява висококачествени резултати. 

През следващите седмици и месеци ще работим върху техническата инфраструктура, ще следим отблизо текущото издание и ще провеждаме още по-строги тестове. Това е в съответствие с нашия принцип на итеративно внедряване. Ако всички проверки за безопасност продължат да отговарят на стандартите ни за пускане в експлоатация, очакваме да пуснем задълбоченото проучване за потребителите на Plus след около месец.

Какво следва

Задълбоченото проучване е налично от днес в уеб сайта на ChatGPT, а до месец ще бъде пуснато и в мобилните и настолните приложения. Понастоящем задълбочените проучвания имат достъп до отворената мрежа и до всички качени файлове. В бъдеще ще можете да се свързвате с по-специализирани източници на данни – ще разширите достъпа до абонаментни или вътрешни ресурси – за да направите изходите още по-стабилни и персонализирани.

С поглед към бъдещето, ние си представяме как агентните преживявания се обединяват в ChatGPT за асинхронни изследвания и изпълнение в реалния свят. Комбинацията от задълбочени проучвания, които могат да извършват асинхронно онлайн разследване, и Operator, който може да предприема реални действия, ще активира ChatGPT да изпълнява все по-сложни задачи за вас.


Допълнение от 3 февруари 2025 г.: Проведохме строги тестове за безопасност, оценки на готовността и прегледи на управлението на ранната версия на o3, която захранва задълбочените проучвания, идентифицирайки я като среден(отваря се в нов прозорец) риск. Проведохме и допълнителни тестове за безопасност, за да разберем по-добре постепенните рискове, свързани със способността на задълбочените проучвания да разглеждат мрежата, и добавихме нови мерки за смекчаване. Ще продължим да тестваме задълбочено и внимателно да наблюдаваме текущото ограничено издание. Ще споделим нашите прозрения за безопасността и предпазни мерки за задълбочените проучвания в картата на системата, когато разширим достъпа до потребителите на Plus.

Бележки под линия

  1. 1

    Установихме, че достоверните отговори за този набор от данни бяха широко разпространени онлайн и съответно блокирахме няколко уеб сайта или URL адреса, за да осигурим справедлива оценка на модела.

Автори

OpenAI

Ръководители на изследвания

Isa Fulford, Zhiqing Sun

Основополагащи сътрудници

Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney и Valerie Qi

Основни сътрудници

Проучване

Илейн Я Ле, Ерик Мичъл, Ерик Уолъс, Хьонг Уон Чунг, Игнаси Клавера, Лео Лиу, Лоренц Кун, Луи Фьоврие, Макс Шварцер, Саачи Джаин, Скоти Ян, Шуню Яо, Витчир Понг

Внедряване

Карпус Чанг, Хари Джао, Джоузеф Трасати, Джошуа Дикенс, Мат Кауфер, Майк Трпчич, Миния Фенг, Нийл Аджарапу, Питър Видани,  Шон Фицджералд

Сътрудници

Проучване

Ахмед Ел-Кишки, Ей Джей Остроу, Александър Вей, Андрей Георге, Андрю Кондрич, Андрей Мишченко, Ануж Наир, Бехруз Горбани, Брайдън Истман, Чак Ли, Фойвос Цимпурлас, Франсис Сонг, Джамбатиста Параскандоло, Гилдас Шабо, Хесам Багеринеждад, Хайтан Ху, Хонгю Рен, Хенри Аспегрен, Хънтър Лайтман, Иля Костриков, Илге Аккая, Джеймс Ленън, Жан Харб, Джонатан Уорд, Кай Чен, Кати Ши, Кевин Лиу, Кевин Ю, Манука Страта, Марвин Джан, Менгюан Ян,  Мостафа Роханинеджад, Ноам Браун, Фийби Тъкър, Раз Гоан, Риа Мияра, Спенсър Папай, Тейлър Гордън, Венда Джоу, Уенлей Сие, Яш Патил, Ян Дюбоа, Юлонг Ченг, Юши Ванг, Уайът Томпсън

+ всички сътрудници към o3.

Системи за безопасност

Адам Калай, Алекс Бойтел, Андреа Валоне, Анди Апълбаум, Дейвид Робинсън, Елизабет Проел, Евън Мейс, Грейс Жао, Ирина Кофман, Джейсън Фанг, Хоакин Куинонеро Кандела, Джоел Париш, Кевин Лиу, Кристен Инг, Лама Ахмад, Леон Максин, Лейтън Хо, Меган Шах, Мишел Уанг, Майлс Уанг, Филип Гуо, Оливия Уоткинс, Оуен Кембъл-Мур, Патрик Чао, Сам Тойзер, Самюел Мисерендино, Сандхини Агарвал, Теджал Патвардхан, Тина Срискандараджа, Трой Петерсън, Яодун Ю, Юнюн Уанг

Внедряване

Адам Копел, Адам Уелс, Адел Ли, Анди Апълбаум, Андрей Малевич, Андрю Дюберщайн, Андрю Хауел, Антон Тананаев, Ашли Тайра, Брандън Уокин, Брайън Ашли, Кари Басин, Кари Хъдсън, Кори Декаро, Кристина Шо, Дерек Чен, Дибя Бхаттачарджи, Дреа Лопес, Ерик Антонов, Ерик Бърк, Филипо Расо, Фотис Чанцис, Фреди Сулит, Харис Коен, Хедър Уитни, Джей Диксит, Джефри Хан, Джен Робинсън, Джесика Шие, Джоел Париш, Кан Ву, Кевин Гладстон, Кшитидж Вадхва, Лео Вандриел, Лейтън Хо, Лианг Чен, Маделин Кристиан, Мами Рейнголд, Мат Джоунс, Мишел Фрадин, Майк МакКлей, Минксуан Ванг, Начо Сото, Нико Феликс, Патрик Дилейни, Пол Макмилън, Филип Пронин, Родриго Риаза Перес, Самуел Мисерендино, Скот Етърсмит, Стивън Болдуин, Томас Димсън, Томо Хирацука, Ямин Лин, Яра Хакбаз, Йининг Чен

Лидерство

Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman и Wojciech Zaremba