2 februari 2025

De introductie van diepgaand onderzoek

Een agent die met redeneren grote hoeveelheden online-informatie synthetiseert en meerstapsonderzoek voor je afrondt. Vanaf nu beschikbaar voor Pro-gebruikers, binnenkort ook voor Plus- en Team-gebruikers.

Probeer het uit op ChatGPT

Bezig met laden...

Update van 10 februari 2026: Je kunt nu diepgaand onderzoek verbinden met elke MCP of app en webzoekopdrachten beperken tot vertrouwde sites. Zo kun jij je richten op geverifieerde bronnen die gelden als standaard binnen de sector. Je kunt nu ook de voortgang in realtime volgen en onderbreken om te verfijnen met vervolgprompts of nieuwe bronnen. We hebben de visuele ervaring bijgewerkt zodat het eenvoudiger is om je onderzoek van begin tot eind te starten, te volgen en te beoordelen.

Update van 17 juli 2025: Diepgaand onderzoek kan nu nog dieper en breder worden uitgevoerd dankzij toegang tot een visuele browser binnen de ChatGPT‑agent. Om toegang te krijgen tot deze nieuwe mogelijkheden, selecteer je 'agent-modus' uit de vervolgkeuzelijst in de composer en voer je je vraag rechtstreeks in. De oorspronkelijke functionaliteit voor diepgaand onderzoek blijft beschikbaar via de optie 'diepgaand onderzoek' in het menu 'Tools'.

Update van 24 april 2025: We verhogen aanzienlijk hoe vaak je diepgaand onderzoek kunt gebruiken—Plus-, Team-, Enterprise- en Edu-gebruikers krijgen nu 25 zoekopdrachten per maand, Pro-gebruikers krijgen er 250 en Free-gebruikers krijgen er 5. Dit wordt mogelijk gemaakt door een nieuwe lichtgewicht versie van diepgaand onderzoek, aangedreven door een versie van o4-mini. Deze versie is voordeliger, met behoud van de onberispelijke kwaliteit. Zodra je de limiet voor de volledige versie hebt bereikt, schakelen je zoekopdrachten automatisch over naar de lichtgewicht versie.

Update 25 februari 2025: Alle Plus-gebruikers kunnen nu diepgaand onderzoek gebruiken.

Update van 5 februari 2025: Diepgaand onderzoek is nu beschikbaar voor Pro-gebruikers in het Verenigd Koninkrijk, Zwitserland en de Europese Economische Ruimte.

Vandaag lanceren we diepgaand onderzoek in ChatGPT, een nieuwe capaciteit van agenten waarmee voor complexe taken meervoudig stappenonderzoek op het internet worden uitgevoerd. Het doet in tientallen minuten wat een mens vele uren zou kosten.

Deep research is de volgende agent van OpenAI's die zelfstandig werk voor je kan doen - je komt met een prompt en ChatGPT vindt, analyseert en synthetiseert honderden online bronnen om een uitgebreid rapport te maken op het niveau van dat van een onderzoeksanalist. Aangestuurd door een versie van het komende OpenAI o3‑model dat is geoptimaliseerd voor browsen op internet en gegevensanalyse, maakt het gebruik van redeneren om enorme hoeveelheden tekst, afbeeldingen en PDF's op het internet te doorzoeken, interpreteren en analyseren, waarbij het richting kiest op basis van de informatie die het aantreft.

Het vermogen om kennis te synthetiseren is een voorwaarde voor het creëren van nieuwe kennis. Om deze reden vormt diepgaand onderzoek een belangrijke stap in de richting van ons bredere doel om AGI te ontwikkelen, waarvan we al lang denken dat het in staat zal zijn tot nieuw wetenschappelijk onderzoek.

Waarom we diepgaand onderzoek hebben gebouwd

Deep research is gemaakt voor mensen die intensief kenniswerk verrichten op gebieden als financiën, wetenschap, beleid en engineering en daarvoor grondig, nauwkeurig en betrouwbaar onderzoek nodig hebben. Het kan net zo nuttig zijn voor veeleisende shoppers die op zoek zijn naar hypergepersonaliseerde aanbevelingen voor het soort aankopen dat doorgaans zorgvuldig onderzoek vereist, zoals auto's, apparaten en meubels. Elke uitvoer is volledig gedocumenteerd, met duidelijke citaten en een samenvatting van de gedachtegang, waardoor het eenvoudig is om de informatie te raadplegen en te verifiëren. Het is vooral effectief bij het vinden van niche-informatie van non-intuïtieve aard waarvoor je veel websites moet doorzoeken. Deep research maakt kostbare tijd vrij doordat je complexe, tijdrovende webonderzoeken met slechts één zoekopdracht kunt uitvoeren.

Deep research ontdekt, beredeneert en bundelt onafhankelijke inzichten vanuit het hele internet. Om dit te bereiken, werd het getraind op realistische taken die het gebruik van browsers en Python-tools vereisen waarbij gebruik werd gemaakt van dezelfde versterkende leermethoden als bij OpenAI o1, ons eerste redeneringsmodel. Hoewel o1 indrukwekkende capaciteiten laat zien op het gebied van programmeren, wiskunde en andere technische domeinen, zijn voor veel uitdagingen in de echte wereld uitgebreide context en het verzamelen van informatie uit diverse online bronnen nodig. Deep research bouwt voort op deze redeneercapaciteiten om die kloof te overbruggen, waardoor deze het soort problemen kan aanpakken waarmee mensen op het werk en in het dagelijks leven worden geconfronteerd.

Hoe diepgaand onderzoek gebruiken

Selecteer in ChatGPT op het berichtenformulier 'diepgaand onderzoek' en voer je vraag in. Vertel ChatGPT wat je nodig hebt, of het nu gaat om een concurrentieanalyse van streamingplatforms of een gepersonaliseerd rapport over de beste fiets om naar je werk te gaan. Je kunt bestanden of spreadsheets bijvoegen om context aan je vraag toe te voegen. Zodra het onderzoek begint, verschijnt er een zijbalk met een samenvatting van de genomen stappen en gebruikte bronnen.

Diepgaand onderzoek duurt 5 tot 30 minuten, de tijd die het nodig heeft om het internet grondig te doorzoeken. In de tussentijd kun je weggaan of aan andere taken werken. Je ontvangt een melding zodra het onderzoek is voltooid. De uiteindelijke uitvoer komt als rapport binnen in de chat. In de komende weken zullen we ook afbeeldingen, datavisualisaties en andere analytische output in deze rapporten opnemen, zodat deze nog meer duidelijkheid en context verschaffen.

Vergeleken met diepgaand onderzoek is GPT‑4o ideaal voor realtime, multimodale gesprekken. Voor veelzijdige, domeinspecifieke onderzoeken waarbij diepgang en detail cruciaal zijn, is het vermogen van diepgaand onderzoek om uitgebreid onderzoek te doen en bij elke bewering de bron te noemen het verschil tussen een snelle samenvatting en een goed gedocumenteerd, verifieerbaar antwoord dat als professioneel product kan worden gebruikt.

GPT-4o

Help me find iOS and android adoption rates, % who want to learn another language, and change in mobile penetration, over the past 10 years, for top 10 developed and top 10 developing countries by GDP. Lay this info out in a table and separate stats into columns, and include recommendations on markets to target for a new iOS translation app from ChatGPT, focusing on markets ChatGPT is currently active in.

Compiling comprehensive data on iOS and Android adoption rates, the percentage of populations interested in learning another language, and changes in mobile penetration over the past decade for the top 10 developed and developing countries by GDP is challenging due to data limitations. However, based on available information, we can provide insights and recommendations for targeting markets with a new iOS translation app powered by ChatGPT.

Top 10 Developed Countries by GDP:

United States
Japan
Germany
United Kingdom
France
Italy
Canada
South Korea
Australia
Spain

Top 10 Developing Countries by GDP:

China
India
Brazil
Russia
Indonesia
Mexico
Turkey
Saudi Arabia
Argentina
South Africa

Insights:

iOS and Android Adoption Rates: Globally, Android holds a dominant market share of approximately 70.93%, while iOS accounts for about 28.32% as of 2024. In the United States, iOS leads with a 58.81% market share. Other developed countries like Japan, Canada, Australia, and the United Kingdom also show a higher preference for iOS devices. In contrast, developing countries such as India and Brazil have a higher prevalence of Android devices.
Interest in Language Learning: While specific percentages of populations interested in learning another language are not readily available, the global popularity of language learning apps like Duolingo, which had approximately 14.3 million downloads in July 2024, indicates a significant interest. This interest is likely higher in countries with diverse linguistic landscapes or where English is not the primary language.
Mobile Penetration Over the Past Decade: Mobile phone ownership has seen substantial growth globally. In the United States, smartphone ownership increased from 35% in 2011 to 91% in 2024. Developing countries have also experienced significant growth in mobile penetration, contributing to increased access to digital services.

Recommendations:

Considering the available data and focusing on markets where ChatGPT is currently active, the following developed countries are promising targets for a new iOS translation app:

United States: High iOS market share and significant interest in language learning.
United Kingdom: Substantial iOS user base and a multicultural population with diverse language needs.
Canada: Notable iOS adoption and a bilingual population (English and French), increasing the demand for translation services.

Among developing countries, the following are noteworthy:

China: Despite Android's dominance, the large population and growing interest in English and other languages present a significant opportunity.
India: High Android usage, but a growing middle class with increasing iOS adoption and a strong interest in language learning, especially English.
Brazil: Predominantly Android users, but with a sizable market for language learning apps, particularly for English and Spanish.

Focusing on these markets aligns with ChatGPT's current availability and leverages existing mobile adoption trends and language learning interests.

Diepgaand onderzoek

Top 10 Developed Economies (by GDP) – Smartphone OS Share, Language-Learning Interest, and Mobile Penetration Growth

Country	iOS Market Share	Android Market Share	Interest in New Language (% of population)	Mobile Penetration Change (2013→2023)
United States (USA)	~58% iOS vs 42% Android	(see left)	High: 70% regret losing foreign-language ability (indicating strong desire to improve)	56%→82% smartphone penetration (↑26 pp)
Japan	~69% iOS vs 31% Android	(see left)	High: Over 50% want to learn English	~30%→79% (approx.) (↑~50 pp)
Germany	~39% iOS vs 60% Android	(see left)	High: 86% of Europeans say everyone should speak ≥1 foreign language (strong pro-language attitude)	40%→82% (↑42 pp)
United Kingdom (UK)	~52% iOS vs 47% Android	(see left)	Moderate-High: ~73% have some interest (only 27% “no interest” in new languages)	62%→82% (↑20 pp)
France	~35% iOS vs 64% Android	(see left)	High: 86% (EU average) favor multilingualism; English widely seen as important	42%→83% (↑40 pp)
Italy	~30% iOS vs 69% Android	(see left)	High: 86% (EU avg.) favor language learning; 1 in 4 regret not learning another	41%→85% (↑44 pp)
Canada	~60% iOS vs 40% Android	(see left)	Moderate: Many bilingual (English/French); rising interest in third languages (no recent % data)	56%→~80% (↑ ~24 pp) (est., similar to US)
South Korea	~24% iOS vs 76% Android	(see left)	Moderate: Strong English education focus; ~40% of teens are learning English	73%→~95% (↑ ~22 pp) – already very high by 2013 (near saturation now)
Australia	~55% iOS vs 45% Android	(see left)	Moderate: ~70% see learning languages as valuable (English dominant but interest in Asian languages growing)	65%→~85% (↑ ~20 pp) (est., high smartphone use)
Spain	~20% iOS vs 79% Android	(see left)	High: 88% of Spaniards learned a foreign language in school (e.g. English); strong cultural interest	55%→~85% (↑ ~30 pp) (est., nearing Western Europe peers)

Top 10 Developing/Emerging Economies (by GDP) – (ChatGPT availability considered)

Country	iOS Market Share	Android Market Share	Interest in New Language (notable stats)	Mobile Penetration Change (2013→2023)
China ^(ChatGPT restricted)	~24% iOS vs 75% Android	(see left)	Very High: Hundreds of millions learning English (but ChatGPT not officially accessible)	47%→68% (↑21 pp)
India	~4% iOS vs 95% Android	(see left)	High: English compulsory in many schools; strong economic motivation (80% link English to higher income)	~5%→46% (↑ ~41 pp) (huge jump in smartphone adoption)
Brazil	~18% iOS vs 82% Android	(see left)	High: Great demand for English – only ~5% speak it, but most see it as key skill	26%→67% (↑40 pp)
Russia ^(ChatGPT limited)	~30% iOS vs 69% Android	(see left)	Moderate: English learning common (compulsory in school); interest exists but ChatGPT availability is uncertain	36%→74% (↑38 pp)
Mexico	~24% iOS vs 76% Android	(see left)	High: Strong desire to learn English for US job/migration; ~50% of students study English in school (est.)	37%→62% (↑25 pp)
Indonesia	~12% iOS vs 88% Android	(see left)	High: English seen as gateway skill; government programs to improve English proficiency	<30%→68% (↑ ~40 pp)
Turkey	~15% iOS vs 85% Android (est.)	(see left)	High: English highly valued (universal in education); 80% link English to better jobs	30%→75% (↑45 pp)
Saudi Arabia	~24% iOS vs 76% Android	(see left)	Moderate: English widely taught; 92% smartphone ownership (many already bilingual in English/Arabic)	73%→~95% (↑ ~22 pp) (early adopter; near saturation now)
South Africa	~16% iOS vs 83% Android	(see left)	High: Multilingual society; English and Afrikaans taught alongside native languages – cultural impetus to learn others	40%→~60% (↑ ~20 pp) (est., steady growth)
Argentina	~12% iOS vs 88% Android	(see left)	High: Strong interest in English (Argentina leads Latin America in English proficiency)	31%→~70% (↑ ~39 pp) (est., sharp rise with smartphone adoption)

Sources: Smartphone OS shares are from StatCounter/Statista data (2023–24). Language-interest metrics come from surveys by Preply, Eurobarometer, Babbel, etc. (e.g. UK 73% interest; US 70% regret lack of languages; Japan >50% want English; Pearson global survey). Mobile penetration is measured as smartphone ownership percentage – dramatic growth is noted in developing markets (e.g. Brazil +40 points) and high saturation in developed ones (e.g. UK ~82%) over the last decade.

Recommendations: Based on the above, prime targets for a new ChatGPT‑powered iOS translation app would be countries with large iOS user bases and strong language-learning demand, where ChatGPT is accessible. Notably, Japan, the U.S., UK, Canada, and Australia emerge as top choices. These markets pair high iOS adoption (50–60%+ share) with significant enthusiasm for language learning – for example, Japan’s iPhone dominance and widespread desire to learn English make it ideal. English-speaking countries like the US, UK, Canada, and Australia, despite being monolingual societies, show substantial interest in learning other languages (e.g. Spanish or French), and all have over 80% smartphone penetration and millions of iPhone users.

Among emerging economies, Mexico and Brazil stand out as secondary targets: although Android prevails, their sheer population sizes mean tens of millions of iPhone users exist, and interest in English is very high for career and education reasons. These Latin American markets (where ChatGPT is active) could yield strong adoption for an iOS-only app, especially given the motivation to learn English. Conversely, China and Russia are less feasible – China’s OS split skews Android and ChatGPT is not officially available there, and Russia faces access and regulatory uncertainties.

In summary, focus on iOS-heavy, pro-learning markets: Japan and Western countries (US, UK, Canada, Australia, plus high-income Europe like Germany and France to a lesser degree) should be the first-tier targets. They combine robust iOS usage with favorable language-learning attitudes. A second tier includes large-population developing markets (Mexico, Brazil, perhaps Saudi Arabia for its historically high iPhone uptake) where interest in English is strong – these can be approached once the app gains traction in the primary markets. Such a strategy ensures the app launches where it has the greatest alignment of platform (iOS) presence and user demand for translation/language tools, maximizing the likelihood of adoption and growth.

Diepgaand onderzoek beantwoordt de prompt op een zeer gedetailleerde manier. Het biedt naast elkaar naar land uitgesplitste gegevens voor zowel de top 10 ontwikkelde landen als de top 10 ontwikkelingslanden. Informatie kan makkelijk worden opgezocht en vergeleken. Het gebruikt die informatie om gedetailleerde en bruikbare aanbevelingen te doen voor het betreden van markten.

Hoe het werkt

Diepgaand onderzoek is getraind met behulp van end-to-end versterkende leermethoden bij lastig browsen en redeneren in een aantal verschillende domeinen. Door die training ontdekte het hoe het een traject in meerdere stappen kan plannen en uitvoeren om de benodigde data te vinden en om zo nodig een stap terug te doen en te reageren op realtime informatie. Het model kan ook door bestanden browsen die door gebruikers zijn geüpload, grafieken plotten en itereren met behulp van de Python-tool, gegenereerde grafieken of afbeeldingen van websites in de antwoorden opnemen en specifieke zinnen of passages uit de bronnen aanhalen. Als gevolg van deze training worden zeer goede resultaten bereikt bij op problemen in de echte wereld gerichte openbare evaluaties.

Het laatste examen van de mensheid

In Het laatste examen van de mensheid⁠(opent in een nieuw venster), een onlangs uitgebrachte evaluatie waarin AI wordt getest op vragen op expertniveau over een breed scala aan onderwerpen, scoort het model achter diepgaand onderzoek met een nauwkeurigheid van 26,6% een nieuw record. Deze test bestaat uit meer dan 3000 meerkeuzevragen en korte antwoordvragen over meer dan 100 onderwerpen, van taalkunde tot raketwetenschap en van klassiekers tot ecologie. Ten opzicht van OpenAI o1 was de winst het grootst bij scheikunde, menswetenschappen en sociale wetenschappen, en wiskunde. Het model dat diepgaand onderzoek aanstuurt, toonde een mensachtige aanpak, want het ging doelgericht op zoek naar gespecialiseerde informatie wanneer dat nodig was.

Model	Nauwkeurigheid (%)
GPT-4o	3,3
Grok-2	3,8
Claude 3.5 Sonnet	4,3
Gemini Thinking	6,2
OpenAI o1	9,1
DeepSeek-R1*	9,4
OpenAI o3-mini (medium)*	10,5
OpenAI o3-mini (hoog)*	13,0
OpenAI diepgaand onderzoek**	26,6

* Model is niet multimodaal, geëvalueerd op subset met alleen tekst.

**met browsen + python-tools

GAIA

Op GAIA⁠(opent in een nieuw venster)¹, een openbare benchmark die AI evalueert aan de hand van vragen uit de reële wereld, bereikt het model dat diepgaand onderzoek aanstuurt een nieuwe state-of-the-art (SOTA), met een toppositie in het externe klassement⁠(opent in een nieuw venster). Deze taken omvatten vragen op drie verschillende moeilijkheidsniveaus en vereisen vaardigheden zoals redeneren, multimodale vermogens, browsen op internet en vakkundig gebruik van tools.

GAIA
	Niveau 1	Niveau 2	Niveau 3	Gem.
Vorige SOTA(opent in een nieuw venster)	67,92	67,44	42,31	63,64
Diepgaand onderzoek (pass@1)	74,29	69,06	47,6	67,36
Diepgaand onderzoek (cons@64)	78,66	73,21	58,03	72,57

GAIA-taakvoorbeelden

In Nature journal's Scientific Reports conference proceedings from 2012, in the article that did not mention plasmons or plasmonics, what nano-compound is studied? Don’t use the prefix nano in your answer if there is one.

[The remaining Chain-of-Thought messages and the final answer are hidden to protect the benchmark's ground truth answer.]

De zoekopdracht verduidelijken

Ik ben bezig met een zoekvraag naar een artikel uit 2012 in Scientific Reports met de beschrijving van een nanoverbinding, uitgezonderd verbindingen die met plasmonica te maken hebben. Waarschijnlijk gaat het hierbij om het filteren van specifieke onderwerpen of verbindingen, zoals zilver of grafeen.

Gegevens verzamelen

Ik ben aan het zoeken naar 'Scientific Reports 2012 nanodeeltjes', dat zal wel wat nanoverbindingen opleveren. Geïnteresseerd in het uitfilteren van plasmonicagerelateerde onderwerpen, misschien met speciale aandacht voor zilver, grafeen of kwantumstippen.

[zoekhandeling]

Door zoekfilters navigeren

Ik ben voor het jaar 2012 met geavanceerde zoekfilters aan het graven in nature.com en Scientific Reports en probeer artikelen te vinden over amorfe nanodeeltjes van koolstof in karamels.

Conferentieverslag op het spoor gekomen

De zoekresultaten laten een conferentieverslag zien met de titel '2D quasiperiodieke plasmonische kristallen' uit 2012, waarschijnlijk gevonden in de categorie 'conferentieverslagen' in Scientific Reports.

[aan het browsen]

Over mogelijke problemen nadenken

Ik denk na over de oorzaken voor een problematische webpagina, die waarschijnlijk te wijten is aan een verouderd type agent of een onbedoelde blokkade.

[aan het browsen]

Dynamische opties overwegen

Ik denk na over een natuursite met dynamische inhoud of een versie in de cache. Het kan daarnaast ook helpen om naar specifieke zinnen te zoeken.

[zoekhandeling]

De belangrijkste kenmerken op een rij

OK, ik heb vier conferentieverslagen uit 2012 in Sci Rep. gevonden. Sommige vermelden 'plasmonisch' en moeten worden uitgesloten.

[aan het browsen]

Inzichten verzamelen

Ik verzamel info over toegang tot cache-versies of fragmentuitbreidingen voor specifieke titels zodat ik een uitgebreide analyse kan maken.

[zoekhandeling]

De gegevens tot één geheel samenvoegen

Ik kijk naar de voortgang die is gemaakt tussen de voorjaarsbijeenkomst van 2012 van de European Materials Research Society en het wetenschappelijke rapport, waarbij ik vooral uitga van de conferentieverslagen. Deze aanpak helpt om context en relevantie vast te stellen.

[zoekhandeling]

Aanwijzingen in het tijdschrift traceren

Probeer om verband te leggen tussen conferentieverslagen van eind 2012 en het tijdschrift 'Scientific Reports', met speciale aandacht voor plasmonische 2D quasiperiodieke materialen. Deze aanpak voelt methodisch en precies aan.

[zoekhandeling]

Informatie over evenementen analyseren

Ik noteer dat de zoekresultaten [8] een pagina bevatten met waarschijnlijk een samenvatting van de voorjaarsbijeenkomst van 2012 van de European Materials Research Society, inclusief 25 symposia.

[aan het browsen]

Onderzoek verzamelen

Ik bestudeer een waarschijnlijke verzamelpagina met vier artikelen, waarin plasmonische en metamateriale onderwerpen aan bod komen en ik zet de belangrijkste bronnen van de voorjaarsbijeenkomst van 2012 van de European Materials Research Society op een rijtje.

[aan het browsen]

De focus bepalen

Ik focus me op de conferentieverslagen van 2012 in 'Scientific Reports' van E-MRS, waarschijnlijk met onderwerpen als '2D quasiperiodieke plasmonische kristallen' en 'Gelaagde plasmonische mantels om de optische verstrooiing op nanoschaal aan te passen'.

[aan het browsen]

Bibliotheekbronnen evalueren

Nadenken over speciale uitgave E-MRS 2012 Sci rep invited paper Monticone en metamaterialenlab bij News Archives - 2012.

[aan het browsen]

Toegankelijkheid beoordelen

Ik verzamel info over mogelijke problemen bij de toegang tot de site, gezien de verouderde status of blokkades. Tevens bezig de Monticone-site te evalueren voor een referentielijst.

[aan het browsen]

Samenvoegen van E-MRS 2012

Ik probeer 'Layered Plasmonic Cloaks' te koppelen aan E-MRS 2012. Denk na over andere mogelijke onderwerpen, zoals grafeen en katalyse.

[aan het browsen]

Zoeken naar relevante onderwerpen

Ik verzamel info over onderwerpen als grafeen, fotovoltaïsche energie en nanogestructureerde verbindingen, maar sla onderwerpen over die te maken hebben met plasmonische energie. Dit brengt me ertoe om me te richten op aspecten van nanotechnologie in bredere zin.

[aan het browsen]

Mijn focus aanpassen

Ik breid de zoekparameters uit door specifieke site- en wetenschappelijke identificatoren in te voeren om artikelen over 2D quasiperiodieke plasmonische kristallen in Nature Scientific Reports van 2012 te vinden.

[zoekhandeling]

Zoeken naar niet-plasmonische mogelijkheden

Ik ben de zoekactie aan het beperken tot artikelen uit de speciale E-MRS-uitgave van 2012 in Scientific Reports. Daarvoor moet ik de titels nalopen op niet-plasmonische onderwerpen, zoals grafeen of functionele oxiden. Er is duidelijk vooruitgang geboekt door gericht te zoeken en plasmonische artikelen uit te sluiten.

[zoekhandeling]

Aanwijzingen samenvoegen

Ik analyseer interacties in een grafeen superrooster, waarschijnlijk uit een Sci Rep-artikel. Kijk naar titels van auteurs als Padooru, Yakovlev, Chen en Alu.

[zoekhandeling]

De puzzelstukjes in elkaar passen

Ik ben info aan het verzamelen over de Sci Rep-verslagen van de voorjaarsbijeenkomst van E-MRS van 2012, met de nadruk op uitnodiging geschreven artikelen, zonder aandacht voor plasmonische verschijnselen. De besproken soorten zijn grafeen, katalyse, energiematerialen, nanogeneeskunde en sensoren.

[zoekhandeling]

Taken op expertniveau

Bij een interne evaluatie van taken op expertniveau in een breed scala van delen, werd diepgaand onderzoek door domeinexperts beoordeeld als een automatisering van vele uren moeilijk, handmatig onderzoek.

Slagingspercentage versus maximum aantal tooloproepen

Hoe meer het model browst en daarover nadenkt, des te beter het presteert. Daarom is het belangrijk om het tijd te geven om na te denken.

Taakvoorbeelden op expertniveau

Tijd bespaard op taken: 4 uur

I am a researcher interested in bringing mixed-gas sorption capabilities to my lab. Please discuss the differences between pure- and mixed-gas sorption for glassy polymers, how the dual-mode sorption model can be used to predict mixed-gas sorption behavior in glassy polymers (include equations where applicable), and what challenges there are in accurately predicting pure- and mixed-gas sorption using the dual-mode sorption model. Only include open-source information as of October 1, 2024.

Pure vs. mixed-gas sorption in glassy polymers: In a glassy polymer (below $T_g$ ), a single gas typically exhibits a concave sorption isotherm: uptake rises sublinearly with pressure, unlike the linear Henry’s-law behavior above $T_g$ . This is attributed to “dual-mode” sorption: some penetrant dissolves in the dense polymer matrix (obeying Henry’s law) while additional penetrant saturates specific microvoid “sites” (a Langmuir-type adsorption in the polymer’s nonequilibrium free volume). By contrast, when two or more gases are present, they compete for those limited Langmuir sorption sites. As a result, each component’s sorbed concentration in a mixture is generally lower than it would be at the same partial pressure alone. In particular the less soluble (lower-affinity) gas tends to be more strongly suppressed, often causing the mixed-gas solubility selectivity (ratio of concentrations) to exceed the ideal value predicted from pure-gas isotherms. For example, in CO₂/CH₄ mixtures both components sorb less than in their pure-gas cases (especially CH₄), so the CO₂/CH₄ sorption selectivity is higher under mixture conditions. In extreme cases, mixed-gas effects can even reverse performance trends observed with single gases. (We note that unlike competitive sorption, synergistic sorption – where one gas increases the sorption of another via polymer swelling – is usually minor in rigid high-free-volume polymers under moderate pressures.)

Dual-mode sorption model and mixed-gas prediction: The dual-mode sorption (DMS) model quantitatively captures glassy polymer sorption by superposing a Henry’s-law term and a Langmuir term. For a single gas, the sorbed concentration $C$ (e.g. in cm³(STP) gas per cm³ polymer) is written as:

$C(p) = k_D\,p \;+\; \frac{C'_H\,b\,p}{\,1 + b\,p\,}\,.$

Here $k_D$ is the Henry’s law coefficient for dissolution, $C'_H$ is the Langmuir capacity constant (proportional to the polymer’s unrelaxed free-volume or “hole” capacity), and $b$ is the Langmuir affinity constant. This empirical formula yields the characteristic concave isotherm of glassy polymers and reduces to simple Henry’s law at the glass-transition (since $C'_H \to 0$ as $T \to T_g$ ). The same three parameters ( $k_D, C'_H, b$ ) are obtained by fitting pure-gas sorption data and are then used to predict mixture sorption. For a binary mixture of gases A and B (with partial pressures $p_A, p_B$ ), the DMS model assumes each gas obeys its own Henry’s term and that both compete for the same Langmuir sites. One convenient form is to write the total sorbed concentration as the sum of contributions from each gas:

$C_{\text{tot}} = k_{D,A}p_A + k_{D,B}p_B \;+\; \frac{\,C'_{H,A}\,b_A\,p_A \;+\; C'_{H,B}\,b_B\,p_B\,}{\,1 + b_A p_A + b_B p_B\,}\,,$

which implicitly means the concentration of component i in the mixture is $C_i = k_{D,i} p_i + \frac{C'_{H,i} b_i p_i}{\,1+\sum_j b_j p_j\,}$ . This reduces to the single-gas formula when the other component’s pressure is zero. In practice, partial pressure in these equations is often replaced by fugacity for accuracy at high pressures, though using fugacities or pressures gives nearly the same results if applied consistently. The DMS mixed-gas model predicts the competitive sorption effect observed experimentally – namely, each gas’s uptake is depressed relative to its pure-gas sorption isotherm.

Challenges and limitations: Although the dual-mode model is widely successful in correlating sorption data, it has notable limitations in predicting sorption behavior. First, the DMS model is empirical – its fitted parameters are not universal constants but can vary with polymer formation history, physical aging, and temperature/pressure range. This means a parameter set obtained under one set of conditions may lack predictive power outside its calibration range. For instance, sorption isotherms measured only over a limited pressure range can be fit well by DMS, but extrapolating beyond that (especially approaching plasticization pressures) may be unreliable. Indeed, multiple distinct combinations of $k_D$ , $C'_H$ , $b$ can sometimes fit the same pure-gas isotherm almost equally well – yet they yield markedly different mixed-gas predictions. This sensitivity undermines confidence in mixture forecasts, as one study showed that using different pure-gas fit sets led to only qualitative agreement with some mixed-CO₂/CH₄ data.

Furthermore, DMS inherently assumes a fixed population of Langmuir sites (microvoids) and ignores polymer relaxation or swelling induced by sorbate. In reality, penetrant-induced swelling (plasticization) can increase free volume and sorption capacity, especially for highly condensable gases at high activity – an effect the basic DMS model cannot capture. In binary sorption, this means any synergistic increase in sorption due to a second gas (or due to polymer dilation) is unaccounted for in the standard model. Conversely, the model also cannot describe sorption isotherm shapes that deviate from concave Langmuir-type behavior (e.g. sigmoidal isotherms caused by specific polymer-penetrant interactions or clustering). For example, glassy polymers absorbing polar molecules like alcohols can show sigmoidal sorption isotherms, which the simple dual-mode framework fails to represent. Finally, accurately measuring mixed-gas sorption itself is challenging, and discrepancies between idealized model assumptions (e.g. truly zero downstream pressure, no competitive diffusion limitations) and experimental realities can add to prediction error. Despite these challenges, the dual-mode sorption model – with appropriate care – remains a valuable first approximation for interpreting sorption in glassy polymers, and it highlights the key role of competitive site occupancy in mixed-gas environments. Researchers often turn to more elaborate models (e.g. non-equilibrium lattice fluid or thermodynamic theories) when the dual-mode model’s assumptions break down, but such models come at the cost of additional parameters or complexity. In summary, dual-mode sorption provides a useful baseline for pure- and mixed-gas sorption in glassy polymers, but one must be mindful of its empirical nature and the above limitations when predicting multicomponent sorption behavior in practice.

Sources: Dual-mode sorption model and mixed-gas extension; competitive sorption effects in mixtures; model equations and parameters; limitations of DMS model; parameter sensitivity and predictivity issues.

Inzicht in sorptiemodellen

Ik verzamel info over de sorptie van zuivere en gemengde gassen in glasachtige polymeren, waarbij ik me concentreer op het duale sorptiemodel en uitdagingen in modelvoorspellingen aankaart.

[zoekhandeling]

Open toegang beoordelen

Oké, laat me eens kijken. Het resultaat van MDPI over sorptie van gemengde gassen in glasachtige polymeren is waarschijnlijk open toegang.

[aan het browsen]

Secties bestuderen
Ik verzamel inzichten uit het Dual Mode Sorption Model en de uitgebreide analyse daarvan in het MDPI-paper.

[aan het browsen]

Belangrijke eigenschappen verduidelijken

Ik bestudeer het laboratoriumverslag om de wet van Henry, de affiniteitsconstante van Langmuir en de capaciteitsconstante van Langmuir te begrijpen, die de sorptie van gas beschrijven.

[aan het browsen]

Verzamelen

Ik ben bezig met de mogelijkheid dat 'Vergelijking (3)' en 'Vergelijking (4)' afbeeldingen of formuleweergaven zijn en overweeg de PDF te raadplegen of te zoeken naar eerdere verwijzingen om ze beter te begrijpen.

[aan het browsen]

Titelrelevantie bevestigen

Ik controleer of het document van Freeman en Koros (1980) specifiek overeenkomt met de referentie 'Model for sorption of mixed gases in glassy polymers' door het abstract en de titel te controleren.

[zoekhandeling]

Verbanden tussen artikelen bestuderen

Ik zag dat het resultaat van 'pmc.ncbi.nlm.nih.gov' waarschijnlijk hetzelfde MDPI-artikel is en ik ben benieuwd of het de tekst of een vereenvoudigde versie weergeeft.

[aan het browsen]

Info verzamelen

Ik verzamel informatie over zuivere en gemengde gassorptie in glasachtige polymeren. Dit is een kritieke stap in het begrijpen van het gedrag van het materiaal bij verschillende gasomgevingen.

[zoekhandeling]

Gassorptie vergelijken

Ik heb gemerkt dat de aanwezigheid van kooldioxide in een mengsel de sorptie van methaan in polymeer beïnvloedt, waardoor de sorptie van methaan afneemt in vergelijking met een scenario met puur gas.

[aan het browsen]

Concepten aan elkaar linken

Ik denk na over hoe de term 'uitgebreid dual mode-vergelijkingsmengsel' zich zou kunnen verhouden tot supergeleidende dual mode kabelvergelijkingen. Dit laat zien dat het mogelijk om concepten uit verschillende vakgebieden met elkaar te verbinden.

[zoekhandeling]

Beoordelingsgegevens opvragen

Ik noteer het verzoek om 'Theories of Sorption and Transport in Polymer Membrane' te beoordelen.

[aan het browsen]

PDF-link controleren

Ik ben nieuwsgierig naar Resultaat [2] en het verkennen van het fragment, waarbij een duaal sorptiemodel wordt uitgebreid naar een binair mengsel en de concentratie van A wordt uitgedrukt in termen van partiële drukken en constanten.

[zoekhandeling]

Voorspellen van sorptiegedrag

Het duale model verwacht dat het toevoegen van een tweede gas de sorptie vermindert bij een constante partiële druk, in tegenstelling tot scenario's met puur gas.

[aan het browsen]

Een PDF ophalen

Ik verzamel informatie op een nature.com-PDF, mogelijk een ouder artikel van Yampol'ski, maar ik denk voor een tekstfragment ook aan alternatieve bronnen zoals het archief van de Universiteit van Texas in Austin.

[aan het browsen]

Opslagmogelijkheden controleren

Ik heb ontdekt dat het resultaat van de UT-repository mogelijk niet correct wordt weergegeven. Zoeken erin is onzeker. Als alternatief bevat resultaat [3] een fragment waarin het dual mode-mengsorptiemodel wordt beschreven, met uitleg over competitie-effecten en de geschiktheid ervan voor het modelleren van experimentele gegevens.

[zoekhandeling]

De focus verfijnen

Ik pas mijn aanpak aan om ervoor te zorgen dat de zoekopdracht op de juiste context is gericht.

[zoekhandeling]

Inzicht in sorptiemodellen

Ik beschrijf het duale sorptiemodel voor zuivere gassen: Henry-oplossing en Langmuir-microholte-vulling. Voor gemengde gassen worden competitieve sorptie en niet-idealiteiten benadrukt.

[zoekhandeling]

Hero.epa.gov verkennen

Nadenken over de mogelijke samenvatting of inhoud van hero.epa.gov.

[aan het browsen]

Het model verfijnen

Ik verzamel inzichten in zuivere en gemengde gassorptie, waarbij ik factoren als competitie, plastificering en parameterstabiliteit meeneem. Integratie van gegevens over gemengde gassen voor nauwkeurigere voorspellingen.

[aan het browsen]

Uitdagingen van duale sorptiemodellen aanpakken

Parameterkoppeling en niet-uniciteit beïnvloeden voorspellingen. Als de toestand van het polymeer niet wijzigt, kan dit tot vergissingen leiden.

[aan het browsen]

Afwijking kwantificeren

Ik kwantificeer niet-ideale CO2-CH4-oplosbaarheid in 6FDA-mPDA en laat gemengde gaseffecten op oplosbaarheid zien. Concurrerende sorptie is niet de enige oorzaak van de afname van de doorlatendheidsselectiviteit.

[aan het browsen]

Verwijzingen integreren

Ik ben aanhalingen aan het verzamelen, gericht op open-source materiaal zoals MDPI 2019 en Vopicka 2014, om de discussie over verschillen en uitdagingen in het duale model voor gassorptie in polymere membranen te ondersteunen.

[aan het browsen]

Secties voorstellen

Ik organiseer secties over sorptie van zuivere versus gemengde gassen, verken het duale sorptiemodel en ga in op uitdagingen zoals parameteronzekerheid en voorspelling van gemengde gassen.

Inhoud organiseren

Ik concentreer me op het duale sorptiemodel, waarbij ik het sorptiegedrag van zuivere en gemengde gassen in detail beschrijf en de belangrijkste verschillen en uitdagingen benadruk met opsommingstekens en gestructureerde secties voor meer duidelijkheid.

[zoekhandeling]

Aanhalingen kiezen

Oké, laat me eens kijken. Ik vertrouw op [3], [20], [22] en [21] voor hun duidelijke inzichten in duale sorptie- en gasmengsels.

Parameters in kaart brengen

Ik heb structuur aangebracht in de parameternamen om verwarring te voorkomen. We houden het voor de duidelijkheid bij (k), (C_H') en (b). De vergelijkingen voor zuiver gas en mengsel zijn gedetailleerd en duidelijk geformatteerd.

Uitdagingen aanpakken

Ik houd me bezig met multi-oplossing parameter-aanpassingen, polymeerplastificering en tijdelijke effecten. Deze fijne kneepjes maken het voorspellen van zuivere en gemengde gassorptie lastig.

Verzamelen

Ik ben secties aan het structureren over sorptieverschillen, het duale model voor zuivere gassen, de uitbreiding daarvan naar gemengde gassen en de bijbehorende uitdagingen. Deze progressie lijkt logisch en effectief.

Slagingspercentage voor taken op expertniveau naar geschatte economische waarde

Slagingspercentage voor taken op expertniveau naar geschatte aantal uren

De geschatte economische waarde van een taak is sterker gecorreleerd met het slagingspercentage dan met het aantal uren dat de taak een mens zou kosten. De dingen die modellen moeilijk vinden zijn andere dan wat mensen als tijdrovend ervaren.

Beperkingen

Diepgaand onderzoek ontsluit belangrijke nieuwe mogelijkheden, maar het is nog in een vroeg stadium en heeft beperkingen. Het kan bij antwoorden soms feiten verzinnen of onjuiste gevolgtrekkingen maken, hoewel dit volgens interne evaluaties aanzienlijk minder vaak gebeurt dan bij bestaande ChatGPT‑modellen. Het kan moeite hebben om gezaghebbende informatie te onderscheiden van geruchten, en vertoont momenteel zwakte in het kalibreren van vertrouwen, waardoor onzekerheid vaak niet accuraat wordt weergegeven. Bij de start kunnen er kleine opmaakfouten voorkomen in rapporten en aanhalingen en kan het langer duren voordat taken starten. We verwachten dat al deze problemen bij meer gebruik en tijd snel zullen afnemen.

Toegang

Diepgaand onderzoek in ChatGPT is momenteel zeer rekenintensief. Hoe langer het duurt om een zoekopdracht te onderzoeken, hoe meer inferentieberekeningen er nodig zijn. We beginnen vandaag met een versie die is geoptimaliseerd voor Pro-gebruikers, met maximaal 100 zoekopdrachten per maand. Plus- en Team-gebruikers krijgen daarna toegang, gevolgd door Enterprise. We werken nog aan de toegang voor gebruikers in het Verenigd Koninkrijk, Zwitserland en de Europese Economische Ruimte.

Alle betalende gebruikers krijgen binnenkort aanzienlijk hogere gebruiksgrenzen. Dat gebeurt als we een snellere, meer kosteneffectieve versie van diepgaand onderzoek uitbrengen, dat zal worden aangestuurd door een kleiner model dat desondanks resultaten van hoge kwaliteit levert.

In de komende weken en maanden werken we aan de technische infrastructuur, houden we de huidige release nauwlettend in de gaten en voeren we nog strengere tests uit. Dit komt overeen met ons principe van iteratieve implementatie. Als alle veiligheidscontroles blijven voldoen aan onze vrijgavestandaarden, verwachten we diepgaand onderzoek over ongeveer een maand vrij te geven aan Plus-gebruikers.

Wat nu

Diepgaand onderzoek is op dit moment beschikbaar op ChatGPT‑web en zal binnen een maand worden uitgerold naar mobiele en desktop apps. Op dit moment heeft diepgaand onderzoek toegang tot het open web en alle geüploade bestanden. In de toekomst zul je in staat zijn om verbinding te maken met meer gespecialiseerde gegevensbronnen, waarbij de toegang wordt uitgebreid tot bronnen waarvoor een abonnement nodig is of die intern zijn, om zo de uitvoer nog robuuster en persoonlijker te maken.

Als we verder vooruit kijken, zien we agentische ervaringen samenkomen in ChatGPT voor asynchroon, real-world onderzoek en uitvoering. De combinatie van diepgaand onderzoek, dat asynchroon online onderzoek kan uitvoeren, en Operator, die echte actie kan ondernemen, zal ChatGPT in staat stellen steeds geavanceerdere taken voor je uit te voeren.

Addendum van 3 februari 2025: We hebben rigoureuze veiligheidstests, paraatheidsevaluaties en governance-beoordelingen uitgevoerd op de vroege versie van o3 die diepgaand onderzoek aanstuurt, en het risico als gemiddeld⁠(opent in een nieuw venster) geclassificeerd. We hebben ook aanvullende veiligheidstests uitgevoerd om een beter inzicht te krijgen in de incrementele risico's die gepaard gaan met het feit dat diepgaand onderzoek op het web kan surfen, en we hebben nieuwe risicobeperkingen toegevoegd. We blijven de huidige beperkte release grondig testen en nauwlettend volgen. We zullen onze veiligheidsinzichten en waarborgen voor diepgaand onderzoek delen in een systeemkaart wanneer we de toegang uitbreiden naar Plus-gebruikers.

Voetnoten

1
We hebben vastgesteld dat de referentieantwoorden voor deze gegevensset op grote schaal online zijn gelekt. Daarom hebben we verschillende websites en URL's geblokkeerd om een eerlijke evaluatie van het model te waarborgen.

Auteurs

OpenAI

Hoofden onderzoek

Isa Fulford, Zhiqing Sun

Bijdragers fundamenteel onderzoek

Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi

Belangrijkste bijdragers

Onderzoek

Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong

Implementatie

Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald

Bijdragers

Onderzoek

Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson

+ iedereen die heeft bijgedragen aan o3.

Veiligheidssystemen

Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang

Implementatie

Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen

Leidinggevenden

Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba