De introductie van diepgaand onderzoek
Een agent die met redeneren grote hoeveelheden online-informatie synthetiseert en meerstapsonderzoek voor je afrondt. Vanaf nu beschikbaar voor Pro-gebruikers, binnenkort ook voor Plus- en Team-gebruikers.
Update van 10 februari 2026: Je kunt nu diepgaand onderzoek verbinden met elke MCP of app en webzoekopdrachten beperken tot vertrouwde sites. Zo kun jij je richten op geverifieerde bronnen die gelden als standaard binnen de sector. Je kunt nu ook de voortgang in realtime volgen en onderbreken om te verfijnen met vervolgprompts of nieuwe bronnen. We hebben de visuele ervaring bijgewerkt zodat het eenvoudiger is om je onderzoek van begin tot eind te starten, te volgen en te beoordelen.
Update van 17 juli 2025: Diepgaand onderzoek kan nu nog dieper en breder worden uitgevoerd dankzij toegang tot een visuele browser binnen de ChatGPT‑agent. Om toegang te krijgen tot deze nieuwe mogelijkheden, selecteer je 'agent-modus' uit de vervolgkeuzelijst in de composer en voer je je vraag rechtstreeks in. De oorspronkelijke functionaliteit voor diepgaand onderzoek blijft beschikbaar via de optie 'diepgaand onderzoek' in het menu 'Tools'.
Update van 24 april 2025: We verhogen aanzienlijk hoe vaak je diepgaand onderzoek kunt gebruiken—Plus-, Team-, Enterprise- en Edu-gebruikers krijgen nu 25 zoekopdrachten per maand, Pro-gebruikers krijgen er 250 en Free-gebruikers krijgen er 5. Dit wordt mogelijk gemaakt door een nieuwe lichtgewicht versie van diepgaand onderzoek, aangedreven door een versie van o4-mini. Deze versie is voordeliger, met behoud van de onberispelijke kwaliteit. Zodra je de limiet voor de volledige versie hebt bereikt, schakelen je zoekopdrachten automatisch over naar de lichtgewicht versie.
Update 25 februari 2025: Alle Plus-gebruikers kunnen nu diepgaand onderzoek gebruiken.
Update van 5 februari 2025: Diepgaand onderzoek is nu beschikbaar voor Pro-gebruikers in het Verenigd Koninkrijk, Zwitserland en de Europese Economische Ruimte.
Vandaag lanceren we diepgaand onderzoek in ChatGPT, een nieuwe capaciteit van agenten waarmee voor complexe taken meervoudig stappenonderzoek op het internet worden uitgevoerd. Het doet in tientallen minuten wat een mens vele uren zou kosten.
Deep research is de volgende agent van OpenAI's die zelfstandig werk voor je kan doen - je komt met een prompt en ChatGPT vindt, analyseert en synthetiseert honderden online bronnen om een uitgebreid rapport te maken op het niveau van dat van een onderzoeksanalist. Aangestuurd door een versie van het komende OpenAI o3‑model dat is geoptimaliseerd voor browsen op internet en gegevensanalyse, maakt het gebruik van redeneren om enorme hoeveelheden tekst, afbeeldingen en PDF's op het internet te doorzoeken, interpreteren en analyseren, waarbij het richting kiest op basis van de informatie die het aantreft.
Het vermogen om kennis te synthetiseren is een voorwaarde voor het creëren van nieuwe kennis. Om deze reden vormt diepgaand onderzoek een belangrijke stap in de richting van ons bredere doel om AGI te ontwikkelen, waarvan we al lang denken dat het in staat zal zijn tot nieuw wetenschappelijk onderzoek.
Deep research is gemaakt voor mensen die intensief kenniswerk verrichten op gebieden als financiën, wetenschap, beleid en engineering en daarvoor grondig, nauwkeurig en betrouwbaar onderzoek nodig hebben. Het kan net zo nuttig zijn voor veeleisende shoppers die op zoek zijn naar hypergepersonaliseerde aanbevelingen voor het soort aankopen dat doorgaans zorgvuldig onderzoek vereist, zoals auto's, apparaten en meubels. Elke uitvoer is volledig gedocumenteerd, met duidelijke citaten en een samenvatting van de gedachtegang, waardoor het eenvoudig is om de informatie te raadplegen en te verifiëren. Het is vooral effectief bij het vinden van niche-informatie van non-intuïtieve aard waarvoor je veel websites moet doorzoeken. Deep research maakt kostbare tijd vrij doordat je complexe, tijdrovende webonderzoeken met slechts één zoekopdracht kunt uitvoeren.
Deep research ontdekt, beredeneert en bundelt onafhankelijke inzichten vanuit het hele internet. Om dit te bereiken, werd het getraind op realistische taken die het gebruik van browsers en Python-tools vereisen waarbij gebruik werd gemaakt van dezelfde versterkende leermethoden als bij OpenAI o1, ons eerste redeneringsmodel. Hoewel o1 indrukwekkende capaciteiten laat zien op het gebied van programmeren, wiskunde en andere technische domeinen, zijn voor veel uitdagingen in de echte wereld uitgebreide context en het verzamelen van informatie uit diverse online bronnen nodig. Deep research bouwt voort op deze redeneercapaciteiten om die kloof te overbruggen, waardoor deze het soort problemen kan aanpakken waarmee mensen op het werk en in het dagelijks leven worden geconfronteerd.
Selecteer in ChatGPT op het berichtenformulier 'diepgaand onderzoek' en voer je vraag in. Vertel ChatGPT wat je nodig hebt, of het nu gaat om een concurrentieanalyse van streamingplatforms of een gepersonaliseerd rapport over de beste fiets om naar je werk te gaan. Je kunt bestanden of spreadsheets bijvoegen om context aan je vraag toe te voegen. Zodra het onderzoek begint, verschijnt er een zijbalk met een samenvatting van de genomen stappen en gebruikte bronnen.
Diepgaand onderzoek duurt 5 tot 30 minuten, de tijd die het nodig heeft om het internet grondig te doorzoeken. In de tussentijd kun je weggaan of aan andere taken werken. Je ontvangt een melding zodra het onderzoek is voltooid. De uiteindelijke uitvoer komt als rapport binnen in de chat. In de komende weken zullen we ook afbeeldingen, datavisualisaties en andere analytische output in deze rapporten opnemen, zodat deze nog meer duidelijkheid en context verschaffen.
Vergeleken met diepgaand onderzoek is GPT‑4o ideaal voor realtime, multimodale gesprekken. Voor veelzijdige, domeinspecifieke onderzoeken waarbij diepgang en detail cruciaal zijn, is het vermogen van diepgaand onderzoek om uitgebreid onderzoek te doen en bij elke bewering de bron te noemen het verschil tussen een snelle samenvatting en een goed gedocumenteerd, verifieerbaar antwoord dat als professioneel product kan worden gebruikt.
GPT-4o
Diepgaand onderzoek
Diepgaand onderzoek beantwoordt de prompt op een zeer gedetailleerde manier. Het biedt naast elkaar naar land uitgesplitste gegevens voor zowel de top 10 ontwikkelde landen als de top 10 ontwikkelingslanden. Informatie kan makkelijk worden opgezocht en vergeleken. Het gebruikt die informatie om gedetailleerde en bruikbare aanbevelingen te doen voor het betreden van markten.
Diepgaand onderzoek is getraind met behulp van end-to-end versterkende leermethoden bij lastig browsen en redeneren in een aantal verschillende domeinen. Door die training ontdekte het hoe het een traject in meerdere stappen kan plannen en uitvoeren om de benodigde data te vinden en om zo nodig een stap terug te doen en te reageren op realtime informatie. Het model kan ook door bestanden browsen die door gebruikers zijn geüpload, grafieken plotten en itereren met behulp van de Python-tool, gegenereerde grafieken of afbeeldingen van websites in de antwoorden opnemen en specifieke zinnen of passages uit de bronnen aanhalen. Als gevolg van deze training worden zeer goede resultaten bereikt bij op problemen in de echte wereld gerichte openbare evaluaties.
In Het laatste examen van de mensheid(opent in een nieuw venster), een onlangs uitgebrachte evaluatie waarin AI wordt getest op vragen op expertniveau over een breed scala aan onderwerpen, scoort het model achter diepgaand onderzoek met een nauwkeurigheid van 26,6% een nieuw record. Deze test bestaat uit meer dan 3000 meerkeuzevragen en korte antwoordvragen over meer dan 100 onderwerpen, van taalkunde tot raketwetenschap en van klassiekers tot ecologie. Ten opzicht van OpenAI o1 was de winst het grootst bij scheikunde, menswetenschappen en sociale wetenschappen, en wiskunde. Het model dat diepgaand onderzoek aanstuurt, toonde een mensachtige aanpak, want het ging doelgericht op zoek naar gespecialiseerde informatie wanneer dat nodig was.
| Model | Nauwkeurigheid (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (hoog)* | 13,0 |
| OpenAI diepgaand onderzoek** | 26,6 |
Op GAIA(opent in een nieuw venster)1, een openbare benchmark die AI evalueert aan de hand van vragen uit de reële wereld, bereikt het model dat diepgaand onderzoek aanstuurt een nieuwe state-of-the-art (SOTA), met een toppositie in het externe klassement(opent in een nieuw venster). Deze taken omvatten vragen op drie verschillende moeilijkheidsniveaus en vereisen vaardigheden zoals redeneren, multimodale vermogens, browsen op internet en vakkundig gebruik van tools.
| GAIA | ||||
|---|---|---|---|---|
| Niveau 1 | Niveau 2 | Niveau 3 | Gem. | |
| Vorige SOTA(opent in een nieuw venster) | 67,92 | 67,44 | 42,31 | 63,64 |
| Diepgaand onderzoek (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Diepgaand onderzoek (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
GAIA-taakvoorbeelden
Bij een interne evaluatie van taken op expertniveau in een breed scala van delen, werd diepgaand onderzoek door domeinexperts beoordeeld als een automatisering van vele uren moeilijk, handmatig onderzoek.
Slagingspercentage versus maximum aantal tooloproepen
Taakvoorbeelden op expertniveau
Slagingspercentage voor taken op expertniveau naar geschatte economische waarde
Slagingspercentage voor taken op expertniveau naar geschatte aantal uren
Diepgaand onderzoek ontsluit belangrijke nieuwe mogelijkheden, maar het is nog in een vroeg stadium en heeft beperkingen. Het kan bij antwoorden soms feiten verzinnen of onjuiste gevolgtrekkingen maken, hoewel dit volgens interne evaluaties aanzienlijk minder vaak gebeurt dan bij bestaande ChatGPT‑modellen. Het kan moeite hebben om gezaghebbende informatie te onderscheiden van geruchten, en vertoont momenteel zwakte in het kalibreren van vertrouwen, waardoor onzekerheid vaak niet accuraat wordt weergegeven. Bij de start kunnen er kleine opmaakfouten voorkomen in rapporten en aanhalingen en kan het langer duren voordat taken starten. We verwachten dat al deze problemen bij meer gebruik en tijd snel zullen afnemen.
Diepgaand onderzoek in ChatGPT is momenteel zeer rekenintensief. Hoe langer het duurt om een zoekopdracht te onderzoeken, hoe meer inferentieberekeningen er nodig zijn. We beginnen vandaag met een versie die is geoptimaliseerd voor Pro-gebruikers, met maximaal 100 zoekopdrachten per maand. Plus- en Team-gebruikers krijgen daarna toegang, gevolgd door Enterprise. We werken nog aan de toegang voor gebruikers in het Verenigd Koninkrijk, Zwitserland en de Europese Economische Ruimte.
Alle betalende gebruikers krijgen binnenkort aanzienlijk hogere gebruiksgrenzen. Dat gebeurt als we een snellere, meer kosteneffectieve versie van diepgaand onderzoek uitbrengen, dat zal worden aangestuurd door een kleiner model dat desondanks resultaten van hoge kwaliteit levert.
In de komende weken en maanden werken we aan de technische infrastructuur, houden we de huidige release nauwlettend in de gaten en voeren we nog strengere tests uit. Dit komt overeen met ons principe van iteratieve implementatie. Als alle veiligheidscontroles blijven voldoen aan onze vrijgavestandaarden, verwachten we diepgaand onderzoek over ongeveer een maand vrij te geven aan Plus-gebruikers.
Diepgaand onderzoek is op dit moment beschikbaar op ChatGPT‑web en zal binnen een maand worden uitgerold naar mobiele en desktop apps. Op dit moment heeft diepgaand onderzoek toegang tot het open web en alle geüploade bestanden. In de toekomst zul je in staat zijn om verbinding te maken met meer gespecialiseerde gegevensbronnen, waarbij de toegang wordt uitgebreid tot bronnen waarvoor een abonnement nodig is of die intern zijn, om zo de uitvoer nog robuuster en persoonlijker te maken.
Als we verder vooruit kijken, zien we agentische ervaringen samenkomen in ChatGPT voor asynchroon, real-world onderzoek en uitvoering. De combinatie van diepgaand onderzoek, dat asynchroon online onderzoek kan uitvoeren, en Operator, die echte actie kan ondernemen, zal ChatGPT in staat stellen steeds geavanceerdere taken voor je uit te voeren.
Addendum van 3 februari 2025: We hebben rigoureuze veiligheidstests, paraatheidsevaluaties en governance-beoordelingen uitgevoerd op de vroege versie van o3 die diepgaand onderzoek aanstuurt, en het risico als gemiddeld(opent in een nieuw venster) geclassificeerd. We hebben ook aanvullende veiligheidstests uitgevoerd om een beter inzicht te krijgen in de incrementele risico's die gepaard gaan met het feit dat diepgaand onderzoek op het web kan surfen, en we hebben nieuwe risicobeperkingen toegevoegd. We blijven de huidige beperkte release grondig testen en nauwlettend volgen. We zullen onze veiligheidsinzichten en waarborgen voor diepgaand onderzoek delen in een systeemkaart wanneer we de toegang uitbreiden naar Plus-gebruikers.
Voetnoten
- 1
We hebben vastgesteld dat de referentieantwoorden voor deze gegevensset op grote schaal online zijn gelekt. Daarom hebben we verschillende websites en URL's geblokkeerd om een eerlijke evaluatie van het model te waarborgen.
Auteurs
Hoofden onderzoek
Isa Fulford, Zhiqing Sun
Bijdragers fundamenteel onderzoek
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Belangrijkste bijdragers
Onderzoek
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Implementatie
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Bijdragers
Onderzoek
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ iedereen die heeft bijgedragen aan o3.
Veiligheidssystemen
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Implementatie
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leidinggevenden
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba