Vi presenterar djup research
En agent som använder resonemang för att sammanställa stora mängder onlineinformation och slutföra flerstegs researchuppgifter åt dig. Tillgängligt för Pro-användare i dag, och snart även för Plus- och Team-användare.
Uppdatering 2026-02-10: Du kan nu ansluta djup forskning till valfri MCP eller app och begränsa webbsökningar till betrodda webbplatser så att du kan fokusera på autentiserade, branschstandardiserade källor. Du kan nu även följa framsteg i realtid och avbryta för att förfina med uppföljande promptar eller nya källor. Vi har uppdaterat den visuella upplevelsen så att det är enklare att starta, följa och granska forskning från början till slut.
Uppdatering 2025-07-17: Djup forskning kan nu gå ännu djupare och bredare med tillgång till en visuell webbläsare som en del av ChatGPT‑agenten. För att få tillgång till dessa uppdaterade funktioner väljer du "agentläge" i kompositörens rullgardinsmeny och skriver in din fråga. Den ursprungliga funktionen för djup forskning är fortfarande tillgänglig via alternativet "djup forskning" i verktygsmenyn.
Uppdatering 2025-04-24: Vi ökar hur ofta du kan använda djup forskning. Plus-, Team-, Enterprise- och Edu-användare får nu 25 frågor per månad, Pro-användare 250 och Free-användare 5. Detta är möjligt tack vare en ny lättviktsversion av djup forskning som drivs av en version av o4-mini som är utformad för att vara mer kostnadseffektiv samtidigt som den bibehåller hög kvalitet. När du når din gräns för den fullständiga versionen växlar dina frågor automatiskt till lättviktsversionen.
Uppdatering 2025-02-25: Alla Plus-användare kan nu använda djup forskning.
Uppdatering 2025-02-05: Djup forskning är nu tillgänglig för Pro-användare i Storbritannien, Schweiz och Europeiska ekonomiska samarbetsområdet.
I dag lanserar vi djup research i ChatGPT, en ny agentfunktion som utför flerstegsresearch på internet vid komplexa uppgifter. Det som skulle ta en människa flera timmar klarar den på tio minuter.
Djup research är OpenAI:s nästa agent som kan utföra uppgifter åt dig på ett självständigt sätt. Ge den en prompt, så hittar, analyserar och sammanställer ChatGPT hundratals onlinekällor och skapar en omfattande rapport värdig en researchanalytiker. Med hjälp av en version av den kommande OpenAI o3‑modellen, som är optimerad för webbsurfning och dataanalys, resonerar den sig fram för att söka, tolka och analysera stora mängder text, bilder och PDF:er på internet, och agerar efter behov på den information den stöter på.
Förmågan att sammanställa kunskap är en förutsättning för att skapa ny kunskap. Därför är djup research ett viktigt steg mot vårt bredare mål: att utveckla AGI, som vi sedan länge har föreställt oss kan åstadkomma ny vetenskaplig research.
Djup research är avsedd för personer som utför intensivt kunskapsarbete inom områden som finans, vetenskap, politik och teknik och behöver grundlig, exakt och tillförlitlig research. Det kan vara lika användbart för medvetna kunder som letar efter personanpassade rekommendationer för köp som i vanligtvis kräver noggrann research, som bilar, vitvaror och möbler. Alla utdata är grundligt dokumenterade, med tydliga citeringar och en sammanfattning av tankeprocessen, vilket gör det enkelt att hänvisa till och verifiera informationen. Den är särskilt effektiv för att hitta nischad, icke-intuitiv information som skulle kräva sökningar på flera webbplatser. Djup research frigör värdefull tid, eftersom du snabbar på processen och slipper komplexa och tidskrävande webbsökningar med en enda fråga.
Djup research upptäcker, resonerar kring och sammanställer insikter från nätet på ett självständigt sätt. För att lyckas med detta har den tränats på riktiga uppgifter som kräver användning av webbläsare och Python-verktyg, med hjälp av samma metoder för förstärkningsinlärning som vår första resonemangsmodell OpenAI o1 använder. Medan o1 uppvisar imponerande förmågor inom kodning, matematik och andra tekniska domän, kräver många verkliga utmaningar en omfattande kontext- och informationsinsamling från olika onlinekällor. Djup research bygger på dessa resonemangsförmågor för att överbrygga det gapet, vilket och gör att den kan ta sig an den typ av problem som människor möter på jobbet och i vardagen.
Välj ”djup research” i meddelandefältet i ChatGPT och ställ din fråga. Berätta för ChatGPT vad du behöver, oavsett om det är en konkurrensanalys av streamingplattformar eller en anpassad rapport om den bästa pendlarcykeln. Du kan bifoga filer eller kalkylark för att ge kontext till din fråga. När processen är i gång visas en sidopanel med en sammanfattning av de steg som vidtagits och vilka källor som använts.
Djup research kan ta mellan 5 och 30 minuter att slutföra, eftersom djupdykningar på nätet tar tid. Under tiden kan du ägna dig åt annat eller ta itu med andra uppgifter. Du får ett meddelande när researchen är klar. Den slutgiltiga utdatan kommer i form av en rapport i chatten. Under kommande veckor lägger vi även till inbäddade bilder, datavisualiseringar och andra analysutdata i dessa rapporter för att öka tydligheten och ge mer kontext.
Jämfört med djup research är GPT‑4o perfekt för multimodala samtal i realtid. För mångfasetterade och domänspecifika frågor där djup och detaljrikedom är avgörande, är den djupa researchens förmåga att genomföra omfattande efterforskningar och citera varje påstående, skillnaden mellan en snabb sammanfattning och ett väldokumenterat och verifierat svar som kan användas som arbetsprodukt.
GPT-4o
Djup research
Djup research svarar på prompten på ett mycket detaljerat sätt och presenterar landspecifika data sida vid sida för såväl de 10 främsta i-länderna som de 10 främsta u-länderna, så att du enkelt kan komma åt dem och göra jämförelser. Den använder informationen för att ge detaljerade rekommendationer för marknadstillträde som är både välinformerade och användbara.
Djup research har tränats med genomgående förstärkningsinlärning på svåra webbsöknings- och resonemangsuppgifter inom en rad olika domän. Genom denna träning har den lärt sig att planera och utföra en process i flera steg för att hitta de data som behövs och vid behov gå tillbaka och reagera på information i realtid. Modellen kan även söka igenom filer som användare laddat upp, rita och iterera på diagram med hjälp av python-verktyget, bädda in såväl genererade diagram och bilder från webbplatser i sina svar och citera specifika meningar eller passager från sina källor. Som ett resultat av denna träning når den nya höjder vad gäller en rad offentliga utvärderingar som är fokuserade på verkliga problem.
I Humanity’s Last Exam(öppnas i ett nytt fönster), en nyligen publicerad utvärdering som testar AI på frågor på expertnivå inom en rad olika ämnen, får modellen som använder djup research en ny toppnotering med 26,6 % riktighet. Testet består av över 3 000 flervals- och kortsvarsfrågor inom fler än 100 ämnen, alltifrån lingvistik och raketforskning till klassiker och ekologi. Jämfört med OpenAI o1 märktes de största fördelarna inom kemi, humaniora och samhällsvetenskap samt matematik. Modellen bakom djup research visade prov på ett mänskligt tillvägagångssätt i och med att den vid behov sökte efter specialiserad information på ett effektivt sätt.
| Modell | Riktighet (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medel)* | 10,5 |
| OpenAI o3-mini (hög)* | 13,0 |
| OpenAI djup research** | 26,6 |
I GAIA(öppnas i ett nytt fönster)1, ett offentligt riktmärke som utvärderar AI på verkliga frågor uppnådde modellen som driver djup research en ny state of the art (SOTA) och toppar den externa resultattavlan(öppnas i ett nytt fönster). Frågorna omfattar tre svårighetsgrader och för att lyckas med uppgifterna krävs förmågor som t.ex. resonemang, multimodal förmåga, webbsurfning och verktygsanvändning.
| GAIA | ||||
|---|---|---|---|---|
| Nivå 1 | Nivå 2 | Nivå 3 | Snitt | |
| Föregående SOTA(öppnas i ett nytt fönster) | 67,92 | 67,44 | 42,31 | 63,64 |
| Djup research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Djup research (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Exempel på GAIA-uppgifter
Under en intern utvärdering av uppgifter på expertnivå inom en rad olika områden bedömde domänexperter att djup research hade automatiserat flera timmars arbetskrävande och manuella efterforskningar.
Godkännandefrekvens jämfört med max verktygsanrop
Exempel på uppgifter på expertnivå
Godkännandefrekvens för uppgifter på expertnivå efter beräknat ekonomiskt värde
Godkännandefrekvens för uppgifter på expertnivå efter beräknade timmar
Djup research innebär nya och betydande möjligheter, men befinner sig fortfarande i ett tidigt skede och har sina begränsningar. Den kan ibland hitta på fakta i svaren eller dra felaktiga slutsatser, även om det sker i en avsevärt lägre grad jämfört med befintliga ChatGPT‑modeller, enligt interna utvärderingar. Den kan ha svårt att skilja mellan tillförlitlig information och rykten, uppvisar för närvarande brister när det gäller att kalibrera självförtroendet och misslyckas ofta med att uttrycka osäkerhet på ett korrekt sätt. Inledningsvis kan det förekomma mindre formateringsfel i rapporter och källhänvisningar, och vissa uppgifter kan ta längre tid att starta. Vi förväntar oss att alla dessa problem snabbt förbättras med tiden och genom ökad användning.
Djup research i ChatGPT är för närvarande en mycket beräkningsintensiv process. Ju längre tid det tar att utforska en fråga, desto mer beräkningskraft krävs för slutsatserna. Vi börjar med en version som är optimerad för Pro-användare i dag, med upp till 100 frågar per månad. Sedan får Plus- och Team-användarna tillgång, följt av Enterprise-användarna. Vi arbetar fortfarande med att ge tillgång till användare i Storbritannien och Nordirland, Schweiz och EES.
Alla betalande användare kommer snart att få betydligt högre hastighetsgränser när vi lanserar en snabbare och mer kostnadseffektiv version av djup research som använder en mindre modell som ändå levererar högkvalitativa resultat.
Under de kommande veckorna och månaderna kommer vi att arbeta med den tekniska infrastrukturen, noga övervaka den nuvarande versionen och genomföra ännu mer rigorösa tester. Detta är i linje med vår princip om iterativ lansering. Om alla säkerhetskontroller fortsätter att uppfylla våra lanseringsstandarder räknar vi med att lansera djup research till Plus-användarna inom ungefär en månad.
Djup research är tillgänglig i dag i webbversionen av ChatGPT, och lanseras till mobil- och skrivbordsapparna inom en månad. För närvarande kan djup research komma åt öppna webben och alla uppladdade filer. I framtiden kommer du att kunna koppla upp dig mot mer specialiserade datakällor – vilket ger utökad åtkomst till prenumerationsbaserade eller interna resurser – för att göra resultaten ännu mer robusta och personliga.
Långsiktigt ser vi framför oss att agentbaserade upplevelser samlas i ChatGPT för asynkron, verklighetsbaserad research och utförande. Kombinationen av djup research, som kan utföra asynkrona onlineundersökningar, och Operator, som kan vidta verkliga åtgärder, kommer att göra att ChatGPT kan utföra mer och mer avancerade uppgifter åt dig.
Tillägg 3 februari 2025: Vi har genomfört rigorösa säkerhetstester, beredskapsutvärderingar och styrningsgranskningar av den tidiga versionen av o3 som driver djup research, och identifierat att risknivån ligger på Medel(öppnas i ett nytt fönster). Vi har också genomfört ytterligare säkerhetstester för att bättre förstå de ökade riskerna kopplade till djup research och dess förmåga att bläddra på webben, och vi har lagt till nya åtgärder för att minska riskerna. Vi fortsätter att genomföra grundliga tester och noga övervaka den nuvarande begränsade releasen. Vi delar med oss av våra säkerhetsinsikter och skyddsåtgärder för djup research i ett systemkort när vi utökar åtkomsten till Plus-användarna.
Fotnoter
- 1
Vi upptäckte att de bekräftat korrekta svaren för denna datamängd utsatts för omfattande läckor online, och vi har därför blockerat flera webbplatser och URL:er i syfte att säkerställa en rättvis utvärdering av modellen.
Författare
Forskningschefer
Isa Fulford, Zhiqing Sun
Grunddeltagare
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Viktiga deltagare
Forskning
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Driftsättning
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Deltagare
Forskning
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ alla som bidragit till arbetet med o3.
Säkerhetssystem
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Driftsättning
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Ledarskap
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba