Vi introduserer Deep Research
En agent som bruker resonnering for å sammenfatte store mengder informasjon fra nettet og utføre komplekse research-oppgaver for deg. Tilgjengelig for Pro-brukere i dag. Plus- og Team-brukere kommer snart.
Oppdatering 10. februar 2026: Du kan nå koble dyp forskning til hvilken som helst MCP eller app og begrense nettsøk til pålitelige nettsteder, slik at du kan fokusere på autentiserte, bransjestandardkilder. Du kan nå også spore fremdriften i sanntid og avbryte for å forbedre med oppfølgingsspørsmål eller nye kilder. Vi har oppdatert den visuelle opplevelsen slik at det er enklere å starte, spore og gjennomgå forskningen din fra start til slutt.
Oppdatering 17. juli 2025: Dyp forskning kan nå gå enda dypere og bredere med tilgang til en visuell nettleser som en del av ChatGPT‑agenten. For å få tilgang til disse oppdaterte funksjonene, velger du “agentmodus” fra rullegardinmenyen i oppretteren, og skriver inn forespørselen din direkte. Den opprinnelige funksjonaliteten for dyp forskning er fortsatt tilgjengelig via “dyp forskning”-alternativet i verktøymenyen.
Oppdatering 24. april 2025: Vi øker betydelig hvor ofte du kan bruke dyp forskning–Plus-, Team-, Enterprise- og Edu-brukere får nå 25 forespørsler per måned, Pro-brukere får 250, og Free-brukere får 5. Dette er mulig takket være en ny lettversjon av dyp forskning, drevet av en versjon av o4-mini, som er designet for å være mer kostnadseffektiv samtidig som den bevarer høy kvalitet. Når du når grensen for fullversjonen, vil forespørslene dine automatisk gå over til lettversjonen.
Oppdatering 25. februar 2025: Alle Plus-brukere kan nå bruke dyp forskning.
Oppdatering 5. februar 2025: Dyp forskning er nå tilgjengelig for Pro-brukere i Storbritannia, Sveits og EØS.
I dag lanserer vi Deep Research i ChatGPT – en ny agentbasert funksjon som utfører flertrinns research på internett for komplekse oppgaver. Den bruker bare noen titalls minutter på noe som ville tatt en person mange timer.
Deep Research er OpenAIs neste agent som kan gjøre jobben for deg – du sender inn en melding, og ChatGPT finner, analyserer og sammenfatter hundrevis av kilder for å opprette en helhetlig rapport, omtrent som en forskningsanalytiker. Den er drevet av en kommende versjon av OpenAI o3‑modellen, som er optimalisert for nettsøk og dataanalyse. Den bruker resonnering for å søke etter, tolke og analysere store mengder tekst, bilder og PDF-er på nettet, og tilpasser seg fortløpende ut fra informasjonen den møter.
Evnen til å syntetisere kunnskap er en forutsetning for å skape ny kunnskap. Derfor representerer Deep Research et viktig skritt i retning av det overordnede målet om å utvikle AGI – som vi lenge har sett for oss som noe som kan produsere ny vitenskapelig forskning.
Deep Research er utviklet for folk i yrker som krever inngående kunnskap innen områder som finans, vitenskap, politikk og ingeniørfag – og som trenger grundig, presis og pålitelig research. Det er like nyttig for kresne forbrukere som ønsker svært personlig tilpassede anbefalinger i kjøpsprosesser som vanligvis krever at man gjør mye research – som biler, hvitevarer og møbler. Alle utdata er grundig dokumentert, med tydelige kildehenvisninger og et sammendrag av tanken bak, slik at det er lett å sjekke opp og bekrefte informasjonen. Funksjonen er spesielt effektiv når det gjelder å finne smal, lite intuitiv informasjon som ellers ville krevd å bla gjennom mange nettsteder. Deep Research frigjør verdifull tid ved å gjøre det mulig å utføre tidkrevende og kompleks research på nett med bare én forespørsel.
Deep Research oppdager, resonnerer over og sammenfatter innsikt fra Internett – helt på egen hånd. For å få til dette ble modellen lært opp med faktiske oppgaver som krever bruk av nettleser- og Python-verktøy, ved hjelp av de samme metodene for forsterkende læring som ligger bak OpenAI o1, den første resonneringsmodellen. Mens o1 demonstrerer imponerende evner innen koding, matematikk og andre tekniske domener, krever mange reelle utfordringer grundig kontekst og innhenting av informasjon fra ulike kilder på nett. Deep Research bygger videre på disse resonneringsegenskapene for å tette dette gapet, og for å kunne håndtere utfordringer folk støter på i arbeids- og dagliglivet.
I ChatGPT velger du «Deep Research» i meldingsfeltet og skriver inn forespørselen din. Fortell ChatGPT hva du trenger – enten det er en analyse av konkurrenter innen strømmetjenester eller en personlig tilpasset rapport om den beste bysykkelen. Du kan legge ved filer eller regneark for å gi mer kontekst til forespørselen. Når Deep Research starter, vises et sidefelt med et sammendrag av trinnene som utføres og kildene som brukes.
Deep Research kan bruke alt fra 5 til 30 minutter på å gjøre ferdig jobben, det tar den tiden som trengs for å gå i dybden på nettet. I mellomtiden kan du jobbe eller gjøre andre ting – du får et varsel når Deep Research er ferdig utført. De endelige utdataene leveres som en rapport i chatten – i løpet av de neste ukene skal vi også legge til innebygde bilder, datavisualiseringer og andre analytiske utdata i disse rapportene for ekstra klarhet og kontekst.
Sammenlignet med Deep Research er 4o ideell for samtaler i sanntid med både tekst, bilde og lyd. For komplekse og domenespesifikke forespørsler der dybde og detaljer er avgjørende, gjør evnen til å gjennomføre omfattende utforsking og dokumentere hver påstand at Deep Research utgjør forskjellen mellom et raskt sammendrag og et godt dokumentert, verifisert svar du kan bruke som arbeidsprodukt.
GPT-4o
Deep Research
Deep Research svarer på meldingen på en svært detaljert måte, og gir sammenlignbare, landspesifikke data for både de 10 mest og de 10 minst utviklede landene innenfor det aktuelle emnet. Den bruker informasjonen til å gi brukeren detaljerte råd om markeder å gå inn i, som er både informerte og anvendelige.
Deep Research ble lært opp med helhetlig forsterkende læring på krevende nettlesings- og resonneringsoppgaver på tvers av ulike domener. Gjennom denne opplæringen lærte den å planlegge og gjennomføre en prosess med flere trinn for å finne dataene den trenger, med tilbakesporing og tilpasning til informasjon i sanntid der det trengs. Modellen kan også bla gjennom filer opplastet av brukere, lage og videreutvikle grafer med Python-verktøyet, bygge inn både genererte grafer og bilder fra nettsteder i svarene sine og sitere spesifikke setninger eller utdrag fra kilder. Som et resultat av denne opplæringen presterer den svært godt i flere offentlige evalueringer med fokus på virkelige problemer.
I evalueringen Humanity’s Last Exam(åpnes i et nytt vindu), en nylig lansert evaluering som tester KI med ekspertspørsmål innen et bredt spekter av fagområder, scorer modellen som driver Deep Research høyere enn noensinne med 26,6 % nøyaktighet. Testen består av over 3000 flervalgsspørsmål og korte svar i fritekst innen mer enn 100 fagområder, fra lingvistikk til romteknologi, klassiske fag til økologi. Sammenlignet med OpenAI o1 er de største forbedringene innen kjemi, humanistiske fag og samfunnsvitenskap, samt matematikk. Modellen som driver Deep Research viste en menneskelignende tilnærming ved å effektivt finne frem til spesialisert informasjon når det var nødvendig.
| Modell | Nøyaktighet (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini-tenkning | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| OpenAI grundig research** | 26,6 |
I GAIA(åpnes i et nytt vindu)1, en offentlig referansemåling som evaluerer KI med virkelige spørsmål, oppnår modellen som driver Deep Research en ny SOTA-status og er på førsteplass på den eksterne resultatlisten(åpnes i et nytt vindu). Oppgavene dekker spørsmål på tre ulike vanskelighetsnivåer, og å fullføre oppgavene krever ferdigheter som resonnering, multimodal flyt, søk på nett og kunnskap om bruk av verktøy.
| GAIA | ||||
|---|---|---|---|---|
| Nivå 1 | Nivå 2 | Nivå 3 | Gj.snitt | |
| Forrige SOTA(åpnes i et nytt vindu) | 67,92 | 67,44 | 42,31 | 63,64 |
| Grundig research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Grundig research (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Eksempler på GAIA-oppgaver
I en intern evaluering av oppgaver på ekspertnivå innen ulike områder ble grundig research vurdert av domeneeksperter til å ha automatisert mange timer med vanskelige, manuelle undersøkelser.
Andel bestått vs. maks verktøybruk
Eksempler på oppgaver på ekspertnivå
Andel bestått for oppgaver på ekspertnivå etter anslått økonomisk verdi
Andel bestått for oppgaver på ekspertnivå etter anslått antall timer
Deep Research åpner for nye muligheter, men teknologien er fortsatt i en tidlig fase og har visse begrensninger. Den kan av og til hallusinere fakta i svarene sine eller trekke feilaktige slutninger – men i betydelig mindre grad enn tidligere ChatGPT‑modeller, ifølge interne evalueringer. Den kan streve med å skille mellom offisiell informasjon og rykter, og viser for øyeblikket svakheter i kalibrering av modellens selvtillit, ofte uten å formidle dette presist. Ved lansering kan det forekomme mindre formateringsfeil i rapporter og sitater, og det kan ta lengre tid før oppgaver starter. Vi forventer at alle disse problemene vil bedre seg raskt med mer bruk og tid.
Deep Research i ChatGPT krever for øyeblikket svært mye datakraft. Det kreves mer regnekraft jo lengre tid det tar å behandle en forespørsel. Vi starter med en versjon som er optimalisert for Pro-brukere i dag, med opptil 100 forespørsler i måneden. Plus- og Team-brukere får tilgang neste i neste omgang, deretter Enterprise. Vi jobber fortsatt med å gi tilgang til brukere i Storbritannia, Sveits og EØS.
Alle betalende brukere vil snart få betydelig høyere grenseverdier når vi lanserer en raskere og mer kostnadseffektiv versjon av Deep Research, drevet av en mindre modell som fortsatt gir resultater av høy kvalitet.
I ukene og månedene fremover vil vi jobbe med den tekniske infrastrukturen, følge nøye med på den nåværende versjonen og gjennomføre enda mer grundig testing. Dette samsvarer med prinsippet vårt om gradvis lansering. Hvis alle sikkerhetskontroller fortsetter å oppfylle kravene våre for lansering, planlegger vi å gjøre Deep Research tilgjengelig for Plus-brukere om omtrent én måned.
Deep Research er i dag tilgjengelig på ChatGPT på nett og vil bli lansert i mobilapper og dataprogrammer i løpet av måneden. Foreløpig har Deep Research tilgang til det åpne nettet og opplastede filer. I fremtiden vil du kunne koble til mer spesialiserte datakilder – og utvide tilgangen til abonnementsbaserte eller interne ressurser – slik at utdataene blir mer enda robuste og personlig tilpasset.
Når vi ser lenger frem i tid, ser vi for oss agentopplevelser i ChatGPT for asynkron, reell research og gjennomføring. Kombinasjonen av Deep Research, som kan utføre asynkrone nettbaserte undersøkelser, og Operator, som kan utføre faktiske handlinger, vil gjøre det mulig for ChatGPT å ta seg av stadig mer avanserte oppgaver for deg.
Tillegg, 3. februar 2025: Vi gjennomførte grundig sikkerhetstesting, beredskapsvurderinger og gjennomgang av styringsrutiner på den tidlige versjonen av o3 som driver Deep Research, og kom frem til at den innebærer middels(åpnes i et nytt vindu) risiko. Vi gjennomførte også ekstra sikkerhetstesting for å få en bedre forståelse av den ekstra risikoen knyttet til at Deep Research kan bla gjennom og søke på nettet, og har lagt til nye sikkerhetstiltak. Vi vil fortsette med grundig testing og nøye overvåking av den nåværende begrensede lanseringen. Vi vil dele resultatene våre fra sikkerhetstestene og sikkerhetstiltakene for Deep Research i et systemkort når vi utvider tilgangen til flere Plus-brukere.
Fotnoter
- 1
Vi fant ut at grunnsannhetssvarene for dette datasettet var blitt lekket i stor grad på nettet og har derfor blokkert flere nettsteder eller nettadresser for å sikre en rettferdig evaluering av modellen.
Forfattere
Research-ledere
Isa Fulford og Zhiqing Sun
Grunnleggende bidragsytere
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney og Valerie Qi
Kjernebidragsytere
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Utrulling
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Bidragsytere
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ alle bidragsyterne bak o3.
Sikkerhetssystemer
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Utrulling
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Lederskap
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman og Wojciech Zaremba