Esittelyssä syvätutkimus
Agentti, joka syntetisoi suuria määriä verkossa olevia tietoja päättelemällä ja suorittaa monivaiheisia tutkimustehtäviä puolestasi. Saatavilla nyt Pro-käyttäjille, seuraavaksi Plus- ja Team-käyttäjille.
Päivitys 10. helmikuuta 2026: voit nyt yhdistää syvätutkimuksen mihin tahansa MCP:hen tai sovellukseen ja rajoittaa verkkohakuja luotettuihin sivustoihin, jotta voit keskittyä todennettuihin, alan standardien mukaisiin lähteisiin. Voit myös seurata edistymistä reaaliajassa ja keskeyttää tarkentaaksesi kehotteilla tai uusilla lähteillä. Olemme päivittäneet visuaalista kokemusta, jotta tutkimuksen aloittaminen, seuranta ja tarkistaminen on helpompaa alusta loppuun.
Päivitys 17. heinäkuuta 2025: syvätutkimus voi nyt mennä entistäkin syvemmälle ja laajemmalle ChatGPT‑agentin visuaalisen selaimen avulla. Voit käyttää näitä päivitettyjä ominaisuuksia, valitsemalla muokkaimen pudotusvalikosta ”agenttitilan” ja syöttämällä kyselysi suoraan. Alkuperäinen syvätutkimustoiminto on edelleen saatavilla työkaluvalikon ”syvätutkimus”-vaihtoehdon kautta.
Päivitys 24. huhtikuuta 2025: olemme merkittävästi lisänneet syvätutkimuksen käyttömahdollisuuksia – Plus-, Team-, Enterprise- ja Edu-käyttäjät saavat nyt 25 kyselyä kuukaudessa, Pro-käyttäjät 250 ja Free-käyttäjät 5. Tämä on mahdollista uuden kevyen syvätutkimusversion ansiosta, joka toimii o4-mini-versiolla ja on suunniteltu kustannustehokkaammaksi laadusta tinkimättä. Kun saavutat täysversion rajan, kyselysi vaihtuvat automaattisesti kevytversioon.
Päivitys 25. helmikuuta 2025: kaikki Plus-käyttäjät voivat nyt käyttää syvätutkimusta.
Päivitys 5. helmikuuta 2025: syvätutkimus on nyt saatavilla Pro-käyttäjille Yhdistyneessä kuningaskunnassa, Sveitsissä ja Euroopan talousalueella.
Lanseeraamme tänään syvätutkimuksen ChatGPT:ssä – uuden agenttitoiminnon, joka tekee monivaiheista tutkimusta verkossa suorittaakseen monimutkaisia tehtäviä. Se suorittaa kymmenissä minuuteissa tehtävän, mikä veisi ihmiseltä useita tunteja.
Syvätutkimus on OpenAI:n uusi agentti, joka työskentelee itsenäisesti puolestasi. Kun kirjoitat kehotteen, ChatGPT löytää, analysoi ja syntetisoi satoja verkossa olevia lähteitä ja luo niistä kattavan raportin, joka vastaa tutkimusanalyytikon tekemän tutkimuksen tasoa. Toimii OpenAI:n tulossa olevalla o3‑mallilla, joka on optimoitu verkkosivujen selaamiseen ja tietojen analyysiin. Se etsii, tulkitsee ja analysoi verkossa olevia valtavia tekstimääriä, kuvia ja PDF-tiedostoja päättelyn avulla ja hyödyntää tarvittaessa kohtaamaansa tietoa.
Kyky yhdistellä tietoa on uuden tiedon luomisen edellytys. Tästä syystä syvätutkimus on merkittävä askel kohti laajempaa tavoitettamme yleisen tekoälyn kehittämisessä. Olemme pitkään visioineet tekoälyn kykenevän tuottamaan uutta tieteellistä tutkimusta.
Syvätutkimus on kehitetty ihmisille, jotka tekevät intensiivistä asiantuntijatyötä mm. taloustieteen, tieteen, politiikan ja tekniikan aloilla ja tarvitsevat perusteellista, täsmällistä ja luotettavaa tutkimustietoa. Sitä voivat hyödyntää myös tarkkanäköiset ostajat, jotka haluavat erittäin yksilöityjä suosituksia yleensä huolellista selvitystä vaativia ostoksia varten, kuten esimerkiksi autot, kodinkoneet ja huonekalut. Jokainen tuotos on täysin dokumentoitu ja sisältää selkeät viitteet ja yhteenvedon sen ajattelusta, mikä tekee tiedon hyödyntämisestä ja varmistamisesta helppoa. Se on erityisen hyvä löytämään marginaalista, ei-intuitiivista tietoa, jonka löytäminen muuten vaatisi lukuisten verkkosivujen selailua. Syvätutkimus vapauttaa arvokasta aikaa, sillä se mahdollistaa monimutkaisten ja aikaa vievien verkkohakujen tekemisen nopeasti vain yhdellä kysymyksellä.
Syvätutkimus löytää, päättelee ja yhdistelee havaintoja itsenäisesti kaikkialta internetistä. Tämän mahdollistamiseksi se on koulutettu todellisilla selaimen ja Python-työkalun käyttöä vaativilla tehtävillä, ja se käyttää samoja vahvistusoppimisen metodeja kuin ensimmäinen päättelymallimme OpenAI o1. Vaikka o1 on osoittanut vaikuttavia kykyjä koodaamisessa, matematiikassa ja muilla teknisillä aloilla, monet tosielämän haasteet vaativat laajaa kontekstia ja tiedonkeruuta erilaisista verkkolähteistä. Syvätutkimus, joka perustuu näihin päättelyvalmiuksiin, kaventaa tätä kuilua, ja pystyy vastaamaan ongelmiin, joita ihmiset kohtaavat työ- ja arkielämässään.
Valitse ”syvätutkimus” ChatGPT:n viestikentässä ja kirjoita kysymyksesi. Kerro ChatGPT:lle mitä tarvitset – oli se sitten kilpailuanalyysi suoratoistoalustoista tai personoitu raportti parhaasta työmatkapyörästä. Voit lisätä kontekstia kysymykseesi liittämällä mukaan tiedostoja tai laskentataulukkoja. Kun toiminto on käynnissä, näet sivupalkin, jossa on yhteenveto tehdyistä vaiheista ja käytetyistä lähteistä.
Syvätutkimus voi kestää 5–30 minuuttia, sillä se sukeltaa syvälle verkkoon ja käyttää tehtävään tarvitsemansa ajan. Sillä välin voit poistua paikalta tai tehdä muita tehtäviä – saat ilmoituksen, kun tutkimus on valmis. Lopullinen tuotos tulee raporttina keskusteluun – tulevien viikkojen aikana lisäämme raportteihin myös upotettuja kuvia, tietojen visualisointeja sekä muita analyyttisia tuloksia, jotka tuovat niihin selkeyttä ja kontekstia.
Syvätutkimukseen verrattuna GPT‑4o soveltuu erinomaisesti reaaliaikaisiin, multimodaalisiin keskusteluihin. Kun kyseessä on monitahoinen, alakohtainen tutkimuskysymys, jossa syvällisyys ja yksityiskohdat ovat tärkeitä, syvätutkimuksen kyky tehdä laajaa tutkimusta ja antaa lähdeviite jokaiselle väitteelle on tuo ero nopean yhteenvedon ja hyvin dokumentoidun, tarkistetun, työtuotteena käytettävän vastauksen välillä.
GPT-4o
Syvätutkimus
Syvätutkimus vastaa kehotteeseen erittäin yksityiskohtaisesti, ja se esittää sekä 10 kehittyneen maan että 10 kehitysmaan maakohtaiset tiedot rinnakkain, jotta niihin on helppo viitata ja niitä on helppo vertailla. Se käyttää tietoja voidakseen tarjota yksityiskohtaisia markkinoille pääsyyn liittyviä suosituksia, jotka ovat asiantuntevia ja käytettäviä.
Syvätutkimus on koulutettu käyttämällä kokonaisvaltaista vahvistusoppimista suorittamaan monien erien alojen vaikeita selaus- ja päättelytehtäviä. Koulutuksen avulla se on oppinut suunnittelemaan ja toteuttamaan monivaiheisia prosesseja tarvitsemiensa tietojen löytämiseksi sekä tarvittaessa peruuttamaan ja reagoimaan reaaliaikaiseen tietoon. Malli voi lisäksi selata käyttäjien lataamia tiedostoja, piirtää ja iteroida kaavioita Python-työkalun avulla, upottaa sekä verkkosivuilta peräisin olevia luotuja kaavioita että kuvia vastauksiinsa ja viitata käyttämiensä lähteiden tiettyihin lauseisiin ja kohtiin. Koulutuksensa ansiosta se nousee uudelle tasolle useissa julkisissa arvioinneissa, joissa keskitytään todellisen maailman ongelmiin.
Äskettäin julkaistussa Humanity’s Last Exam(avautuu uudessa ikkunassa) -arvioinnissa, joka testaa tekoälyä asiantuntijatason kysymyksillä laajasta aihealueesta, syvätutkimusmalli saavutti uuden huipputuloksen: 26,6 % tarkkuuden. Testi koostuu yli 3 000 monivalintatehtävästä ja lyhyistä kysymyksistä, jotka liittyvät yli 100 aiheeseen kielitieteestä rakettitieteeseen, antiikintutkimuksesta ekologiaan. OpenAI o1:een verrattuna se on parempi erityisesti kemian, humanististen tieteiden, yhteiskuntatieteiden sekä matematiikan aloilla. Syvätutkimusta pyörittävä malli on osoittanut, että sillä on ihmisen kaltainen lähestymistapa etsiä tarvittaessa tehokkaasti erikoistunutta tietoa.
| Malli | Tarkkuus (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (keskitaso)* | 10,5 |
| OpenAI o3-mini (korkea)* | 13,0 |
| OpenAI-syvätutkimus** | 26,6 |
Julkinen vertailuarvoGAIA(avautuu uudessa ikkunassa)1 arvioi sitä, miten tekoäly suoriutuu todellisen maailman kysymyksistä. Syvätutkimusta pyörittävä malli saavuttaa uuden huipputason (SOTA) ja on ulkoisen tulostaulukon(avautuu uudessa ikkunassa) kärjessä. GAIA sisältää kolmen eri vaikeustason kysymyksiä, ja tehtävien suorittaminen hyväksytysti edellyttää mm. päättelykykyä, multimodaalista sujuvuutta, verkon selailua sekä taitoa käyttää työkaluja.
| GAIA | ||||
|---|---|---|---|---|
| Taso 1 | Taso 2 | Taso 3 | Keskiarvo | |
| Edellinen SOTA(avautuu uudessa ikkunassa) | 67,92 | 67,44 | 42,31 | 63,64 |
| Syvätutkimus (cons@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Syvätutkimus (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Esimerkkejä GAIA-tehtävistä
Eri alojen asiantuntijatason tehtävien sisäisessä arvioinnissa alan asiantuntijat arvioivat, että syvätutkimus on automatisoinut useiden tuntien haastavan manuaalisen tutkimuksen.
Läpäisyaste vs. maksimityökalupyynnöt
Esimerkkejä asiantuntijatasoisista tehtävistä
Asiantuntijatason tehtävien läpäisyaste arvioidun taloudellisen arvon mukaan jaoteltuna
Asiantuntijatason tehtävien läpäisyaste arvioitujen tuntien mukaan jaoteltuna
Syvätutkimus avaa merkittäviä uusia mahdollisuuksia, mutta se on vielä alkuvaiheessa ja sillä on rajoituksia. Joskus se voi esittää virheellisiä väitteitä tai tehdä vääriä päätelmiä, vaikkakin sisäisten arvioiden mukaan huomattavasti harvemmin kuin olemassa olevat ChatGPT‑mallit. Sillä on joskus vaikeuksia erottaa luotettavaa tietoa huhuista, ja sen varmuuden kalibrointi on tällä hetkellä heikkoa, eikä se useinkaan pysty ilmaisemaan epävarmuuttaan tarkasti. Julkaisun yhteydessä raporteissa ja viitteissä saattaa esiintyä pieniä muotoiluvirheitä, ja tehtävien käynnistyminen voi kestää kauemmin. Odotamme, että kaikki nämä ongelmat korjaantuvat nopeasti käytön ja ajan myötä.
ChatGPT:n syvätutkimus vaatii tällä hetkellä runsaasti laskentatehoa. Mitä kauemmin kyselyn tutkiminen kestää, sitä enemmän laskentatehoa päättelyyn tarvitaan. Aloitamme tänään Pro-käyttäjille optimoidulla versiolla, joka sallii jopa 100 kyselyä kuukaudessa. Plus- ja Team-käyttäjät saavat pääsyn seuraavaksi, ja heidän jälkeensä Enterprise-käyttäjät. Työskentelemme parhaillaan sen hyväksi, että käyttäjät Yhdistyneessä kuningaskunnassa, Sveitsissä ja ETA-alueella saisivat palvelun käyttöönsä.
Kaikki maksavat käyttäjät saavat pian selvästi korkeammat käyttörajat, kun julkaisemme syvätutkimuksesta nopeamman ja kustannustehokkaamman version, joka perustuu pienempään malliin, mutta tuottaa silti laadukkaita tuloksia.
Tulevina viikkoina ja kuukausina kehitämme teknistä infrastruktuuria, seuraamme tarkasti nykyistä julkaisua ja suoritamme entistä perusteellisempia testauksia. Tämä vastaa toistuvan käyttöönoton periaatettamme. Jos kaikki turvallisuustarkastukset jatkossakin täyttävät julkaisustandardimme, aiomme julkaista syvätutkimuksen Plus-käyttäjille noin kuukauden kuluttua.
Syvätutkimus on saatavilla tänään ChatGPT:n verkossa, ja se otetaan käyttöön mobiili- ja työpöytäsovelluksissa kuukauden kuluessa. Tällä hetkellä syvätutkimus voi käyttää avointa verkkoa ja kaikkia ladattuja tiedostoja. Tulevaisuudessa voit yhdistää syvätutkimuksen entistä erikoistuneempiin tietolähteisiin – laajentaen sen pääsyä tilauspohjaisiin tai sisäisiin resursseihin – mikä tekee sen tuotoksista entistä vahvempia ja yksilöllisempiä.
Jatkossa suunnittelemme agenttipohjaisten kokemusten yhdistyvän ChatGPT:ssä asynkronista, reaalimaailman tutkimusta ja toteutusta varten. Yhdistelmä syvätutkimusta, joka kykenee asynkroniseen verkkopohjaiseen tiedonhakuun, ja Operatoria, joka voi toteuttaa toimintoja reaalimaailmassa, mahdollistaa sen, että ChatGPT voi suorittaa yhä kehittyneempiä tehtäviä puolestasi.
Lisäys 3. helmikuuta 2025: Suoritimme perusteellisia turvallisuustestauksia, valmiusarviointeja ja hallintotarkastuksia syvätutkimusta käyttävän o3:n varhaisversiolle, ja arvioimme sen riskitasoksi keskitason(avautuu uudessa ikkunassa). Suoritimme myös lisää turvallisuustestauksia ymmärtääksemme paremmin syvätutkimuksen verkkoselauskykyyn liittyviä lisäriskejä, ja olemme ottaneet käyttöön uusia lieventämistoimia. Jatkamme nykyisen rajoitetun version perusteellista testaamista ja tarkkaa seurantaa. Jaamme turvallisuuteen liittyvät havainnot ja suojatoimet syvätutkimusta koskevassa järjestelmäkortissa, kun laajennamme pääsyn Plus-käyttäjille.
Alaviitteet
- 1
Havaitsimme, että tämän aineiston totuudenmukaiset vastaukset olivat vuotaneet laajalti verkkoon, ja olemme estäneet useita verkkosivustoja tai URL-osoitteita varmistaaksemme mallin oikeudenmukaisen arvioinnin.
Tekijät
Tutkimusjohtajat
Isa Fulford ja Zhiqing Sun
Keskeiset tukijat
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney ja Valerie Qi
Päätukijat
Tutkimus
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Käyttöönotto
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Tukijat
Tutkimus
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ kaikki o3-tukijat.
Turvallisuusjärjestelmät
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Käyttöönotto
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Johtoryhmä
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman ja Wojciech Zaremba