Ti presentiamo Deep Research
Un agente che utilizza il ragionamento per sintetizzare grandi quantità di informazioni online e completare per te attività di ricerca articolate in più passaggi. Disponibile da oggi per gli utenti Pro, a seguire per gli utenti Plus e Team.
Aggiornamento del 10 febbraio 2026: ora puoi collegare la deep research a qualsiasi MCP o app e limitare le ricerche sul web a siti affidabili, così puoi concentrarti su fonti autenticate e conformi agli standard del settore. Ora puoi anche monitorare i progressi in tempo reale e interrompere la ricerca per perfezionarla con prompt di follow-up o nuove fonti. Abbiamo aggiornato l'esperienza visiva in modo che sia più facile avviare, monitorare e rivedere la tua ricerca dall'inizio alla fine.
Aggiornamento del 17 luglio 2025: Deep Research può ora effettuare ricerche ancora più approfondite e ampie grazie all'accesso a un browser visivo integrato nell'agente ChatGPT. Per accedere a queste funzionalità aggiornate, seleziona "modalità agente" dal menu a tendina nel compositore e inserisci direttamente la tua query. La funzionalità originale di Deep Research rimane disponibile tramite l'opzione "Deep Research" nel menu degli strumenti.
Aggiornamento del 24 aprile 2025: stiamo aumentando in modo significativo la frequenza con cui è possibile utilizzare la deep research: inoltre, gli utenti Plus, Team, Enterprise ed Edu ora hanno a disposizione 25 query al mese, gli utenti Pro ne hanno 250, mentre gli utenti Free 5. Questo è reso possibile grazie a una nuova versione leggera di deep research basata su una versione di o4-mini, progettata per essere più efficiente in termini di costi pur mantenendo un'elevata qualità. Una volta raggiunto il limite consentito per la versione completa, le query passeranno automaticamente alla versione leggera.
Aggiornamento del 25 febbraio 2025: tutti gli utenti Plus possono ora utilizzare Deep research.
Aggiornamento del 5 febbraio 2025: Deep Research è ora disponibile per gli utenti Pro nel Regno Unito, in Svizzera e nello Spazio economico europeo.
Oggi presentiamo Deep Research in ChatGPT, una nuova funzionalità agentica che conduce ricerche articolate in più passaggi su Internet per attività complesse. Nel giro di decine di minuti è in grado di svolgere ciò che a un essere umano richiederebbe molte ore.
Deep Research è il nuovo agente di OpenAI che lavora per te in autonomia: tu fornisci un prompt e ChatGPT trova, analizza e sintetizza centinaia di fonti online per creare un report completo, con la qualità di un research analyst. Basato su una versione del futuro modello OpenAI o3 ottimizzato per la navigazione su web e l’analisi dei dati, Deep Research sfrutta il ragionamento per cercare, interpretare e analizzare grandi quantità di testi, immagini e PDF online, adattando il suo approccio in base alle informazioni che trova.
La capacità di sintetizzare le informazioni è un prerequisito fondamentale per generarne delle nuove. È in quest’ottica che Deep Research rappresenta un importante passo in avanti verso il nostro obiettivo più ampio di sviluppare un'AGI in grado di contribuire attivamente alla ricerca scientifica.
Deep Research è pensato per chi svolge lavori ad alta intensità cognitiva in ambiti come finanza, scienza, politica pubblica e ingegneria e necessita quindi di ricerche dettagliate, precise e affidabili. È altrettanto utile per i consumatori più attenti in cerca di consigli d’acquisto altamente personalizzati su prodotti che richiedono una valutazione approfondita, come auto, elettrodomestici e mobili. Ogni output include una documentazione dettagliata, fonti chiare e un riepilogo del processo di ragionamento, il che garantisce trasparenza e una facile consultazione dei dati. È particolarmente efficace nel trovare informazioni di nicchia e difficili da reperire che altrimenti richiederebbero la consultazione di molti siti web. Con Deep Research puoi risparmiare tempo prezioso velocizzando ricerche web lunghe e complesse con un'unica query.
Deep Research scopre, analizza e raggruppa autonomamente informazioni provenienti da tutto il web. A tal fine, è stato addestrato su attività reali che prevedono l’utilizzo di browser e Python, mediante le stesse tecniche di apprendimento per rinforzo del nostro primo modello di ragionamento, OpenAI o1. Sebbene o1 dimostri notevoli capacità di codifica, matematica e altri ambiti tecnici, molte sfide reali richiedono un contesto più ampio e la raccolta di informazioni da varie fonti online. Deep Research sfrutta queste capacità di ragionamento per colmare il divario e affrontare i problemi tipici del lavoro e della vita di tutti i giorni.
In ChatGPT, seleziona "Deep Research" nel compositore di messaggi e inserisci la tua query. Basta dire a ChatGPT di cosa hai bisogno, che si tratti di un confronto tra piattaforme di streaming o di un report personalizzato sulla migliore bici per gli spostamenti quotidiani. Puoi allegare file o fogli elettronici per aggiungere più contesto alla tua domanda. All’avvio, si apre una barra laterale che mostra il riepilogo dei passaggi eseguiti e delle fonti utilizzate.
Deep Research può impiegare dai 5 ai 30 minuti per completare il suo lavoro, il tempo necessario per effettuare una ricerca approfondita sul web. Nel frattempo, puoi allontanarti e dedicarti ad altre attività: una notifica ti avviserà al termine della ricerca. Il risultato finale viene fornito sotto forma di report nella chat. Nelle prossime settimane aggiungeremo anche immagini, visualizzazioni di dati e altri output analitici per rendere il tutto ancora più chiaro e contestualizzato.
Rispetto a Deep Research, GPT‑4o è ideale per conversazioni multimodali in tempo reale. Per richieste complesse e specifiche di settore dove profondità e dettagli sono fondamentali, invece, Deep Research si distingue per le sue analisi approfondite e citazioni puntuali che trasformano un rapido riassunto in una risposta ben documentata, verificata e affidabile.
GPT-4o
Deep Research
Deep Research risponde al prompt in modo estremamente dettagliato e offre dati affiancati per i primi 10 Paesi sviluppati e i primi 10 Paesi in via di sviluppo, facilitando così la consultazione e il confronto. Sfrutta queste informazioni per offrire consigli di ingresso nel mercato dettagliati, affidabili e concreti.
Deep Research è stato addestrato con tecniche di apprendimento per rinforzo end-to-end su complesse attività di navigazione e ragionamento in vari ambiti. Grazie a questo tipo di addestramento, ha imparato a pianificare ed eseguire una strategia in più passaggi per trovare i dati di cui ha bisogno ed è in grado di adattarsi alle informazioni in tempo reale quando necessario. Il modello è anche in grado di esaminare i file caricati dagli utenti, creare e modificare grafici mediante Python, incorporare sia grafici generati che immagini provenienti da siti web nelle sue risposte, e citare frasi o passaggi specifici dalle fonti consultate. Questo addestramento garantisce prestazioni mai raggiunte prima in numerosi benchmark pubblici dedicati a problemi reali.
In Humanity’s Last Exam(si apre in una nuova finestra), una nuova valutazione che misura le prestazioni dell'IA su domande complesse in numerosi ambiti, il modello alla base di Deep Research ha raggiunto un nuovo record di precisione del 26,6%. Questo test comprende oltre 3.000 domande a scelta multipla e a risposta breve su più di 100 discipline, dalla linguistica all’ingegneria aerospaziale, dai classici all’ecologia. Rispetto a OpenAI o1, i miglioramenti più notevoli sono emersi in ambiti come chimica, scienze umane e sociali e matematica. Il modello alla base di Deep Research ha mostrato un approccio simile a quello umano, cercando efficacemente informazioni specialistiche quando necessario.
| Modello | Precisione (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Pensiero di Gemini | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medio)* | 10,5 |
| OpenAI o3-mini (alto)* | 13,0 |
| Deep Research di OpenAI | 26,6 |
In GAIA(si apre in una nuova finestra)1, un benchmark pubblico che valuta l'IA su domande legate al mondo reale, il modello di Deep Research stabilisce un nuovo stato dell'arte (SOTA) e si posiziona al primo posto della classifica(si apre in una nuova finestra) esterna. Per affrontare con successo domande di tre livelli di difficoltà, sono necessarie abilità di ragionamento, padronanza multimodale, navigazione su web e utilizzo di strumenti.
| GAIA | ||||
|---|---|---|---|---|
| Livello 1 | Livello 2 | Livello 3 | Media | |
| SOTA precedente(si apre in una nuova finestra) | 67,92 | 67,44 | 42,31 | 63,64 |
| Deep Research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Deep Research (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Esempi di attività in GAIA
In una valutazione interna su attività di livello avanzato in vari ambiti, secondo alcuni esperti di settore Deep Research è stato in grado di automatizzare numerose ore di complesse ricerche manuali.
Confronto tra tasso di superamento e chiamate strumento massime
Esempi di attività di livello avanzato
Tasso di superamento nelle attività di livello esperto in base al valore economico stimato
Tasso di superamento nelle attività di livello esperto in base alle ore stimate
Deep Research introduce nuove importanti funzionalità, ma si trova ancora in una fase iniziale e presenta delle limitazioni. Può occasionalmente generare informazioni inesatte nelle risposte o trarre conclusioni errate, anche se con una frequenza notevolmente inferiore rispetto ai modelli di ChatGPT attuali, secondo valutazioni interne. Può avere difficoltà a distinguere tra informazioni autorevoli e semplici speculazioni e al momento presenta limiti nella calibrazione della sicurezza, spesso senza riuscire a comunicare correttamente il grado di incertezza. Al momento del rilascio, potrebbero verificarsi piccoli errori di formattazione nei report e nelle citazioni e l’avvio delle attività potrebbe richiedere più tempo del previsto. Riteniamo che questi aspetti miglioreranno rapidamente con l’uso e il passare del tempo.
Al momento la funzione di Deep Research in ChatGPT richiede un’elevata potenza di calcolo. Più tempo è necessario per svolgere una ricerca, maggiore sarà la potenza di calcolo richiesta per l’inferenza. Iniziamo con una versione ottimizzata per gli utenti Pro, che permette fino a 100 query mensili. L'accesso sarà esteso successivamente agli utenti Plus e Team, seguiti da quelli Enterprise. Stiamo ancora lavorando per offrire l’accesso agli utenti nel Regno Unito, in Svizzera e nello Spazio economico europeo.
Presto, tutti gli utenti abbonati potranno beneficiare di limiti di utilizzo molto più alti grazie al rilascio di una versione più veloce ed economica di Deep Research, basata su un modello più piccolo ma ugualmente performante.
Nelle prossime settimane e mesi ci concentreremo sull’infrastruttura tecnica, monitoreremo attentamente la versione attuale e svolgeremo test ancora più rigorosi, in linea con il nostro approccio di implementazione iterativa. Se tutti i controlli di sicurezza continueranno a rispettare i nostri standard, prevediamo di rilasciare Deep Research agli utenti Plus entro circa un mese.
Deep Research è già disponibile su ChatGPT web e arriverà sulle app mobile e desktop entro la fine del mese. Attualmente Deep Research può accedere al web aperto e a tutti i file caricati. In futuro sarà possibile collegarsi a fonti di dati più specializzate, ampliando l’accesso a risorse in abbonamento o interne, al fine di rendere i risultati ancora più completi e personalizzati.
Nel lungo termine prevediamo che ChatGPT combini esperienze agentiche per supportare attività di ricerca ed esecuzione asincrone del mondo reale. Grazie all’integrazione tra Deep Research, che esegue ricerche online asincrone, e Operator, che compie azioni reali, ChatGPT sarà in grado di gestire per te attività sempre più sofisticate.
Nota aggiuntiva del 3 febbraio 2025: abbiamo effettuato test di sicurezza rigorosi, valutazioni della preparazione e revisioni della governance sulla prima versione di o3 alla base di Deep Research e abbiamo identificato un livello di rischio medio(si apre in una nuova finestra). Abbiamo inoltre eseguito test di sicurezza aggiuntivi per comprendere meglio i rischi incrementali legati alla capacità di Deep Research di navigare sul web e abbiamo aggiunto nuove misure di mitigazione. Proseguiremo con test rigorosi e un attento monitoraggio dell'attuale versione limitata. Condivideremo le nostre analisi di sicurezza e le misure di protezione per Deep Research in una scheda di sistema quando estenderemo l’accesso agli utenti Plus.
Note di riferimento
- 1
Abbiamo scoperto che le risposte di verità di base per questo set di dati sono state ampiamente diffuse online e di conseguenza abbiamo bloccato diversi siti web o URL per garantire una valutazione equa del modello.
Autori
Responsabili della ricerca
Isa Fulford e Zhiqing Sun
Contributori fondamentali
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney e Valerie Qi
Collaboratori principali
Ricerca
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Distribuzione
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Collaboratori
Ricerca
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ tutti i collaboratori di o3.
Sistemi di sicurezza
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Distribuzione
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Direttivo
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman e Wojciech Zaremba