Actualització del 10 de febrer de 2026: Ara pots connectar la recerca profunda a qualsevol MCP o aplicació i restringir les cerques web a llocs de confiança, perquè et puguis centrar en fonts autenticades i estàndard del sector. També pots seguir el progrés en temps real i interrompre’l per afinar-lo amb indicacions de seguiment o noves fonts. Hem actualitzat l’experiència visual perquè sigui més fàcil iniciar, seguir i revisar la teva recerca de cap a cap.
Actualització del 17 de juliol de 2025: La recerca profunda ara pot anar encara més lluny i ser més àmplia amb accés a un navegador visual com a part de ChatGPT agent. Per accedir a aquestes capacitats actualitzades, només has de seleccionar «mode agent» al menú desplegable del camp de text per als missatges i introduir-hi directament la consulta. La funcionalitat original de recerca profunda continua disponible mitjançant l’opció «recerca profunda» al menú d’eines.
Actualització del 24 d’abril de 2025: Estem augmentant significativament la freqüència amb què pots fer servir la recerca profunda: els usuaris Plus, Team, Enterprise i Edu ara tenen 25 consultes al mes, els usuaris Pro en tenen 250 i els usuaris Free en tenen 5. Això és possible gràcies a una nova versió lleugera de recerca profunda impulsada per una versió d’o4-mini, dissenyada per ser més eficient en costos i preservar una alta qualitat. Un cop arribis al límit de la versió completa, les teves consultes canviaran automàticament a la versió lleugera.
Actualització del 25 de febrer de 2025: Tots els usuaris Plus ja poden fer servir la recerca profunda.
Actualització del 5 de febrer de 2025: La recerca profunda ja està disponible per als usuaris Pro al Regne Unit, Suïssa i l’Espai Econòmic Europeu.
Avui llancem la recerca profunda a ChatGPT, una nova capacitat agentiva que fa recerca de diversos passos a internet per a tasques complexes. Aconsegueix en desenes de minuts allò que a una persona li prendria moltes hores.
La recerca profunda és el següent agent d’OpenAI que pot treballar per tu de manera independent: tu li dones una indicació, i ChatGPT trobarà, analitzarà i sintetitzarà centenars de fonts en línia per crear un informe exhaustiu al nivell d’un analista de recerca. Impulsada per una versió del proper model OpenAI o3 optimitzada per a la navegació web i l’anàlisi de dades, aprofita el raonament per cercar, interpretar i analitzar quantitats massives de text, imatges i PDF a internet, reorientant-se segons calgui en resposta a la informació que troba.
La capacitat de sintetitzar coneixement és un requisit previ per crear coneixement nou. Per aquest motiu, la recerca profunda marca un pas important cap al nostre objectiu més ampli de desenvolupar AGI, que fa temps que imaginem capaç de produir recerca científica nova.
La recerca profunda està pensada per a persones que fan treball intensiu de coneixement en àrees com les finances, la ciència, les polítiques públiques i l’enginyeria, i que necessiten una recerca exhaustiva, precisa i fiable. També pot ser igualment útil per a compradors exigents que busquen recomanacions hiperpersolitzades en compres que solen requerir una recerca acurada, com ara cotxes, electrodomèstics i mobles. Cada resultat està plenament documentat, amb citacions clares i un resum del seu procés de pensament, cosa que facilita referenciar i verificar la informació. És especialment eficaç per trobar informació de nínxol i poc intuïtiva que requeriria navegar per nombrosos llocs web. La recerca profunda allibera temps valuós perquè et permet delegar i accelerar recerques web complexes i intensives en temps amb una sola consulta.
La recerca profunda descobreix, raona i consolida de manera independent idees de tota la web. Per aconseguir-ho, es va entrenar amb tasques del món real que requerien l’ús del navegador i de l’eina Python, utilitzant els mateixos mètodes d’aprenentatge per reforç darrere d’OpenAI o1, el nostre primer model de raonament. Tot i que o1 demostra capacitats impressionants en programació, matemàtiques i altres dominis tècnics, molts reptes del món real exigeixen un context ampli i recopilació d’informació de fonts en línia diverses. La recerca profunda es basa en aquestes capacitats de raonament per cobrir aquest buit, i li permet afrontar els tipus de problemes que la gent té a la feina i a la vida quotidiana.
A ChatGPT, selecciona «recerca profunda» al camp de text per als missatges i introdueix-hi la teva consulta. Digues a ChatGPT què necessites, ja sigui una anàlisi competitiva de plataformes de streaming o un informe personalitzat sobre la millor bicicleta per anar a treballar. Pots adjuntar fitxers o fulls de càlcul per afegir context a la teva pregunta. Un cop comença a executar-se, apareix una barra lateral amb un resum dels passos seguits i de les fonts utilitzades.
La recerca profunda pot trigar entre 5 i 30 minuts a completar la feina, prenent-se el temps necessari per aprofundir a la web. Mentrestant, pots allunyar-te o treballar en altres tasques: rebràs una notificació un cop la recerca hagi acabat. El resultat final arriba com un informe dins del xat; en les properes setmanes també afegirem imatges incrustades, visualitzacions de dades i altres resultats analítics en aquests informes per aportar més claredat i context.
En comparació amb la recerca profunda, GPT‑4o és ideal per a converses multimodals en temps real. Per a consultes multifacètiques i específiques d’un domini en què la profunditat i el detall són crítics, la capacitat de la recerca profunda de fer una exploració extensa i citar cada afirmació marca la diferència entre un resum ràpid i una resposta ben documentada i verificada que es pot fer servir com a producte de treball.
GPT-4o
recerca profunda
La recerca profunda respon a la indicació amb un alt nivell de detall, aportant dades específiques per país en paral·lel tant per als 10 principals països desenvolupats com per als 10 principals països en desenvolupament, per facilitar la consulta i la comparació. Utilitza aquesta informació per oferir recomanacions detallades, informades i útils d’entrada al mercat.
La recerca profunda es va entrenar amb aprenentatge per reforç de cap a cap sobre tasques difícils de navegació i raonament en diversos dominis. Mitjançant aquest entrenament, va aprendre a planificar i executar una trajectòria de diversos passos per trobar les dades que necessita, retrocedint i reaccionant a informació en temps real quan cal. El model també pot navegar per fitxers pujats pels usuaris, traçar i iterar gràfics amb l’eina Python, incrustar tant gràfics generats com imatges de llocs web a les seves respostes i citar frases o passatges específics de les seves fonts. Com a resultat d’aquest entrenament, assoleix nous màxims en diverses avaluacions públiques centrades en problemes del món real.
A Humanity’s Last Exam(s'obre en una finestra nova), una avaluació publicada recentment que posa a prova la IA en una àmplia gamma de matèries amb preguntes de nivell expert, el model que impulsa la recerca profunda aconsegueix un nou màxim del 26,6% de precisió. Aquesta prova consta de més de 3.000 preguntes de resposta múltiple i resposta curta en més de 100 matèries, des de lingüística fins a ciència de coets, i des dels clàssics fins a l’ecologia. En comparació amb OpenAI o1, els avenços més grans van aparèixer en química, humanitats i ciències socials, i matemàtiques. El model que impulsa la recerca profunda va mostrar un enfocament semblant a l’humà buscant de manera eficaç informació especialitzada quan calia.
| Model | Precisió (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Raonament de Gemini | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (alt)* | 13,0 |
| Recerca profunda d'OpenAI** | 26,6 |
A GAIA(s'obre en una finestra nova)1, una prova de referència pública que avalua la IA amb preguntes del món real, el model que impulsa la recerca profunda assoleix un nou estat de l’art (SOTA) i encapçala la classificació(s'obre en una finestra nova) externa. Amb preguntes de tres nivells de dificultat, completar amb èxit aquestes tasques requereix capacitats com ara raonament, fluïdesa multimodal, navegació web i domini en l’ús d’eines.
| GAIA | ||||
|---|---|---|---|---|
| Nivell 1 | Nivell 2 | Nivell 3 | Mitj. | |
| SOTA anterior(s'obre en una finestra nova) | 67,92 | 67,44 | 42,31 | 63,64 |
| Recerca profunda (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Recerca profunda (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Exemples de tasques de GAIA
En una avaluació interna de tasques de nivell expert en diferents àrees, experts del domini van valorar que la recerca profunda havia automatitzat diverses hores d’investigació manual difícil.
Taxa d’èxit vs crides màximes a eines
Exemples de tasques de nivell expert
Taxa d’èxit en tasques de nivell expert per valor econòmic estimat
Taxa d’èxit en tasques de nivell expert per hores estimades
La recerca profunda obre noves capacitats significatives, però encara és aviat i té limitacions. De vegades pot al·lucinar fets en les respostes o fer inferències incorrectes, tot i que a una taxa notablement més baixa que els models actuals de ChatGPT, segons avaluacions internes. Pot tenir dificultats per distingir la informació autoritzada dels rumors, i actualment mostra feblesa en la calibració de la confiança, sovint sense transmetre la incertesa amb precisió. En el llançament, hi pot haver petits errors de format en informes i citacions, i les tasques poden trigar més a començar. Esperem que tots aquests problemes millorin ràpidament amb més ús i temps.
La recerca profunda a ChatGPT requereix actualment una gran intensitat de càlcul. Com més temps triga a investigar una consulta, més càlcul d’inferència es necessita. Avui comencem amb una versió optimitzada per a usuaris Pro, amb fins a 100 consultes al mes. Els usuaris Plus i Team hi tindran accés després, seguits d’Enterprise. Encara estem treballant per oferir accés als usuaris del Regne Unit, Suïssa i l’Espai Econòmic Europeu.
Tots els usuaris de pagament aviat tindran límits d’ús significativament més alts quan llancem una versió més ràpida i més rendible de la recerca profunda impulsada per un model més petit que continuï oferint resultats d’alta qualitat.
Durant les properes setmanes i mesos, treballarem en la infraestructura tècnica, supervisarem de prop la versió actual i durem a terme proves encara més rigoroses. Això s’alinea amb el nostre principi de desplegament iteratiu. Si totes les comprovacions de seguretat continuen complint els nostres estàndards de llançament, preveiem oferir la recerca profunda als usuaris Plus d’aquí a aproximadament un mes.
La recerca profunda està disponible avui a ChatGPT web i es desplegarà a les aplicacions mòbils i d’escriptori durant aquest mes. Actualment, la recerca profunda pot accedir a la web oberta i a qualsevol fitxer pujat. En el futur, podràs connectar-te a fonts de dades més especialitzades —ampliant l’accés a recursos amb subscripció o interns— per fer que els seus resultats siguin encara més robustos i personalitzats.
Mirant més enllà, imaginem experiències agentives que convergeixin a ChatGPT per a recerca i execució asíncrones del món real. La combinació de la recerca profunda, que pot dur a terme investigació en línia asíncrona, i Operator, que pot actuar en el món real, permetrà a ChatGPT realitzar per tu tasques cada cop més sofisticades.
Addenda del 3 de febrer de 2025: Vam dur a terme proves de seguretat rigoroses, avaluacions de preparació i revisions de governança sobre la versió inicial d’o3 que impulsa la recerca profunda, i la vam identificar com a risc mitjà(s'obre en una finestra nova). També vam fer proves de seguretat addicionals per entendre millor els riscos incrementals associats amb la capacitat de la recerca profunda de navegar per la web, i hi hem afegit noves mitigacions. Continuarem provant a fons i supervisant de prop l’actual llançament limitat. Compartirem les nostres conclusions de seguretat i les salvaguardes de la recerca profunda en una fitxa del model quan ampliem l’accés als usuaris Plus.
Notes al peu
- 1
Hem descobert que les respostes de referència d’aquest conjunt de dades s’havien filtrat àmpliament en línia i, en conseqüència, hem bloquejat diversos llocs web o URL per garantir una avaluació justa del model.
Autors
Responsables de recerca
Isa Fulford i Zhiqing Sun
Contribuïdors fonamentals
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney i Valerie Qi
Contribuïdors principals
Recerca
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Desplegament
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contribuïdors
Recerca
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ tots els contribuïdors a o3.
Sistemes de seguretat
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Desplegament
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Lideratge
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman i Wojciech Zaremba