Presentamos la investigación en profundidad
Un agente capaz de razonar para recopilar y resumir grandes cantidades de información en línea y efectuar tareas de investigación complejas por ti. Disponible hoy para usuarios de la versión Pro y próximamente para usuarios de las versiones Plus y Team.
Actualización del 10 de febrero de 2026: Ahora puedes conectar la investigación avanzada a cualquier MCP o aplicación y restringir las búsquedas web a sitios de confianza, para que puedas centrarte en fuentes autenticadas y estándar del sector. También puedes hacer un seguimiento del progreso en tiempo real e interrumpir para ajustar con prompts de seguimiento o nuevas fuentes. Hemos actualizado la experiencia visual para que sea más fácil iniciar, seguir y revisar tu investigación de principio a fin.
Actualización del 17 de julio de 2025: La investigación avanzada ahora puede ir todavía más lejos y abarcar mucho más accediendo a un navegador visual como parte del agente de ChatGPT. Para acceder a estas capacidades actualizadas, simplemente selecciona «modo agente» en el menú desplegable del redactor e introduce tu consulta directamente. La funcionalidad original de investigación avanzada sigue disponible a través de la opción «investigación avanzada» en el menú de herramientas.
Actualización del 24 de abril de 2025: Estamos aumentando considerablemente la frecuencia con la que puedes usar la investigación avanzada. Los usuarios con suscripción Plus, Team, Enterprise y Edu ahora disponen de 25 consultas al mes, mientras que los usuarios Pro tienen 250, y los Free solo 5. Esto es posible gracias a una nueva versión ligera de la investigación avanzada, impulsada por una versión de o4-mini, diseñada para ser más rentable sin comprometer la alta calidad. Una vez que alcances tu límite para la versión completa, tus consultas cambiarán automáticamente a la versión ligera.
Actualización del 25 de febrero de 2025: Ahora, todos los usuarios Plus pueden usar la investigación avanzada.
Actualización del 5 de febrero de 2025: La investigación avanzada ya está disponible para los usuarios Pro en el Reino Unido, Suiza y el Espacio Económico Europeo.
Hoy presentamos la investigación en profundidad en ChatGPT, una nueva función que actúa como si de un agente se tratase y lleva a cabo investigaciones de varios pasos en línea con el objetivo de resolver tareas complejas. Consigue en cuestión de minutos lo que una persona tardaría horas en hacer.
Investigación en profundidad es el nuevo agente de OpenAI, capaz de trabajar de forma independiente: dale una indicación y ChatGPT se encargará de localizar, analizar y reunir información de cientos de fuentes en línea para elaborar un informe exhaustivo y profesional. Funciona con una versión del futuro modelo OpenAI o3, optimizada para la navegación web y el análisis de datos. Utiliza el razonamiento para buscar, interpretar y analizar grandes cantidades de texto, imágenes y archivos PDF en la red, adaptándose en función de la información que va encontrando.
Saber sintetizar conocimiento es fundamental para poder generar conocimiento nuevo. Por eso consideramos que esta herramienta representa un avance clave hacia nuestro objetivo de crear una AGI capaz de producir investigación científica original.
Investigación en profundidad es una función pensada para quienes trabajan con grandes volúmenes de conocimiento en campos como las finanzas, la ciencia, la política o la ingeniería, y necesitan resultados rigurosos, precisos y bien fundamentados. También puede ser útil para personas que buscan recomendaciones muy personalizadas para tomar mejores decisiones sobre compras importantes, como a la hora de adquirir un coche, electrodomésticos o muebles. Cada informe está completamente documentado, con citas claras y un resumen del razonamiento, lo que permite verificar fácilmente la información. Es especialmente eficaz para localizar datos poco obvios o muy concretos, que normalmente requieren navegar por muchas páginas. En definitiva, investigación en profundidad permite ahorrar tiempo al asumir tareas de investigación en la red complejas y laboriosas con una sola consulta.
La investigación en profundidad es capaz de descubrir, interpretar y sintetizar por sí sola ideas extraídas de toda la web. Para lograrlo, se ha entrenado con tareas reales que requerían el uso de un navegador y herramientas en Python, usando los mismos métodos de aprendizaje por refuerzo que empleamos en OpenAI o1, nuestro primer modelo razonador. Si bien o1 destaca en programación, matemáticas y otras disciplinas técnicas, muchos problemas reales requieren manejar mucho contexto y reunir información de fuentes en línea de distintos tipos. Investigación en profundidad emplea las capacidades de razonamiento para cubrir esa necesidad y resolver problemas habituales del trabajo y del día a día.
En ChatGPT, selecciona «investigación en profundidad» en el cuadro de mensaje y escribe la consulta. Puedes pedirle lo que necesites: desde un análisis competitivo sobre plataformas de streaming hasta un informe personalizado sobre qué bicicleta es mejor para ir y volver del trabajo. Si quieres, puedes adjuntar archivos u hojas de cálculo que aporten contexto a la consulta. Cuando se inicie la investigación, aparecerá una barra lateral con un resumen de los pasos seguidos y las fuentes empleadas.
La investigación en profundidad puede tardar entre 5 y 30 minutos en completarse, ya que analiza la información en detalle navegando por internet. Mientras tanto, puedes dedicarte a otras tareas o hacer una pausa; recibirás una notificación cuando la investigación haya concluido. El resultado final tiene forma de un informe dentro del chat. En las próximas semanas, incorporaremos imágenes, gráficos y otros elementos visuales y analíticos para aportar más claridad y contexto.
En comparación con la investigación en profundidad, GPT‑4o es más adecuado para conversaciones multimodales en tiempo real. Sin embargo, para consultas complejas y especializadas, donde lo que prima son las respuestas bien fundamentadas y detalladas, la capacidad de la investigación en profundidad para realizar búsquedas exhaustivas y respaldar con fuentes cada afirmación marca la diferencia entre un resumen rápido y una respuesta bien documentada y verificada que se pueda emplear en un entorno profesional.
GPT-4o
Investigación en profundidad
Investigación en profundidad responde a la indicación de forma muy precisa, mostrando datos por país de los 10 países desarrollados y los 10 en desarrollo más importantes, uno al lado del otro para que sea fácil compararlos. Con esos datos, proporciona recomendaciones detalladas, claras y útiles para la entrada en el mercado.
Investigación en profundidad se ha entrenado mediante aprendizaje por refuerzo de extremo a extremo en tareas complejas de navegación y razonamiento en distintos campos. Gracias a este entrenamiento, ha aprendido a planificar y ejecutar una secuencia de pasos para encontrar los datos que necesita, retrocediendo y adaptándose en función de la información que va encontrando. El modelo también puede acceder a archivos subidos por el usuario, trazar y ajustar gráficos usando la herramienta de Python, incorporar tanto los gráficos creados como imágenes de otras páginas web en las respuestas y citar frases o fragmentos concretos de las fuentes. Gracias a esto, ha conseguido puntuaciones récord en varias evaluaciones públicas centradas en aplicaciones reales.
En Humanity’s Last Exam(se abre en una ventana nueva) (El último examen de la humanidad), una evaluación publicada recientemente que pone a prueba la inteligencia artificial con preguntas especializadas de toda una serie de campos del conocimiento, el modelo que hay detrás de la investigación en profundidad ha alcanzado una nueva puntuación máxima con un 26,6 % de aciertos. Esta prueba incluye más de 3000 preguntas, tanto de opción múltiple como de respuesta corta, en más de 100 disciplinas distintas, que abarcan desde la lingüística hasta la ingeniería aeroespacial, pasando por los estudios clásicos o la ecología. En comparación con OpenAI o1, las mejoras más notables se observaron en química, humanidades, ciencias sociales y matemáticas. El modelo tras la investigación en profundidad demostró un comportamiento similar al humano, sabiendo buscar información especializada cuando era necesario.
| Modelo | Precisión (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medio)* | 10,5 |
| OpenAI o3-mini (alto)* | 13,0 |
| OpenAI Deep Research** | 26,6 |
En GAIA(se abre en una ventana nueva)1, una prueba comparativa pública que evalúa la capacidad de la IA ante cuestiones reales, el modelo que hay detrás de la investigación en profundidad ha alcanzado el mejor resultado registrado hasta la fecha y se ha colocado a la cabeza de la clasificación(se abre en una ventana nueva) externa. Las preguntas que plantea esta prueba están divididas en tres niveles de dificultad, y superarlas requiere capacidades como razonamiento, fluidez multimodal, navegación web y dominio del uso de herramientas.
| GAIA | ||||
|---|---|---|---|---|
| Nivel 1 | Nivel 2 | Nivel 3 | Media | |
| SOTA anterior(se abre en una ventana nueva) | 67,92 | 67,44 | 42,31 | 63,64 |
| Deep Research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Deep Research (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Ejemplos de tareas en GAIA
En una evaluación interna de tareas especializadas en distintos ámbitos, expertos de cada sector valoraron que la investigación en profundidad fue capaz de automatizar varias horas de trabajo manual complejo y laborioso.
Porcentaje de éxito frente al núm. máx. de llamadas a la herramienta
Ejemplos de tareas especializadas
Porcentaje de éxito en tareas profesionales según el valor económico estimado
Porcentaje de éxito en tareas profesionales según las horas estimadas
Investigación en profundidad abre la puerta a capacidades nuevas muy relevantes, pero aún está en una fase inicial y tiene sus limitaciones. A veces puede inventar datos o sacar conclusiones incorrectas, aunque lo hace con una frecuencia significativamente menor que los modelos actuales de ChatGPT, según evaluaciones internas. También puede tener dificultades para distinguir entre fuentes fiables y rumores, y aún no calibra bien el nivel de certeza, por lo que no siempre comunica con claridad cuándo duda. En la fase de lanzamiento, es posible que los informes y citas contengan pequeños errores de formato, o que algunas tareas tarden más en iniciarse. Esperamos que todos estos aspectos mejoren rápidamente con el uso y el tiempo.
Actualmente, la investigación en profundidad en ChatGPT requiere una gran cantidad de recursos informáticos. Cuanto más compleja o larga es la investigación de una consulta, más capacidad de cálculo se necesita. Estamos comenzando con una versión optimizada para usuarios Pro, que podrán realizar hasta 100 consultas al mes. Más adelante estará disponible para usuarios Plus y Team, y después para Enterprise. Aún estamos trabajando para ofrecer acceso a usuarios del Reino Unido, Suiza y el Espacio Económico Europeo.
En breve, todos los usuarios de pago dispondrán de límites mucho más amplios gracias al lanzamiento de una versión más rápida y rentable de la investigación en profundidad, impulsada por un modelo más pequeño que sigue ofreciendo resultados de alta calidad.
Durante las próximas semanas y meses seguiremos desarrollando la infraestructura técnica, supervisando de cerca el funcionamiento actual y haciendo pruebas aún más exigentes, en virtud de nuestra estrategia de despliegue iterativo. Si las comprobaciones de seguridad siguen cumpliendo con nuestros estándares, esperamos ofrecer la función de investigación en profundidad a los usuarios Plus dentro de un mes aproximadamente.
Desde hoy mismo, la función de investigación en profundidad está disponible en la versión web de ChatGPT y llegará a las aplicaciones para móvil y escritorio en un mes aproximadamente. Actualmente, puede acceder a la web abierta y a cualquier archivo que se haya cargado. En el futuro, podrás conectarla a fuentes de datos más especializadas, como por ejemplo recursos internos o disponibles mediante suscripción, lo que permitirá generar resultados aún más completos y personalizados.
De cara al futuro, nuestra visión es integrar experiencias con agentes dentro de ChatGPT que permitan investigar y ejecutar tareas reales de forma asíncrona. La combinación de la investigación en profundidad, capaz de hacer búsquedas asíncronas en línea, con Operator, que puede ejecutar tareas reales, permitirá a ChatGPT asumir por ti tareas cada vez más complejas.
Anexo del 3 de febrero de 2025: Hemos llevado a cabo pruebas de seguridad, evaluaciones de preparación y controles de gobernanza exhaustivos sobre la versión inicial del modelo o3, que es el motor de la función de investigación en profundidad, y la hemos clasificado como de riesgo medio(se abre en una ventana nueva). Asimismo, hemos efectuado pruebas adicionales para comprender mejor los riesgos derivados de su capacidad para navegar por la red, y hemos añadido nuevas medidas de mitigación. Continuaremos probando y supervisando detenidamente la versión limitada actual. Cuando ampliemos el acceso a los usuarios Plus, publicaremos una tarjeta del sistema con los hallazgos de seguridad y las salvaguardias aplicadas a la investigación en profundidad.
Notas al pie
- 1
Hemos observado que las respuestas de referencia de este conjunto de datos se han difundido de forma masiva por la red, por lo que hemos bloqueado varios sitios web o URL para garantizar una evaluación justa del modelo.
Autores
Dirección de investigación
Isa Fulford y Zhiqing Sun
Contribuidores fundamentales
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney y Valerie Qi
Contribuidores clave
Investigación
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao y Vitchyr Pong
Implementación
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani y Sean Fitzgerald
Contribuidores
Investigación
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ el resto de colaboradores del modelo o3.
Sistemas de Seguridad
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu y Yunyun Wang
Implementación
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz y Yining Chen
Liderazgo
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman y Wojciech Zaremba