Presentamos la investigación a fondo
Un agente que aplica el razonamiento para sintetizar grandes cantidades de información en línea y llevar a cabo tareas de investigación de varios pasos por ti. Disponible actualmente para los usuarios Pro y próximamente para los usuarios Plus y Team.
Actualización del 10 de febrero de 2026: Ahora puedes conectar la investigación profunda a cualquier MCP o aplicación y restringir las búsquedas en la web a sitios de confianza, para que puedas enfocarte en fuentes autenticadas y estándares de la industria. También puedes seguir el progreso en tiempo real e interrumpir para perfeccionar con prompts de seguimiento o nuevas fuentes. Hemos actualizado la experiencia visual para que sea más fácil iniciar, seguir y revisar tu investigación de principio a fin.
Actualización del 17 de julio de 2025: La investigación profunda ahora puede ser aún más profunda y amplia con acceso a un navegador visual como parte del agente de ChatGPT. Para acceder a estas capacidades actualizadas, simplemente selecciona “modo agente” en el menú desplegable del compositor e ingresa tu consulta directamente. La funcionalidad original de investigación profunda sigue disponible a través de la opción “investigación profunda” en el menú de herramientas.
Actualización del 24 de abril de 2025: Estamos aumentando significativamente la frecuencia con la que puedes usar la investigación profunda: los usuarios Plus, Team, Enterprise y Edu ahora tienen 25 consultas al mes, los usuarios Pro tienen 250 y los usuarios Free tienen 5. Esto es posible gracias a una nueva versión ligera de la investigación profunda, impulsada por una versión de o4-mini, diseñada para ser más rentable sin comprometer la alta calidad. Una vez que alcances tu límite de la versión completa, tus consultas cambiarán automáticamente a la versión ligera.
Actualización del 25 de febrero de 2025: Todos los usuarios Plus ahora pueden usar investigación profunda.
Actualización del 5 de febrero de 2025: La investigación profunda ya está disponible para los usuarios Pro en el Reino Unido, Suiza y el Área Económica Europea.
Con la investigación a fondo en ChatGPT, la nueva herramienta que realiza búsquedas de varios pasos en Internet, podrás solucionar tareas complejas. Es capaz de lograr en 20 o 30 minutos lo que a un ser humano le llevaría muchas horas.
La investigación a fondo es el nuevo agente de OpenAI que puede trabajar por ti de forma independiente: tú le envías un mensaje solicitando lo que necesitas y ChatGPT se encargará de buscar, analizar y sintetizar cientos de fuentes en línea para crear un informe detallado digno de un analista de investigación. Esta nueva herramienta está impulsada por una versión del nuevo modelo OpenAI o3, optimizada para navegar por la web y analizar datos, que aprovecha el razonamiento para buscar, interpretar y analizar grandes cantidades de texto, imágenes y archivos PDF publicados en Internet, reaccionando a la información que encuentra en función de tus necesidades.
Para poder crear nuevos conocimientos es necesario poder sintetizarlos. Por eso, la investigación a fondo es un avance esencial hacia el gran objetivo de desarrollar la AGI, que desde hace ya mucho tiempo consideramos capaz de generar nuevas investigaciones científicas.
La investigación a fondo está pensada para personas que realizan un trabajo intensivo de conocimiento en campos como las finanzas, la ciencia, la política y la ingeniería y necesitan una investigación minuciosa, precisa y digna de confianza. También puede resultarles muy útil a los compradores exigentes que buscan recomendaciones totalmente personalizadas para hacer compras que normalmente obligan a realizar una investigación minuciosa, como sucede con los automóviles, los electrodomésticos y los muebles. Cada salida está ampliamente documentada, pues incluye citas claras y una síntesis de su pensamiento, con lo que facilita la consulta de las referencias y la verificación de la información. Esta herramienta es especialmente eficaz para encontrar información especializada y que no sea intuitiva, ya que para encontrarla habría que navegar por numerosos sitios web. La investigación a fondo te permite ganar una cantidad de tiempo nada despreciable, ya que con una sola consulta puedes descargar y agilizar búsquedas web complejas que, de otro modo, te tomarían mucho tiempo.
La investigación a fondo se encarga de descubrir, analizar y consolidar información obtenida en la web de forma independiente. Para lograrlo, se la entrenó en tareas del mundo real que requieren el uso de navegadores y herramientas Python, aplicando los mismos métodos de aprendizaje por refuerzo que hay detrás de OpenAI o1, nuestro primer modelo de razonamiento. Si bien o1 muestra unas capacidades asombrosas para la codificación, las matemáticas y otras disciplinas técnicas, para muchos de los desafíos del mundo real es necesario contar con un contexto amplio y recopilar información de diferentes fuentes en línea. Para salvar esa diferencia, la investigación a fondo recurre a estas capacidades de razonamiento, que le permiten abordar los tipos de problemas a los que las personas nos enfrentamos en el trabajo y en el día a día.
En ChatGPT, selecciona “Investigación a fondo” en el editor de mensajes e ingresa tu consulta. Dile a ChatGPT lo que necesitas, por ejemplo, un análisis de la competencia entre plataformas de streaming o un informe personalizado sobre la mejor bicicleta para ir al trabajo. Si deseas añadirle más contexto a tu pregunta, puedes adjuntar archivos u hojas de cálculo. Una vez que comienza a ejecutar la búsqueda, aparece una barra lateral con un resumen de los pasos que ha ido siguiendo y las fuentes que consulta.
La investigación a fondo puede tomar de 5 a 30 minutos para completar su trabajo, ya que dedica el tiempo necesario a adentrarse en las profundidades de la web. Mientras tanto, puedes ausentarte o trabajar en otras tareas, pues te enviará una notificación una vez finalice la investigación. Los datos de salida finales se presentan en el chat a modo de informes. A estos informes, en las próximas semanas les añadiremos imágenes incrustadas, visualizaciones de datos y otros resultados analíticos que les aportarán mayor claridad y contexto.
Comparado con la investigación a fondo, GPT‑4o es ideal para conversaciones en tiempo real que incluyan, por ejemplo, texto, voz, imágenes y videos. Cuando se trata de consultas multifacéticas y centradas en un ámbito en particular, en el que la minuciosidad y el detalle sean esenciales, la capacidad de la investigación a fondo para realizar exploraciones exhaustivas y citar cada argumento marca la diferencia entre un resumen rápido y una respuesta verificada y bien documentada que se puede utilizar como producto de trabajo.
GPT-4o
Investigación a fondo
La investigación a fondo responde a los mensajes con todo detalle y ofrece datos desglosados por países, tanto de los 10 principales países desarrollados como de los 10 principales países en desarrollo, para que la consulta y la comparación resulten más sencillas. A partir de esa información, puede ofrecer recomendaciones detalladas para entrar en cada mercado, fundamentadas y útiles.
La investigación a fondo se entrenó aplicando el aprendizaje por refuerzo de extremo a extremo a tareas difíciles de navegación y razonamiento en una amplia gama de dominios. Este entrenamiento le permitió aprender a planificar y ejecutar una trayectoria de varios pasos hasta encontrar los datos que necesita, retrocediendo y reaccionando a la información en tiempo real siempre que sea necesario. El modelo también tiene la capacidad de explorar los archivos que cargan los usuarios, elaborarlos, refinarlos y mejorarlos, generar gráficos e incrustarlos en sus respuestas valiéndose de la herramienta Python, así como citar frases o pasajes concretos de sus fuentes. Gracias a este entrenamiento, llega a nuevos máximos en una serie de evaluaciones públicas centradas en problemas del mundo real.
En la prueba Humanity’s Last Exam(se abre en una nueva ventana), un estudio publicado recientemente que pone a prueba la inteligencia artificial en una amplia gama de temas con preguntas de nivel experto, el modelo que impulsa la investigación profunda alcanza un nuevo récord con un 26,6 % de precisión. Esta evaluación consta de más de 3000 preguntas con respuestas de opción múltiple y cortas acerca de más de 100 temas, que van desde la lingüística a los cohetes espaciales, pasando por las obras clásicas o la ecología. Si se compara con OpenAI o1, los mayores avances se registraron en química, ciencias humanas y sociales y matemáticas. El modelo que hace posible la investigación a fondo presentó un enfoque similar al humano al buscar eficazmente información especializada cada vez que era necesario.
| Modelo | Precisión (%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Claude 3.5 Sonnet | 4.3 |
| Gemini Thinking | 6.2 |
| OpenAI o1 | 9.1 |
| DeepSeek-R1* | 9.4 |
| OpenAI o3-mini (medio)* | 10.5 |
| OpenAI o3-mini (alto)* | 13.0 |
| Deep Research de OpenAI** | 26.6 |
En la prueba GAIA(se abre en una nueva ventana)1, un estudio de referencia público que evalúa la IA con preguntas del mundo real, el modelo que hace posible la investigación a fondo alcanza un nuevo nivel de excelencia (SOTA, por sus siglas en inglés y encabeza la clasificación(se abre en una nueva ventana) externa. Para llevar a cabo estas tareas con éxito, que comprenden preguntas de tres niveles de dificultad, se necesitan capacidades como el razonamiento, la fluidez multimodal, la navegación por Internet y la destreza en el uso de herramientas.
| GAIA | ||||
|---|---|---|---|---|
| Nivel 1 | Nivel 2 | Nivel 3 | Promedio | |
| SOTA anterior(se abre en una nueva ventana) | 67.92 | 67.44 | 42.31 | 63.64 |
| Deep Research (pass@1) | 74.29 | 69.06 | 47.6 | 67.36 |
| Deep Research (cons@64) | 78.66 | 73.21 | 58.03 | 72.57 |
Ejemplos de tareas para la prueba GAIA
En una evaluación interna de tareas a nivel experto en una serie de dominios, los expertos en cada uno de ellos consideraron que la investigación a fondo había permitido automatizar muchas horas de ardua investigación manual.
Tasa de aprobación frente a cantidad máxima de solicitudes a herramientas
Ejemplos de tareas a nivel experto
Tasa de aprobación en tareas de nivel experto según el valor económico estimado
Tasa de aprobación en tareas de nivel experto según las horas estimadas
La investigación a fondo te permite acceder a nuevas capacidades, pero aún está en sus inicios y tiene algunas limitaciones. A veces, puede generar alucinaciones en sus respuestas o hacer inferencias incorrectas, aunque en mucha menor medida que los modelos ChatGPT existentes, según indican las evaluaciones internas. A veces, le puede costar distinguir entre información fidedigna y rumores. De momento, muestra debilidad a la hora de calibrar la confianza y suele no transmitir con precisión lo que le parece incierto. En el momento de su lanzamiento, los informes y las citas podrían contener pequeños errores de formato, mientras que las tareas podrían tardar un poco más en iniciarse. Con el uso y el tiempo, esperamos que todos estos problemas se corrijan rápidamente.
Por el momento, la investigación a fondo en ChatGPT consume muchos recursos informáticos. De hecho, cuanto más tiempo le lleve investigar una consulta, más cálculos de inferencia necesitará. Por eso, para comenzar, te proponemos una versión optimizada para usuarios Pro, que puede responder hasta 100 consultas al mes. Luego, el acceso estará disponible para los usuarios Plus y Team y, posteriormente, los usuarios Enterprise. Aún estamos trabajando para facilitarles el acceso a los usuarios del Reino Unido, Suiza y el Espacio Económico Europeo.
En breve, todos los usuarios de paga disfrutarán de límites de tarifa significativamente más altos cuando lancemos una versión más rápida y rentable de la investigación a fondo, basada en un modelo más pequeño que sin embargo proporcionará resultados de alta calidad.
Durante las próximas semanas, e incluso meses, nos dedicaremos a mejorar la infraestructura técnica, haremos un estrecho seguimiento de la versión actual y realizaremos pruebas aún más rigurosas. De este modo, cumpliremos con nuestro principio de despliegue iterativo. Si todas las verificaciones de seguridad siguen cumpliendo nuestras normas de lanzamiento, pensamos que podremos poner la investigación a fondo a disposición de los usuarios Plus en aproximadamente un mes.
La investigación a fondo está disponible desde hoy en la web de ChatGPT y en el plazo de un mes llegará a las aplicaciones para móviles y computadoras de escritorio. Hasta ahora, la investigación a fondo puede acceder a la web abierta y a cualquier archivo que cargues. En el futuro, podrás conectarte a fuentes de datos más especializadas, ya que su acceso a recursos de suscripción o internos permitirá que sus datos de salida sean aún más sólidos y personalizados.
Además, imaginamos que, a largo plazo, podremos combinar las experiencias virtuales dentro de ChatGPT para llevar a cabo investigaciones y ejecuciones asincrónicas del mundo real. Al combinar la investigación a fondo, que es capaz de llevar a cabo una investigación en línea asincrónica, y Operator, que puede realizar acciones en el mundo real, ChatGPT estará en condiciones de hacer realidad las tareas cada vez más sofisticadas que les solicites.
Anexo del 3 de febrero de 2025: Hemos llevado a cabo rigurosas pruebas de seguridad, evaluaciones de preparación y revisiones de gobernanza en la primera versión de o3 en la que se basa la investigación a fondo y la hemos identificado como de riesgo medio(se abre en una nueva ventana). Además, hemos realizado pruebas de seguridad adicionales destinadas a comprender mejor los riesgos adicionales relacionados con la capacidad para explorar la web de la investigación a fondo, y le hemos añadido nuevas medidas de mitigación. Vamos a seguir haciendo pruebas rigurosas, así como un estricto seguimiento de la actual versión limitada. Cuando extendamos el acceso a los usuarios Plus, daremos a conocer nuestros conocimientos en materia de seguridad y protección de la investigación a fondo en una tarjeta del sistema.
Notas al pie
- 1
Constatamos que las respuestas reales de este conjunto de datos se habían filtrado ampliamente en Internet y por ello bloqueamos varios sitios web o URL para garantizar una evaluación justa del modelo.
Autores
Jefes de investigación
Isa Fulford y Zhiqing Sun
Colaboradores fundadores
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney y Valerie Qi
Contribuidores clave
Investigación
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao y Vitchyr Pong.
Implementación
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani y Sean Fitzgerald.
Colaboradores
Investigación
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang y Wyatt Thompson.
Más todos los colaboradores de o3.
Sistemas de Seguridad
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu y Yunyun Wang.
Implementación
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz y Yining Chen.
Liderazgo
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman y Wojciech Zaremba