Apresentamos a deep research
Um agente que usa reflexão para sintetizar grandes quantidades de informação online e completar tarefas de investigação em várias fases por ti. Disponível hoje para utilizadores Pro, e em breve para Plus e Team.
Atualização de 10 de fevereiro de 2026: Podes agora ligar a pesquisa aprofundada a qualquer MCP ou aplicação e restringir as pesquisas na web a sites confiáveis, para focar em fontes autenticadas e normalizadas do setor. Também podes acompanhar o progresso em tempo real e interromper para refinar com prompts de seguimento ou novas fontes. Atualizámos a experiência visual para que seja mais fácil iniciar, acompanhar e rever a sua pesquisa do início ao fim.
Atualização de 17 de julho de 2025: a deep research é agora ainda mais completa e abrangente, com acesso a um navegador visual integrado no agente ChatGPT. Para acederes a estes recursos atualizados, basta selecionares "modo agente" no menu suspenso do editor e inserires diretamente a tua consulta. A funcionalidade original de deep research continua disponível na opção "deep research" no menu de ferramentas.
Atualização de 24 de abril de 2025: estamos a aumentar significativamente a frequência com que pode utilizar a deep research — os utilizadores Plus, Team, Enterprise e Edu têm agora direito a 25 consultas por mês, os utilizadores Pro têm direito a 250, e os utilizadores Free a 5. Isto é possível graças a uma nova versão simplificada da deep research, baseada numa versão do o4-mini, concebida para ser mais económica sem comprometer a alta qualidade. Assim que atingires o limite da versão completa, as tuas consultas serão automaticamente transferidas para a versão simplificada.
Atualização de 25 de fevereiro de 2025: todos os utilizadores do plano Plus podem agora utilizar a deep research.
Atualização de 5 de fevereiro de 2025: a deep research está agora disponível para utilizadores Pro no Reino Unido, Suíça e Espaço Económico Europeu.
Hoje estamos a lançar a deep research no ChatGPT, um novo recurso agêntico que realiza investigações em várias etapas na internet para tarefas complexas. Completa em dezenas de minutos aquilo que levaria a um ser humano muitas horas.
A deep research é o próximo agente da OpenAI capaz de trabalhar de forma independente — basta fazer um prompt e o ChatGPT encontra, analisa e sintetiza centenas de fontes online para criar um relatório abrangente ao nível de um analista de investigação. Baseada numa versão do futuro modelo OpenAI o3, otimizado para navegação na web e análise de dados, utiliza a reflexão para pesquisar, interpretar e analisar grandes quantidades de texto, imagens e PDFs na internet, adaptando-se conforme necessário em resposta à informação encontrada.
A capacidade de sintetizar conhecimento é um pré-requisito para criar novos conhecimentos. Por esta razão, a deep research representa um passo significativo em direção ao nosso objetivo mais amplo de desenvolver a AGI, que há muito imaginamos ser capaz de produzir investigação científica inovadora.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
A deep research foi treinada utilizando a aprendizagem por reforço completa em tarefas difíceis de navegação e reflexão, em vários domínios. Através deste treino, aprendeu a planear e executar uma trajeto de várias etapas para encontrar os dados necessários, retrocedendo e reagindo a informações em tempo real, quando necessário. O modelo também é capaz de navegar por ficheiros enviados pelo utilizador, planear e iterar sobre gráficos através da ferramenta Python, incorporar gráficos gerados e imagens de sites nas suas respostas e citar frases ou excertos específicos das fontes. Como resultado deste treino, alcança novos patamares em várias avaliações públicas focadas em problemas do mundo real.
No Humanity’s Last Exam(abre numa nova janela), uma avaliação recentemente divulgada que testa a IA numa vasta gama de assuntos com perguntas de nível especializado, o modelo por detrás da deep research alcançou um novo recorde de 26,6% de precisão. Este teste é composto por mais de 3000 questões de escolha múltipla e de resposta curta sobre mais de 100 disciplinas, desde linguística e ciência aeroespacial a estudos clássicos e ecologia. Em comparação com o OpenAI o1, os maiores ganhos surgiram na química, ciências sociais e humanas e matemática. O modelo que alimenta a deep research demonstrou uma abordagem semelhante à humana, procurando eficazmente informações especializadas quando necessário.
| Modelo | Precisão (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (médio)* | 10,5 |
| OpenAI o3-mini (alto)* | 13,0 |
| Deep research da OpenAI** | 26,6 |
No GAIA(abre numa nova janela)1, um benchmark público que avalia a IA em questões do mundo real, o modelo por trás da deep research atinge um novo patamar de excelência (SOTA), liderando o ranking(abre numa nova janela) externo. Abrangendo questões em três níveis de dificuldade, a conclusão bem sucedida destas tarefas exige competências como a reflexão, a fluência multimodal, a navegação na web e a proficiência na utilização de ferramentas.
| GAIA | ||||
|---|---|---|---|---|
| Nível 1 | Nível 2 | Nível 3 | Média | |
| SOTA anterior(abre numa nova janela) | 67,92 | 67,44 | 42,31 | 63,64 |
| Deep Research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Deep research (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Exemplos de tarefas do GAIA
Numa avaliação interna de tarefas de nível de especialista em diversas áreas, a deep research foi considerada por especialistas da área como tendo automatizado várias horas de investigação manual difícil.
Taxa de aprovação x Máximo de chamadas da ferramenta
Exemplos de tarefas de nível de especialista
Taxa de aprovação em tarefas de nível de especialista por valor económico estimado
Taxa de aprovação em tarefas de nível de especialista por horas estimadas
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
A deep research está hoje disponível no ChatGPT web e será implementada nas aplicações para dispositivos móveis e de desktop ainda este mês. Atualmente, a deep research pode aceder à web aberta e a quaisquer arquivos carregados. No futuro, poderás conectar-te a fontes de dados mais especializadas — alargando o acesso a recursos internos ou baseados em assinatura—, para tornar os resultados ainda mais robustos e personalizados.
Numa perspetiva mais ampla, prevemos reunir experiências agênticas no ChatGPT para pesquisa e execução assíncronas no mundo real. A combinação da deep research, capaz de realizar investigações online assíncronas, e do Operador, que pode tomar medidas no mundo real, permitirá ao ChatGPT realizar tarefas cada vez mais sofisticadas por ti.
Adenda de 3 de fevereiro de 2025: Realizámos testes de segurança rigorosos, avaliações de prontidão e revisões de governação na versão inicial do o3, que possibilita a deep research, e classificámo-la como de risco Médio(abre numa nova janela). Também realizámos testes de segurança adicionais para compreender melhor os riscos incrementais associados à capacidade da deep research de navegar na web e adicionámos novas medidas de mitigação. Continuaremos a testar minuciosamente e a monitorizar de perto a versão atual limitada. Partilharemos as nossas perceções e medidas de proteção para a deep research num cartão do sistema quando alargarmos o acesso aos utilizadores Plus.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford, Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba