Apresentamos a investigação
Um agente que usa reflexão para sintetizar grandes quantidades de informações online e concluir tarefas de pesquisa em várias etapas para você. Disponível hoje para usuários Pro, e em breve para Plus e Team.
Atualização de 10 de fevereiro de 2026: Agora você pode conectar pesquisas aprofundadas a qualquer MCP ou aplicativo e restringir as buscas na web a sites confiáveis, para que você possa se concentrar em fontes autenticadas e em conformidade com os padrões do setor. Você também pode acompanhar o progresso em tempo real e interromper a pesquisa para refiná-la com sugestões de acompanhamento ou novas fontes. Atualizamos a experiência visual para que seja mais fácil iniciar, acompanhar e revisar sua pesquisa do início ao fim.
Atualização de 17 de julho de 2025: A pesquisa aprofundada agora pode ser ainda mais completa e abrangente com o acesso a um navegador visual integrado ao agente ChatGPT. Para acessar esses recursos atualizados, basta selecionar "modo agente" no menu suspenso do editor e inserir sua consulta diretamente. A funcionalidade original de pesquisa aprofundada continua disponível por meio da opção "pesquisa aprofundada" no menu de ferramentas.
Atualização de 24 de abril de 2025: Estamos aumentando significativamente a frequência com que você pode usar a pesquisa avançada — usuários dos planos Plus, Team, Enterprise e Edu agora têm direito a 25 consultas por mês, usuários do plano Pro têm direito a 250 e usuários do plano gratuito têm direito a 5. Isso é possível graças a uma nova versão simplificada da pesquisa avançada, baseada em uma versão do o4-mini, projetada para ser mais econômica sem comprometer a alta qualidade. Assim que você atingir o limite da versão completa, suas consultas serão automaticamente transferidas para a versão simplificada.
Atualização de 25 de fevereiro de 2025: Todos os usuários do plano Plus agora podem usar a pesquisa avançada.
Atualização de 5 de fevereiro de 2025: A pesquisa aprofundada agora está disponível para usuários Pro no Reino Unido, Suíça e Espaço Econômico Europeu.
Estamos lançando hoje a Investigação no ChatGPT, uma nova capacidade autônoma que realiza investigações em várias etapas na internet para tarefas complexas. Ela faz em dezenas de minutos o que um ser humano levaria muitas horas.
A Investigação é o próximo agente da OpenAI que pode trabalhar para você de maneira independente: você faz um prompt, e o ChatGPT encontra, analisa e sintetiza centenas de fontes online para criar um relatório abrangente no mesmo nível que um analista de investigação. Desenvolvida com base em uma versão do futuro modelo OpenAI o3, otimizado para navegação na Web e análise de dados, ela utiliza reflexão para buscar, interpretar e analisar grandes quantidades de textos, imagens e PDFs na internet, adaptando-se conforme necessário em resposta às informações encontradas.
A capacidade de sintetizar conhecimento é um pré-requisito para criar novo conhecimento. Por esse motivo, a investigação marca um passo significativo em direção ao nosso objetivo mais amplo de desenvolver a AGI, que há muito imaginamos ser capaz de produzir novas pesquisas científicas.
A investigação foi concebida para pessoas que fazem um trabalho intensivo de conhecimento em áreas como finanças, ciência, política e engenharia e que precisam de uma investigação exaustiva, precisa e de confiança. Ela pode ser igualmente útil para compradores exigentes que buscam recomendações hiperpersonalizadas sobre compras que normalmente exigem uma pesquisa cuidadosa, como carros, eletrodomésticos e móveis. Todos os resultados são totalmente documentados, com citações claras e um sumário do raciocínio, facilitando a referência e a verificação das informações. Ela é particularmente eficaz para encontrar informações específicas e não intuitivas que exigiriam a navegação em vários sites. A investigação liberta um tempo valioso, permitindo que você transfira e agilize pesquisas complexas e demoradas na web com apenas uma consulta.
A investigação descobre, raciocina e consolida de maneira independente os insights encontrados na web. Para isso, ela foi treinada em tarefas realistas que exigem um navegador e a ferramenta Python, utilizando os mesmos métodos de aprendizado por reforço que estão no OpenAI o1, nosso primeiro modelo de raciocínio. Embora o o1 demonstre capacidades impressionantes em codificação, matemática e outros domínios técnicos, muitos desafios do mundo real exigem um contexto extenso e a coleta de informações de diversas fontes online. A investigação baseia-se nessas capacidades de reflexão para superar essa lacuna, o que lhe permite abordar os tipos de problemas com que as pessoas se deparam no trabalho e no dia a dia.
No ChatGPT, selecione “investigação” no editor de mensagens e insira sua consulta. Diga ao ChatGPT o que você precisa, seja uma análise competitiva sobre plataformas de streaming ou um relatório personalizado sobre a melhor bicicleta para ir ao trabalho. Você pode anexar arquivos ou planilhas para adicionar contexto à sua pergunta. Assim que a execução começar, é exibida uma barra lateral com um sumário das etapas realizadas e das fontes utilizadas.
A investigação pode demorar entre 5 a 30 minutos para concluir o trabalho, dependendo do tempo necessário para aprofundar a pesquisa na web. Enquanto isso, você pode se afastar ou trabalhar em outras tarefas: uma notificação será enviada assim que a investigação for concluída. O resultado final chega como um relatório no chat. Nas próximas semanas, também adicionaremos imagens incorporadas, visualizações de dados e outros resultados analíticos a esses relatórios para maior clareza e contexto.
Em comparação com a investigação, o GPT‑4o é ideal para conversas multimodais em tempo real. Para consultas multifacetadas e específicas de um domínio, em que a profundidade e os detalhes são fundamentais, a capacidade da investigação de realizar uma exploração extensa e citar cada afirmação é a diferença entre um sumário rápido e uma resposta bem documentada e verificada que pode ser utilizada como produto de trabalho.
GPT-4o
Investigação
A investigação responde ao prompt de maneira altamente detalhada, fornecendo dados lado a lado específicos por país, tanto para os 10 principais países desenvolvidos como para os 10 principais países em desenvolvimento, para fácil referência e comparação. Ela usa essas informações para oferecer recomendações detalhadas e úteis sobre como entrar no mercado.
A investigação foi treinada utilizando aprendizagem por reforço completa em tarefas difíceis de navegação e reflexão em vários domínios. Com esse treinamento, ela aprendeu a planejar e executar uma trajetória em várias etapas para encontrar os dados necessários, retrocedendo e reagindo às informações em tempo real, quando necessário. O modelo também é capaz de navegar por arquivos enviados pelo usuário, plotar e iterar em gráficos usando a ferramenta Python, incorporar gráficos gerados e imagens de sites em suas respostas e citar frases ou trechos específicos de suas fontes. Como resultado desse treinamento, ela alcança novos patamares em várias avaliações públicas focadas em problemas do mundo real.
Na Humanity’s Last Exam(abre em uma nova janela), uma avaliação recém-divulgada que testa a IA em uma ampla gama de assuntos com perguntas de nível especializado, o modelo que alimenta a Investigação alcança um novo recorde de 26,6% de precisão. Esse teste tem mais de 3.000 perguntas de múltipla escolha e respostas curtas sobre mais de 100 assuntos, desde linguística até ciência espacial, clássicos e ecologia. Em comparação com o OpenAI o1, os maiores ganhos apareceram em química, ciências humanas e sociais e matemática. O modelo que está por trás da investigação apresentou uma abordagem semelhante à humana, procurando de modo eficaz informações especializadas quando necessário.
| Modelo | Precisão (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (médio)* | 10,5 |
| OpenAI o3-mini (alto)* | 13,0 |
| Investigação da OpenAI** | 26,6 |
No GAIA(abre em uma nova janela)1, um benchmark público que avalia a IA em questões do mundo real, o modelo por trás da investigação atinge um novo patamar de excelência (SOTA), liderando o ranking(abre em uma nova janela) externo. Englobando questões em três níveis de dificuldade, essas tarefas exigem habilidades que incluem reflexão, fluência multimodal, navegação na Web e proficiência no uso de ferramentas.
| GAIA | ||||
|---|---|---|---|---|
| Nível 1 | Nível 2 | Nível 3 | Média | |
| SOTA anterior(abre em uma nova janela) | 67,92 | 67,44 | 42,31 | 63,64 |
| Investigação (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Investigação (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Exemplos de tarefas do GAIA
Em uma avaliação interna de tarefas realizadas por especialistas em diversas áreas, a investigação foi classificada por especialistas da área como tendo automatizado várias horas de investigação manual difícil.
Índice de aprovação x Máximo de chamadas da ferramenta
Exemplos de tarefas de nível avançado
Índice de aprovação em tarefas de nível Especialista, por valor econômico estimado
Índice de aprovação em tarefas de nível Especialista, por horas estimadas
A investigação abre novas capacidades significativas, mas ainda está em fase inicial e apresenta limitações. Às vezes, ela pode ter alucinações sobre fatos nas respostas ou fazer inferências incorretas, embora em um índice significativamente menor do que os modelos existentes do ChatGPT, de acordo com avaliações internas. Ela pode ter dificuldade em distinguir informações confiáveis de rumores e, atualmente, apresenta fraqueza na calibração da confiança, muitas vezes não conseguindo transmitir a incerteza com precisão. No lançamento, podem ocorrer pequenos erros de formatação nos relatórios e citações, e as tarefas podem demorar mais tempo para serem iniciadas. Esperamos que todos esses problemas sejam rapidamente resolvidos com o aumento do uso e com o tempo.
Atualmente, a investigação no ChatGPT é muito exigente em termos computacionais. Quanto mais tempo leva para pesquisar uma consulta, mais computação de inferência é necessária. Estamos começando hoje com uma versão otimizada para usuários Pro, com até 100 consultas por mês. Os usuários Plus e Team terão acesso em seguida, seguidos pelos usuários Enterprise. Ainda estamos trabalhando para disponibilizar o acesso aos usuários no Reino Unido, na Suíça e no Espaço Econômico Europeu.
Todos os usuários pagos receberão em breve limites de taxa significativamente mais altos quando lançarmos uma versão mais rápida e econômica da investigação, alimentada por um modelo menor que ainda fornece resultados de alta qualidade.
Nas próximas semanas e meses, trabalharemos na infraestrutura técnica, monitorando de perto a versão atual e realizando testes ainda mais rigorosos. Isso está em consonância com nosso princípio de implantação iterativa. Se todas as verificações de segurança continuarem a cumprir os nossos padrões de lançamento, prevemos disponibilizar a investigação aos usuários Plus em cerca de um mês.
A investigação está disponível hoje no ChatGPT web e será lançada em aplicativos móveis e para desktop ainda este mês. Atualmente, a investigação pode acessar a web aberta e qualquer arquivo carregado. No futuro, você poderá se conectar a fontes de dados mais especializadas, expandindo o acesso a recursos internos ou baseados em assinatura, para tornar os resultados ainda mais robustos e personalizados.
Em uma perspectiva mais ampla, prevemos que experiências autônomas se unirão no ChatGPT para pesquisa e execução assíncronas no mundo real. A combinação da investigação, que pode realizar investigações online assíncronas, e do Operator, que pode tomar medidas no mundo real, permitirá ao ChatGPT realizar tarefas cada vez mais sofisticadas para você.
Adendo de 3 de fevereiro de 2025: Realizamos testes de segurança rigorosos, avaliações de prontidão e análises de governança na versão inicial do o3, que capacita a investigação, identificando-o como risco Médio(abre em uma nova janela). Também realizamos testes de segurança adicionais para entender melhor os riscos incrementais associados à capacidade da investigação de navegar na web e adicionamos novas medidas de mitigação. Continuaremos a testar exaustivamente e a monitorar de perto a versão limitada atual. Compartilharemos nossas percepções sobre segurança e medidas de proteção para a investigação em um cartão do sistema quando ampliarmos o acesso aos usuários Plus.
Notas de rodapé
- 1
Descobrimos que as respostas corretas para este conjunto de dados foram amplamente vazadas online e bloqueamos vários sites ou URLs para garantir uma avaliação justa do modelo.
Autoria
Líderes de investigações
Isa Fulford, Zhiqing Sun
Colaboradores fundadores
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Colaboradores principais
Investigação
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao e Vitchyr Pong
Implementação
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani e Sean Fitzgerald
Colaboradores
Investigação
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang e Wyatt Thompson
+ todos os colaboradores do o3.
Sistemas de segurança
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu e Yunyun Wang
Implementação
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz e Yining Chen
Liderança
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba