23 de outubro de 2025

Consensus usa GPT‑5 e API Responses para concluir semanas de pesquisa em questão de minutos

Usando o GPT‑5 e a API Responses, o Consensus desenvolveu um sistema multiagente que planeja, lê e sintetiza evidências científicas da mesma maneira que os pesquisadores.

Logotipo do Consensus em branco, centralizado em um fundo azul-petróleo escuro, com painéis verticais texturizados em vários tons de azul e verde.

Carregando…

Todo ano, são publicadas milhões de pesquisas científicas, muito mais do que qualquer pessoa sozinha conseguiria ler.

Para os cientistas, o desafio não está em acessar o conhecimento, mas na tarefa homérica de encontrá-lo, interpretá-lo e conectá-lo. As descobertas acontecem no limite do que é conhecido, mas os pesquisadores passam a maior parte do tempo simplesmente procurando esses limites, em vez de ultrapassá-los.

O Consensus⁠(abre em uma nova janela), um assistente de pesquisa usado por mais de 8 milhões de pessoas, foi criado para mudar isso. A plataforma criada por Christian Salem e Eric Olson busca, lê e sintetiza publicações científicas revisadas por pesquisadores em mais de 220 milhões de artigos. Sua mais nova capacidade, o Scholar Agent, é um sistema multiagente que usa o GPT‑5 e a API Responses como base. Ele imita o trabalho de pesquisadores de verdade, ajudando-os a passar de perguntas para conclusões em questão de minutos, em vez de semanas.

O objetivo, porém, não é apenas tornar a pesquisa mais rápida, e sim acelerar a descoberta. "A ciência avança quando é mais acessível", diz Salem. "Nossa tarefa é dar aos pesquisadores do mundo todo a capacidade de encontrar evidências, confiar nelas e agir usando-as como base.

De mecanismo de busca a assistente autônomo

A primeira versão do Consensus funcionava como um mecanismo de busca vertical para a ciência, indexando artigos acadêmicos, extraindo resultados relevantes e gerando resumos baseados em citações. Porém, apenas buscar não era suficiente.

"A pesquisa não se resume em encontrar artigos", afirma Salem. "Trata-se de interpretar resultados, comparar constatações e conectar ideias. Quanto mais tempo os cientistas gastam buscando, lendo e interpretando conhecimentos passados para o estudo certo, menos tempo passam descobrindo e realizando pesquisas de verdade."

Assim, a equipe começou a redesenhar o Consensus com um novo conceito em mente: um sistema multiagente chamado "Scholar Agent" que operasse da mesma forma que os pesquisadores humanos.

Usando o GPT‑5 e a API Responses como base, o sistema passou a executar um fluxo de trabalho coordenado entre os agentes:

O Agente de Planejamento analisa a pergunta do usuário e decide quais ações devem ser tomadas em seguida
O Agente de Busca vasculha o índice de artigos do Consensus, a biblioteca privada do usuário e a rede de citações científicas
O Agente de Leitura interpreta artigos individualmente ou em lotes
O Agente de Análise sintetiza os resultados, determina a estrutura e os aspectos visuais e compõe o material final

Cada agente cuida de um escopo restrito, o que mantém um raciocínio preciso e minimiza gerações incorretas (alucinações) A arquitetura também permite que o Consensus decida quando não deve responder. Se não encontrar estudos que atendam à qualidade mínima, o assistente simplesmente diz não.

"Ao dividir o fluxo de trabalho entre vários agentes, reduzimos os erros e tornamos o sistema mais disciplinado", diz Salem. "Nenhum dos agentes sozinhos têm responsabilidade demais, o que é muito importante para a confiabilidade."

Diagrama de fluxo dos agentes mostrando como uma solicitação do usuário é processada por meio de planejamento, pesquisa paralela, leitura e análise dos agentes para gerar um resultado baseado em pesquisa.

A equipe chama essa abordagem de engenharia de contexto, que reúne as evidências científicas corretas antes que a geração seja iniciada. Cada resposta é acompanhada de um "pacote de contexto da pesquisa", ou seja, um conjunto estruturado de artigos, metadados e as principais conclusões que remetem aos estudos originais.

"Não queremos que os pesquisadores percam tempo verificando cada afirmação duas vezes", explica Salem. "Se o sistema não conseguir basear uma resposta em evidências reais, ele não a inventará."

Criação com a API Responses

O Consensus migrou da API Chat Completions para a API Responses para que seu roteamento multiagente fosse compatível. Com a mudança, tanto a confiabilidade quanto a eficiência de custo foram aprimoradas, dando à equipe um controle mais preciso sobre as chamadas de subagentes. Com o raciocínio de contexto extenso do GPT‑5 e a chamada confiável de ferramentas, a escolha ficou fácil.

As primeiras evoluções confirmaram a suspeita: o GPT‑5 superou o GPT‑4.1, o Sonnet 4 e o Gemini 2.5 Pro no que diz respeito à precisão da chamada de ferramentas e à estabilidade de planejamento. Isso permitiu que a equipe do Consensus se concentrasse menos em malabarismos com os prompts e mais na construção de comportamentos de agentes que se relacionassem diretamente com os fluxos de trabalho de pesquisa.

Tabela comparativa das métricas do Agente de Pesquisa do GPT-5 para os modelos OAI, Anthropic e Google em termos de exatidão, precisão, estrutura e latência.

Foco no usuário em meio a gigantes institucionais

Desde o início, o Consensus abordou o mercado de uma maneira diferente do esperado. Em vez de adotar o modelo de vendas para instituições, a equipe se concentrou nas pessoas que realizavam a pesquisa: estudantes, professores e médicos que precisavam de respostas imediatas. Esse foco direto no pesquisador influenciou tanto o desenvolvimento do produto quanto seu rápido crescimento.

"Todos dizem que, no meio acadêmico, seria impossível vender diretamente ao consumidor, mas a IA mudou isso", diz Salem. "As pessoas já não esperam mais por aprovação. Elas usam o que funciona."

Essa decisão moldou o tom e a curva de crescimento do produto. O Consensus se parece mais como um aplicativo moderno para consumidores do que uma ferramenta acadêmica, com integração rápida, design intuitivo e interface conversacional. A adoção se disseminou pelo boca a boca nos campi e laboratórios.

Alunos universitários e candidatos a doutorado se tornaram os primeiros usuários avançados, seguidos por professores e pesquisadores privados. Em seguida, vieram os médicos, que começaram a usar o Consensus para divulgar as evidências mais recentes em suas áreas de atuação.

"Nossa intenção original não era criar algo para a comunidade médica", afirma Salem. "Porém, eles precisam do mesmo que os pesquisadores: acesso rápido a evidências científicas confiáveis."

A empresa assinou recentemente um contrato com a biblioteca médica da Mayo Clinic e acaba de lançar o "Medical Mode", um novo recurso projetado para profissionais que buscam evidências clínicas.

Expansão com base na ciência

No último ano, o Consensus se expandiu rapidamente, alcançando mais de 8 milhões de pesquisadores em todo o mundo e aumentando sua receita em oito vezes.

Esse crescimento, contudo, não mudou as prioridades do produto. Todos os recursos ainda giram em torno de respostas verificáveis e com baixo índice de alucinações. A equipe fez grandes investimentos em pipelines de avaliação, que testam a precisão, a rastreabilidade das citações e a consistência estilística entre os agentes.

A arquitetura do Consensus é propositalmente modular, projetada para que novos agentes possam ser incorporados à medida que os modelos se expandem e melhoram, agentes esses que repliquem experimentos, gerem números ou executem análises estatísticas.

"Estamos criando o assistente que os pesquisadores realmente precisam em um mundo de rápidas mudanças", afirma Salem. "Os modelos seguem melhorando, o sistema cresce com eles e a ciência avança mais rapidamente."

A OpenAI <3 startups. Venha construir conosco.

Junte-se à comunidade Começar a criar

Continuar lendo

Como equipes de vendas usam o ChatGPT Codex | OpenAI

OpenAI Academy14 de jul. de 2026

How data science teams use Codex > card image

Como equipes de ciência de dados usam ChatGPT Codex | OpenAI

OpenAI Academy14 de jul. de 2026

How Deutsche Telekom is rewiring telecommunications with AI

10 de jul. de 2026