Consensus usa GPT‑5 e API Responses para concluir semanas de pesquisa em questão de minutos
Usando o GPT‑5 e a API Responses, o Consensus desenvolveu um sistema multiagente que planeja, lê e sintetiza evidências científicas da mesma maneira que os pesquisadores.

Todo ano, são publicadas milhões de pesquisas científicas, muito mais do que qualquer pessoa sozinha conseguiria ler.
Para os cientistas, o desafio não está em acessar o conhecimento, mas na tarefa homérica de encontrá-lo, interpretá-lo e conectá-lo. As descobertas acontecem no limite do que é conhecido, mas os pesquisadores passam a maior parte do tempo simplesmente procurando esses limites, em vez de ultrapassá-los.
O Consensus(abre em uma nova janela), um assistente de pesquisa usado por mais de 8 milhões de pessoas, foi criado para mudar isso. A plataforma criada por Christian Salem e Eric Olson busca, lê e sintetiza publicações científicas revisadas por pesquisadores em mais de 220 milhões de artigos. Sua mais nova capacidade, o Scholar Agent, é um sistema multiagente que usa o GPT‑5 e a API Responses como base. Ele imita o trabalho de pesquisadores de verdade, ajudando-os a passar de perguntas para conclusões em questão de minutos, em vez de semanas.
O objetivo, porém, não é apenas tornar a pesquisa mais rápida, e sim acelerar a descoberta. "A ciência avança quando é mais acessível", diz Salem. "Nossa tarefa é dar aos pesquisadores do mundo todo a capacidade de encontrar evidências, confiar nelas e agir usando-as como base.
A primeira versão do Consensus funcionava como um mecanismo de busca vertical para a ciência, indexando artigos acadêmicos, extraindo resultados relevantes e gerando resumos baseados em citações. Porém, apenas buscar não era suficiente.
"A pesquisa não se resume em encontrar artigos", afirma Salem. "Trata-se de interpretar resultados, comparar constatações e conectar ideias. Quanto mais tempo os cientistas gastam buscando, lendo e interpretando conhecimentos passados para o estudo certo, menos tempo passam descobrindo e realizando pesquisas de verdade."
Assim, a equipe começou a redesenhar o Consensus com um novo conceito em mente: um sistema multiagente chamado "Scholar Agent" que operasse da mesma forma que os pesquisadores humanos.
Usando o GPT‑5 e a API Responses como base, o sistema passou a executar um fluxo de trabalho coordenado entre os agentes:
- O Agente de Planejamento analisa a pergunta do usuário e decide quais ações devem ser tomadas em seguida
- O Agente de Busca vasculha o índice de artigos do Consensus, a biblioteca privada do usuário e a rede de citações científicas
- O Agente de Leitura interpreta artigos individualmente ou em lotes
- O Agente de Análise sintetiza os resultados, determina a estrutura e os aspectos visuais e compõe o material final
Cada agente cuida de um escopo restrito, o que mantém um raciocínio preciso e minimiza gerações incorretas (alucinações) A arquitetura também permite que o Consensus decida quando não deve responder. Se não encontrar estudos que atendam à qualidade mínima, o assistente simplesmente diz não.
"Ao dividir o fluxo de trabalho entre vários agentes, reduzimos os erros e tornamos o sistema mais disciplinado", diz Salem. "Nenhum dos agentes sozinhos têm responsabilidade demais, o que é muito importante para a confiabilidade."

A equipe chama essa abordagem de engenharia de contexto, que reúne as evidências científicas corretas antes que a geração seja iniciada. Cada resposta é acompanhada de um "pacote de contexto da pesquisa", ou seja, um conjunto estruturado de artigos, metadados e as principais conclusões que remetem aos estudos originais.
"Não queremos que os pesquisadores percam tempo verificando cada afirmação duas vezes", explica Salem. "Se o sistema não conseguir basear uma resposta em evidências reais, ele não a inventará."
O Consensus migrou da API Chat Completions para a API Responses para que seu roteamento multiagente fosse compatível. Com a mudança, tanto a confiabilidade quanto a eficiência de custo foram aprimoradas, dando à equipe um controle mais preciso sobre as chamadas de subagentes. Com o raciocínio de contexto extenso do GPT‑5 e a chamada confiável de ferramentas, a escolha ficou fácil.
As primeiras evoluções confirmaram a suspeita: o GPT‑5 superou o GPT‑4.1, o Sonnet 4 e o Gemini 2.5 Pro no que diz respeito à precisão da chamada de ferramentas e à estabilidade de planejamento. Isso permitiu que a equipe do Consensus se concentrasse menos em malabarismos com os prompts e mais na construção de comportamentos de agentes que se relacionassem diretamente com os fluxos de trabalho de pesquisa.

Desde o início, o Consensus abordou o mercado de uma maneira diferente do esperado. Em vez de adotar o modelo de vendas para instituições, a equipe se concentrou nas pessoas que realizavam a pesquisa: estudantes, professores e médicos que precisavam de respostas imediatas. Esse foco direto no pesquisador influenciou tanto o desenvolvimento do produto quanto seu rápido crescimento.
"Todos dizem que, no meio acadêmico, seria impossível vender diretamente ao consumidor, mas a IA mudou isso", diz Salem. "As pessoas já não esperam mais por aprovação. Elas usam o que funciona."
Essa decisão moldou o tom e a curva de crescimento do produto. O Consensus se parece mais como um aplicativo moderno para consumidores do que uma ferramenta acadêmica, com integração rápida, design intuitivo e interface conversacional. A adoção se disseminou pelo boca a boca nos campi e laboratórios.
Alunos universitários e candidatos a doutorado se tornaram os primeiros usuários avançados, seguidos por professores e pesquisadores privados. Em seguida, vieram os médicos, que começaram a usar o Consensus para divulgar as evidências mais recentes em suas áreas de atuação.
"Nossa intenção original não era criar algo para a comunidade médica", afirma Salem. "Porém, eles precisam do mesmo que os pesquisadores: acesso rápido a evidências científicas confiáveis."
A empresa assinou recentemente um contrato com a biblioteca médica da Mayo Clinic e acaba de lançar o "Medical Mode", um novo recurso projetado para profissionais que buscam evidências clínicas.
No último ano, o Consensus se expandiu rapidamente, alcançando mais de 8 milhões de pesquisadores em todo o mundo e aumentando sua receita em oito vezes.
Esse crescimento, contudo, não mudou as prioridades do produto. Todos os recursos ainda giram em torno de respostas verificáveis e com baixo índice de alucinações. A equipe fez grandes investimentos em pipelines de avaliação, que testam a precisão, a rastreabilidade das citações e a consistência estilística entre os agentes.
A arquitetura do Consensus é propositalmente modular, projetada para que novos agentes possam ser incorporados à medida que os modelos se expandem e melhoram, agentes esses que repliquem experimentos, gerem números ou executem análises estatísticas.
"Estamos criando o assistente que os pesquisadores realmente precisam em um mundo de rápidas mudanças", afirma Salem. "Os modelos seguem melhorando, o sistema cresce com eles e a ciência avança mais rapidamente."


