23 de octubre de 2025

Consensus utiliza GPT‑5 y la API Responses para completar semanas de investigación en minutos

Gracias a GPT‑5 y a la API Responses, Consensus ha diseñado un sistema con múltiples agentes que planifica, lee y sintetiza datos empíricos del mismo modo que lo haría un investigador.

Logotipo de Consensus en blanco, centrado sobre un fondo verde azulado oscuro con paneles verticales texturizados en distintos tonos de azul y verde.

Cargando…

Cada año se publican millones de artículos científicos, muchos más de los que una sola persona podría leer.

Para los científicos, el reto no es acceder al conocimiento, sino enfrentarse a la abrumadora tarea de encontrarlo, interpretarlo y conectarlo. Los avances se producen en los límites de lo conocido, pero los investigadores pasan la mayor parte del tiempo localizando esos límites en lugar de superarlos.

Consensus⁠(se abre en una ventana nueva), un asistente de investigación que ya usan más de 8 millones de personas, nació para cambiar esa realidad. Fundada por Christian Salem y Eric Olson, la plataforma busca, lee y sintetiza literatura científica revisada por pares entre más de 220 millones de artículos. Su nueva función, Scholar Agent, es un sistema con múltiples agentes basado en GPT‑5 y en la API Responses. Refleja el modo en que trabajan realmente los investigadores y les ayuda a pasar de la pregunta a la conclusión en minutos en lugar de semanas.

Pero el objetivo no es solo acelerar la investigación, sino acortar el camino hacia el descubrimiento. «La ciencia avanza cuando resulta más accesible», afirma Salem. «Nuestro trabajo consiste en ofrecer a los investigadores de todo el mundo la posibilidad de encontrar, confiar y actuar con base en las evidencias».

Del buscador al asistente basado en agentes

La primera versión de Consensus funcionaba como un buscador especializado en ciencia: indexaba artículos académicos, recuperaba resultados relevantes y generaba resúmenes fundamentados en citas. Pero con buscar no bastaba.

«Investigar no es solo encontrar artículos», explica Salem. «Es interpretar resultados, comparar hallazgos y conectar ideas. Cuanto más tiempo dedican los científicos a buscar, leer e interpretar conocimientos previos para dar con el estudio adecuado, menos tiempo les queda para descubrir y hacer investigación de verdad».

Así que el equipo empezó a rediseñar Consensus en torno a un nuevo concepto: un sistema con múltiples agentes llamado «Scholar Agent» que funciona como lo haría un investigador humano.

Basado en GPT‑5 y en la API Responses, el sistema ejecuta ahora un flujo de trabajo coordinado entre agentes:

El agente de planificación descompone la pregunta del usuario y decide qué medidas tomar a continuación.
El agente de búsqueda rastrea el índice de artículos de Consensus, la biblioteca privada del usuario y el grafo de citas.
El agente de lectura interpreta los artículos, de forma individual o por lotes.
El agente de análisis sintetiza los resultados, determina la estructura y los elementos visuales y redacta la respuesta final.

Cada agente tiene un ámbito limitado, lo que mantiene un razonamiento preciso y reduce al mínimo la información inventada. Esta arquitectura también permite que Consensus decida cuándo no debe responder; si no hay estudios relevantes que cumplan su umbral de calidad, el asistente simplemente lo indicará.

«Al repartir el flujo de trabajo entre distintos agentes, reducimos los errores y logramos un sistema mucho más disciplinado», afirma Salem. «Ningún agente asume demasiada responsabilidad y eso resulta clave para garantizar la fiabilidad».

Diagrama del flujo de agentes que muestra cómo una consulta del usuario pasa por los agentes de planificación, de búsqueda en paralelo, de lectura y de análisis hasta generar una respuesta basada en la investigación.

Este enfoque es lo que el equipo denomina «ingeniería del contexto»: reunir los datos empíricos adecuados antes de iniciar la generación. Cada respuesta se acompaña de un «paquete de contexto de investigación»: un conjunto estructurado de artículos, metadatos y hallazgos clave que remiten a los estudios originales.

«No queremos que los investigadores pierdan tiempo comprobando cada afirmación», señala Salem. «Si el sistema no puede fundamentar una respuesta con datos empíricos reales, no se la inventará».

Integración con la API Responses

Consensus pasó de Chat Completions a la API Responses para dar soporte al enrutamiento entre múltiples agentes. El cambio mejoró tanto la fiabilidad como la eficiencia de costes y ofreció al equipo un control más preciso sobre las llamadas entre subagentes. Gracias al razonamiento con contexto largo de GPT‑5 y a su fiabilidad en la invocación de herramientas, la elección fue clara.

Las primeras evaluaciones confirmaron la apuesta: GPT‑5 superó a GPT‑4.1, Sonnet 4 y Gemini 2.5 Pro en precisión de invocación de herramientas y estabilidad de planificación. Eso permitió al equipo de Consensus centrarse menos en hacer malabarismos con indicaciones y más en construir comportamientos de agentes que se adaptan a los flujos reales de investigación.

Tabla que compara las métricas del agente de investigación con GPT-5 entre los modelos de OAI, Anthropic y Google en cuanto a precisión, estructura y latencia.

Una apuesta por el usuario en un mundo de instituciones

Desde el principio, Consensus abordó el mercado de una forma poco convencional. En lugar de vender a instituciones, el equipo se centró en quienes realmente hacen investigación: estudiantes, docentes y profesionales que necesitan respuestas hoy mismo. Ese enfoque directo al investigador definió tanto el diseño del producto como su crecimiento acelerado.

«Todo el mundo decía que no se podía ir directo al usuario en el mundo académico, pero la inteligencia artificial ha cambiado eso», afirma Salem. «La gente ya no espera aprobación, simplemente usa lo que funciona».

Esa decisión marcó el tono del producto y su curva de crecimiento. Consensus se parece más a una aplicación de consumo moderna que a una herramienta académica tradicional: incorporación rápida, diseño intuitivo e interfaz conversacional. Su adopción se extendió a través del boca a boca por campus y laboratorios.

Los primeros usuarios intensivos fueron estudiantes de posgrado y doctorandos, seguidos por docentes e investigadores independientes. Después llegaron los profesionales de la salud, que empezaron a usar Consensus para encontrar los datos empíricos más recientes en sus áreas de trabajo.

«No pensábamos crear algo para médicos», dice Salem. «Pero ellos necesitan lo mismo que los investigadores: acceso rápido a datos empíricos fiables».

La empresa ha llegado a un acuerdo con la biblioteca médica de la Mayo Clinic y acaba de lanzar «Medical Mode», una nueva función pensada para profesionales que buscan evidencias clínicas.

A escala con la ciencia

En el último año, Consensus ha crecido rápidamente, con más de 8 millones de investigadores en todo el mundo y unos ingresos ocho veces mayores.

Ese crecimiento no ha alterado las prioridades del producto. Cada función sigue girando en torno a respuestas verificables y con poca información inventada. El equipo ha invertido intensamente en procesos de evaluación para comprobar la precisión, la trazabilidad de las citas y la coherencia estilística entre los agentes.

La arquitectura de Consensus es deliberadamente modular, diseñada para que se puedan incorporar nuevos agentes a medida que los modelos evolucionan y mejoran: agentes que repliquen experimentos, generen gráficos o realicen análisis estadísticos.

«Estamos construyendo el asistente que los investigadores realmente necesitan en un mundo en constante cambio», afirma Salem. «Los modelos no dejan de mejorar, el sistema crece con ellos y la ciencia avanza más deprisa».

OpenAI <3 las startups. Ven a construir con nosotros.

Unirse a la comunidad Comenzar a crear

Sigue leyendo

How Deutsche Telekom is rewiring telecommunications with AI

10 jul 2026

Primeros pasos con ChatGPT | OpenAI

OpenAI Academy10 jul 2026

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 ya es el modelo preferido en Microsoft 365 Copilot

Producto9 jul 2026