Ir al contenido principal
OpenAI

16 de abril de 2026

InvestigaciónLanzamiento

Presentamos GPT‑Rosalind para la investigación en ciencias de la vida

Un nuevo modelo diseñado específicamente para acelerar la investigación científica y el descubrimiento de fármacos.

Hoy presentamos GPT‑Rosalind, nuestro modelo de razonamiento de vanguardia diseñado para apoyar la investigación en biología, descubrimiento de fármacos y medicina traslacional. La serie de modelos para ciencias de la vida está optimizada para flujos de trabajo científicos, combinando un uso mejorado de herramientas con una comprensión más profunda en química, ingeniería de proteínas y genómica.

En promedio, se necesitan entre 10 y 15 años para pasar del descubrimiento de un objetivo terapéutico a la aprobación regulatoria de un nuevo fármaco en Estados Unidos. Los avances logrados en las primeras etapas del descubrimiento se multiplican posteriormente en una mejor selección de objetivos, hipótesis biológicas más sólidas y experimentos de mayor calidad. El progreso en las ciencias de la vida se ve limitado no solo por la dificultad de la ciencia subyacente, sino también por la complejidad de los propios flujos de trabajo de investigación. Los científicos deben trabajar con grandes volúmenes de bibliografía, bases de datos especializadas, datos experimentales e hipótesis en evolución para generar y evaluar nuevas ideas. Estos flujos de trabajo suelen requerir mucho tiempo, estar fragmentados y ser difíciles de escalar.

Creemos que los sistemas avanzados de IA pueden ayudar a los investigadores a avanzar por estos flujos de trabajo más rápido, no solo haciendo más eficiente el trabajo existente, sino también ayudando a los científicos a explorar más posibilidades, identificar conexiones que podrían pasar desapercibidas y formular mejores hipótesis antes. Al respaldar la síntesis de evidencias, la generación de hipótesis, la planificación experimental y otras tareas de investigación de varios pasos, este modelo está diseñado para ayudar a los investigadores a acelerar las primeras etapas del descubrimiento. Con el tiempo, estos sistemas podrían ayudar a las organizaciones del sector de las ciencias de la vida a lograr avances revolucionarios que, de otro modo, no serían posibles, con una tasa de éxito mucho mayor. 

GPT‑Rosalind ya está disponible en una versión preliminar de investigación en ChatGPT, Codex y la API para clientes cualificados a través de nuestro programa de acceso confiable. Además, hemos incorporado un plugin de investigación en ciencias de la vida de libre acceso para Codex, que ayuda a los científicos a conectar modelos con más de 50 herramientas científicas y fuentes de datos. Estamos trabajando con clientes como Amgen, Moderna, the Allen Institute, Thermo Fisher Scientific y otros para aplicar GPT‑Rosalind en flujos de trabajo que aceleran la investigación y los descubrimientos.

El modelo lleva el nombre de Rosalind Franklin, cuya rigurosa investigación ayudó a revelar la estructura del ADN y sentó las bases de la biología molecular moderna.

Desde los datos sin procesar hasta las decisiones de descubrimiento bien fundamentadas, descubre cómo nuestro modelo especializado acelera los flujos de trabajo de investigación.

Diseñado para flujos de trabajo científicos

La serie de modelos GPT‑Rosalind está diseñada para el trabajo científico moderno en publicaciones científicas, datos, herramientas y experimentos. En nuestras evaluaciones, ofrece el mejor desempeño en tareas que requieren razonamiento sobre moléculas, proteínas, genes, vías y biología relevante para las enfermedades. Además, es más eficaz en el uso de herramientas y bases de datos científicas en flujos de trabajo de varios pasos, como la revisión bibliográfica, la interpretación de secuencia a función, la planificación experimental y el análisis de datos.

Este es el primer lanzamiento de nuestra serie de modelos GPT‑Rosalind para ciencias de la vida, y seguiremos ampliando los límites de sus capacidades de razonamiento bioquímico en flujos de trabajo científicos de largo alcance y con un uso intensivo de herramientas. La infraestructura informática de OpenAI nos permite seguir entrenando, evaluando y mejorando modelos de dominio cada vez más capaces frente a tareas científicas reales, lo que ayuda a que estos sistemas sean más útiles a medida que los propios flujos de trabajo se vuelven más complejos.

Desde conocimientos de descubrimiento basados en evidencia hasta experimentos de alto impacto, descubre cómo nuestro conjunto de soluciones se traducen en mejoras medibles en tus flujos de trabajo de investigación.

Clientes y ecosistema

Estamos colaborando con clientes líderes en los sectores farmacéutico, biotecnológico y de investigación, así como con organizaciones tecnológicas de ciencias de la vida, para implementar GPT‑Rosalind en flujos de trabajo que fomentan el descubrimiento.

«El sector de las ciencias de la vida exige precisión en cada paso. Las preguntas son muy complejas, los datos son sumamente singulares y lo que está en juego es increíblemente importante. Nuestra colaboración única con OpenAI nos permite aplicar sus capacidades y herramientas más avanzadas de formas nuevas e innovadoras, con el potencial de acelerar la forma en que hacemos llegar medicamentos a los pacientes».
—Sean Bruich, vicepresidente sénior de inteligencia artificial y datos de Amgen

Rendimiento y evaluación

Evaluamos GPT‑Rosalind en una gama de capacidades fundamentales para el descubrimiento científico y la investigación industrial. Estas evaluaciones miden el razonamiento fundamental en distintos subdominios científicos, incluidos los mecanismos de reacción química; la estructura de proteínas, los efectos de las mutaciones y las interacciones; y la interpretación filogenética de secuencias de ADN. También evalúan si los modelos pueden respaldar flujos de trabajo de investigación reales mediante la interpretación de resultados experimentales, la identificación de patrones relevantes para los expertos y la síntesis de información externa para diseñar experimentos de seguimiento. Por último, prueban si los modelos pueden seleccionar y utilizar las herramientas computacionales, las bases de datos y las capacidades específicas del dominio adecuadas para ampliar su razonamiento. En conjunto, estas evaluaciones muestran avances a lo largo de todo el proceso integral de la investigación científica y sugieren una mayor capacidad para ayudar a los investigadores a abordar tareas complejas de descubrimiento.

Prompt

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

Evaluaciones del sector

Evaluamos GPT‑Rosalind en una serie de pruebas de referencia públicas. En BixBench, una prueba de referencia diseñada en torno a la bioinformática y el análisis de datos del mundo real, GPT‑Rosalind logró un desempeño líder entre los modelos con puntuaciones publicadas.

En LABBench2, una prueba de referencia que mide el desempeño en una variedad de tareas de investigación como la búsqueda de literatura, el acceso a bases de datos, la manipulación de secuencias y el diseño de protocolos, GPT‑Rosalind supera a GPT‑5.4 en 6 de 11 tareas. La mejora más notable se observa en CloningQA, que requiere el diseño integral ADN y reactivos enzimáticos para protocolos de clonación molecular.

También nos asociamos con Dyno Therapeutics, una empresa pionera en terapias génicas diseñadas con IA, para evaluar el modelo en una tarea de predicción y generación de funciones a partir de secuencias de ARN inéditas y no contaminadas. El desempeño se comparó con 57 puntuaciones históricas de expertos humanos en el campo de la IA aplicada a la biología. Al evaluarse directamente en la aplicación Codex, las mejores de diez ejecuciones del modelo se situaron por encima del percentil 95 de los expertos humanos en la tarea de predicción y alrededor del percentil 84 en la tarea de generación de secuencias.

Estas evaluaciones proporcionan un indicio significativo del rendimiento en los tipos de flujos de trabajo en los que los científicos confían a diario para generar evidencia, analizar datos complejos y avanzar hacia conclusiones biológicas sólidas.


Conexión con las herramientas que utilizan los científicos

Los científicos pueden usar nuestro nuevo plugin de investigación en ciencias de la vida(se abre en una ventana nueva) para Codex, ya disponible en GitHub. Este paquete incluye un amplio conjunto de habilidades modulares para los flujos de trabajo de investigación más comunes, diseñado para ayudar a los usuarios a trabajar en genética humana, genómica funcional, estructura de proteínas, bioquímica, evidencia clínica y descubrimiento de estudios públicos.

Imagen estática de demostración del complemento de ciencias de la vida

Estas capacidades actúan como una capa de orquestación que ayuda a los científicos a abordar de forma más eficaz preguntas amplias, ambiguas y de múltiples pasos. Proporcionan acceso a más de 50 bases de datos públicas multiómicas, fuentes bibliográficas y herramientas de biología, y ofrecen un punto de partida flexible para flujos de trabajo habituales y repetibles, como la consulta de estructuras de proteínas, la búsqueda de secuencias, la revisión bibliográfica y el descubrimiento de conjuntos de datos públicos.

Los usuarios empresariales que cumplan con los requisitos pueden utilizar este plugin en flujos de trabajo de investigación con GPT‑Rosalind para un razonamiento biológico más profundo, mientras que todos los usuarios pueden usar el paquete de plugins con nuestros modelos principales.

Acceso confiable

Queremos poner estas capacidades a disposición de los científicos y organizaciones de investigación mejor posicionados para avanzar en la salud humana, mientras mantenemos fuertes salvaguardas contra el uso indebido biológico. El modelo de ciencias de la vida se lanzará inicialmente en Estados Unidos mediante un esquema de acceso confiable para clientes empresariales calificados, con controles en torno a la elegibilidad, la gestión de accesos y la gobernanza organizacional. Al mismo tiempo, estamos poniendo a disposición de un público más amplio un conjunto de conectores y el plugin de investigación en ciencias de la vida, para que los investigadores puedan usar nuestros modelos principales de manera más eficaz en tareas de investigación en ciencias de la vida. 

El modelo de ciencias de la vida se ha desarrollado con controles de seguridad de nivel empresarial reforzados y una gestión de acceso más sólida, lo que permite su uso profesional en entornos de investigación regulados. Evaluamos el acceso en función de tres principios fundamentales: uso con beneficio público, gobernanza sólida y supervisión de la seguridad, y acceso controlado con seguridad de nivel empresarial. En la práctica, esto significa que las organizaciones participantes deben realizar investigaciones científicas legítimas con un claro beneficio público; mantener una gobernanza adecuada, controles de cumplimiento y prevención de uso indebido; y restringir el acceso a usuarios autorizados en entornos seguros y bien gestionados. Las organizaciones también deben aceptar los términos de la versión preliminar de investigación en ciencias de la vida y cumplir con las políticas de uso de OpenAI. Es posible que solicitemos información adicional como parte del proceso de incorporación o de la participación continua.

Cómo empezar

Las organizaciones pueden solicitar acceso mediante nuestro proceso de revisión de cualificación y seguridad.

Durante la versión preliminar de investigación, el uso de este modelo no consumirá créditos ni tokens existentes, aunque estará sujeto a medidas de protección contra el uso indebido. Compartiremos más información sobre los precios y la disponibilidad a medida que el programa se amplíe.

El modelo de ciencias de la vida está diseñado para ayudar a las organizaciones científicas a realizar un trabajo de mayor calidad y con más rapidez, en entornos que requieren tanto capacidad técnica como control operativo. Nuestro equipo especializado en ciencias de la vida, así como socios asesores como McKinsey & Company, Boston Consulting Group (BCG) y Bain & Company, ayudan a las organizaciones a identificar casos de uso de alto impacto, integrar el modelo en entornos empresariales e impulsar resultados medibles. Si te gustaría explorar cómo OpenAI Ciencias de la vida puede apoyar tu trabajo, puedes contactar con nuestro equipo de ciencias de la vida.

Próximos pasos

Este es el primer lanzamiento de nuestra serie de modelos de ciencias de la vida, y lo consideramos el comienzo de un compromiso a largo plazo para desarrollar una IA que pueda acelerar el descubrimiento científico en áreas de gran importancia para la sociedad, desde la salud humana hasta la investigación biológica en un sentido más amplio. Seguiremos mejorando el razonamiento biológico del modelo, ampliando el soporte para flujos de trabajo de investigación con uso intensivo de herramientas y de largo plazo, y colaborando estrechamente con instituciones científicas líderes para evaluar el impacto en el mundo real. Eso incluye colaboraciones continuas con laboratorios nacionales como Los Alamos National Laboratory, donde estamos explorando el diseño de proteínas y catalizadores guiado por IA, así como la capacidad de los sistemas de IA para modificar estructuras biológicas mientras preservan o mejoran propiedades funcionales clave. 

Con el tiempo, esperamos que estos sistemas se conviertan en colaboradores cada vez más capaces en el descubrimiento, ayudando a los científicos a pasar más rápido de la pregunta a las evidencias, de las evidencias a los hallazgos y de los hallazgos a nuevos tratamientos para los pacientes.