Pular para o conteúdo principal
OpenAI

16 de abril de 2026

PesquisaLançamento

Apresentamos o GPT‑Rosalind para pesquisa em ciências da vida

Um novo modelo desenvolvido especificamente para acelerar a pesquisa científica e a descoberta de medicamentos.

Hoje, apresentamos o GPT‑Rosalind, nosso modelo de raciocínio de fronteira criado para apoiar pesquisas em biologia, descoberta de medicamentos e medicina translacional. A série de modelos para ciências da vida foi otimizada para fluxos de trabalho científicos, combinando melhor uso de ferramentas com uma compreensão mais profunda de química, engenharia de proteínas e genômica.

Em média, leva cerca de 10 a 15 anos para ir da descoberta do alvo à aprovação regulatória de um novo medicamento nos Estados Unidos. Os ganhos obtidos nas etapas mais iniciais da descoberta se acumulam ao longo do processo, resultando em melhor seleção de alvos, hipóteses biológicas mais robustas e experimentos de maior qualidade. O progresso nas ciências da vida é limitado não apenas pela dificuldade da ciência em si, mas também pela complexidade dos próprios fluxos de trabalho de pesquisa. Cientistas precisam lidar com grandes volumes de literatura, bancos de dados especializados, dados experimentais e hipóteses em evolução para gerar e avaliar novas ideias. Esses fluxos de trabalho costumam demandar muito tempo, ser fragmentados e difíceis de escalar.

Acreditamos que sistemas avançados de IA podem ajudar pesquisadores a avançar por esses fluxos de trabalho mais rapidamente — não apenas tornando o trabalho existente mais eficiente, mas ajudando cientistas a explorar mais possibilidades, revelar conexões que poderiam passar despercebidas e chegar a hipóteses melhores mais cedo. Ao apoiar síntese de evidências, geração de hipóteses, planejamento experimental e outras tarefas de pesquisa em várias etapas, este modelo foi projetado para ajudar pesquisadores a acelerar os estágios iniciais da descoberta. Com o tempo, esses sistemas podem ajudar organizações de ciências da vida a alcançar avanços que, de outra forma, não seriam possíveis, com uma taxa de sucesso muito maior. 

O GPT‑Rosalind já está disponível como uma prévia de pesquisa no ChatGPT, no Codex e na API para clientes qualificados por meio do nosso programa de acesso confiável. Também estamos lançando um Plug-in de Pesquisa em Ciências da Vida, de acesso gratuito, para o Codex, ajudando cientistas a conectar modelos a mais de 50 ferramentas científicas e fontes de dados. Estamos trabalhando com clientes como Amgen, Moderna, o Allen Institute, Thermo Fisher Scientific e outros para aplicar o GPT‑Rosalind em fluxos de trabalho que aceleram a pesquisa e a descoberta.

O modelo recebe o nome de Rosalind Franklin, cuja pesquisa rigorosa ajudou a revelar a estrutura do DNA e lançou as bases da biologia molecular moderna.

Dos dados brutos a decisões de descoberta embasadas, veja como nosso modelo criado para essa finalidade acelera fluxos de trabalho de pesquisa.

Criado para fluxos de trabalho científicos

A série de modelos GPT‑Rosalind para ciências da vida foi criada para o trabalho científico moderno com evidências publicadas, dados, ferramentas e experimentos. Em nossas avaliações, ele apresenta o melhor desempenho em tarefas que exigem raciocínio sobre moléculas, proteínas, genes, vias e biologia relevante para doenças, e é mais eficaz no uso de ferramentas científicas e bancos de dados em fluxos de trabalho de várias etapas, como revisão da literatura, interpretação de sequência para função, planejamento experimental e análise de dados.

Este é o primeiro lançamento da nossa série de modelos GPT‑Rosalind para ciências da vida, e continuaremos expandindo as fronteiras das capacidades de raciocínio bioquímico do modelo em fluxos de trabalho científicos de longo horizonte e intensivos em ferramentas. A infraestrutura de computação da OpenAI nos dá a capacidade de continuar treinando, avaliando e aprimorando modelos de domínio cada vez mais capazes em tarefas científicas reais — ajudando esses sistemas a se tornarem mais úteis à medida que os próprios fluxos de trabalho ficam mais complexos.

De insights de descoberta baseados em evidências a experimentos de alto impacto, veja como nosso conjunto de soluções se traduz em melhorias mensuráveis nos seus fluxos de trabalho de pesquisa.

Clientes e ecossistema

Estamos trabalhando com clientes líderes do setor farmacêutico, de biotecnologia e de pesquisa, além de organizações de tecnologia em ciências da vida, para aplicar o GPT‑Rosalind em fluxos de trabalho que impulsionam a descoberta.

"O campo das ciências da vida exige precisão em cada etapa. As questões são altamente complexas, os dados são altamente específicos e os riscos são incrivelmente altos. Nossa colaboração única com a OpenAI nos permite aplicar suas capacidades e ferramentas mais avançadas de maneiras novas e inovadoras, com potencial para acelerar a forma como entregamos medicamentos aos pacientes."
—Sean Bruich, vice-presidente sênior de Inteligência Artificial e Dados, Amgen

Desempenho e avaliação

Avaliamos o GPT‑Rosalind em uma série de capacidades fundamentais para a descoberta científica e a pesquisa industrial. Essas avaliações medem o raciocínio central em subdomínios científicos, incluindo mecanismos de reação química; estrutura de proteínas, efeitos de mutações e interações; e interpretação filogenética de sequências de DNA. Elas também avaliam se os modelos conseguem apoiar fluxos de trabalho de pesquisa reais ao interpretar resultados experimentais, identificar padrões relevantes para especialistas e sintetizar informações externas para desenhar experimentos de acompanhamento. Por fim, testam se os modelos conseguem selecionar e usar as ferramentas computacionais, os bancos de dados e as capacidades específicas do domínio adequados para ampliar seu raciocínio. Em conjunto, essas avaliações mostram progresso em todo o processo ponta a ponta da pesquisa científica e sugerem uma capacidade maior de ajudar pesquisadores a lidar com tarefas desafiadoras de descoberta.

Prompt

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

Avaliações do setor

Avaliamos o GPT‑Rosalind em uma série de benchmarks públicos. No BixBench, um benchmark projetado em torno de bioinformática do mundo real e análise de dados, o GPT‑Rosalind alcançou desempenho líder entre modelos com pontuações publicadas.

No LABBench2, um benchmark que mede desempenho em uma variedade de tarefas de pesquisa como busca de literatura, acesso a bancos de dados, manipulação de sequências e desenho de protocolos, o GPT‑Rosalind supera o GPT‑5.4 em 6 de 11 tarefas. A melhoria mais notável vem do CloningQA, que exige o desenho ponta a ponta de reagentes de DNA e enzimas para protocolos de clonagem molecular.

Também fizemos parceria com a Dyno Therapeutics, uma empresa pioneira em terapias gênicas projetadas por IA, para avaliar o modelo em uma tarefa de previsão e geração de sequência de RNA para função usando sequências inéditas e não contaminadas. O desempenho foi comparado com 57 pontuações históricas de especialistas humanos na área de IA aplicada à biologia. Quando avaliadas diretamente no app Codex, as submissões do modelo no formato "melhor de dez" ficaram acima do percentil 95 de especialistas humanos na tarefa de previsão e em torno do percentil 84 de especialistas humanos na tarefa de geração de sequências.

Essas avaliações fornecem um sinal significativo de desempenho nos tipos de fluxos de trabalho em que cientistas confiam todos os dias para gerar evidências, analisar dados complexos e avançar em direção a conclusões biológicas defensáveis.


Conectando-se às ferramentas que cientistas usam

Cientistas podem usar nosso novo Plug-in de Pesquisa em Ciências da Vida(abre em uma nova janela) para o Codex, disponível hoje no GitHub. Este pacote inclui um amplo conjunto de skills modulares para os fluxos de trabalho de pesquisa mais comuns, projetado para ajudar usuários a trabalhar com genética humana, genômica funcional, estrutura de proteínas, bioquímica, evidências clínicas e descoberta de estudos públicos.

Imagem estática da demonstração do plug-in de ciências da vida

Essas skills funcionam como uma camada de orquestração que ajuda cientistas a lidar de forma mais eficaz com perguntas amplas, ambíguas e de várias etapas. Elas dão acesso a mais de 50 bancos de dados públicos de multi-ômicas, fontes de literatura e ferramentas de biologia, e oferecem um ponto de partida flexível para fluxos de trabalho comuns e repetíveis, como consulta de estrutura de proteínas, busca de sequências, revisão da literatura e descoberta de conjuntos de dados públicos.

Usuários Enterprise elegíveis podem aproveitar esse plug-in em fluxos de trabalho de pesquisa com o GPT‑Rosalind para um raciocínio biológico mais profundo, enquanto todos os usuários podem usar o pacote do plug-in com nossos modelos principais.

Acesso confiável

Queremos disponibilizar essas capacidades para cientistas e organizações de pesquisa mais bem posicionados para avançar a saúde humana, mantendo proteções robustas contra uso biológico indevido. O modelo de ciências da vida está sendo lançado por meio de uma estrutura de implantação com acesso confiável, inicialmente para clientes Enterprise qualificados nos EUA, com controles de elegibilidade, gerenciamento de acesso e governança organizacional. Ao mesmo tempo, estamos disponibilizando um conjunto de conectores e o Plug-in de Pesquisa em Ciências da Vida de forma mais ampla, para que pesquisadores possam usar nossos modelos principais de maneira mais eficaz em tarefas de pesquisa em ciências da vida. 

O modelo de ciências da vida foi desenvolvido com controles de segurança de nível empresarial mais rigorosos e gerenciamento de acesso reforçado, permitindo uso científico profissional em ambientes de pesquisa com governança. Avaliamos o acesso com base em três princípios fundamentais: uso benéfico, governança robusta e supervisão de segurança, e acesso controlado com segurança de nível empresarial. Na prática, isso significa que as organizações participantes devem conduzir pesquisa científica legítima com benefício público claro; manter controles adequados de governança, conformidade e prevenção de uso indevido; e restringir o acesso a usuários aprovados em ambientes seguros e bem gerenciados. As organizações também devem concordar com os termos da prévia de pesquisa em ciências da vida e cumprir as políticas de uso da OpenAI, e poderemos solicitar informações adicionais como parte da integração ou da participação contínua.

Primeiros passos

As organizações podem solicitar acesso por meio do nosso processo de qualificação e revisão de segurança.

Durante a prévia de pesquisa, o uso deste modelo não consumirá créditos ou tokens existentes — sujeito a proteções contra abuso. Compartilharemos mais detalhes sobre preços e disponibilidade conforme o programa se expandir.

O modelo de ciências da vida foi criado para ajudar organizações científicas a fazer um trabalho de maior qualidade, mais rápido, em ambientes que exigem capacidade técnica e controle operacional. Nossa equipe dedicada de ciências da vida — além de parceiros consultivos como McKinsey & Company, Boston Consulting Group (BCG) e Bain & Company — ajuda as organizações a identificar casos de uso de alto impacto, integrar o modelo a ambientes corporativos e gerar resultados mensuráveis. Se você quiser explorar como a OpenAI Life Sciences pode apoiar seu trabalho, entre em contato com nossa equipe de ciências da vida.

O que vem a seguir

Este é o primeiro lançamento da nossa série de modelos de ciências da vida e o vemos como o início de um compromisso de longo prazo para criar IA capaz de acelerar a descoberta científica em áreas de profunda importância para a sociedade, da saúde humana à pesquisa biológica mais ampla. Continuaremos aprimorando o raciocínio biológico do modelo, ampliando o suporte a fluxos de trabalho de pesquisa intensivos em ferramentas e de longo horizonte, e trabalhando de perto com instituições científicas líderes para avaliar o impacto no mundo real. Isso inclui parcerias contínuas com laboratórios nacionais como o Los Alamos National Laboratory, onde estamos explorando o design de proteínas e catalisadores guiado por IA, incluindo a capacidade de sistemas de IA modificarem estruturas biológicas preservando ou melhorando propriedades funcionais essenciais. 

Com o tempo, esperamos que esses sistemas se tornem parceiros cada vez mais capazes na descoberta — ajudando cientistas a avançar mais rapidamente da pergunta à evidência, da evidência ao insight e do insight a novos tratamentos para pacientes.