Apresentando novos recursos ao GPT‑Rosalind
Levando mais inteligência baseada em fluxos de trabalho científicos reais para o setor de ciências da vida.
Estamos lançando uma nova atualização de modelo para nossa série GPT‑Rosalind, desenvolvida especificamente para pesquisa em ciências da vida em escala empresarial. Ela combina os recursos de programação agêntica e uso de ferramentas do GPT‑5.5 com inteligência de modelo mais forte em domínios centrais da descoberta de medicamentos, como química medicinal e genômica, ao mesmo tempo que melhora o desempenho em análises, design e fluxos de trabalho experimentais mais amplos em ciências da vida.
O progresso nas ciências da vida depende da síntese de dados e evidências entre escalas e modalidades: moléculas, genes, vias e sistemas vivos. Em nossas avaliações, o GPT‑Rosalind atualizado mostra ganhos amplos de desempenho em tarefas de pesquisa de especialistas em biologia, consultas complexas de química medicinal, biologia quantitativa e solução de problemas em laboratório úmido.
GPT‑Rosalind agora está disponível em prévia de pesquisa para organizações qualificadas no mundo todo por meio da nossa estrutura de implantação com acesso confiável.
Para medir e melhorar continuamente o impacto real do GPT‑Rosalind, criamos o LifeSciBench, um benchmark julgado externamente por especialistas e focado em aspectos fundamentais da pesquisa em ciências da vida. Diferentemente dos benchmarks existentes, que avaliam um único componente do desempenho do modelo ou domínio biológico isoladamente, o LifeSciBench adota uma visão de ponta a ponta do trabalho cientificamente valioso ao extrair tarefas de seis áreas de fluxo de trabalho centrais à pesquisa em ciências da vida: manejo de evidências, análise, design e otimização, raciocínio científico, validação e operações, e tradução e comunicação. Usamos esse benchmark para alinhar o progresso às necessidades e realidades da pesquisa em ciências da vida.
GPT‑Rosalind lidera o desempenho em tarefas cientificamente valiosas identificadas por especialistas da indústria e da academia.
Extração, reconciliação e auditoria de evidências científicas de artigos, figuras, tabelas e registros experimentais.
Exemplo de avaliação
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Resposta do candidato
Conclusão principal: Como apresentado, este pacote não é forte o suficiente para sustentar aprovação acelerada com base na expressão de microdistrofina como endpoint substituto razoavelmente provável de prever benefício clínico. Um revisor cético da FDA provavelmente veria as evidências de biomarcador, função, durabilidade, segurança e generalizabilidade como materialmente insuficientes.
Item do pacote | Principal modo de falha | O que seria necessário |
|---|---|---|
Quantificação por Western blot | MANEX1A liga um epítopo N-terminal compartilhado pela distrofina endógena de comprimento total e pelo transgene de microdistrofina, de modo que o ensaio não distingue claramente transgene de distrofina residual/revertente. Quantificar uma microdistrofina de 138 kDa contra um padrão saudável de distrofina de comprimento total também é inválido. | Use um padrão recombinante de microdistrofina e um método ortogonal que distinga transgene de distrofina endógena, como espectrometria de massa direcionada ou um ensaio específico de transgene/epítopo. |
Imunofluorescência | O anticorpo policlonal C-terminal é pouco adequado porque o construto de 138 kDa carece do domínio C-terminal. Muitos pacientes com DMD têm fibras revertentes, e a distrofina revertente pode reter epítopos C-terminais. Fibras revertentes podem se expandir clonalmente com a idade, enviesando o sinal de IF, especialmente em meninos mais velhos. | Repita a IF com um anticorpo contra um epítopo presente no transgene, mas ausente da distrofina revertente. Quantifique fibras positivas para transgene separadamente das fibras revertentes. |
Validade do endpoint substituto | O pacote confunde quantidade de proteína com função clínica. “38% da massa proteica de controle saudável” não significa 38% da função normal da distrofina, porque a microdistrofina é estruturalmente truncada. | Valide empiricamente a relação entre percentual de massa de microdistrofina, localização sarcolemal, restauração funcional a jusante e benefício clínico antes de tratar a expressão como endpoint substituto. |
Desenho de biópsia | Biópsias contralaterais do vasto lateral pré e pós-tratamento introduzem variabilidade esquerda-direita e espacial intramuscular. A progressão da doença e a substituição fibro-gordurosa também podem alterar o sinal normalizado por proteína total. | Padronize o local da biópsia usando marcos anatômicos consistentes, normalize para proteínas específicas de músculo e meça em paralelo a composição fibro-gordurosa. |
Comparador/estatística de NSAA | Uma coorte externa de história natural não é um controle concorrente randomizado. Elegibilidade do estudo, cuidados de suporte, efeitos de participação, NSAA basal, regime de esteroides, idade e classe de éxon podem enviesar a comparação. Um teste t não pareado não é suficiente. Além disso, uma mudança de +1,4 no NSAA está dentro da variabilidade teste-reteste para esse grupo etário. | Conduza um estudo randomizado concorrente controlado por placebo ou, no mínimo, use análises ajustadas que considerem NSAA basal, idade, regime de esteroides, classe de éxon e outros fatores de confusão. |
Confundimento por janela etária | Meninos de 4 a 7 anos estão em uma janela de desenvolvimento na qual pacientes ambulatórios com DMD não tratados podem ganhar função motora antes que o declínio predomine. Uma mudança de NSAA em 48 semanas mistura ganho de desenvolvimento, progressão da doença e possível efeito do tratamento. | Use um controle randomizado concorrente com estratificação por idade para separar a trajetória de desenvolvimento do efeito do tratamento. |
Precedente clínico anterior | Resultados funcionais de microdistrofina em estudos abertos não previram de forma confiável benefício confirmatório; precedentes publicados incluem ensaios confirmatórios de terapia gênica com microdistrofina que falharam em reproduzir melhorias no NSAA observadas em estudos abertos. | Não se baseie em mudança de NSAA observada em estudo aberto como suporte decisivo. Exija evidência funcional controlada. |
Limites estruturais do construto | O construto de 138 kDa remove as repetições de espectrina R16/17, que contêm sítios de ligação de nNOS. A perda de recrutamento de nNOS pode prejudicar a simpatólise funcional e a proteção contra isquemia durante exercício, criando um teto mecanístico para o resgate independente do nível de expressão. | Adicione estudos mecanísticos que mostrem se esse construto específico restaura a função relevante do complexo associado à distrofina, localização de nNOS, fisiologia do exercício e proteção muscular. |
Durabilidade do AAV | Genomas vetoriais em 12 semanas não estabelecem expressão durável. Genomas de AAV9 são em grande parte epissomos não integrativos e podem diminuir com o tempo. Persistência de genoma vetorial não é o mesmo que expressão proteica persistente. | Meça longitudinalmente a expressão proteica do transgene e a durabilidade de biomarcadores funcionais além de 12 semanas. |
Perfil imune/de segurança | Transaminite em 8/12 pacientes é consistente com resposta imune a células transduzidas por AAV, mas o mecanismo não está estabelecido. Um caso de miocardite é preocupante dado o tropismo cardíaco do AAV9. | Forneça monitoramento imune mais profundo, caracterização de segurança hepática/cardíaca e acompanhamento cardíaco intensificado. |
Seleção de pacientes/generalizabilidade | Excluir pacientes positivos para anticorpos neutralizantes anti-AAV9 limita a generalizabilidade. Excluir deleções do éxon 44 limita a aplicabilidade a esse subgrupo de DMD. n=12 é pequeno demais para caracterizar segurança e eficácia na população mais ampla de DMD. | Amplie a elegibilidade quando possível ou pré-especifique análises estratificadas por status de anticorpos, genótipo/classe de éxon, idade e função basal antes de usar o resultado para apoiar aprovação ampla. |
Conclusão regulatória: O pacote pode mostrar atividade biológica, mas ainda não estabelece que a expressão medida de microdistrofina seja um substituto confiável e razoavelmente provável de prever benefício clínico. As principais lacunas são especificidade do ensaio, padrões de quantificação inválidos, possível confundimento por fibras revertentes, ausência de controle randomizado, confundimento de NSAA relacionado à idade, durabilidade incerta e questões não resolvidas de segurança/generalizabilidade.
Para fechar a lacuna, o programa precisaria de um desenho clínico controlado e estratificado por idade, com ensaios de expressão específicos do transgene, quantificação proteica ortogonal, controles de composição tecidual, dados longitudinais de durabilidade, ensaios funcionais mecanísticos para o construto truncado e monitoramento de segurança mais forte, especialmente hepático e cardíaco.
Critérios e notas de avaliação
GPT‑Rosalind alcança desempenho líder do setor em química medicinal, uma área focada em transformar moléculas em medicamentos úteis. Criamos o MedChemBench para refletir fluxos de trabalho realistas de química medicinal, avaliando compreensão multimodal de estruturas químicas; relação estrutura-atividade (SAR); previsão de potência, toxicidade e absorção, distribuição, metabolismo e excreção (ADME) de medicamentos; tomada de decisão multiparamétrica de otimização de compostos líderes; e retrossíntese. GPT‑Rosalind supera o GPT‑5.5 em 27,5% contra 25,1% no MedChemBench, usando 7,2% menos tokens.
GPT‑Rosalind mostra melhor síntese multimodal e raciocínio mecanístico em química medicinal.
No GeneBench, nossa avaliação agêntica de análises de longo horizonte e ponta a ponta em genômica e biologia quantitativa, GPT‑Rosalind usa 31% menos tokens que o GPT‑5.5, alcançando maior precisão: 21,6% contra 20,4%. O GeneBench avalia o desempenho agêntico em tarefas quantitativas de longo horizonte: com base em dados científicos realistas, um agente consegue planejar análises válidas, QC, modelagem e correções para chegar a respostas relevantes para decisões? Os problemas incluídos abrangem vários domínios, incluindo genômica funcional, transcriptômica espacial, proteômica, epigenômica e genética aplicada.
GPT‑Rosalind usa 31% menos tokens que o GPT‑5.5, ao mesmo tempo que melhora a precisão.
Apresentamos uma nova avaliação para testar a capacidade do GPT‑Rosalind de ajudar cientistas que realizam trabalho de laboratório no mundo real. O LabWorkBench testa a capacidade do modelo de relacionar perturbações a resultados experimentais em protocolos reais de laboratório úmido usados por cientistas, para finalidades que vão da solução de problemas à otimização. Os dados usados pelo LabWorkBench são proprietários e, portanto, não contaminados. GPT‑Rosalind pontua 63,2% contra 55,8% do GPT‑5.5, usando 5,3% menos tokens.
Em assistência a protocolos reais de laboratório úmido, GPT‑Rosalind mostra ganhos significativos em relação ao GPT‑5.5, ao mesmo tempo que melhora a eficiência de tokens.
Criamos os plugins Life Sciences Research(abre em uma nova janela) e Life Sciences NGS Analysis(abre em uma nova janela) para ampliar a inteligência aumentada do GPT‑Rosalind com uma camada de execução prática para fluxos de trabalho científicos repetíveis. Juntos, esses plugins trazem recuperação de evidências com fontes, interpretação biológica e execução bioinformática para o mesmo workspace, ajudando pesquisadores a conectar evidências externas a análises ômicas internas, preservando artefatos e proveniência. Todos os usuários agora podem acessar ambos os plugins pelo Codex. Usuários empresariais qualificados do GPT‑Rosalind também podem usar o GPT‑Rosalind para alimentar esses plugins.
Para aproveitar melhor o Codex como uma bancada dinâmica para cientistas, adicionamos visualizadores interativos para tipos de arquivo nativos da biologia. O conjunto inicial de visualizadores de sequência, alinhamento e estrutura foi criado para manter os cientistas próximos das evidências enquanto GPT‑Rosalind raciocina ao longo de um fluxo de trabalho e responde diretamente a perguntas de acompanhamento usando o visualizador ativo em contexto.
A demonstração acima mostra esses recursos em ação, orquestrados pelo GPT‑Rosalind. Acompanhamos um cientista investigando uma biópsia tumoral líquida para identificar mutações e outras alterações moleculares que poderiam orientar o tratamento. O plugin Life Sciences NGS Analysis transforma uma revisão de registros processados de ctDNA em um notebook interativo, destacando alterações recorrentes, chamadas de baixa frequência e trajetórias de amostras que focam a investigação em KRAS G12C. A partir daí, o plugin Life Sciences Research adiciona contexto com fontes sobre alvo, inibidor e resistência, enquanto os visualizadores nativos de sequência, alinhamento e estrutura permitem ao cientista inspecionar diretamente o resíduo mutante 12, sua conservação na família RAS e o bolso ligado ao inibidor. O fluxo de trabalho conclui traduzindo essas evidências em opções concretas de acompanhamento, com cada etapa e artefato disponíveis para revisão por especialistas.

Plugin Life Sciences NGS Analysis
QC e anotação de scRNA-seq

Transforme um pacote de matriz estilo 10x em artefatos unicelulares filtrados por QC, anotações e UMAPs que você pode inspecionar e revisar no Codex. O plugin Life Sciences NGS Analysis roteia a solicitação para scrna-seq-qc, escolhe limiares de QC a partir dos dados, preserva a proveniência em torno da filtragem e anotação e destaca bloqueadores, como dependências ausentes de detecção de dupletos.
QC de FASTQ de RNA-seq em bulk

Transforme uma planilha de amostras de RNA-seq em bulk, um pacote FASTQ e arquivos de referência em um pacote de contagens revisado por QC que você pode inspecionar e reutilizar no Codex. O plugin Life Sciences NGS Analysis roteia a solicitação, valida as entradas e retorna um envelope de execução auditável com MultiQC, matrizes Salmon, proveniência e ressalvas explícitas.
Estamos ampliando o acesso à série GPT‑Rosalind para organizações qualificadas no mundo todo. GPT‑Rosalind estará disponível em prévia de pesquisa por meio da nossa estrutura de implantação com acesso confiável para organizações que conduzem pesquisa científica legítima com claro benefício público, têm governança forte e supervisão de segurança, e acesso controlado com segurança de nível empresarial.
Como parte dessa expansão global, estamos animados em ajudar a apoiar a missão da Novo Nordisk de levar opções de tratamento inovadoras aos pacientes mais rapidamente, ajudando a escalar sua pesquisa médica com GPT‑Rosalind. A Novo Nordisk está aproveitando recursos de IA de fronteira para ajudar pesquisadores a analisar conjuntos de dados complexos, descobrir padrões úteis e testar hipóteses mais rapidamente. A compreensão biológica mais forte do GPT‑Rosalind ajudará equipes a conectar evidências entre literatura, genômica, transcriptômica, sequência, estrutura e resultados experimentais, facilitando a passagem de dados para decisões de pesquisa mais claras.
“A pesquisa em ciências da vida é complexa, rica em dados e interdisciplinar. Para entregar valor significativo aos pesquisadores, modelos avançados de IA devem estar fundamentados em dados científicos confiáveis, conectados a ferramentas validadas e integrados aos fluxos de trabalho reais que os pesquisadores usam todos os dias. Estamos satisfeitos com nossa parceria com a OpenAI e com a oportunidade de explorar como GPT‑Rosalind pode apoiar abordagens mais rigorosas e práticas para a descoberta de medicamentos.”
Mishal Patel, vice-presidente de grupo, IA e inovação digital, P&D - Novo Nordisk
Também estamos oferecendo agora um workspace gerenciado pela OpenAI para organizações qualificadas sem uma conta Enterprise.
O GPT‑Rosalind atualizado é o próximo passo em nosso compromisso mais amplo de criar sistemas de IA que ajudem a acelerar a descoberta científica, garantindo que recursos biológicos avançados sejam implantados com salvaguardas adequadas. Continuaremos melhorando o raciocínio biológico do modelo, expandindo o suporte a fluxos de trabalho de pesquisa com uso intenso de ferramentas e de longo horizonte, e trabalhando com organizações qualificadas em diferentes regiões para avaliar o impacto no mundo real.
Isso também significa aplicar IA para ciências da vida a trabalhos de alto impacto e benefício público, da descoberta de medicamentos e medicina translacional à saúde pública, preparação e biodefesa. Por meio do Rosalind Biodefense e do nosso modelo de implantação com acesso confiável, buscamos colocar capacidades biológicas de fronteira nas mãos de pesquisadores, instituições e defensores que trabalham para melhorar a saúde humana e fortalecer a resiliência social.
Continuaremos desenvolvendo o GPT‑Rosalind para se tornar um parceiro mais capaz em todo o ciclo de vida da pesquisa científica, ajudando cientistas a avançar mais rapidamente das perguntas certas para evidências mais claras, melhores experimentos e, por fim, novos tratamentos para pacientes.


