Présentation de nouvelles capacités pour GPT‑Rosalind
Une intelligence accrue, ancrée dans de vrais workflows scientifiques pour le secteur des sciences de la vie.
Nous présentons une nouvelle mise à jour de modèle pour notre série GPT‑Rosalind, conçue expressément pour la recherche en sciences de la vie à l’échelle de l’entreprise. Elle combine les capacités de programmation agentique et d’utilisation d’outils de GPT‑5.5 à une intelligence de modèle accrue dans des domaines clés de la découverte de médicaments, comme la chimie médicinale et la génomique, tout en améliorant les performances pour l’analyse, la conception et les workflows expérimentaux plus larges en sciences de la vie.
Les progrès en sciences de la vie reposent sur la synthèse de données et de preuves à plusieurs échelles et selon plusieurs modalités : molécules, gènes, voies biologiques et systèmes vivants. Dans nos évaluations, la version mise à jour de GPT‑Rosalind affiche de vastes gains de performance sur des tâches de recherche proposées par des experts en biologie, des requêtes complexes en chimie médicinale, la biologie quantitative et le dépannage en laboratoire humide.
GPT‑Rosalind est maintenant offert en aperçu de recherche aux organisations admissibles du monde entier grâce à notre structure de déploiement à accès fiable.
Pour mesurer et améliorer continuellement l’impact réel de GPT‑Rosalind, nous avons conçu LifeSciBench, un banc d’essai évalué par des experts externes et axé sur les aspects fondamentaux de la recherche en sciences de la vie. Contrairement aux bancs d’essai existants qui évaluent isolément un seul volet de la performance d’un modèle ou un domaine biologique, LifeSciBench adopte une perspective de bout en bout du travail à valeur scientifique en puisant des tâches dans six domaines de workflow centraux en sciences de la vie : gestion des preuves, analyse, conception et optimisation, raisonnement scientifique, validation et opérations, ainsi que traduction et communication. Nous utilisons ce banc d’essai pour aligner les progrès sur les besoins et les réalités de la recherche en sciences de la vie.
GPT‑Rosalind domine les performances sur des tâches à valeur scientifique recensées par des experts de l’industrie et du milieu universitaire.
Extraire, rapprocher et auditer des preuves scientifiques tirées d’articles, de figures, de tableaux et de dossiers expérimentaux.
Exemple d’évaluation
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Réponse du candidat
En résumé : tel que présenté, cet ensemble n’est pas assez solide pour soutenir une approbation accélérée fondée sur l’expression de la micro-dystrophine comme critère de substitution raisonnablement susceptible de prédire un bénéfice clinique. Un évaluateur sceptique de la FDA jugerait probablement que les preuves relatives au biomarqueur, à la fonction, à la durabilité, à la sécurité et à la généralisabilité sont matériellement insuffisantes.
Élément du dossier | Mode de défaillance clé | Ce qui serait nécessaire |
|---|---|---|
Quantification par Western blot | MANEX1A se lie à un épitope N-terminal partagé par la dystrophine endogène pleine longueur et le transgène de micro-dystrophine; le dosage ne distingue donc pas nettement le transgène de la dystrophine résiduelle/révertante. Quantifier une micro-dystrophine de 138 kDa par rapport à un étalon sain de dystrophine pleine longueur est aussi invalide. | Utiliser un étalon recombinant de micro-dystrophine et une méthode orthogonale qui distingue le transgène de la dystrophine endogène, comme la spectrométrie de masse ciblée ou un dosage spécifique du transgène/de l’épitope. |
Immunofluorescence | L’anticorps polyclonal C-terminal est mal adapté, car le construit de 138 kDa ne possède pas le domaine C-terminal. De nombreux patients atteints de DMD ont des fibres révertantes, et la dystrophine révertante peut conserver des épitopes C-terminaux. Les fibres révertantes peuvent prendre de l’expansion clonale avec l’âge, biaisant le signal IF, surtout chez les garçons plus âgés. | Répéter l’IF avec un anticorps dirigé contre un épitope présent dans le transgène, mais absent de la dystrophine révertante. Quantifier séparément les fibres positives pour le transgène et les fibres révertantes. |
Validité du critère de substitution | Le dossier confond la quantité de protéine avec la fonction clinique. « 38 % de la masse protéique du témoin sain » ne signifie pas 38 % de la fonction normale de la dystrophine, car la micro-dystrophine est structurellement tronquée. | Valider empiriquement la relation entre le pourcentage de masse de micro-dystrophine, la localisation sarcolemmique, la restauration fonctionnelle en aval et le bénéfice clinique avant de traiter l’expression comme critère de substitution. |
Conception des biopsies | Les biopsies pré- et post-traitement du vaste latéral controlatéral introduisent une variabilité gauche-droite et spatiale intramusculaire. La progression de la maladie et le remplacement fibro-adipeux peuvent aussi modifier le signal normalisé aux protéines totales. | Standardiser le site de biopsie à l’aide de repères anatomiques constants, normaliser selon des protéines propres au muscle et mesurer en parallèle la composition fibro-adipeuse. |
Comparateur/statistiques NSAA | Une cohorte externe d’histoire naturelle n’est pas un contrôle randomisé concurrent. L’admissibilité à l’essai, les soins de soutien, les effets de participation, le NSAA de départ, le schéma de stéroïdes, l’âge et la classe d’exon peuvent tous biaiser la comparaison. Un test t non apparié ne suffit pas. De plus, une variation NSAA de +1,4 se situe dans la variabilité test-retest pour ce groupe d’âge. | Mener une étude randomisée concurrente contrôlée par placebo ou, au minimum, utiliser des analyses ajustées tenant compte du NSAA de départ, de l’âge, du schéma de stéroïdes, de la classe d’exon et d’autres facteurs de confusion. |
Confusion liée à la fenêtre d’âge | Les garçons de 4 à 7 ans se trouvent dans une fenêtre de développement où des patients ambulatoires atteints de DMD non traités peuvent gagner en fonction motrice avant que le déclin ne domine. Une variation du NSAA sur 48 semaines combine gain développemental, progression de la maladie et possible effet du traitement. | Utiliser un contrôle randomisé concurrent avec stratification par âge pour distinguer la trajectoire développementale de l’effet du traitement. |
Précédent clinique antérieur | Les signaux fonctionnels ouverts de micro-dystrophine n’ont pas prédit de façon fiable un bénéfice confirmatoire; les précédents publiés incluent des essais confirmatoires de thérapie génique par micro-dystrophine qui n’ont pas reproduit les améliorations NSAA observées en ouvert. | Ne pas s’appuyer sur la variation ouverte du NSAA comme preuve décisive. Exiger des preuves fonctionnelles contrôlées. |
Limites structurelles du construit | Le construit de 138 kDa supprime les répétitions de spectrine R16/17, qui contiennent des sites de liaison nNOS. La perte du recrutement de nNOS peut nuire à la sympatholyse fonctionnelle et à la protection contre l’ischémie pendant l’exercice, créant un plafond mécanistique au sauvetage indépendant du niveau d’expression. | Ajouter des études mécanistiques montrant si ce construit précis restaure la fonction pertinente du complexe associé à la dystrophine, la localisation de nNOS, la physiologie de l’exercice et la protection musculaire. |
Durabilité AAV | Les génomes vectoriels à 12 semaines n’établissent pas une expression durable. Les génomes AAV9 sont surtout des épisomes non intégrants et peuvent diminuer avec le temps. La persistance des génomes vectoriels n’est pas équivalente à une expression protéique persistante. | Mesurer longitudinalement l’expression protéique du transgène et la durabilité des biomarqueurs fonctionnels au-delà de 12 semaines. |
Profil immunitaire/sécurité | La transaminite chez 8/12 patients est compatible avec une réponse immunitaire aux cellules transduites par AAV, mais le mécanisme n’est pas établi. Un cas de myocardite est préoccupant compte tenu du tropisme cardiaque d’AAV9. | Fournir une surveillance immunitaire plus approfondie, une caractérisation de la sécurité hépatique/cardiaque et un suivi cardiaque intensifié. |
Sélection des patients/généralisabilité | Exclure les patients positifs pour les anticorps neutralisants anti-AAV9 limite la généralisabilité. Exclure les délétions de l’exon 44 limite l’applicabilité à ce sous-groupe DMD. n=12 est trop faible pour caractériser la sécurité et l’efficacité dans l’ensemble de la population DMD. | Élargir l’admissibilité lorsque possible ou prédéfinir des analyses stratifiées selon le statut anticorps, le génotype/la classe d’exon, l’âge et la fonction de départ avant d’utiliser le résultat pour soutenir une approbation large. |
Conclusion réglementaire : le dossier peut montrer une activité biologique, mais il n’établit pas encore que l’expression mesurée de micro-dystrophine est un substitut fiable raisonnablement susceptible de prédire un bénéfice clinique. Les principales lacunes sont la spécificité du dosage, les étalons de quantification invalides, la confusion possible par les fibres révertantes, l’absence de contrôle randomisé, la confusion NSAA liée à l’âge, la durabilité incertaine et les enjeux non résolus de sécurité/généralisabilité.
Pour combler l’écart, le programme nécessiterait une conception clinique contrôlée et stratifiée par âge, des dosages d’expression propres au transgène, une quantification protéique orthogonale, des contrôles de composition tissulaire, des données longitudinales de durabilité, des essais fonctionnels mécanistiques pour le construit tronqué et une surveillance de sécurité renforcée, surtout hépatique et cardiaque.
Critères et notes
GPT‑Rosalind atteint des performances de pointe dans l’industrie en chimie médicinale, un domaine consacré à transformer des molécules en médicaments utiles. Nous avons conçu MedChemBench pour refléter des workflows réalistes de chimie médicinale, en évaluant la compréhension multimodale des structures chimiques; les relations structure-activité (SAR); la prédiction de la puissance, de la toxicité et de l’absorption, distribution, métabolisme et excrétion (ADME) des médicaments; la prise de décision d’optimisation de têtes de série à paramètres multiples; et la rétrosynthèse. GPT‑Rosalind surpasse GPT‑5.5 avec 27,5 % contre 25,1 % sur MedChemBench, tout en utilisant 7,2 % moins de tokens.
GPT‑Rosalind montre une meilleure synthèse multimodale et un meilleur raisonnement mécanistique en chimie médicinale.
Sur GeneBench, notre évaluation agentique d’analyses de longue portée de bout en bout en génomique et en biologie quantitative, GPT‑Rosalind utilise 31 % moins de tokens que GPT‑5.5 tout en atteignant une précision supérieure, soit 21,6 % contre 20,4 %. GeneBench évalue la performance agentique sur des tâches quantitatives de longue portée : à partir de données scientifiques réalistes, un agent peut-il planifier des analyses, du CQ, de la modélisation et des corrections valides pour parvenir à des réponses pertinentes pour la décision? Les problèmes inclus couvrent divers domaines, dont la génomique fonctionnelle, la transcriptomique spatiale, la protéomique, l’épigénomique et la génétique appliquée.
GPT‑Rosalind utilise 31 % moins de tokens que GPT‑5.5 tout en améliorant la précision.
Nous présentons une nouvelle évaluation pour tester la capacité de GPT‑Rosalind à aider les scientifiques qui mènent des travaux de laboratoire dans le monde réel. LabWorkBench teste la capacité du modèle à relier des perturbations aux résultats expérimentaux dans de vrais protocoles de laboratoire humide utilisés par des scientifiques, à des fins allant du dépannage à l’optimisation. Les données utilisées par LabWorkBench sont propriétaires et donc non contaminées. GPT‑Rosalind obtient 63,2 % contre 55,8 % pour GPT‑5.5, tout en utilisant 5,3 % moins de tokens.
Dans l’assistance à de vrais protocoles de laboratoire humide, GPT‑Rosalind affiche des gains importants par rapport à GPT‑5.5 tout en améliorant l’efficacité des tokens.
Nous avons créé les plugins Life Sciences Research(s'ouvre dans une nouvelle fenêtre) et Life Sciences NGS Analysis(s'ouvre dans une nouvelle fenêtre) pour prolonger l’intelligence accrue de GPT‑Rosalind par une couche d’exécution pratique pour des workflows scientifiques reproductibles. Ensemble, ces plugins intègrent la recherche de preuves sourcées, l’interprétation biologique et l’exécution bio-informatique dans le même espace de travail, aidant les chercheurs à relier les preuves externes aux analyses omiques internes tout en conservant les artéfacts et la provenance. Tous les utilisateurs peuvent maintenant accéder aux deux plugins par l’entremise de Codex. Les utilisateurs d’entreprise GPT‑Rosalind qualifiés peuvent aussi utiliser GPT‑Rosalind pour alimenter ces plugins.
Pour mieux exploiter Codex comme établi dynamique pour les scientifiques, nous avons ajouté des visualiseurs interactifs pour les types de fichiers propres à la biologie. Le premier ensemble de visualiseurs de séquences, d’alignements et de structures est conçu pour garder les scientifiques près des preuves pendant que GPT‑Rosalind raisonne sur un workflow et répond directement aux questions de suivi en utilisant le visualiseur actif en contexte.
La démonstration ci-dessus montre ces capacités en action, orchestrées par GPT‑Rosalind. Nous suivons une scientifique qui étudie une biopsie liquide de tumeur pour identifier des mutations et d’autres changements moléculaires pouvant éclairer le traitement. Le plugin Life Sciences NGS Analysis transforme l’examen de dossiers ctDNA traités en un carnet interactif, faisant ressortir les altérations récurrentes, les appels à faible fréquence et les trajectoires d’échantillons qui orientent l’enquête vers KRAS G12C. À partir de là, le plugin Life Sciences Research ajoute un contexte sourcé sur les cibles, les inhibiteurs et la résistance, tandis que les visualiseurs natifs de séquences, d’alignements et de structures permettent à la scientifique d’inspecter directement le résidu mutant 12, sa conservation dans la famille RAS et la poche liée à l’inhibiteur. Le workflow se conclut en traduisant ces preuves en options de suivi concrètes, chaque étape et chaque artéfact étant disponibles pour un examen expert.

Plugin Life Sciences NGS Analysis
CQ et annotation scRNA-seq

Transformez un lot de matrices de style 10x en artéfacts unicellulaires filtrés par CQ, annotations et UMAP que vous pouvez inspecter et réviser dans Codex. Le plugin Life Sciences NGS Analysis achemine la demande vers scrna-seq-qc, choisit les seuils de CQ à partir des données, conserve la provenance autour du filtrage et de l’annotation, et signale les obstacles comme les dépendances manquantes pour la détection des doublets.
CQ FASTQ RNA-seq en vrac

Transformez une feuille d’échantillons RNA-seq en vrac, un lot FASTQ et des fichiers de référence en un lot de comptages examiné au CQ que vous pouvez inspecter et réutiliser dans Codex. Le plugin Life Sciences NGS Analysis achemine la demande, valide les entrées et retourne une enveloppe d’exécution auditable avec MultiQC, matrices Salmon, provenance et mises en garde explicites.
Nous élargissons l’accès à la série GPT‑Rosalind aux organisations admissibles du monde entier. GPT‑Rosalind sera offert en aperçu de recherche dans le cadre de notre structure de déploiement à accès fiable aux organisations qui mènent une recherche scientifique légitime ayant un avantage public clair, qui disposent d’une gouvernance et d’une surveillance de la sécurité solides, ainsi que d’un accès contrôlé avec une sécurité de niveau entreprise.
Dans le cadre de cette expansion mondiale, nous sommes heureux de contribuer à la mission de Novo Nordisk, qui vise à offrir plus rapidement aux patients des options de traitement innovantes, en l’aidant à accroître sa recherche médicale avec GPT‑Rosalind. Novo Nordisk exploite les capacités d’IA de pointe pour aider les chercheurs à analyser des ensembles de données complexes, à découvrir des tendances utiles et à tester des hypothèses plus rapidement. La compréhension biologique renforcée de GPT‑Rosalind aidera les équipes à relier les preuves issues de la littérature, de la génomique, de la transcriptomique, des séquences, des structures et des résultats expérimentaux, facilitant le passage des données à des décisions de recherche plus claires.
« La recherche en sciences de la vie est complexe, riche en données et interdisciplinaire. Pour offrir une valeur réelle aux chercheurs, les modèles d’IA avancés doivent être ancrés dans des données scientifiques fiables, reliés à des outils validés et intégrés aux workflows réels que les chercheurs utilisent au quotidien. Nous sommes heureux de notre partenariat avec OpenAI et de l’occasion d’explorer comment GPT‑Rosalind peut soutenir des approches plus rigoureuses et pratiques de la découverte de médicaments. »
Mishal Patel, vice-président de groupe, IA et innovation numérique, R-D - Novo Nordisk
Nous offrons aussi maintenant un espace de travail géré par OpenAI aux organisations qualifiées sans compte Enterprise.
La version mise à jour de GPT‑Rosalind constitue la prochaine étape de notre engagement plus vaste à bâtir des systèmes d’IA qui peuvent accélérer la découverte scientifique tout en veillant à ce que les capacités biologiques avancées soient déployées avec les mesures de protection appropriées. Nous continuerons d’améliorer le raisonnement biologique du modèle, d’élargir la prise en charge des workflows de recherche à forte utilisation d’outils et de longue portée, et de travailler avec des organisations qualifiées dans les différentes régions pour évaluer l’impact réel.
Cela signifie aussi appliquer l’IA en sciences de la vie à des travaux à fort impact et d’intérêt public, de la découverte de médicaments et de la médecine translationnelle à la santé publique, à la préparation et à la biodéfense. Grâce à Rosalind Biodefense et à notre modèle de déploiement à accès fiable, nous voulons mettre des capacités biologiques de pointe entre les mains des chercheurs, des institutions et des défenseurs qui travaillent à améliorer la santé humaine et à renforcer la résilience de la société.
Nous continuerons de développer GPT‑Rosalind pour en faire un partenaire plus capable tout au long du cycle de vie de la recherche scientifique, en aidant les scientifiques à passer plus rapidement des bonnes questions à des preuves plus claires, à de meilleures expériences et, ultimement, à de nouveaux traitements pour les patients.


