Passer au contenu principal
OpenAI

Présentation de nouvelles capacités pour GPT‑Rosalind

Apporter une intelligence accrue, ancrée dans de vrais workflows scientifiques, à l’industrie des sciences de la vie.

Nous lançons une nouvelle mise à jour de modèle pour notre série GPT‑Rosalind, spécialement conçue pour la recherche en sciences de la vie à l’échelle de l’entreprise. Elle combine les capacités de programmation agentique et d’utilisation d’outils de GPT‑5.5 avec une intelligence de modèle renforcée dans des domaines clés de la découverte de médicaments, comme la chimie médicinale et la génomique, tout en améliorant les performances sur l’analyse, la conception et les workflows expérimentaux plus larges des sciences de la vie.

Les progrès en sciences de la vie reposent sur la synthèse de données et de preuves à travers les échelles et les modalités : molécules, gènes, voies biologiques et systèmes vivants. Dans nos évaluations, le GPT‑Rosalind mis à jour montre de larges gains de performance sur des tâches de recherche proposées par des experts en biologie, des requêtes complexes de chimie médicinale, la biologie quantitative et le dépannage en laboratoire humide.

GPT‑Rosalind est désormais disponible en aperçu de recherche pour les organisations éligibles dans le monde entier via notre structure de déploiement à accès de confiance.

Améliorer les performances sur des tâches à forte valeur scientifique

Afin de mesurer et d’améliorer en continu l’impact réel de GPT‑Rosalind, nous avons conçu LifeSciBench, un benchmark évalué par des experts externes et centré sur les aspects fondamentaux de la recherche en sciences de la vie. Contrairement aux benchmarks existants qui évaluent isolément un seul composant des performances du modèle ou un domaine biologique, LifeSciBench adopte une vision de bout en bout du travail à valeur scientifique en tirant ses tâches de six domaines de workflow centraux pour la recherche en sciences de la vie : gestion des preuves, analyse, conception et optimisation, raisonnement scientifique, validation et opérations, ainsi que traduction et communication. Nous utilisons ce benchmark pour aligner les progrès sur les besoins et les réalités de la recherche en sciences de la vie.

GPT‑Rosalind domine les performances sur des tâches à valeur scientifique identifiées par des experts industriels et universitaires.

Extraire, rapprocher et auditer les preuves scientifiques issues d’articles, de figures, de tableaux et de dossiers expérimentaux.

Exemple d’évaluation

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Réponse candidate

Conclusion : Tel que présenté, ce dossier n’est pas assez solide pour étayer une approbation accélérée fondée sur l’expression de micro-dystrophine comme critère de substitution raisonnablement susceptible de prédire un bénéfice clinique. Un évaluateur sceptique de la FDA jugerait probablement les preuves relatives au biomarqueur, à la fonction, à la durabilité, à la sécurité et à la généralisabilité comme matériellement insuffisantes.

Élément du dossier

Mode d’échec clé

Ce qui serait nécessaire

Quantification par western blot

MANEX1A se lie à un épitope N-terminal partagé par la dystrophine endogène pleine longueur et le transgène de micro-dystrophine, de sorte que le test ne distingue pas proprement le transgène de la dystrophine résiduelle/révertante. Quantifier une micro-dystrophine de 138 kDa par rapport à un étalon sain de dystrophine pleine longueur est également invalide.

Utiliser un étalon recombinant de micro-dystrophine et une méthode orthogonale distinguant le transgène de la dystrophine endogène, comme la spectrométrie de masse ciblée ou un test spécifique du transgène/de l’épitope.

Immunofluorescence

L’anticorps polyclonal C-terminal est mal adapté, car la construction de 138 kDa manque du domaine C-terminal. De nombreux patients DMD possèdent des fibres révertantes, et la dystrophine révertante peut conserver des épitopes C-terminaux. Les fibres révertantes peuvent s’étendre clonalement avec l’âge, biaisant le signal IF, surtout chez les garçons plus âgés.

Répéter l’IF avec un anticorps dirigé contre un épitope présent dans le transgène mais absent de la dystrophine révertante. Quantifier séparément les fibres positives pour le transgène et les fibres révertantes.

Validité du critère de substitution

Le dossier confond quantité de protéine et fonction clinique. « 38 % de la masse protéique du témoin sain » ne signifie pas 38 % de la fonction normale de la dystrophine, car la micro-dystrophine est structurellement tronquée.

Valider empiriquement la relation entre le pourcentage massique de micro-dystrophine, la localisation sarcolemmique, la restauration fonctionnelle en aval et le bénéfice clinique avant de traiter l’expression comme un critère de substitution.

Conception des biopsies

Les biopsies pré- et post-traitement du vaste latéral controlatéral introduisent une variabilité gauche-droite et spatiale intramusculaire. La progression de la maladie et le remplacement fibro-adipeux peuvent aussi modifier le signal normalisé par les protéines totales.

Standardiser le site de biopsie avec des repères anatomiques constants, normaliser sur des protéines spécifiques du muscle et mesurer en parallèle la composition fibro-adipeuse.

Comparateur/statistiques NSAA

Une cohorte externe d’histoire naturelle n’est pas un contrôle concomitant randomisé. L’éligibilité à l’essai, les soins de soutien, les effets de participation, le NSAA initial, le schéma stéroïdien, l’âge et la classe d’exon peuvent tous biaiser la comparaison. Un test t non apparié ne suffit pas. De plus, une variation NSAA de +1,4 se situe dans la variabilité test-retest pour ce groupe d’âge.

Mener une étude randomisée concomitante contrôlée par placebo, ou au minimum utiliser des analyses ajustées tenant compte du NSAA initial, de l’âge, du schéma stéroïdien, de la classe d’exon et d’autres facteurs de confusion.

Confusion liée à la fenêtre d’âge

Les garçons de 4 à 7 ans se trouvent dans une fenêtre de développement où les patients DMD ambulatoires non traités peuvent gagner en fonction motrice avant que le déclin ne domine. Une variation du NSAA sur 48 semaines mêle gain développemental, progression de la maladie et effet possible du traitement.

Utiliser un contrôle randomisé concomitant avec stratification par âge pour séparer la trajectoire développementale de l’effet du traitement.

Précédent clinique antérieur

Les signaux fonctionnels en ouvert de micro-dystrophine n’ont pas prédit de façon fiable un bénéfice confirmatoire ; les précédents publiés incluent des essais confirmatoires de thérapie génique par micro-dystrophine n’ayant pas reproduit les améliorations NSAA en ouvert.

Ne pas s’appuyer sur une variation NSAA en ouvert comme soutien décisif. Exiger des preuves fonctionnelles contrôlées.

Limites structurelles de la construction

La construction de 138 kDa supprime les répétitions spectrine R16/17, qui contiennent les sites de liaison à nNOS. La perte du recrutement de nNOS peut altérer la sympatholyse fonctionnelle et la protection contre l’ischémie pendant l’exercice, créant un plafond mécanistique au sauvetage indépendant du niveau d’expression.

Ajouter des études mécanistiques montrant si cette construction spécifique restaure la fonction pertinente du complexe associé à la dystrophine, la localisation de nNOS, la physiologie de l’exercice et la protection musculaire.

Durabilité AAV

Les génomes vectoriels à 12 semaines n’établissent pas une expression durable. Les génomes AAV9 sont largement des épisomes non intégratifs et peuvent diminuer avec le temps. La persistance du génome vectoriel n’est pas la même chose qu’une expression protéique persistante.

Mesurer longitudinalement l’expression protéique du transgène et la durabilité des biomarqueurs fonctionnels au-delà de 12 semaines.

Profil immunitaire/sécurité

La transaminite chez 8/12 patients est compatible avec une réponse immunitaire aux cellules transduites par AAV, mais le mécanisme n’est pas établi. Un cas de myocardite est préoccupant compte tenu du tropisme cardiaque d’AAV9.

Fournir un suivi immunitaire plus approfondi, une caractérisation de la sécurité hépatique/cardiaque et un suivi cardiaque intensifié.

Sélection des patients/généralisabilité

Exclure les patients positifs pour les anticorps neutralisants anti-AAV9 limite la généralisabilité. Exclure les délétions de l’exon 44 limite l’applicabilité à ce sous-groupe DMD. n=12 est trop faible pour caractériser la sécurité et l’efficacité dans la population DMD plus large.

Élargir l’éligibilité lorsque c’est possible ou préspécifier des analyses stratifiées selon le statut anticorps, le génotype/la classe d’exon, l’âge et la fonction initiale avant d’utiliser le résultat pour soutenir une approbation large.

Conclusion réglementaire : Le dossier peut montrer une activité biologique, mais il n’établit pas encore que l’expression mesurée de micro-dystrophine est un substitut fiable raisonnablement susceptible de prédire un bénéfice clinique. Les principales lacunes sont la spécificité des tests, des étalons de quantification invalides, une possible confusion due aux fibres révertantes, l’absence de contrôle randomisé, la confusion du NSAA liée à l’âge, une durabilité incertaine et des questions de sécurité/généralisabilité non résolues.

Pour combler l’écart, le programme aurait besoin d’un plan clinique contrôlé et stratifié par âge, avec des tests d’expression spécifiques du transgène, une quantification protéique orthogonale, des contrôles de composition tissulaire, des données longitudinales de durabilité, des tests fonctionnels mécanistiques pour la construction tronquée et une surveillance de sécurité renforcée, notamment hépatique et cardiaque.

Critères et notes

Critère
Points
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Un raisonnement scientifique plus solide

Chimie médicinale

GPT‑Rosalind atteint des performances de pointe dans l’industrie en chimie médicinale, un domaine axé sur la transformation de molécules en médicaments utiles. Nous avons conçu MedChemBench pour refléter des workflows réalistes de chimie médicinale, en évaluant la compréhension multimodale des structures chimiques ; les relations structure-activité (SAR) ; la prédiction de la puissance, de la toxicité et de l’absorption, distribution, métabolisme et excrétion (ADME) des médicaments ; la prise de décision multiparamétrique pour l’optimisation de têtes de série ; et la rétrosynthèse. GPT‑Rosalind surpasse GPT‑5.5 sur MedChemBench, avec 27,5 % contre 25,1 %, tout en utilisant 7,2 % de tokens en moins.

GPT‑Rosalind montre une meilleure synthèse multimodale et un raisonnement mécanistique supérieur en chimie médicinale.

Génomique et biologie quantitative

Sur GeneBench, notre évaluation agentique de l’analyse de bout en bout à long horizon en génomique et biologie quantitative, GPT‑Rosalind utilise 31 % de tokens en moins que GPT‑5.5 tout en atteignant une précision supérieure, 21,6 % contre 20,4 %. GeneBench évalue les performances agentiques sur des tâches quantitatives à long horizon : à partir de données scientifiques réalistes, un agent peut-il planifier une analyse valide, un QC, une modélisation et des corrections pour parvenir à des réponses pertinentes pour la décision ? Les problèmes inclus couvrent divers domaines, dont la génomique fonctionnelle, la transcriptomique spatiale, la protéomique, l’épigénomique et la génétique appliquée.

GPT‑Rosalind utilise 31 % de tokens en moins que GPT‑5.5 tout en améliorant la précision.

Aider le travail de laboratoire réel

Nous introduisons une nouvelle évaluation pour tester la capacité de GPT‑Rosalind à aider les scientifiques qui mènent des travaux de laboratoire dans le monde réel. LabWorkBench teste la capacité du modèle à relier les perturbations aux résultats expérimentaux dans de vrais protocoles de laboratoire humide utilisés par les scientifiques, à des fins allant du dépannage à l’optimisation. Les données utilisées par LabWorkBench sont propriétaires et donc non contaminées. GPT‑Rosalind obtient 63,2 % contre 55,8 % pour GPT‑5.5, tout en utilisant 5,3 % de tokens en moins.

Sur l’assistance à de vrais protocoles de laboratoire humide, GPT‑Rosalind affiche des gains significatifs par rapport à GPT‑5.5 tout en améliorant l’efficacité en tokens.

Du raisonnement aux workflows exécutés

Nous avons créé les plugins Life Sciences Research(ouverture dans une nouvelle fenêtre) et Life Sciences NGS Analysis(ouverture dans une nouvelle fenêtre) pour compléter l’intelligence accrue de GPT‑Rosalind par une couche d’exécution pratique pour des workflows scientifiques reproductibles. Ensemble, ces plugins réunissent la recherche de preuves sourcées, l’interprétation biologique et l’exécution bioinformatique dans le même espace de travail, aidant les chercheurs à relier les preuves externes aux analyses omiques internes tout en préservant les artefacts et la provenance. Tous les utilisateurs peuvent désormais accéder aux deux plugins via Codex. Les utilisateurs entreprise qualifiés de GPT‑Rosalind peuvent en outre utiliser GPT‑Rosalind pour alimenter ces plugins.

Pour mieux exploiter Codex comme établi dynamique pour les scientifiques, nous avons ajouté des visualiseurs interactifs pour les types de fichiers biologiques natifs. Le premier ensemble de visualiseurs de séquences, d’alignements et de structures est conçu pour garder les scientifiques au plus près des preuves tandis que GPT‑Rosalind raisonne sur un workflow et répond directement aux questions de suivi en utilisant le visualiseur actif en contexte.

La démo ci-dessus montre ces capacités en action, orchestrées par GPT‑Rosalind. Nous suivons un scientifique qui étudie une biopsie liquide de tumeur afin d’identifier des mutations et d’autres changements moléculaires susceptibles d’éclairer le traitement. Le plugin Life Sciences NGS Analysis transforme l’examen de dossiers ctDNA traités en notebook interactif, faisant ressortir les altérations récurrentes, les appels à faible fréquence et les trajectoires d’échantillons qui concentrent l’investigation sur KRAS G12C. À partir de là, le plugin Life Sciences Research ajoute le contexte sourcé sur la cible, l’inhibiteur et la résistance, tandis que les visualiseurs natifs de séquences, d’alignements et de structures permettent au scientifique d’inspecter directement le résidu mutant 12, sa conservation dans la famille RAS et la poche liée à l’inhibiteur. Le workflow se conclut en traduisant ces preuves en options de suivi concrètes, chaque étape et artefact étant disponible pour examen par des experts.

Un écran d’ordinateur montre un espace de travail demandant l’utilisation d’un plugin NGS Analysis pour explorer des données de mutations ctDNA. L’écran comprend plusieurs histogrammes intitulés « Principales histologies détaillées » et « Principaux gènes altérés par échantillons cfDNA mutés », affichant des données sur les types de cancer et les altérations géniques. Le texte décrit le jeu de données, les principaux résultats et les paramètres d’analyse.

Plugin Life Sciences NGS Analysis

QC & annotation scRNA-seq

Capture d’écran d’un workflow bioinformatique en écran partagé. Le panneau gauche montre un assistant IA résumant une analyse de contrôle qualité de séquençage ARN unicellulaire (scRNA-seq) terminée, incluant fichiers générés, métriques QC, visualisations UMAP et annotations de types cellulaires. Le panneau droit affiche un rapport « Revue QC scRNA » avec des histogrammes des comptages totaux, des gènes détectés et du pourcentage mitochondrial, ainsi que des diagrammes en barres montrant les comptages réussite/échec QC et les populations cellulaires filtrées. L’interface apparaît sur un fond en dégradé bleu et vert.

Transformez un lot de matrices de type 10x en artefacts unicellulaires filtrés par QC, annotations et UMAP inspectables et révisables dans Codex. Le plugin Life Sciences NGS Analysis achemine la demande vers scrna-seq-qc, choisit les seuils de QC à partir des données, préserve la provenance autour du filtrage et de l’annotation, et fait ressortir les blocages comme des dépendances manquantes de détection des doublets.

QC FASTQ d’ARN-seq bulk

Vue en écran partagé d’un workflow RNA-seq : un assistant IA résume à gauche les résultats de contrôle qualité RNA-seq bulk terminés, tandis qu’un rapport MultiQC interactif avec statistiques de séquençage et métriques Salmon est affiché à droite.

Transformez une feuille d’échantillons RNA-seq bulk, un lot FASTQ et des fichiers de référence en un lot de comptages revu par QC, que vous pouvez inspecter et réutiliser dans Codex. Le plugin Life Sciences NGS Analysis achemine la demande, valide les entrées et renvoie une enveloppe d’exécution auditable avec MultiQC, matrices Salmon, provenance et réserves explicites.

Accès élargi pour les organisations de confiance

Nous élargissons l’accès à la série GPT‑Rosalind aux organisations éligibles dans le monde entier. GPT‑Rosalind sera disponible en aperçu de recherche via notre structure de déploiement à accès de confiance pour les organisations qui mènent une recherche scientifique légitime présentant un bénéfice public clair, disposent d’une gouvernance solide et d’une supervision de la sécurité, ainsi que d’un accès contrôlé avec une sécurité de niveau entreprise.

Dans le cadre de cette expansion mondiale, nous sommes ravis de contribuer à la mission de Novo Nordisk, qui consiste à proposer plus vite aux patients des options thérapeutiques innovantes, en l’aidant à étendre sa recherche médicale avec GPT‑Rosalind. Novo Nordisk exploite les capacités d’IA de pointe pour aider les chercheurs à analyser des jeux de données complexes, découvrir des motifs utiles et tester des hypothèses plus rapidement. La compréhension biologique renforcée de GPT‑Rosalind aidera les équipes à relier les preuves issues de la littérature, de la génomique, de la transcriptomique, des séquences, des structures et des résultats expérimentaux, facilitant le passage des données à des décisions de recherche plus claires.

« La recherche en sciences de la vie est complexe, riche en données et interdisciplinaire. Pour apporter une valeur réelle aux chercheurs, les modèles d’IA avancés doivent être ancrés dans des données scientifiques fiables, connectés à des outils validés et intégrés aux workflows réels que les chercheurs utilisent chaque jour. Nous sommes satisfaits de notre partenariat avec OpenAI et de l’occasion d’explorer comment GPT‑Rosalind peut soutenir des approches plus rigoureuses et pratiques de la découverte de médicaments. »

Mishal Patel, Group Vice President, AI & Digital Innovation, R&D - Novo Nordisk

Nous proposons aussi désormais un espace de travail géré par OpenAI pour les organisations qualifiées sans compte Enterprise.

Et ensuite

Le GPT‑Rosalind mis à jour constitue la prochaine étape de notre engagement plus large à créer des systèmes d’IA capables d’accélérer la découverte scientifique tout en veillant à ce que les capacités biologiques avancées soient déployées avec des garde-fous appropriés. Nous continuerons à améliorer le raisonnement biologique du modèle, à étendre la prise en charge des workflows de recherche intensifs en outils et à long horizon, et à travailler avec des organisations qualifiées dans différentes régions pour évaluer l’impact réel.

Cela signifie aussi appliquer l’IA des sciences de la vie à des travaux à fort impact et d’intérêt public, de la découverte de médicaments et de la médecine translationnelle à la santé publique, la préparation et la biodéfense. Grâce à Rosalind Biodefense et à notre modèle de déploiement à accès de confiance, nous visons à mettre des capacités biologiques de pointe entre les mains des chercheurs, institutions et défenseurs qui travaillent à améliorer la santé humaine et à renforcer la résilience sociétale.

Nous continuerons à développer GPT‑Rosalind pour en faire un partenaire plus capable tout au long du cycle de vie de la recherche scientifique, aidant les scientifiques à passer plus vite des bonnes questions à des preuves plus claires, de meilleures expériences et, en fin de compte, de nouveaux traitements pour les patients.