Gå til hovedindhold
OpenAI

Introduktion af nye funktioner til GPT‑Rosalind

Større intelligens forankret i reelle videnskabelige workflows til life science-industrien.

Vi introducerer en ny modelopdatering til vores GPT‑Rosalind-serie, der er formålsbygget til life science-forskning i virksomhedsskala. Den kombinerer GPT‑5.5’s agentiske kodnings- og værktøjsbrugsfunktioner med stærkere modelintelligens i centrale lægemiddelopdagelsesdomæner såsom medicinalkemi og genomik, samtidig med at ydeevnen forbedres på tværs af bredere analyse-, design- og eksperimentelle workflows inden for life science.

Fremskridt inden for life science afhænger af syntese af data og evidens på tværs af skalaer og modaliteter: molekyler, gener, signalveje og levende systemer. I vores evalueringer viser den opdaterede GPT‑Rosalind brede forbedringer i ydeevne på forskningsopgaver fra biologieksperter, komplekse medicinalkemiske forespørgsler, kvantitativ biologi og fejlfinding i vådlaboratoriet.

GPT‑Rosalind er nu tilgængelig som research preview for kvalificerede organisationer globalt gennem vores implementeringsstruktur med betroet adgang.

Forbedring af ydeevnen på videnskabeligt værdifulde opgaver

For at måle og løbende forbedre den virkelige effekt af GPT‑Rosalind designede vi LifeSciBench, en benchmark bedømt af eksterne eksperter med fokus på grundlæggende aspekter af life science-forskning. I modsætning til eksisterende benchmarks, der evaluerer en enkelt komponent af modelydeevne eller et biologisk domæne isoleret, anlægger LifeSciBench et end-to-end-perspektiv på videnskabeligt værdifuldt arbejde ved at hente opgaver fra seks workflowområder, der er centrale for life science-forskning: evidenshåndtering, analyse, design og optimering, videnskabelig ræsonnering, validering og drift samt translation og kommunikation. Vi bruger denne benchmark til at afstemme fremskridt med behovene og realiteterne i life science-forskning.

GPT‑Rosalind fører i ydeevne på tværs af videnskabeligt værdifulde opgaver identificeret af branche- og akademiske eksperter.

Udtræk, afstemning og audit af videnskabelig evidens fra artikler, figurer, tabeller og eksperimentelle optegnelser.

Evalueringseksempel

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Kandidatens respons

Bundlinje: Som præsenteret er denne pakke ikke stærk nok til at understøtte accelereret godkendelse baseret på mikrodystrofin-ekspression som et surrogatendepunkt, der med rimelighed sandsynligvis forudsiger klinisk fordel. En skeptisk FDA-reviewer ville sandsynligvis vurdere evidensen for biomarkør, funktion, holdbarhed, sikkerhed og generaliserbarhed som materielt utilstrækkeligt understøttet.

Pakkepunkt

Vigtig fejltilstand

Hvad der ville være nødvendigt

Western blot-kvantificering

MANEX1A binder en N-terminal epitop, der deles af endogent fuldlængde-dystrofin og mikrodystrofin-transgenet, så assayet skelner ikke rent mellem transgen og residual/revertant dystrofin. Kvantificering af en 138 kDa mikrodystrofin mod en sund fuldlængde-dystrofinstandard er også ugyldig.

Brug en rekombinant mikrodystrofinstandard og en ortogonal metode, der skelner transgen fra endogent dystrofin, såsom målrettet massespektrometri eller et transgen-specifikt/epitop-specifikt assay.

Immunofluorescens

Det C-terminale polyklonale antistof er dårligt egnet, fordi 138 kDa-konstruktionen mangler det C-terminale domæne. Mange DMD-patienter har revertante fibre, og revertant dystrofin kan bevare C-terminale epitoper. Revertante fibre kan ekspandere klonalt med alderen og biasere IF-signalet, især hos ældre drenge.

Gentag IF med et antistof mod en epitop, der findes i transgenet, men ikke i revertant dystrofin. Kvantificer transgen-positive fibre separat fra revertante fibre.

Surrogatendepunktets validitet

Pakken sammenblander proteinmængde med klinisk funktion. "38 % af proteinmassen i raske kontroller" betyder ikke 38 % af normal dystrofinfunktion, fordi mikrodystrofin er strukturelt trunkeret.

Valider empirisk forholdet mellem mikrodystrofin-masseprocent, sarkolemmal lokalisering, downstream funktionel genopretning og klinisk fordel, før ekspression behandles som surrogatendepunkt.

Biopsidesign

Kontralaterale vastus lateralis-biopsier før og efter behandling introducerer venstre-højre- og intramuskulær spatial variabilitet. Sygdomsprogression og fibro-fedt-udskiftning kan også ændre totalprotein-normaliseret signal.

Standardiser biopsistedet ved hjælp af ensartede anatomiske pejlemærker, normaliser til muskelspecifikke proteiner, og mål fibro-fedt-sammensætning parallelt.

NSAA-komparator/statistik

En ekstern natural-history-kohorte er ikke en randomiseret samtidig kontrol. Forsøgsberettigelse, understøttende behandling, deltagelseseffekter, baseline-NSAA, steroidregime, alder og exonklasse kan alle biasere sammenligningen. En uparret t-test er ikke tilstrækkelig. Desuden ligger en +1,4 NSAA-ændring inden for test-retest-variabiliteten for denne aldersgruppe.

Kør et randomiseret samtidigt placebokontrolleret studie, eller brug som minimum justerede analyser, der tager højde for baseline-NSAA, alder, steroidregime, exonklasse og andre confoundere.

Konfounding af aldersvindue

Drenge i alderen 4–7 er i et udviklingsvindue, hvor ubehandlede ambulante DMD-patienter kan øge motorisk funktion, før nedgang dominerer. En 48-ugers NSAA-ændring blander udviklingsgevinst, sygdomsprogression og mulig behandlingseffekt.

Brug en samtidig randomiseret kontrol med aldersstratificering for at adskille udviklingsforløb fra behandlingseffekt.

Tidligere klinisk præcedens

Open-label funktionelle signaler for mikrodystrofin har ikke pålideligt forudsagt bekræftende fordel; publiceret præcedens omfatter bekræftende forsøg med mikrodystrofin-genterapi, der ikke reproducerede open-label NSAA-forbedringer.

Stol ikke på open-label NSAA-ændring som afgørende støtte. Kræv kontrolleret funktionel evidens.

Konstruktionens strukturelle grænser

138 kDa-konstruktionen sletter spectrin repeats R16/17, som indeholder nNOS-bindingssteder. Tab af nNOS-rekruttering kan forringe funktionel sympatholyse og iskæmibeskyttelse under motion, hvilket skaber et mekanistisk loft for rescue uafhængigt af ekspressionsniveau.

Tilføj mekanistiske studier, der viser, om denne specifikke konstruktion genopretter relevant dystrofin-associeret kompleksfunktion, nNOS-lokalisering, træningsfysiologi og muskelbeskyttelse.

AAV-holdbarhed

Vektorgenomer ved 12 uger etablerer ikke holdbar ekspression. AAV9-genomer er overvejende ikke-integrerende episomer og kan falde over tid. Vektorgenom-persistens er ikke det samme som vedvarende proteinekspression.

Mål longitudinel transgen-proteinekspression og funktionel biomarkørholdbarhed ud over 12 uger.

Immun-/sikkerhedsprofil

Transaminitis hos 8/12 patienter er foreneligt med immunrespons mod AAV-transducerede celler, men mekanismen er ikke fastlagt. Ét tilfælde af myokarditis er bekymrende i betragtning af AAV9’s kardiale tropisme.

Lever dybere immunmonitorering, lever-/hjertesikkerhedskarakterisering og intensiveret hjertelig opfølgning.

Patientudvælgelse/generaliserbarhed

Udelukkelse af anti-AAV9 neutraliserende antistof-positive patienter begrænser generaliserbarheden. Udelukkelse af exon-44-deletioner begrænser anvendeligheden for denne DMD-undergruppe. n=12 er for lille til at karakterisere sikkerhed og effekt på tværs af den bredere DMD-population.

Udvid berettigelsen, hvor det er muligt, eller præspecificer stratificerede analyser efter antistofstatus, genotype/exonklasse, alder og baselinefunktion, før resultatet bruges til at understøtte bred godkendelse.

Regulatorisk konklusion: Pakken kan vise biologisk aktivitet, men den fastslår endnu ikke, at den målte mikrodystrofin-ekspression er et pålideligt surrogat, der med rimelig sandsynlighed forudsiger klinisk fordel. De vigtigste huller er assayspecificitet, ugyldige kvantificeringsstandarder, mulig revertant-fiber-konfounding, mangel på randomiseret kontrol, aldersrelateret NSAA-konfounding, usikker holdbarhed og uløste sikkerheds-/generaliserbarhedsproblemer.

For at lukke hullet ville programmet kræve et kontrolleret, aldersstratificeret klinisk design med transgen-specifikke ekspressionsassays, ortogonal proteinkvantificering, vævssammensætningskontroller, longitudinelle holdbarhedsdata, mekanistiske funktionelle assays for den trunkerede konstruktion og stærkere sikkerhedsmonitorering, især hepatisk og kardial.

Kriterier og karakterer for rubrikker

Kriterium
Point
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Stærkere videnskabelig ræsonnering

Medicinalkemi

GPT‑Rosalind opnår brancheførende ydeevne inden for medicinalkemi, et felt med fokus på at omdanne molekyler til nyttige lægemidler. Vi designede MedChemBench til at afspejle realistiske medicinalkemiske workflows og evaluere multimodal forståelse af kemiske strukturer; struktur-aktivitets-relation (SAR); forudsigelse af lægemiddelpotens, toksicitet og absorption, distribution, metabolisme, ekskretion (ADME); beslutningstagning om multiparameter lead-optimering; og retrosyntese. GPT‑Rosalind klarer sig bedre end GPT‑5.5 med 27,5 % mod 25,1 % på MedChemBench, samtidig med at den bruger 7,2 % færre tokens.

GPT‑Rosalind viser bedre multimodal syntese og mekanistisk ræsonnering inden for medicinalkemi.

Genomik og kvantitativ biologi

På GeneBench, vores agentiske evaluering af langvarig end-to-end-analyse inden for genomik og kvantitativ biologi, bruger GPT‑Rosalind 31 % færre tokens end GPT‑5.5 og opnår samtidig en højere nøjagtighed på 21,6 % mod 20,4 %. GeneBench vurderer agentisk ydeevne på kvantitative opgaver med lang tidshorisont: Kan en agent på basis af realistiske videnskabelige data planlægge gyldig analyse, QC, modellering og korrektioner for at nå frem til beslutningsrelevante svar? De inkluderede problemer spænder over en række domæner, herunder funktionel genomik, spatial transkriptomik, proteomik, epigenomik og anvendt genetik.

GPT‑Rosalind bruger 31 % færre tokens end GPT‑5.5 og forbedrer samtidig nøjagtigheden.

Assistance til laboratoriearbejde i den virkelige verden

Vi introducerer en ny evaluering for at teste GPT‑Rosalinds evne til at hjælpe forskere, der udfører laboratoriearbejde i den virkelige verden. LabWorkBench tester modelens evne til at forbinde perturbationer med eksperimentelle resultater i reelle vådlaboratorieprotokoller, der bruges af forskere, til formål fra fejlfinding til optimering. De data, der bruges af LabWorkBench, er proprietære og dermed ukontaminerede. GPT‑Rosalind scorer 63,2 % mod GPT‑5.5 på 55,8 %, samtidig med at den bruger 5,3 % færre tokens.

På assistance til reelle vådlaboratorieprotokoller viser GPT‑Rosalind markante gevinster i forhold til GPT‑5.5 og forbedrer samtidig token-effektiviteten.

Fra ræsonnering til udførte workflows

Vi byggede pluginsene Life Sciences Research(åbner i et nyt vindue) og Life Sciences NGS Analysis(åbner i et nyt vindue) for at udvide den øgede intelligens i GPT‑Rosalind med et praktisk eksekveringslag til gentagelige videnskabelige workflows. Tilsammen bringer disse plugins evidenssøgning med kilder, biologisk fortolkning og bioinformatisk eksekvering ind i samme arbejdsområde og hjælper forskere med at forbinde ekstern evidens med interne omics-analyser, samtidig med at artefakter og proveniens bevares. Alle brugere kan nu få adgang til begge plugins via Codex. Kvalificerede GPT‑Rosalind‑virksomhedsbrugere kan desuden bruge GPT‑Rosalind til at drive disse plugins.

For bedre at udnytte Codex som en dynamisk arbejdsbænk for forskere har vi tilføjet interaktive visere til biologisk native filtyper. Det indledende sæt af sekvens-, alignment- og strukturvisere er designet til at holde forskere tæt på evidensen, mens GPT‑Rosalind ræsonnerer på tværs af et workflow og direkte besvarer opfølgende spørgsmål ved hjælp af den aktive viser i kontekst.

Demoen ovenfor viser disse kapaciteter i praksis, orkestreret af GPT‑Rosalind. Vi følger en forsker, der undersøger en flydende tumorbiopsi for at identificere mutationer og andre molekylære ændringer, der kan informere behandling. Life Sciences NGS Analysis-pluginet omdanner en gennemgang af behandlede ctDNA-optegnelser til en interaktiv notebook, der fremhæver tilbagevendende ændringer, lavfrekvente kald og prøveforløb, som fokuserer undersøgelsen på KRAS G12C. Derfra tilføjer Life Sciences Research-pluginet kildebaseret kontekst om target, inhibitor og resistens, mens de native sekvens-, alignment- og strukturvisere lader forskeren inspicere mutant rest 12, dens konservering på tværs af RAS-familien og den inhibitorbundne lomme direkte. Workflowet afsluttes med at omsætte denne evidens til konkrete opfølgningsmuligheder, hvor hvert trin og artefakt er tilgængeligt for ekspertgennemgang.

En computerskærm viser et arbejdsområde, der instruerer i brug af et NGS Analysis-plugin til at udforske ctDNA-mutationsdata. Skærmen indeholder flere søjlediagrammer mærket "Top detaljerede histologier" og "Top ændrede gener efter muterede cfDNA-prøver", som viser data om kræfttyper og genændringer. Tekst beskriver datasættet, nøglefund og analyseparametre.

Life Sciences NGS Analysis-plugin

scRNA-seq-QC & annotering

Skærmbillede af et bioinformatisk workflow i delt skærm. Venstre panel viser en AI-assistent, der opsummerer en afsluttet kvalitetskontrolanalyse af single-cell RNA-sekventering (scRNA-seq), herunder genererede filer, QC-metrikker, UMAP-visualiseringer og celletypeannoteringer. Højre panel viser en "scRNA QC Review"-rapport med histogrammer for total counts, detekterede gener og mitokondrieprocent samt søjlediagrammer, der viser QC bestået/ikke bestået-tal og filtrerede cellepopulationer. Grænsefladen vises mod en blå-grøn gradientbaggrund.

Omdan en 10x-lignende matrixpakke til QC-filtrerede enkeltcelleartefakter, annoteringer og UMAP’er, som du kan inspicere og revidere i Codex. Life Sciences NGS Analysis-pluginet ruter anmodningen til scrna-seq-qc, vælger QC-tærskler fra dataene, bevarer proveniens omkring filtrering og annotering og fremhæver blokeringer såsom manglende afhængigheder til doublet-detektion.

Bulk RNA-seq FASTQ-QC

Delt skærmvisning af et RNA-seq-workflow: En AI-assistent opsummerer afsluttede bulk RNA-seq-kvalitetskontrolresultater til venstre, mens en interaktiv MultiQC-rapport med sekventeringsstatistik og Salmon-metrikker vises til højre.

Omdan et bulk RNA-seq-prøveark, en FASTQ-pakke og referencefiler til en QC-gennemgået tællepakke, som du kan inspicere og genbruge i Codex. Life Sciences NGS Analysis-pluginet ruter anmodningen, validerer inputtene og returnerer en auditerbar kørselskuvert med MultiQC, Salmon-matricer, proveniens og eksplicitte forbehold.

Udvidet adgang for betroede organisationer

Vi udvider adgangen til GPT‑Rosalind-serien til kvalificerede organisationer globalt. GPT‑Rosalind vil være tilgængelig som research preview gennem vores implementeringsstruktur med betroet adgang for organisationer, der udfører legitim videnskabelig forskning med tydelig offentlig nytte, har stærk governance og sikkerhedstilsyn samt kontrolleret adgang med sikkerhed på virksomhedsniveau.

Som del af denne globale udvidelse glæder vi os over at hjælpe med at understøtte Novo Nordisks mission om hurtigere at bringe innovative behandlingsmuligheder til patienter ved at hjælpe med at skalere deres medicinske forskning med GPT‑Rosalind. Novo Nordisk udnytter frontier AI-kapaciteter til at hjælpe forskere med at analysere komplekse datasæt, afdække nyttige mønstre og teste hypoteser hurtigere. GPT‑Rosalinds stærkere biologiske forståelse vil hjælpe teams med at forbinde evidens på tværs af litteratur, genomik, transkriptomik, sekvens, struktur og eksperimentelle resultater, så det bliver lettere at gå fra data til klarere forskningsbeslutninger.

"Life science-forskning er kompleks, datarig og tværfaglig. For at levere meningsfuld værdi til forskere skal avancerede AI-modeller være forankret i betroede videnskabelige data, forbundet med validerede værktøjer og integreret i de virkelige workflows, forskere bruger hver dag. Vi er glade for vores partnerskab med OpenAI og muligheden for at undersøge, hvordan GPT‑Rosalind kan understøtte mere stringente, praktiske tilgange til lægemiddelopdagelse."

Mishal Patel, Group Vice President, AI & Digital Innovation, R&D - Novo Nordisk

Vi tilbyder nu også et OpenAI-administreret arbejdsområde til kvalificerede organisationer uden en Enterprise-konto.

Hvad er det næste

Den opdaterede GPT‑Rosalind er næste skridt i vores bredere forpligtelse til at bygge AI-systemer, der kan hjælpe med at accelerere videnskabelige opdagelser, samtidig med at avancerede biologiske kapaciteter implementeres med passende sikkerhedsforanstaltninger. Vi vil fortsætte med at forbedre modelens biologiske ræsonnering, udvide understøttelsen af værktøjstunge forskningsworkflows med lang tidshorisont og samarbejde med kvalificerede organisationer på tværs af regioner for at evaluere effekten i den virkelige verden.

Det betyder også at anvende life science-AI på arbejde med stor offentlig nytte, fra lægemiddelopdagelse og translationel medicin til folkesundhed, beredskab og bioforsvar. Gennem Rosalind Biodefense og vores implementeringsmodel med betroet adgang sigter vi mod at lægge frontier-biologiske kapaciteter i hænderne på de forskere, institutioner og forsvarere, der arbejder for at forbedre menneskers sundhed og styrke samfundets robusthed.

Vi vil fortsætte med at bygge GPT‑Rosalind, så den bliver en mere kapabel partner på tværs af hele livscyklussen for videnskabelig forskning og hjælper forskere med hurtigere at gå fra de rigtige spørgsmål til klarere evidens, bedre eksperimenter og i sidste ende nye behandlinger til patienter.