Vi introduserer nye funksjoner i GPT‑Rosalind
Større intelligens forankret i reelle vitenskapelige arbeidsflyter for livsvitenskapsbransjen.
Vi introduserer en ny modelloppdatering i GPT‑Rosalind-serien vår, spesialbygget for livsvitenskapelig forskning i virksomhetsskala. Den kombinerer GPT‑5.5s agentiske koding og verktøybruk med sterkere modellintelligens i sentrale domener innen legemiddelutvikling, som legemiddelkjemi og genomikk, samtidig som den forbedrer ytelsen på bredere analyse-, design- og eksperimentelle arbeidsflyter innen livsvitenskap.
Fremskritt innen livsvitenskap avhenger av å syntetisere data og evidens på tvers av skalaer og modaliteter: molekyler, gener, signalveier og levende systemer. I evalueringene våre viser den oppdaterte GPT‑Rosalind brede ytelsesforbedringer på forskningsoppgaver fra biologiske eksperter, komplekse spørsmål innen legemiddelkjemi, kvantitativ biologi og feilsøking i våtlaboratorium.
GPT‑Rosalind er nå tilgjengelig som forskningsforhåndsvisning for kvalifiserte organisasjoner globalt gjennom vår distribusjonsstruktur for betrodd tilgang.
For å måle og kontinuerlig forbedre den reelle effekten av GPT‑Rosalind utviklet vi LifeSciBench, en referansetest vurdert av eksterne eksperter, med fokus på grunnleggende aspekter ved livsvitenskapelig forskning. I motsetning til eksisterende referansetester som evaluerer én enkelt komponent av modellytelse eller ett biologisk domene isolert, ser LifeSciBench helhetlig på vitenskapelig verdifullt arbeid ved å hente oppgaver fra seks arbeidsflytområder som er sentrale for livsvitenskapelig forskning: evidenshåndtering, analyse, design og optimalisering, vitenskapelig resonnering, validering og drift samt oversettelse og kommunikasjon. Vi bruker denne referansetesten til å samordne fremdrift med behovene og realitetene i livsvitenskapelig forskning.
GPT‑Rosalind leder an i ytelse på vitenskapelig verdifulle oppgaver identifisert av bransje- og akademiske eksperter.
Uttrekk, avstemming og revisjon av vitenskapelig evidens fra artikler, figurer, tabeller og eksperimentelle registreringer.
Evalueringseksempel
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Kandidatsvar
Konklusjon Slik pakken er presentert, er den ikke sterk nok til å støtte fremskyndet godkjenning på grunnlag av mikrodystrofinuttrykk som et surrogatendepunkt som med rimelig sannsynlighet kan forutsi klinisk nytte. En skeptisk FDA-gransker vil sannsynligvis anse dokumentasjonen for biomarkører, funksjonalitet, holdbarhet, sikkerhet og generaliserbarhet som vesentlig underbygget.
Pakkeelement | Nøkkelfeilmodus | Hva som trengs |
|---|---|---|
Western blot-kvantifisering | MANEX1A binder en N-terminal epitop som deles av endogent dystrofin i full lengde og mikrodystrofintransgenet, slik at analysen ikke skiller klart mellom transgenet og gjenværende/revertant dystrofin. Kvantifisering av et 138 kDa mikro-dystrofin mot en frisk dystrofinstandard i full lengde er også ugyldig. | Bruk en rekombinant mikrodystrofinstandard og en ortogonal metode som skiller transgen fra endogent dystrofin, for eksempel målrettet massespektrometri eller en transgenspesifikk/epitopspesifikk analyse. |
Immunfluorescens | Det C-terminale polyklonale antistoffet er dårlig egnet fordi 138 kDa-konstruksjonen mangler det C-terminale domenet. Mange DMD-pasienter har revertante fibre, og revertant dystrofin kan beholde C-terminale epitoper. Revertantfibre kan ekspandere klonalt med alderen og forvrenge IF-signalet, spesielt hos eldre gutter. | Gjenta IF med et antistoff mot en epitop som finnes i transgenet, men som er fraværende i revertant dystrofin. Kvantifiser transgenpositive fibre separat fra revertantfibre. |
Surrogatendepunktets validitet | Pakken blander sammen proteinmengde med klinisk funksjon. "38% av proteinmassen til en frisk kontrollgruppe" betyr ikke 38% av normal dystrofinfunksjon, fordi mikrodystrofin er strukturelt avkortet. | Empirisk validering av forholdet mellom mikrodystrofinmasseprosent, sarkolemmal lokalisering, funksjonell gjenoppretting nedstrøms og klinisk nytte før ekspresjon behandles som et surrogatendepunkt. |
Utforming av biopsi | Biopsier fra den kontralaterale vastus lateralis før og etter behandling viser romlig variasjon mellom venstre og høyre side og intramuskulært. Sykdomsprogresjon og fibro-fettutskiftning kan også endre det totalproteinnormaliserte signalet. | Standardiser biopsiområdet ved hjelp av konsistente anatomiske landemerker, normaliser til muskelspesifikke proteiner, og mål fibro-fettsammensetningen parallelt. |
NSAA-komparator/statistikk | En ekstern naturhistorisk kohort er ikke en randomisert, samtidig kontroll. Deltakelse i studien, støttebehandling, deltagelseseffekter, NSAA ved baseline, steroidregime, alder og eksonklasse kan alle påvirke sammenligningen. En uparet t-test er ikke tilstrekkelig. En endring på +1,4 NSAA ligger også innenfor test-retest-variabiliteten for denne aldersgruppen. | Utfør en randomisert, samtidig placebokontrollert studie, eller bruk som et minimum justerte analyser som tar hensyn til baseline NSAA, alder, steroidregime, eksonklasse og andre konfunderende faktorer. |
Forveksling mellom alder og vindu | Gutter i alderen 4-7 år befinner seg i et utviklingsvindu der ubehandlede, ambulante DMD-pasienter kan få bedre motorisk funksjon før tilbakegangen blir dominerende. En 48-ukers NSAA-endring blander utviklingsgevinst, sykdomsprogresjon og mulig behandlingseffekt. | Bruk en samtidig randomisert kontrollgruppe med aldersstratifisering for å skille utviklingsforløp fra behandlingseffekt. |
Tidligere klinisk presedens | Åpne, funksjonelle signaler om mikrodystrofin har ikke gitt pålitelige prediksjoner av bekreftende fordeler; publisert presedens inkluderer bekreftende studier med genterapi med mikrodystrofin som ikke har klart å reprodusere de åpne NSAA-forbedringene. | Ikke stol på åpen NSAA-endring som avgjørende støtte. Krever kontrollert funksjonell dokumentasjon. |
Konstruksjonens strukturelle grenser | Konstruksjonen på 138 kDa fjerner spektrinrepetisjonene R16/17, som inneholder nNOS-bindingssteder. Tap av nNOS-rekruttering kan svekke funksjonell sympatolyse og iskemibeskyttelse under trening, noe som skaper et mekanistisk tak for redning uavhengig av ekspresjonsnivå. | Legg til mekanistiske studier som viser om denne spesifikke konstruksjonen gjenoppretter relevant dystrofinassosiert kompleksfunksjon, nNOS-lokalisering, treningsfysiologi og muskelbeskyttelse. |
AAV-holdbarhet | Vektorgenomer ved 12 uker etablerer ikke varig uttrykk. AAV9-genomene er i stor grad ikke-integrerende episomer og kan reduseres over tid. Vektor-genompersistens er ikke det samme som persistent proteinuttrykk. | Måle transgenets proteinuttrykk og funksjonelle biomarkørers holdbarhet etter 12 uker. |
Immunitet/sikkerhetsprofil | Transaminitt hos 8/12 pasienter er forenlig med immunrespons på AAV-transduserte celler, men mekanismen er ikke fastslått. Ett tilfelle av myokarditt er bekymringsfullt med tanke på AAV9s hjertetropisme. | Sørg for grundigere immunovervåking, karakterisering av lever- og hjertesikkerhet og intensivert hjerteoppfølging. |
Pasientutvelgelse/generaliserbarhet | Ekskludering av anti-AAV9-nøytraliserende antistoff-positive pasienter begrenser generaliserbarheten. Ekskludering av exon-44-deletjoner begrenser anvendeligheten til denne DMD-undergruppen. n=12 er for lite til å karakterisere sikkerhet og effekt i en bredere DMD-populasjon. | Utvid kvalifiseringen der det er mulig, eller spesifiser på forhånd stratifiserte analyser etter antistoffstatus, genotype/eksonklasse, alder og utgangsfunksjon før resultatet brukes til å støtte bred godkjenning. |
Regulatorisk konklusjon: Pakken kan vise biologisk aktivitet, men det er ennå ikke fastslått at det målte mikro-dystrofinuttrykket er et pålitelig surrogat som med rimelig sannsynlighet kan forutsi klinisk nytte. De største manglene er analysespesifisitet, ugyldige kvantifiseringsstandarder, mulig revertant-fiber-forvirring, mangel på randomisert kontroll, aldersrelatert NSAA-forvirring, usikker holdbarhet og uavklarte spørsmål om sikkerhet/generaliserbarhet.
For å tette gapet trenger programmet et kontrollert, aldersstratifisert klinisk design med transgen-spesifikke ekspresjonsanalyser, ortogonal proteinkvantifisering, kontroller av vevssammensetning, longitudinelle holdbarhetsdata, mekanistiske funksjonelle analyser for den avkortede konstruksjonen og sterkere sikkerhetsovervåking, spesielt av lever og hjerte.
Rubrikkriterier og grader
GPT‑Rosalind oppnår bransjeledende ytelse innen legemiddelkjemi, et felt som fokuserer på å gjøre molekyler til nyttige legemidler. Vi utviklet MedChemBench for å gjenspeile realistiske arbeidsflyter i legemiddelkjemi, med evaluering av multimodal forståelse av kjemiske strukturer, struktur-aktivitetsforhold (SAR), prediksjon av legemiddelpotens, toksisitet og absorpsjon, distribusjon, metabolisme og utskillelse (ADME), beslutningstaking for multiparameter lead-optimalisering og retrosyntese. GPT‑Rosalind overgår GPT‑5.5 med 27,5 % mot 25,1 % på MedChemBench, samtidig som den bruker 7,2 % færre tokener.
GPT‑Rosalind viser bedre multimodal syntese og mekanistisk resonnering innen legemiddelkjemi.
På GeneBench, vår agentiske evaluering av langsiktige ende-til-ende-analyser innen genomikk og kvantitativ biologi, bruker GPT‑Rosalind 31 % færre tokener enn GPT‑5.5, samtidig som den oppnår høyere nøyaktighet: 21,6 % mot 20,4 %. GeneBench vurderer agentisk ytelse på langsiktige kvantitative oppgaver: Basert på realistiske vitenskapelige data, kan en agent planlegge gyldig analyse, QC, modellering og korrigeringer for å komme frem til beslutningsrelevante svar? Oppgavene omfatter en rekke domener, inkludert funksjonell genomikk, spatial transkriptomikk, proteomikk, epigenomikk og anvendt genetikk.
GPT‑Rosalind bruker 31 % færre tokener enn GPT‑5.5, samtidig som nøyaktigheten forbedres.
Vi introduserer en ny evaluering for å teste GPT‑Rosalinds evne til å hjelpe forskere som utfører laboratoriearbeid i den virkelige verden. LabWorkBench tester modellens evne til å koble perturbasjoner til eksperimentelle utfall i reelle våtlaboratorieprotokoller som brukes av forskere, til formål fra feilsøking til optimalisering. Dataene som brukes av LabWorkBench, er proprietære og dermed ukontaminerte. GPT‑Rosalind scorer 63,2 % mot GPT‑5.5s 55,8 %, samtidig som den bruker 5,3 % færre tokener.
For bistand med reelle våtlaboratorieprotokoller viser GPT‑Rosalind betydelige forbedringer sammenlignet med GPT‑5.5, samtidig som tokeneffektiviteten øker.
Vi bygde programtilleggene Life Sciences Research(åpnes i et nytt vindu) og Life Sciences NGS Analysis(åpnes i et nytt vindu) for å utvide den økte intelligensen i GPT‑Rosalind med et praktisk utførelseslag for repeterbare vitenskapelige arbeidsflyter. Sammen bringer disse programtilleggene innhenting av kildestøttet evidens, biologisk tolkning og bioinformatisk utførelse inn i samme arbeidsområde, og hjelper forskere med å koble ekstern evidens til interne omikk-analyser samtidig som artefakter og proveniens bevares. Alle brukere har nå tilgang til begge programtilleggene gjennom Codex. Kvalifiserte bedriftsbrukere av GPT‑Rosalind kan i tillegg bruke GPT‑Rosalind til å drive disse programtilleggene.
For å utnytte Codex bedre som en dynamisk arbeidsbenk for forskere la vi til interaktive visninger for biologisk native filtyper. Det første settet med sekvens-, alignerings- og strukturvisninger er utformet for å holde forskere tett på evidensen mens GPT‑Rosalind resonnerer på tvers av en arbeidsflyt og besvarer oppfølgingsspørsmål direkte med den aktive visningen i kontekst.
Demoen ovenfor viser disse funksjonene i bruk, orkestrert av GPT‑Rosalind. Vi følger en forsker som undersøker en flytende tumorbiopsi for å identifisere mutasjoner og andre molekylære endringer som kan informere behandling. Programtillegget Life Sciences NGS Analysis gjør en gjennomgang av prosesserte ctDNA-registreringer om til en interaktiv notatbok, og løfter frem tilbakevendende endringer, lavfrekvente kall og prøveforløp som fokuserer undersøkelsen på KRAS G12C. Derfra legger programtillegget Life Sciences Research til kildestøttet kontekst om mål, inhibitorer og resistens, mens de native sekvens-, alignerings- og strukturvisningene lar forskeren inspisere mutantrest 12, dens bevaring på tvers av RAS-familien og den inhibitorbundne lommen direkte. Arbeidsflyten avsluttes ved å oversette denne evidensen til konkrete oppfølgingsalternativer, der hvert trinn og artefakt er tilgjengelig for ekspertgjennomgang.

Life Sciences NGS Analysis-programtillegg
scRNA-seq-QC og annotering

Gjør en 10x-lignende matrise-pakke om til QC-filtrerte enkeltcelleartefakter, annoteringer og UMAP-er som du kan inspisere og revidere i Codex. Programtillegget Life Sciences NGS Analysis ruter forespørselen til scrna-seq-qc, velger QC-terskler fra dataene, bevarer proveniens rundt filtrering og annotering og synliggjør blokkeringer som manglende avhengigheter for doublet-deteksjon.
Bulk RNA-seq FASTQ-QC

Gjør et bulk RNA-seq-prøveark, en FASTQ-pakke og referansefiler om til en QC-gjennomgått tellepakke som du kan inspisere og gjenbruke i Codex. Programtillegget Life Sciences NGS Analysis ruter forespørselen, validerer inndataene og returnerer en reviderbar kjøringspakke med MultiQC, Salmon-matriser, proveniens og eksplisitte forbehold.
Vi utvider tilgangen til GPT‑Rosalind-serien for kvalifiserte organisasjoner globalt. GPT‑Rosalind blir tilgjengelig som forskningsforhåndsvisning gjennom vår distribusjonsstruktur for betrodd tilgang for organisasjoner som driver legitim vitenskapelig forskning med tydelig allmennyttig formål, har sterk styring og sikkerhetstilsyn samt kontrollert tilgang med sikkerhet på bedriftsnivå.
Som en del av denne globale utvidelsen er vi glade for å bidra til å støtte Novo Nordisks oppdrag om å gi pasienter innovative behandlingsalternativer raskere ved å hjelpe dem med å skalere medisinsk forskning med GPT‑Rosalind. Novo Nordisk utnytter avanserte KI-kapasiteter for å hjelpe forskere med å analysere komplekse datasett, avdekke nyttige mønstre og teste hypoteser raskere. GPT‑Rosalinds sterkere biologiske forståelse vil hjelpe team med å koble evidens på tvers av litteratur, genomikk, transkriptomikk, sekvens, struktur og eksperimentelle resultater, noe som gjør det enklere å gå fra data til klarere forskningsbeslutninger.
«Livsvitenskapelig forskning er kompleks, datarik og tverrfaglig. For å levere meningsfull verdi for forskere må avanserte KI-modeller være forankret i pålitelige vitenskapelige data, koblet til validerte verktøy og integrert i de virkelige arbeidsflytene forskere bruker hver dag. Vi er fornøyde med partnerskapet vårt med OpenAI og muligheten til å utforske hvordan GPT‑Rosalind kan støtte mer robuste og praktiske tilnærminger til legemiddelutvikling.»
Mishal Patel, Group Vice President, AI & Digital Innovation, R&D – Novo Nordisk
Vi tilbyr nå også et OpenAI-administrert arbeidsområde for kvalifiserte organisasjoner uten Enterprise-konto.
Den oppdaterte GPT‑Rosalind er neste steg i vårt bredere engasjement for å bygge KI-systemer som kan bidra til å akselerere vitenskapelige oppdagelser, samtidig som avanserte biologiske kapasiteter distribueres med egnede sikkerhetstiltak. Vi vil fortsette å forbedre modellens biologiske resonnering, utvide støtten for verktøytunge og langsiktige forskningsarbeidsflyter og samarbeide med kvalifiserte organisasjoner på tvers av regioner for å evaluere reell effekt.
Dette betyr også å bruke KI for livsvitenskap på allmennyttig arbeid med høy effekt, fra legemiddelutvikling og translasjonsmedisin til folkehelse, beredskap og bioforsvar. Gjennom Rosalind Biodefense og vår distribusjonsmodell for betrodd tilgang har vi som mål å legge avanserte biologiske kapasiteter i hendene på forskerne, institusjonene og forsvarerne som arbeider for å forbedre menneskers helse og styrke samfunnets motstandsdyktighet.
Vi vil fortsette å bygge GPT‑Rosalind til å bli en mer kapabel partner gjennom hele livssyklusen for vitenskapelig forskning, slik at forskere raskere kan gå fra de riktige spørsmålene til klarere evidens, bedre eksperimenter og til slutt nye behandlinger for pasienter.


