Gå direkt till huvudinnehåll
OpenAI

Vi introducerar nya funktioner i GPT‑Rosalind

Större intelligens grundad i verkliga vetenskapliga arbetsflöden för life sciences-branschen.

Vi introducerar en ny modelluppdatering i vår GPT‑Rosalind-serie, specialbyggd för forskning inom life sciences i företagsomfattning. Den kombinerar GPT‑5.5:s funktioner för agentbaserad kodning och verktygsanvändning med starkare modellintelligens inom centrala områden för läkemedelsutveckling, såsom läkemedelskemi och genomik, samtidigt som prestandan förbättras inom bredare analys, design och experimentella arbetsflöden för life sciences.

Framsteg inom life sciences beror på att data och evidens syntetiseras över skalor och modaliteter: molekyler, gener, signalvägar och levande system. I våra utvärderingar visar den uppdaterade GPT‑Rosalind breda prestandaförbättringar på forskningsuppgifter från biologiexperter, komplexa frågor inom läkemedelskemi, kvantitativ biologi och felsökning i våtlabb.

GPT‑Rosalind är nu tillgänglig som forskningsförhandsversion för berättigade organisationer globalt via vår distributionsstruktur med betrodd åtkomst.

Förbättrad prestanda på vetenskapligt värdefulla uppgifter

För att mäta och kontinuerligt förbättra GPT‑Rosalinds verkliga genomslag utformade vi LifeSciBench, ett riktmärke bedömt av externa experter och fokuserat på grundläggande aspekter av forskning inom life sciences. Till skillnad från befintliga riktmärken som utvärderar en enskild komponent av modellprestanda eller biologisk domän isolerat tar LifeSciBench ett helhetsperspektiv på vetenskapligt värdefullt arbete genom att hämta uppgifter från sex arbetsflödesområden som är centrala för forskning inom life sciences: evidenshantering, analys, design och optimering, vetenskapligt resonemang, validering och drift samt översättning och kommunikation. Vi använder detta riktmärke för att anpassa framsteg till behoven och verkligheten inom forskning i life sciences.

GPT‑Rosalind leder prestandan inom vetenskapligt värdefulla uppgifter som identifierats av experter från industri och akademi.

Extrahera, sammanjämka och granska vetenskaplig evidens från artiklar, figurer, tabeller och experimentella journaler.

Utv. exempel

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Kandidatens svar

Slutsats: Som det presenteras är detta paket inte tillräckligt starkt för att stödja accelererat godkännande baserat på mikrodystrofinuttryck som en surrogatslutpunkt som rimligen sannolikt förutsäger klinisk nytta. En skeptisk FDA-granskare skulle sannolikt bedöma evidensen för biomarkör, funktion, hållbarhet, säkerhet och generaliserbarhet som väsentligt otillräcklig.

Paketpost

Viktigt felläge

Vad som skulle behövas

Western blot-kvantifiering

MANEX1A binder en N-terminal epitop som delas av endogent fullängdsdystrofin och mikrodystrofintransgenen, så analysen skiljer inte rent transgen från residualt/revertant dystrofin. Att kvantifiera ett 138 kDa mikrodystrofin mot en frisk fullängdsdystrofinstandard är också ogiltigt.

Använd en rekombinant mikrodystrofinstandard och en ortogonal metod som skiljer transgen från endogent dystrofin, såsom riktad masspektrometri eller en transgenspecifik/epitopspecifik analys.

Immunofluorescens

Den C-terminala polyklonala antikroppen är dåligt lämpad eftersom 138 kDa-konstrukten saknar den C-terminala domänen. Många DMD-patienter har revertanta fibrer, och revertant dystrofin kan behålla C-terminala epitoper. Revertanta fibrer kan expandera klonalt med åldern och snedvrida IF-signalen, särskilt hos äldre pojkar.

Upprepa IF med en antikropp mot en epitop som finns i transgenen men saknas i revertant dystrofin. Kvantifiera transgenpositiva fibrer separat från revertanta fibrer.

Surrogatslutpunktens giltighet

Paketet blandar ihop proteinmängd med klinisk funktion. ”38 % av frisk kontrollproteinmassa” betyder inte 38 % av normal dystrofinfunktion, eftersom mikrodystrofin är strukturellt trunkerat.

Validera empiriskt sambandet mellan massprocent mikrodystrofin, sarkolemmal lokalisering, nedströms funktionell återställning och klinisk nytta innan uttryck behandlas som en surrogatslutpunkt.

Biopsidesign

Kontralaterala vastus lateralis-biopsier före och efter behandling introducerar vänster–höger- och intramuskulär spatial variabilitet. Sjukdomsprogression och fibro-fettig ersättning kan också förändra signal normaliserad mot totalprotein.

Standardisera biopsistället med konsekventa anatomiska landmärken, normalisera mot muskelspecifika proteiner och mät fibro-fettig sammansättning parallellt.

NSAA-jämförelse/statistik

En extern naturalförloppskohort är inte en randomiserad samtidig kontroll. Studiebehörighet, stödjande vård, deltagareffekter, baslinje-NSAA, steroidregim, ålder och exonklass kan alla snedvrida jämförelsen. Ett oparat t-test är inte tillräckligt. Dessutom ligger en NSAA-förändring på +1,4 inom test–retest-variabiliteten för denna åldersgrupp.

Genomför en randomiserad samtidig placebokontrollerad studie, eller använd åtminstone justerade analyser som tar hänsyn till baslinje-NSAA, ålder, steroidregim, exonklass och andra confounders.

Confounding av åldersfönster

Pojkar i åldern 4–7 befinner sig i ett utvecklingsfönster där obehandlade ambulanta DMD-patienter kan få bättre motorisk funktion innan försämringen dominerar. En 48-veckors NSAA-förändring blandar utvecklingsvinst, sjukdomsprogression och möjlig behandlingseffekt.

Använd en samtidig randomiserad kontroll med åldersstratifiering för att separera utvecklingsbana från behandlingseffekt.

Tidigare kliniskt prejudikat

Öppna funktionella signaler för mikrodystrofin har inte tillförlitligt förutsagt bekräftande nytta; publicerat prejudikat omfattar bekräftande prövningar av mikrodystrofin-genterapi som inte lyckats reproducera öppna NSAA-förbättringar.

Förlita dig inte på öppen NSAA-förändring som avgörande stöd. Kräv kontrollerad funktionell evidens.

Konstruktens strukturella begränsningar

138 kDa-konstrukten tar bort spektrinrepeats R16/17, som innehåller nNOS-bindningsställen. Förlust av nNOS-rekrytering kan försämra funktionell sympatolys och ischemiskt skydd under träning, vilket skapar ett mekanistiskt tak för räddning oberoende av uttrycksnivå.

Lägg till mekanistiska studier som visar om just denna konstrukt återställer relevant funktion i det dystrofinassocierade komplexet, nNOS-lokalisering, träningsfysiologi och muskelskydd.

AAV-hållbarhet

Vektorgenom vid 12 veckor fastställer inte hållbart uttryck. AAV9-genom är till stor del icke-integrerande episomer och kan minska över tid. Vektorgenompersistens är inte samma sak som bestående proteinuttryck.

Mät longitudinellt transgent proteinuttryck och hållbarhet hos funktionella biomarkörer bortom 12 veckor.

Immun-/säkerhetsprofil

Transaminit hos 8/12 patienter överensstämmer med immunsvar mot AAV-transducerade celler, men mekanismen är inte fastställd. Ett fall av myokardit är oroande med tanke på AAV9:s hjärttropism.

Tillhandahåll djupare immunövervakning, karakterisering av lever-/hjärtsäkerhet och intensifierad hjärtuppföljning.

Patienturval/generaliserbarhet

Att exkludera patienter positiva för neutraliserande anti-AAV9-antikroppar begränsar generaliserbarheten. Att exkludera exon-44-deletioner begränsar tillämpligheten på den DMD-undergruppen. n=12 är för litet för att karakterisera säkerhet och effekt i den bredare DMD-populationen.

Bredda behörigheten där det är möjligt eller förhandspecificera stratifierade analyser efter antikroppsstatus, genotyp/exonklass, ålder och baslinjefunktion innan resultatet används för att stödja brett godkännande.

Regulatorisk slutsats: Paketet kan visa biologisk aktivitet, men det fastställer ännu inte att det uppmätta mikrodystrofinuttrycket är ett tillförlitligt surrogat som rimligen sannolikt förutsäger klinisk nytta. De huvudsakliga luckorna är analysspecificitet, ogiltiga kvantifieringsstandarder, möjlig confounding från revertanta fibrer, avsaknad av randomiserad kontroll, åldersrelaterad NSAA-confounding, osäker hållbarhet och olösta säkerhets-/generaliserbarhetsfrågor.

För att stänga luckan skulle programmet behöva en kontrollerad, åldersstratifierad klinisk design med transgenspecifika uttrycksanalyser, ortogonal proteinkvantifiering, kontroller för vävnadssammansättning, longitudinella hållbarhetsdata, mekanistiska funktionella analyser för den trunkerade konstrukten och starkare säkerhetsövervakning, särskilt hepatisk och kardiell.

Rubrikkriterier och betyg

Kriterium
Poäng
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Starkare vetenskapligt resonemang

Läkemedelskemi

GPT‑Rosalind uppnår branschledande prestanda inom läkemedelskemi, ett fält som fokuserar på att omvandla molekyler till användbara läkemedel. Vi utformade MedChemBench för att spegla realistiska arbetsflöden inom läkemedelskemi och utvärdera multimodal förståelse av kemiska strukturer, struktur–aktivitetsrelationer (SAR), prediktion av läkemedelspotens, toxicitet och absorption, distribution, metabolism och exkretion (ADME), beslutsfattande för multiparametrisk lead-optimering samt retrosyntes. GPT‑Rosalind överträffar GPT‑5.5 med 27,5 % mot 25,1 % på MedChemBench, samtidigt som den använder 7,2 % färre token.

GPT‑Rosalind visar bättre multimodal syntes och mekanistiskt resonemang inom läkemedelskemi.

Genomik och kvantitativ biologi

På GeneBench, vår agentbaserade utvärdering av långsiktig helhetsanalys inom genomik och kvantitativ biologi, använder GPT‑Rosalind 31 % färre token än GPT‑5.5 samtidigt som den uppnår högre noggrannhet: 21,6 % mot 20,4 %. GeneBench bedömer agentbaserad prestanda på långsiktiga kvantitativa uppgifter: utifrån realistiska vetenskapliga data, kan en Agent planera giltig analys, QC, modellering och korrigeringar för att komma fram till beslutsrelevanta svar? De inkluderade problemen spänner över flera domäner, bland annat funktionell genomik, spatial transkriptomik, proteomik, epigenomik och tillämpad genetik.

GPT‑Rosalind använder 31 % färre token än GPT‑5.5 samtidigt som noggrannheten förbättras.

Stöd för verkligt laboratoriearbete

Vi introducerar en ny utvärdering för att testa GPT‑Rosalinds förmåga att hjälpa forskare som utför laboratoriearbete i verkligheten. LabWorkBench testar modellens förmåga att koppla störningar till experimentella utfall i verkliga våtlabbsprotokoll som används av forskare, för syften som sträcker sig från felsökning till optimering. De data som används av LabWorkBench är proprietära och därmed okontaminerade. GPT‑Rosalind får 63,2 % jämfört med GPT‑5.5:s 55,8 %, samtidigt som den använder 5,3 % färre token.

Vid stöd för verkliga våtlabbsprotokoll visar GPT‑Rosalind betydande förbättringar jämfört med GPT‑5.5 och högre tokeneffektivitet.

Från resonemang till körda arbetsflöden

Vi byggde pluginerna Life Sciences Research(öppnas i ett nytt fönster) och Life Sciences NGS Analysis(öppnas i ett nytt fönster) för att utöka den ökade intelligensen hos GPT‑Rosalind med ett praktiskt exekveringslager för repeterbara vetenskapliga arbetsflöden. Tillsammans för dessa pluginer in evidenshämtning med källor, biologisk tolkning och bioinformatisk exekvering i samma arbetsyta, vilket hjälper forskare att koppla extern evidens till interna omik-analyser samtidigt som artefakter och proveniens bevaras. Alla användare kan nu komma åt båda pluginerna via Codex. Kvalificerade företagsanvändare av GPT‑Rosalind kan dessutom använda GPT‑Rosalind för att driva dessa pluginer.

För att bättre utnyttja Codex som en dynamisk arbetsbänk för forskare har vi lagt till interaktiva visare för biologiskt inhemska filtyper. Den första uppsättningen visare för sekvenser, alignment och strukturer är utformad för att hålla forskare nära evidensen när GPT‑Rosalind resonerar över ett arbetsflöde och direkt besvarar följdfrågor med den aktiva visaren i kontext.

Demon ovan visar dessa funktioner i praktiken, orkestrerade av GPT‑Rosalind. Vi följer en forskare som undersöker en vätskebiopsi av en tumör för att identifiera mutationer och andra molekylära förändringar som kan vägleda behandling. Pluginen Life Sciences NGS Analysis omvandlar en granskning av bearbetade ctDNA-poster till en interaktiv notebook, lyfter fram återkommande förändringar, lågfrekventa anrop och provtrajektorier som fokuserar undersökningen på KRAS G12C. Därifrån lägger pluginen Life Sciences Research till källbelagd kontext om mål, inhibitorer och resistens, medan de inbyggda visarna för sekvens, alignment och struktur låter forskaren inspektera mutantrest 12, dess konservering över RAS-familjen och den inhibitorbundna fickan direkt. Arbetsflödet avslutas med att översätta denna evidens till konkreta uppföljningsalternativ, med varje steg och artefakt tillgängliga för expertgranskning.

En datorskärm visar en arbetsyta som instruerar användning av en NGS Analysis-plugin för att utforska ctDNA-mutationsdata. Skärmen innehåller flera stapeldiagram märkta ”Top detailed histologies” och ”Top altered genes by mutated cfDNA samples”, som visar data om cancertyper och genförändringar. Text beskriver datamängden, viktiga fynd och analysparametrar.

Life Sciences NGS Analysis-plugin

scRNA-seq-QC och annotering

Skärmbild av ett bioinformatiskt arbetsflöde med delad skärm. Den vänstra panelen visar en AI-assistent som sammanfattar en slutförd kvalitetskontrollanalys av encells-RNA-sekvensering (scRNA-seq), inklusive genererade filer, QC-mått, UMAP-visualiseringar och celltypsannoteringar. Den högra panelen visar en rapport med titeln ”scRNA QC Review” med histogram för totala räkningar, detekterade gener och mitokondrieprocent, tillsammans med stapeldiagram som visar antal godkända/underkända QC och filtrerade cellpopulationer. Gränssnittet visas mot en blågrön tonad bakgrund.

Omvandla ett matrispaket i 10x-stil till QC-filtrerade encellsartefakter, annoteringar och UMAP:er som du kan inspektera och revidera i Codex. Pluginen Life Sciences NGS Analysis dirigerar begäran till scrna-seq-qc, väljer QC-trösklar från data, bevarar proveniens kring filtrering och annotering och lyfter fram hinder som saknade beroenden för dubbeltdetektion.

Bulk-RNA-seq FASTQ-QC

Delad skärmvy av ett RNA-seq-arbetsflöde: en AI-assistent sammanfattar slutförda kvalitetskontrollresultat för bulk-RNA-seq till vänster, medan en interaktiv MultiQC-rapport med sekvenseringsstatistik och Salmon-mått visas till höger.

Omvandla ett provblad för bulk-RNA-seq, ett FASTQ-paket och referensfiler till ett QC-granskat räknepaket som du kan inspektera och återanvända i Codex. Pluginen Life Sciences NGS Analysis dirigerar begäran, validerar indata och returnerar ett granskningsbart körningshölje med MultiQC, Salmon-matriser, proveniens och uttryckliga förbehåll.

Utökad åtkomst för betrodda organisationer

Vi utökar åtkomsten till GPT‑Rosalind-serien för berättigade organisationer globalt. GPT‑Rosalind blir tillgänglig som forskningsförhandsversion via vår distributionsstruktur med betrodd åtkomst för organisationer som bedriver legitim vetenskaplig forskning med tydlig samhällsnytta, har stark styrning och säkerhetstillsyn samt kontrollerad åtkomst med säkerhet på företagsnivå.

Som en del av denna globala expansion är vi glada över att stödja Novo Nordisks uppdrag att snabbare ge patienter innovativa behandlingsalternativ genom att hjälpa dem skala upp sin medicinska forskning med GPT‑Rosalind. Novo Nordisk utnyttjar avancerade AI-funktioner för att hjälpa forskare analysera komplexa datamängder, upptäcka användbara mönster och testa hypoteser snabbare. GPT‑Rosalinds starkare biologiska förståelse hjälper team att koppla evidens mellan litteratur, genomik, transkriptomik, sekvens, struktur och experimentella resultat, vilket gör det enklare att gå från data till tydligare forskningsbeslut.

”Forskning inom life sciences är komplex, datarik och tvärvetenskaplig. För att leverera meningsfullt värde till forskare måste avancerade AI-modeller vara grundade i betrodda vetenskapliga data, kopplade till validerade verktyg och integrerade i de verkliga arbetsflöden som forskare använder varje dag. Vi är glada över vårt partnerskap med OpenAI och möjligheten att utforska hur GPT‑Rosalind kan stödja mer rigorösa och praktiska angreppssätt för läkemedelsutveckling.”

Mishal Patel, Group Vice President, AI & Digital Innovation, R&D – Novo Nordisk

Vi erbjuder nu också en OpenAI-hanterad arbetsyta för kvalificerade organisationer utan Enterprise-konto.

Nästa steg

Den uppdaterade GPT‑Rosalind är nästa steg i vårt bredare åtagande att bygga AI-system som kan hjälpa till att påskynda vetenskapliga upptäckter, samtidigt som avancerade biologiska förmågor distribueras med lämpliga skyddsåtgärder. Vi kommer att fortsätta förbättra modellens biologiska resonemang, utöka stödet för verktygstunga och långsiktiga forskningsarbetsflöden och arbeta med kvalificerade organisationer i olika regioner för att utvärdera verklig effekt.

Det innebär också att tillämpa AI för life sciences på arbete med stor samhällsnytta, från läkemedelsutveckling och translationell medicin till folkhälsa, beredskap och biologiskt försvar. Genom Rosalind Biodefense och vår distributionsmodell med betrodd åtkomst vill vi lägga avancerade biologiska förmågor i händerna på de forskare, institutioner och försvarare som arbetar för att förbättra människors hälsa och stärka samhällets motståndskraft.

Vi kommer att fortsätta bygga GPT‑Rosalind till en mer kapabel partner genom hela livscykeln för vetenskaplig forskning, som hjälper forskare att snabbare gå från rätt frågor till tydligare evidens, bättre experiment och i slutändan nya behandlingar för patienter.