Overslaan naar hoofdinhoud
OpenAI

Nieuwe mogelijkheden voor GPT‑Rosalind

Meer intelligentie, verankerd in echte wetenschappelijke workflows voor de life-sciencessector.

We introduceren een nieuwe modelupdate voor onze GPT‑Rosalind-serie, speciaal ontwikkeld voor life-sciencesonderzoek op ondernemingsschaal. Deze combineert de mogelijkheden van GPT‑5.5 voor agentic programmeren en toolgebruik met sterkere modelintelligentie in kerndomeinen van geneesmiddelenonderzoek, zoals medicinale chemie en genomica, en verbetert de prestaties in bredere analyse-, ontwerp- en experimentele workflows binnen de life sciences.

Vooruitgang in de life sciences hangt af van het samenbrengen van data en bewijs over verschillende schalen en modaliteiten heen: moleculen, genen, biologische pathways en levende systemen. In onze evaluaties laat de bijgewerkte GPT‑Rosalind brede prestatieverbeteringen zien bij onderzoekstaken van biologie-experts, complexe vragen in medicinale chemie, kwantitatieve biologie en probleemoplossing in het natte lab.

GPT‑Rosalind is nu wereldwijd als onderzoeks-preview beschikbaar voor in aanmerking komende organisaties via onze implementatiestructuur met vertrouwde toegang.

Betere prestaties op wetenschappelijk waardevolle taken

Om de impact van GPT‑Rosalind in de praktijk te meten en voortdurend te verbeteren, hebben we LifeSciBench ontworpen, een benchmark die extern door experts wordt beoordeeld en gericht is op fundamentele aspecten van life-sciencesonderzoek. In tegenstelling tot bestaande benchmarks die één onderdeel van modelprestaties of een biologisch domein afzonderlijk beoordelen, kijkt LifeSciBench end-to-end naar wetenschappelijk waardevol werk met taken uit zes workflowgebieden die centraal staan in life-sciencesonderzoek: bewijsverwerking, analyse, ontwerp en optimalisatie, wetenschappelijke redenering, validatie en operaties, en vertaling en communicatie. We gebruiken deze benchmark om vooruitgang af te stemmen op de behoeften en realiteit van life-sciencesonderzoek.

GPT‑Rosalind levert topprestaties op wetenschappelijk waardevolle taken die door experts uit industrie en academische wereld zijn geïdentificeerd.

Wetenschappelijk bewijs uit papers, figuren, tabellen en experimentele dossiers extraheren, afstemmen en auditen.

Voorbeeld van evaluatie

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Reactie van kandidaat

Kortom: zoals gepresenteerd is dit pakket niet sterk genoeg om versnelde goedkeuring te ondersteunen op basis van micro-dystrofine-expressie als surrogaateindpunt dat redelijkerwijs waarschijnlijk klinisch voordeel voorspelt. Een sceptische FDA-beoordelaar zou het bewijs voor biomarker, functie, duurzaamheid, veiligheid en generaliseerbaarheid waarschijnlijk als materieel onvoldoende onderbouwd zien.

Pakketonderdeel

Belangrijkste faalmodus

Wat nodig zou zijn

Western-blotkwantificatie

MANEX1A bindt een N-terminaal epitoop dat wordt gedeeld door endogeen volledig dystrofine en het micro-dystrofine-transgen, waardoor de assay transgen niet zuiver onderscheidt van residueel/revertant dystrofine. Kwantificatie van een 138 kDa micro-dystrofine tegenover een gezonde volledig-dystrofine-standaard is ook ongeldig.

Gebruik een recombinante micro-dystrofine-standaard en een orthogonale methode die transgen van endogeen dystrofine onderscheidt, zoals gerichte massaspectrometrie of een transgen-specifieke/epitoop-specifieke assay.

Immunofluorescentie

Het C-terminale polyklonale antilichaam is slecht geschikt omdat het 138 kDa-construct het C-terminale domein mist. Veel DMD-patiënten hebben revertante vezels, en revertant dystrofine kan C-terminale epitopen behouden. Revertante vezels kunnen met de leeftijd klonaal uitbreiden, waardoor IF-signaal wordt vertekend, vooral bij oudere jongens.

Herhaal IF met een antilichaam tegen een epitoop dat aanwezig is in het transgen maar afwezig is in revertant dystrofine. Kwantificeer transgen-positieve vezels apart van revertante vezels.

Validiteit van surrogaateindpunt

Het pakket vermengt eiwithoeveelheid met klinische functie. '38% van de eiwitmassa van gezonde controles' betekent niet 38% van de normale dystrofinefunctie, omdat micro-dystrofine structureel verkort is.

Valideer empirisch de relatie tussen micro-dystrofine-massapercentage, sarcolemmale lokalisatie, downstream functioneel herstel en klinisch voordeel voordat expressie als surrogaateindpunt wordt behandeld.

Biopsieontwerp

Contralaterale vastus-lateralisbiopten vóór en na behandeling introduceren links-rechts- en intramusculaire ruimtelijke variabiliteit. Ziekteprogressie en fibro-vettige vervanging kunnen ook het op totaal eiwit genormaliseerde signaal veranderen.

Standaardiseer de biopsielocatie met consistente anatomische herkenningspunten, normaliseer op spierspecifieke eiwitten en meet fibro-vettige samenstelling parallel.

NSAA-comparator/statistiek

Een extern natural-history-cohort is geen gerandomiseerde gelijktijdige controle. Geschiktheid voor de trial, ondersteunende zorg, participatie-effecten, baseline-NSAA, steroïdregime, leeftijd en exonklasse kunnen de vergelijking allemaal vertekenen. Een ongepaarde t-test is niet voldoende. Ook ligt een +1,4 NSAA-verandering binnen de test-hertestvariabiliteit voor deze leeftijdsgroep.

Voer een gerandomiseerde gelijktijdige placebogecontroleerde studie uit, of gebruik minimaal aangepaste analyses die rekening houden met baseline-NSAA, leeftijd, steroïdregime, exonklasse en andere confounders.

Confounding door leeftijdsvenster

Jongens van 4–7 jaar bevinden zich in een ontwikkelingsvenster waarin onbehandelde ambulante DMD-patiënten motorische functie kunnen winnen voordat achteruitgang domineert. Een NSAA-verandering over 48 weken mengt ontwikkelingswinst, ziekteprogressie en mogelijk behandelingseffect.

Gebruik een gelijktijdige gerandomiseerde controle met leeftijdsstratificatie om het ontwikkelingstraject van het behandelingseffect te scheiden.

Eerder klinisch precedent

Open-label functionele signalen van micro-dystrofine hebben bevestigend voordeel niet betrouwbaar voorspeld; gepubliceerd precedent omvat bevestigende trials voor micro-dystrofine-gentherapie die open-label NSAA-verbeteringen niet konden reproduceren.

Vertrouw niet op open-label NSAA-verandering als doorslaggevende ondersteuning. Vereis gecontroleerd functioneel bewijs.

Structurele grenzen van het construct

Het 138 kDa-construct verwijdert spectrin repeats R16/17, die nNOS-bindingsplaatsen bevatten. Verlies van nNOS-rekrutering kan functionele sympatholyse en ischemiebescherming tijdens inspanning verminderen, waardoor een mechanistisch plafond op rescue ontstaat dat onafhankelijk is van expressieniveau.

Voeg mechanistische studies toe die laten zien of dit specifieke construct relevante functie van het dystrofine-geassocieerde complex, nNOS-lokalisatie, inspanningsfysiologie en spierbescherming herstelt.

AAV-duurzaamheid

Vectorgenomen na 12 weken tonen geen duurzame expressie aan. AAV9-genomen zijn grotendeels niet-integrerende episomen en kunnen in de tijd afnemen. Persistentie van vectorgenomen is niet hetzelfde als persistente eiwitexpressie.

Meet longitudinale transgen-eiwitexpressie en duurzaamheid van functionele biomarkers voorbij 12 weken.

Immuun-/veiligheidsprofiel

Transaminitis bij 8/12 patiënten past bij een immuunrespons op AAV-getransduceerde cellen, maar het mechanisme is niet vastgesteld. Eén geval van myocarditis is zorgwekkend gezien het cardiale tropisme van AAV9.

Lever diepere immuunmonitoring, karakterisering van lever-/cardiale veiligheid en geïntensiveerde cardiale follow-up.

Patiëntselectie/generaliseerbaarheid

Het uitsluiten van anti-AAV9-neutraliserende-antilichaam-positieve patiënten beperkt de generaliseerbaarheid. Het uitsluiten van exon-44-deleties beperkt de toepasbaarheid op die DMD-subgroep. n=12 is te klein om veiligheid en werkzaamheid in de bredere DMD-populatie te karakteriseren.

Verbreed de geschiktheid waar mogelijk of specificeer vooraf gestratificeerde analyses op antilichaamstatus, genotype/exonklasse, leeftijd en baselinefunctie voordat het resultaat wordt gebruikt ter ondersteuning van brede goedkeuring.

Regulatoire conclusie: Het pakket kan biologische activiteit tonen, maar bewijst nog niet dat de gemeten micro-dystrofine-expressie een betrouwbaar surrogaat is dat redelijkerwijs waarschijnlijk klinisch voordeel voorspelt. De belangrijkste hiaten zijn assayspecificiteit, ongeldige kwantificatiestandaarden, mogelijke confounding door revertante vezels, gebrek aan een gerandomiseerde controle, leeftijdsgerelateerde NSAA-confounding, onzekere duurzaamheid en onopgeloste veiligheids-/generaliseerbaarheidskwesties.

Om de kloof te dichten heeft het programma een gecontroleerd, leeftijdsgestratificeerd klinisch ontwerp nodig met transgen-specifieke expressieassays, orthogonale eiwitkwantificatie, controles voor weefselsamenstelling, longitudinale duurzaamheidsdata, mechanistische functionele assays voor het verkorte construct en sterkere veiligheidsmonitoring, vooral hepatisch en cardiaal.

Criteria en beoordelingen van rubric

Criterium
Punten
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Sterkere wetenschappelijke redenering

Medicinale chemie

GPT‑Rosalind behaalt toonaangevende prestaties in de medicinale chemie, een vakgebied dat zich richt op het omzetten van moleculen in bruikbare geneesmiddelen. We hebben MedChemBench ontworpen om realistische workflows in medicinale chemie te weerspiegelen, met evaluatie van multimodaal begrip van chemische structuren; structuur-activiteitsrelaties (SAR); voorspelling van geneesmiddelpotentie, toxiciteit en absorptie, distributie, metabolisme en excretie (ADME); multiparameterbesluitvorming voor lead-optimalisatie; en retrosynthese. GPT‑Rosalind presteert beter dan GPT‑5.5 op MedChemBench, met 27,5% tegenover 25,1%, terwijl het 7,2% minder tokens gebruikt.

GPT‑Rosalind laat betere multimodale synthese en mechanistische redenering zien in de medicinale chemie.

Genomica en kwantitatieve biologie

Op GeneBench, onze agentic evaluatie voor end-to-endanalyse over een lange horizon in genomica en kwantitatieve biologie, gebruikt GPT‑Rosalind 31% minder tokens dan GPT‑5.5 en behaalt het een hogere nauwkeurigheid van 21,6% tegenover 20,4%. GeneBench beoordeelt agentic prestaties op kwantitatieve taken met een lange horizon: kan een agent, op basis van realistische wetenschappelijke data, geldige analyse, QC, modellering en correcties plannen om tot besluitrelevante antwoorden te komen? De opgenomen problemen bestrijken uiteenlopende domeinen, waaronder functionele genomica, ruimtelijke transcriptomica, proteomica, epigenomica en toegepaste genetica.

GPT‑Rosalind gebruikt 31% minder tokens dan GPT‑5.5 en verbetert tegelijk de nauwkeurigheid.

Ondersteuning van echt labwerk

We introduceren een nieuwe evaluatie om te testen hoe goed GPT‑Rosalind wetenschappers kan helpen die in de praktijk labwerk uitvoeren. LabWorkBench test het vermogen van het model om verstoringen te koppelen aan experimentele uitkomsten in echte natte-labprotocollen die door wetenschappers worden gebruikt, voor doelen van probleemoplossing tot optimalisatie. De data die LabWorkBench gebruikt zijn bedrijfseigen en daarom niet door trainingsdata gecontamineerd. GPT‑Rosalind scoort 63,2% tegenover 55,8% voor GPT‑5.5, terwijl het 5,3% minder tokens gebruikt.

Bij hulp met echte natte-labprotocollen laat GPT‑Rosalind aanzienlijke verbeteringen zien ten opzichte van GPT‑5.5, met een betere tokenefficiëntie.

Van redenering naar uitgevoerde workflows

We hebben de plug-ins Life Sciences Research(opent in een nieuw venster) en Life Sciences NGS Analysis(opent in een nieuw venster) gebouwd om de toegenomen intelligentie van GPT‑Rosalind uit te breiden met een praktische uitvoeringslaag voor herhaalbare wetenschappelijke workflows. Samen brengen deze plug-ins bewijsopvraging met bronnen, biologische interpretatie en bio-informatische uitvoering samen in dezelfde werkruimte, zodat onderzoekers extern bewijs kunnen verbinden met interne omics-analyses en tegelijk artefacten en herkomst behouden. Alle gebruikers hebben nu via Codex toegang tot beide plug-ins. Gekwalificeerde enterprisegebruikers van GPT‑Rosalind kunnen daarnaast GPT‑Rosalind gebruiken om deze plug-ins aan te sturen.

Om Codex beter te benutten als dynamische werkbank voor wetenschappers, hebben we interactieve viewers toegevoegd voor biologisch native bestandstypen. De eerste reeks sequence-, alignment- en structure-viewers is ontworpen om wetenschappers dicht bij het bewijs te houden terwijl GPT‑Rosalind door een workflow redeneert en vervolgvragen rechtstreeks beantwoordt met de actieve viewer in context.

De demo hierboven toont deze mogelijkheden in actie, georkestreerd door GPT‑Rosalind. We volgen een wetenschapper die een liquid biopsy van een tumor onderzoekt om mutaties en andere moleculaire veranderingen te identificeren die richting kunnen geven aan de behandeling. De Life Sciences NGS Analysis-plug-in zet een review van verwerkte ctDNA-gegevens om in een interactief notebook en brengt terugkerende afwijkingen, laagfrequente calls en monstertrajecten naar voren, waardoor het onderzoek zich richt op KRAS G12C. Vervolgens voegt de Life Sciences Research-plug-in brongebonden context over target, remmers en resistentie toe, terwijl de native sequence-, alignment- en structure-viewers de wetenschapper in staat stellen mutant residu 12, de conservering ervan binnen de RAS-familie en de remmergebonden pocket direct te inspecteren. De workflow eindigt met het vertalen van dat bewijs naar concrete vervolgopties, waarbij elke stap en elk artefact beschikbaar is voor expertbeoordeling.

Een computerscherm toont een werkruimte met instructies om een NGS Analysis-plug-in te gebruiken om ctDNA-mutatiegegevens te verkennen. Het scherm bevat meerdere staafdiagrammen met de labels 'Belangrijkste gedetailleerde histologieën' en 'Belangrijkste genen met veranderingen in cfDNA-monsters met mutaties', met gegevens over kankertypen en genveranderingen. Tekst beschrijft de dataset, belangrijkste bevindingen en analyseparameters.

Life Sciences NGS Analysis-plug-in

scRNA-seq-QC & annotatie

Screenshot van een bio-informatica-workflow met gesplitst scherm. Het linkerpaneel toont een AI-assistent die een voltooide kwaliteitscontroleanalyse van single-cell RNA-sequencing (scRNA-seq) samenvat, inclusief gegenereerde bestanden, QC-metrics, UMAP-visualisaties en celtypeannotaties. Het rechterpaneel toont een rapport 'scRNA QC Review' met histogrammen voor totale counts, gedetecteerde genen en mitochondriaal percentage, naast staafdiagrammen met aantallen geslaagd/gefaald voor QC en gefilterde celpopulaties. De interface wordt weergegeven tegen een blauw-groene verloopachtergrond.

Zet een matrixbundel in 10x-stijl om in QC-gefilterde single-cell-artefacten, annotaties en UMAPs die je in Codex kunt inspecteren en herzien. De Life Sciences NGS Analysis-plug-in routeert de aanvraag naar scrna-seq-qc, kiest QC-drempels op basis van de data, behoudt herkomst rond filtering en annotatie, en toont blokkades zoals ontbrekende afhankelijkheden voor doublet-detectie.

Bulk RNA-seq FASTQ-QC

Gesplitste weergave van een RNA-seq-workflow: links vat een AI-assistent voltooide kwaliteitscontroleresultaten voor bulk RNA-seq samen, terwijl rechts een interactief MultiQC-rapport met sequencingstatistieken en Salmon-metrics wordt getoond.

Zet een bulk RNA-seq-samplesheet, FASTQ-bundel en referentiebestanden om in een door QC beoordeelde countsbundel die je in Codex kunt inspecteren en hergebruiken. De Life Sciences NGS Analysis-plug-in routeert de aanvraag, valideert de invoer en retourneert een auditbare run-envelop met MultiQC, Salmon-matrices, herkomst en expliciete kanttekeningen.

Uitgebreide toegang voor vertrouwde organisaties

We breiden de toegang tot de GPT‑Rosalind-serie wereldwijd uit naar in aanmerking komende organisaties. GPT‑Rosalind komt als onderzoeks-preview beschikbaar via onze implementatiestructuur met vertrouwde toegang voor organisaties die legitiem wetenschappelijk onderzoek uitvoeren met duidelijk publiek nut, beschikken over sterke governance, stevig veiligheidstoezicht en gecontroleerde toegang met beveiliging op enterpriseniveau.

Als onderdeel van deze wereldwijde uitbreiding ondersteunen we graag de missie van Novo Nordisk om innovatieve behandelopties sneller bij patiënten te brengen door hun medisch onderzoek met GPT‑Rosalind op te schalen. Novo Nordisk benut frontier-AI-mogelijkheden om onderzoekers te helpen complexe datasets te analyseren, nuttige patronen te ontdekken en hypothesen sneller te testen. Het sterkere biologische begrip van GPT‑Rosalind helpt teams bewijs te verbinden uit literatuur, genomica, transcriptomica, sequenties, structuren en experimentele resultaten, waardoor het makkelijker wordt om van data naar duidelijkere onderzoeksbeslissingen te gaan.

'Life-sciencesonderzoek is complex, datarijk en interdisciplinair. Om betekenisvolle waarde voor onderzoekers te leveren, moeten geavanceerde AI-modellen verankerd zijn in vertrouwde wetenschappelijke data, verbonden zijn met gevalideerde tools en geïntegreerd zijn in de praktische workflows die onderzoekers dagelijks gebruiken. We zijn blij met onze samenwerking met OpenAI en de kans om te verkennen hoe GPT‑Rosalind strengere, praktische benaderingen van geneesmiddelenontdekking kan ondersteunen.'

Mishal Patel, Group Vice President, AI & Digital Innovation, R&D, Novo Nordisk

We bieden nu ook een door OpenAI beheerde werkruimte aan voor gekwalificeerde organisaties zonder Enterprise-account.

Wat volgt

De bijgewerkte GPT‑Rosalind is de volgende stap in onze bredere inzet om AI-systemen te bouwen die wetenschappelijke ontdekkingen kunnen versnellen, terwijl geavanceerde biologische capaciteiten met passende waarborgen worden ingezet. We blijven de biologische redenering van het model verbeteren, ondersteuning uitbreiden voor tool-intensieve en langlopende onderzoeksworkflows, en samenwerken met gekwalificeerde organisaties in verschillende regio’s om de impact in de praktijk te evalueren.

Dit betekent ook dat AI voor life sciences wordt toegepast op werk met grote publieke impact, van geneesmiddelenontdekking en translationele geneeskunde tot volksgezondheid, paraatheid en biologische verdediging. Via Rosalind Biodefense en ons implementatiemodel met vertrouwde toegang willen we frontier-biologische capaciteiten in handen geven van de onderzoekers, instellingen en verdedigers die werken aan betere menselijke gezondheid en sterkere maatschappelijke veerkracht.

We blijven GPT‑Rosalind uitbouwen tot een capabelere partner in de volledige levenscyclus van wetenschappelijk onderzoek, zodat wetenschappers sneller van de juiste vragen naar duidelijker bewijs, betere experimenten en uiteindelijk nieuwe behandelingen voor patiënten kunnen gaan.