Salta al contingut principal
OpenAI

3 de juny del 2026

ProducteRecercaPublicació

Presentem noves capacitats per a GPT‑Rosalind

Més intel·ligència fonamentada en fluxos de treball científics reals per al sector de les ciències de la vida.

Presentem una nova actualització de model per a la nostra sèrie GPT‑Rosalind, creada específicament per a la recerca en ciències de la vida a escala empresarial. Combina les capacitats de programació agentiva i ús d'eines de GPT‑5.5 amb una intel·ligència de model més potent en àmbits clau del descobriment de fàrmacs, com la química medicinal i la genòmica, alhora que millora el rendiment en anàlisi, disseny i fluxos experimentals més amplis de les ciències de la vida.

El progrés en ciències de la vida depèn de sintetitzar dades i proves entre escales i modalitats: molècules, gens, vies i sistemes vius. En les nostres avaluacions, el GPT‑Rosalind actualitzat mostra millores àmplies de rendiment en tasques de recerca d'experts en biologia, consultes complexes de química medicinal, biologia quantitativa i resolució de problemes de laboratori humit.

GPT‑Rosalind ja està disponible en previsualització de recerca per a organitzacions aptes d'arreu del món mitjançant la nostra estructura de desplegament d'accés de confiança.

Millorar el rendiment en tasques de valor científic

Per mesurar i millorar contínuament l'impacte real de GPT‑Rosalind, vam dissenyar LifeSciBench, un punt de referència jutjat externament per experts i centrat en aspectes fonamentals de la recerca en ciències de la vida. A diferència dels punts de referència existents, que avaluen un sol component del rendiment del model o un domini biològic de manera aïllada, LifeSciBench adopta una visió d'extrem a extrem del treball de valor científic extraient tasques de sis àrees de flux de treball centrals per a la recerca en ciències de la vida: gestió de proves, anàlisi, disseny i optimització, raonament científic, validació i operacions, i traducció i comunicació. Fem servir aquest punt de referència per alinear el progrés amb les necessitats i les realitats de la recerca en ciències de la vida.

GPT‑Rosalind lidera el rendiment en tasques de valor científic identificades per experts de la indústria i l'acadèmia.

Extracció, conciliació i auditoria de proves científiques d'articles, figures, taules i registres experimentals.

Exemple d’avaluació

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Resposta del candidat

Conclusió principal: Tal com es presenta, aquest paquet no és prou sòlid per donar suport a una aprovació accelerada basada en l'expressió de microdistrofina com a punt final substitutiu raonablement probable de predir benefici clínic. Un revisor escèptic de la FDA probablement consideraria que les proves de biomarcador, funcionals, de durabilitat, seguretat i generalitzabilitat tenen un suport materialment insuficient.

Element del paquet

Mode de fallada clau

Què caldria

Quantificació per Western blot

MANEX1A s'uneix a un epítop N-terminal compartit per la distrofina endògena de longitud completa i el transgèn de microdistrofina, de manera que l'assaig no distingeix netament el transgèn de la distrofina residual/revertant. Quantificar una microdistrofina de 138 kDa contra un estàndard de distrofina sana de longitud completa també és invàlid.

Useu un estàndard recombinant de microdistrofina i un mètode ortogonal que distingeixi el transgèn de la distrofina endògena, com l'espectrometria de masses dirigida o un assaig específic de transgèn/epítop.

Immunofluorescència

L'anticòs policlonal C-terminal és poc adequat perquè el constructe de 138 kDa no té el domini C-terminal. Molts pacients amb DMD tenen fibres revertants, i la distrofina revertant pot retenir epítops C-terminals. Les fibres revertants poden expandir-se clonalment amb l'edat, esbiaixant el senyal IF, especialment en nens més grans.

Repetiu la IF amb un anticòs contra un epítop present al transgèn però absent de la distrofina revertant. Quantifiqueu les fibres positives per al transgèn separadament de les fibres revertants.

Validesa del punt final substitutiu

El paquet confon quantitat de proteïna amb funció clínica. «38% de la massa proteica del control sa» no vol dir 38% de la funció normal de la distrofina, perquè la microdistrofina està truncada estructuralment.

Valideu empíricament la relació entre percentatge de massa de microdistrofina, localització sarcolèmica, restauració funcional aigües avall i benefici clínic abans de tractar l'expressió com a punt final substitutiu.

Disseny de biòpsia

Les biòpsies contralaterals de vast lateral abans i després del tractament introdueixen variabilitat esquerra-dreta i espacial intramuscular. La progressió de la malaltia i el reemplaçament fibrogras també poden canviar el senyal normalitzat per proteïna total.

Estandarditzeu el lloc de biòpsia amb punts anatòmics coherents, normalitzeu a proteïnes específiques de múscul i mesureu en paral·lel la composició fibrograssa.

Comparador/estadística NSAA

Una cohort externa d'història natural no és un control concurrent aleatoritzat. L'elegibilitat de l'assaig, l'atenció de suport, els efectes de participació, la NSAA basal, el règim d'esteroides, l'edat i la classe d'exó poden esbiaixar la comparació. Una prova t no aparellada no és suficient. A més, un canvi de +1,4 en NSAA és dins de la variabilitat test-retest per a aquest grup d'edat.

Feu un estudi aleatoritzat concurrent controlat amb placebo o, com a mínim, useu anàlisis ajustades que tinguin en compte NSAA basal, edat, règim d'esteroides, classe d'exó i altres confusors.

Confusió per finestra d'edat

Els nens de 4–7 anys són en una finestra de desenvolupament en què pacients amb DMD ambulants no tractats poden guanyar funció motora abans que domini el declivi. Un canvi NSAA de 48 setmanes barreja guany de desenvolupament, progressió de la malaltia i possible efecte del tractament.

Useu un control aleatoritzat concurrent amb estratificació per edat per separar la trajectòria de desenvolupament de l'efecte del tractament.

Precedent clínic previ

Els senyals funcionals oberts de microdistrofina no han predit de manera fiable el benefici confirmatori; el precedent publicat inclou assaigs confirmatoris de teràpia gènica amb microdistrofina que no van reproduir millores NSAA obertes.

No confieu en el canvi NSAA obert com a suport decisiu. Exigiu proves funcionals controlades.

Límits estructurals del constructe

El constructe de 138 kDa elimina les repeticions d'espectrina R16/17, que contenen llocs d'unió a nNOS. La pèrdua de reclutament de nNOS pot perjudicar la simpatòlisi funcional i la protecció contra la isquèmia durant l'exercici, creant un sostre mecanístic al rescat independent del nivell d'expressió.

Afegiu estudis mecanístics que mostrin si aquest constructe específic restaura la funció rellevant del complex associat a la distrofina, la localització de nNOS, la fisiologia de l'exercici i la protecció muscular.

Durabilitat de l'AAV

Els genomes vectorials a 12 setmanes no estableixen expressió durable. Els genomes AAV9 són en gran part episomes no integrants i poden disminuir amb el temps. La persistència del genoma vectorial no és el mateix que l'expressió persistent de proteïna.

Mesureu longitudinalment l'expressió proteica del transgèn i la durabilitat dels biomarcadors funcionals més enllà de 12 setmanes.

Perfil immune/de seguretat

La transaminitis en 8/12 pacients és coherent amb una resposta immune a cèl·lules transduïdes per AAV, però el mecanisme no està establert. Un cas de miocarditis és preocupant atès el tropisme cardíac d'AAV9.

Proporcioneu monitoratge immune més profund, caracterització de seguretat hepàtica/cardiaca i seguiment cardíac intensificat.

Selecció de pacients/generalitzabilitat

Excloure pacients positius per anticossos neutralitzants anti-AAV9 limita la generalitzabilitat. Excloure delecions de l'exó 44 limita l'aplicabilitat a aquest subgrup de DMD. n=12 és massa petit per caracteritzar seguretat i eficàcia en la població DMD més àmplia.

Amplieu l'elegibilitat quan sigui possible o preespecifiqueu anàlisis estratificades per estat d'anticossos, genotip/classe d'exó, edat i funció basal abans d'utilitzar el resultat per donar suport a una aprovació àmplia.

Conclusió reguladora: El paquet pot mostrar activitat biològica, però encara no estableix que l'expressió mesurada de microdistrofina sigui un substitut fiable raonablement probable de predir benefici clínic. Les principals bretxes són l'especificitat de l'assaig, estàndards de quantificació invàlids, possible confusió per fibres revertants, manca d'un control aleatoritzat, confusió de NSAA relacionada amb l'edat, durabilitat incerta i problemes no resolts de seguretat/generalitzabilitat.

Per tancar la bretxa, el programa necessitaria un disseny clínic controlat i estratificat per edat amb assaigs d'expressió específics del transgèn, quantificació ortogonal de proteïna, controls de composició tissular, dades longitudinals de durabilitat, assaigs funcionals mecanístics per al constructe truncat i un monitoratge de seguretat més sòlid, especialment hepàtic i cardíac.

Criteris de rúbrica i qualificacions

Criteri
Punts
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Raonament científic més sòlid

Química medicinal

GPT‑Rosalind assoleix un rendiment líder del sector en química medicinal, un camp centrat a convertir molècules en fàrmacs útils. Vam dissenyar MedChemBench per reflectir fluxos de treball realistes de química medicinal, avaluant la comprensió multimodal d'estructures químiques; la relació estructura-activitat (SAR); la predicció de potència, toxicitat i absorció, distribució, metabolisme i excreció (ADME) de fàrmacs; la presa de decisions d'optimització de compostos cap de sèrie multiparamètrica; i la retrosíntesi. GPT‑Rosalind supera GPT‑5.5 a MedChemBench, amb un 27,5% davant d'un 25,1%, i fa servir un 7,2% menys de segments.

GPT‑Rosalind mostra una millor síntesi multimodal i raonament mecanístic en química medicinal.

Genòmica i biologia quantitativa

A GeneBench, la nostra avaluació agentiva d'anàlisi d'extrem a extrem i de llarg horitzó en genòmica i biologia quantitativa, GPT‑Rosalind fa servir un 31% menys de segments que GPT‑5.5 i aconsegueix una precisió superior, del 21,6% davant del 20,4%. GeneBench avalua el rendiment agentiu en tasques quantitatives de llarg horitzó: a partir de dades científiques realistes, pot un agent planificar anàlisis vàlides, QC, modelatge i correccions per arribar a respostes rellevants per a la decisió? Els problemes inclosos abasten diversos dominis, com ara genòmica funcional, transcriptòmica espacial, proteòmica, epigenòmica i genètica aplicada.

GPT‑Rosalind fa servir un 31% menys de segments que GPT‑5.5 i alhora millora la precisió.

Assistència al treball de laboratori real

Presentem una nova avaluació per provar la capacitat de GPT‑Rosalind d'ajudar científics que duen a terme treball de laboratori al món real. LabWorkBench posa a prova la capacitat del model de vincular pertorbacions amb resultats experimentals en protocols reals de laboratori humit utilitzats per científics, amb finalitats que van de la resolució de problemes a l'optimització. Les dades utilitzades per LabWorkBench són propietàries i, per tant, no estan contaminades. GPT‑Rosalind obté un 63,2% davant del 55,8% de GPT‑5.5, i fa servir un 5,3% menys de segments.

En l'assistència a protocols reals de laboratori humit, GPT‑Rosalind mostra millores significatives respecte de GPT‑5.5 i alhora millora l'eficiència dels segments.

Del raonament als fluxos de treball executats

Hem creat els connectors Life Sciences Research(s'obre en una finestra nova) i Life Sciences NGS Analysis(s'obre en una finestra nova) per ampliar la intel·ligència millorada de GPT‑Rosalind amb una capa d'execució pràctica per a fluxos de treball científics repetibles. Junts, aquests connectors porten la recuperació de proves amb fonts, la interpretació biològica i l'execució bioinformàtica al mateix espai de treball, ajudant els investigadors a connectar proves externes amb anàlisis òmiques internes tot preservant artefactes i procedència. Tots els usuaris ja poden accedir a tots dos connectors mitjançant Codex. Els usuaris empresarials qualificats de GPT‑Rosalind també poden fer servir GPT‑Rosalind per impulsar aquests connectors.

Per aprofitar millor Codex com a banc de treball dinàmic per a científics, hem afegit visualitzadors interactius per a tipus de fitxer nadius de la biologia. El conjunt inicial de visualitzadors de seqüències, alineaments i estructures està dissenyat per mantenir els científics a prop de les proves mentre GPT‑Rosalind raona al llarg d'un flux de treball i respon directament preguntes de seguiment fent servir el visualitzador actiu en context.

La demostració anterior mostra aquestes capacitats en acció, orquestrades per GPT‑Rosalind. Seguim una científica que investiga una biòpsia líquida de tumor per identificar mutacions i altres canvis moleculars que podrien informar el tractament. El connector Life Sciences NGS Analysis converteix una revisió de registres de ctDNA processats en un quadern interactiu, fent aflorar alteracions recurrents, crides de baixa freqüència i trajectòries de mostres que centren la investigació en KRAS G12C. A partir d'aquí, el connector Life Sciences Research afegeix context amb fonts sobre la diana, l'inhibidor i la resistència, mentre que els visualitzadors natius de seqüència, alineament i estructura permeten a la científica inspeccionar directament el residu mutant 12, la seva conservació a la família RAS i la butxaca unida a l'inhibidor. El flux de treball conclou traduint aquestes proves en opcions concretes de seguiment, amb cada pas i artefacte disponible per a revisió experta.

Una pantalla d'ordinador mostra un espai de treball que indica l'ús d'un connector NGS Analysis per explorar dades de mutacions de ctDNA. La pantalla inclou diversos gràfics de barres etiquetats «Top detailed histologies» i «Top altered genes by mutated cfDNA samples», que mostren dades sobre tipus de càncer i alteracions gèniques. El text descriu el conjunt de dades, les troballes clau i els paràmetres d'anàlisi.

Connector Life Sciences NGS Analysis

QC i anotació de scRNA-seq

Captura de pantalla d'un flux de treball bioinformàtic amb pantalla dividida. El panell esquerre mostra un assistent d'IA que resumeix una anàlisi de control de qualitat de seqüenciació d'ARN unicel·lular (scRNA-seq) completada, inclosos fitxers generats, mètriques de QC, visualitzacions UMAP i anotacions de tipus cel·lular. El panell dret mostra un informe «scRNA QC Review» amb histogrames de recomptes totals, gens detectats i percentatge mitocondrial, juntament amb gràfics de barres de recomptes QC apte/no apte i poblacions cel·lulars filtrades. La interfície es mostra sobre un fons degradat blau i verd.

Converteix un paquet de matriu d'estil 10x en artefactes unicel·lulars filtrats per QC, anotacions i UMAP que pots inspeccionar i revisar a Codex. El connector Life Sciences NGS Analysis encamina la sol·licitud a scrna-seq-qc, tria llindars de QC a partir de les dades, preserva la procedència sobre el filtratge i l'anotació, i mostra bloquejadors com dependències de detecció de doblets que falten.

QC de FASTQ d'RNA-seq massiu

Vista de pantalla dividida d'un flux de treball d'RNA-seq: un assistent d'IA resumeix a l'esquerra resultats completats de control de qualitat d'RNA-seq massiu, mentre que a la dreta es mostra un informe interactiu MultiQC amb estadístiques de seqüenciació i mètriques Salmon.

Converteix un full de mostres d'RNA-seq massiu, un paquet FASTQ i fitxers de referència en un paquet de recomptes revisat amb QC que pots inspeccionar i reutilitzar a Codex. El connector Life Sciences NGS Analysis encamina la sol·licitud, valida les entrades i retorna un embolcall d'execució auditable amb MultiQC, matrius Salmon, procedència i advertiments explícits.

Accés ampliat per a organitzacions de confiança

Estem ampliant l'accés a la sèrie GPT‑Rosalind a organitzacions aptes d'arreu del món. GPT‑Rosalind estarà disponible en previsualització de recerca mitjançant la nostra estructura de desplegament d'accés de confiança per a organitzacions que duen a terme recerca científica legítima amb un benefici públic clar, que disposen d'una governança i supervisió de seguretat sòlides i d'un accés controlat amb seguretat de nivell empresarial.

Com a part d'aquesta expansió global, ens il·lusiona ajudar a donar suport a la missió de Novo Nordisk de portar opcions de tractament innovadores als pacients més ràpidament, ajudant a escalar la seva recerca mèdica amb GPT‑Rosalind. Novo Nordisk aprofita capacitats d'IA d'avantguarda per ajudar els investigadors a analitzar conjunts de dades complexos, descobrir patrons útils i provar hipòtesis més ràpidament. La comprensió biològica més sòlida de GPT‑Rosalind ajudarà els equips a connectar proves entre literatura, genòmica, transcriptòmica, seqüència, estructura i resultats experimentals, facilitant el pas de les dades a decisions de recerca més clares.

«La recerca en ciències de la vida és complexa, rica en dades i interdisciplinària. Per aportar valor significatiu als investigadors, els models d'IA avançats han d'estar fonamentats en dades científiques de confiança, connectats a eines validades i integrats en els fluxos de treball reals que els investigadors utilitzen cada dia. Ens satisfà la nostra col·laboració amb OpenAI i l'oportunitat d'explorar com GPT‑Rosalind pot donar suport a enfocaments més rigorosos i pràctics per al descobriment de fàrmacs.»

Mishal Patel, vicepresident de grup, IA i innovació digital, R+D - Novo Nordisk

Ara també oferim un espai de treball gestionat per OpenAI per a organitzacions qualificades sense compte Enterprise.

Què ve ara

El GPT‑Rosalind actualitzat és el pas següent en el nostre compromís més ampli de crear sistemes d'IA que ajudin a accelerar el descobriment científic i alhora garanteixin que les capacitats biològiques avançades es despleguin amb salvaguardes adequades. Continuarem millorant el raonament biològic del model, ampliant el suport per a fluxos de treball de recerca de llarg horitzó i intensius en eines, i treballant amb organitzacions qualificades de diverses regions per avaluar-ne l'impacte real.

Això també vol dir aplicar la IA de ciències de la vida a treball d'alt impacte i benefici públic, des del descobriment de fàrmacs i la medicina translacional fins a la salut pública, la preparació i la biodefensa. Mitjançant Rosalind Biodefense i el nostre model de desplegament d'accés de confiança, volem posar capacitats biològiques d'avantguarda en mans dels investigadors, institucions i defensors que treballen per millorar la salut humana i reforçar la resiliència social.

Continuarem desenvolupant GPT‑Rosalind perquè esdevingui un soci més capaç al llarg de tot el cicle de vida de la recerca científica, ajudant els científics a avançar més ràpidament de les preguntes adequades a proves més clares, millors experiments i, en última instància, nous tractaments per als pacients.