Prezentăm noi capabilități pentru GPT‑Rosalind
Aducem mai multă inteligență ancorată în fluxuri de lucru științifice reale pentru industria științelor vieții.
Prezentăm o nouă actualizare de model pentru seria noastră GPT‑Rosalind, creată special pentru cercetarea în științele vieții la scară de întreprindere. Aceasta combină capacitățile de codare agentivă și utilizare a instrumentelor ale GPT‑5.5 cu o inteligență de model mai puternică în domenii centrale ale descoperirii de medicamente, precum chimia medicinală și genomica, îmbunătățind totodată performanța în analiza, proiectarea și fluxurile experimentale mai ample din științele vieții.
Progresul în științele vieții depinde de sintetizarea datelor și dovezilor la diferite scări și în diverse modalități: molecule, gene, căi biologice și sisteme vii. În evaluările noastre, GPT‑Rosalind actualizat arată câștiguri ample de performanță la sarcini de cercetare de la experți în biologie, interogări complexe de chimie medicinală, biologie cantitativă și depanare în laborator umed.
GPT‑Rosalind este acum disponibil în previzualizare de cercetare pentru organizațiile eligibile la nivel global prin structura noastră de implementare cu acces de încredere.
Pentru a măsura și îmbunătăți continuu impactul real al GPT‑Rosalind, am proiectat LifeSciBench, un test evaluat extern de experți, axat pe aspecte fundamentale ale cercetării în științele vieții. Spre deosebire de testele existente, care evaluează izolat o singură componentă a performanței modelului sau un domeniu biologic, LifeSciBench adoptă o perspectivă completă asupra muncii cu valoare științifică, folosind sarcini din șase zone de flux de lucru esențiale pentru cercetarea în științele vieții: gestionarea dovezilor, analiza, proiectarea și optimizarea, raționamentul științific, validarea și operațiunile, precum și traducerea și comunicarea. Folosim acest benchmark pentru a alinia progresul cu nevoile și realitățile cercetării în științele vieții.
GPT‑Rosalind conduce performanța în sarcini cu valoare științifică identificate de experți din industrie și mediul academic.
Extragerea, reconcilierea și auditarea dovezilor științifice din articole, figuri, tabele și înregistrări experimentale.
Exemplu de evaluare
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Răspunsul candidatului
Concluzie esențială: așa cum este prezentat, acest pachet nu este suficient de puternic pentru a susține aprobarea accelerată pe baza expresiei micro-distrofinei ca punct final surogat rezonabil de probabil să prezică beneficiu clinic. Un evaluator FDA sceptic ar considera probabil că dovezile privind biomarkerul, funcția, durabilitatea, siguranța și generalizabilitatea sunt insuficient susținute material.
Element al pachetului | Mod principal de eșec | Ce ar fi necesar |
|---|---|---|
Cuantificare Western blot | MANEX1A se leagă de un epitop N-terminal comun distrofinei endogene complete și transgenei de micro-distrofină, astfel că testul nu distinge clar transgena de distrofina reziduală/revertantă. Cuantificarea unei micro-distrofine de 138 kDa față de un standard sănătos de distrofină completă este, de asemenea, invalidă. | Folosește un standard recombinant de micro-distrofină și o metodă ortogonală care distinge transgena de distrofina endogenă, cum ar fi spectrometria de masă țintită sau un test specific transgenei/epitopului. |
Imunofluorescență | Anticorpul policlonal C-terminal nu este prea potrivit deoarece constructul de 138 kDa nu are domeniul C-terminal. Mulți pacienți DMD au fibre revertante, iar distrofina revertantă poate păstra epitopi C-terminali. Fibrele revertante se pot extinde clonal odată cu vârsta, ceea ce poate introduce o eroare sistematică în semnalul IF, mai ales la băieții mai mari. | Repetă IF cu un anticorp împotriva unui epitop prezent în transgenă, dar absent din distrofina revertantă. Cuantifică fibrele pozitive pentru transgenă separat de fibrele revertante. |
Validitatea punctului final surogat | Pachetul confundă cantitatea de proteină cu funcția clinică. „38% din masa proteică a controlului sănătos” nu înseamnă 38% din funcția normală a distrofinei, deoarece micro-distrofina este structural trunchiată. | Validează empiric relația dintre procentul de masă al micro-distrofinei, localizarea sarcolemală, restaurarea funcțională din aval și beneficiul clinic înainte de a trata expresia ca punct final surogat. |
Designul biopsiei | Biopsiile contralaterale ale vastului lateral înainte și după tratament introduc variabilitate stânga-dreapta și spațială intramusculară. Progresia bolii și înlocuirea fibro-adipoasă pot modifica, de asemenea, semnalul normalizat la proteina totală. | Standardizează locul biopsiei folosind repere anatomice consecvente, normalizează la proteine specifice mușchiului și măsoară în paralel compoziția fibro-adipoasă. |
Comparator/statistici NSAA | O cohortă externă de istoric natural nu este un control concurent randomizat. Eligibilitatea în studiu, îngrijirea de susținere, efectele participării, NSAA inițial, regimul cu steroizi, vârsta și clasa de exon pot biasa comparația. Un test t nepereche nu este suficient. De asemenea, o schimbare NSAA de +1,4 se află în variabilitatea test-retest pentru această grupă de vârstă. | Derulează un studiu randomizat concurent controlat cu placebo sau, cel puțin, folosește analize ajustate pentru NSAA inițial, vârstă, regim cu steroizi, clasă de exon și alți factori de confuzie. |
Confuzie legată de fereastra de vârstă | Băieții de 4–7 ani se află într-o fereastră de dezvoltare în care pacienții DMD ambulatori netratați pot câștiga funcție motorie înainte ca declinul să domine. O schimbare NSAA la 48 de săptămâni amestecă câștigul de dezvoltare, progresia bolii și posibilul efect al tratamentului. | Folosește un control randomizat concurent cu stratificare pe vârstă pentru a separa traiectoria de dezvoltare de efectul tratamentului. |
Precedent clinic anterior | Semnalele funcționale open-label ale micro-distrofinei nu au prezis în mod fiabil beneficiul confirmator; precedentul publicat include studii confirmatorii de terapie genică cu micro-distrofină care nu au reprodus îmbunătățirile NSAA open-label. | Nu te baza pe schimbarea NSAA open-label ca suport decisiv. Solicită dovezi funcționale controlate. |
Limitele structurale ale constructului | Constructul de 138 kDa elimină repetițiile spectrină R16/17, care conțin situsuri de interacțiune cu nNOS. Absența recrutării nNOS poate afecta simpatoliza funcțională și protecția împotriva ischemiei în timpul efortului, creând un plafon mecanistic al gradului de recuperare independent de nivelul expresiei. | Adaugă studii mecanistice care arată dacă acest construct specific restaurează funcția relevantă a complexului asociat distrofinei, localizarea nNOS, fiziologia efortului și protecția musculară. |
Durabilitatea AAV | Genomurile vectoriale la 12 săptămâni nu stabilesc expresie durabilă. Genomurile AAV9 sunt în mare parte episomi neintegranți și pot scădea în timp. Persistența genomului vectorial nu este același lucru cu expresia persistentă a proteinei. | Măsoară longitudinal expresia proteică a transgenei și durabilitatea biomarkerilor funcționali dincolo de 12 săptămâni. |
Profil imun/de siguranță | Transaminita la 8/12 pacienți este compatibilă cu un răspuns imun la celulele transduse cu AAV, dar mecanismul nu este stabilit. Un caz de miocardită este îngrijorător având în vedere tropismul cardiac al AAV9. | Furnizează monitorizare imună mai profundă, caracterizare a siguranței hepatice/cardiace și urmărire cardiacă intensificată. |
Selecția pacienților/generalizabilitate | Excluderea pacienților pozitivi pentru anticorpi neutralizanți anti-AAV9 limitează generalizabilitatea. Excluderea pacienților cu deleții ale exonului 44 limitează aplicabilitatea la acel subgrup DMD. n=12 este prea mic pentru a caracteriza siguranța și eficacitatea în populația DMD mai largă. | Extinde eligibilitatea unde este posibil sau prespecifică analize stratificate după statusul anticorpilor, genotip/clasă de exon, vârstă și funcție inițială înainte de a folosi rezultatul pentru a susține o aprobare largă. |
Concluzie de reglementare: pachetul poate arăta activitate biologică, dar încă nu stabilește că expresia măsurată a micro-distrofinei este un surogat fiabil, rezonabil de probabil să prezică beneficiu clinic. Principalele lacune sunt specificitatea testului, standardele de cuantificare invalide, posibila confuzie prin fibre revertante, lipsa unui control randomizat, confuzia NSAA legată de vârstă, durabilitatea incertă și problemele nerezolvate de siguranță/generalizabilitate.
Pentru a închide lacuna, programul ar avea nevoie de un design clinic controlat, stratificat pe vârstă, cu teste de expresie specifice transgenei, cuantificare proteică ortogonală, controale ale compoziției țesutului, date longitudinale de durabilitate, teste funcționale mecanistice pentru constructul trunchiat și monitorizare mai puternică a siguranței, mai ales hepatică și cardiacă.
Criterii și note pentru rubrică
GPT‑Rosalind atinge performanțe de vârf în industrie în chimia medicinală, un domeniu axat pe transformarea moleculelor în medicamente utile. Am proiectat MedChemBench pentru a reflecta fluxuri de lucru realiste de chimie medicinală, evaluând înțelegerea multimodală a structurii chimice; relația structură-activitate (SAR); predicția potenței, toxicității și absorbției, distribuției, metabolismului și excreției (ADME) medicamentelor; luarea deciziilor multiparametrice de optimizare a compușilor principali; și retrosinteza. GPT‑Rosalind depășește GPT‑5.5 pe MedChemBench, cu 27,5% față de 25,1%, folosind în același timp cu 7,2% mai puține tokenuri.
GPT‑Rosalind arată sinteză multimodală și raționament mecanistic mai bune în chimia medicinală.
Pe GeneBench, evaluarea noastră agentivă pentru analiză end-to-end de lungă durată în genomică și biologie cantitativă, GPT‑Rosalind folosește cu 31% mai puține tokenuri decât GPT‑5.5, obținând totodată o acuratețe mai mare, de 21,6% față de 20,4%. GeneBench evaluează performanța agentivă în sarcini cantitative pe orizont lung: pe baza unor date științifice realiste, poate un agent să planifice analize valide, QC, modelare și corecții pentru a ajunge la răspunsuri relevante pentru decizie? Problemele incluse acoperă o varietate de domenii, inclusiv genomica funcțională, transcriptomica spațială, proteomica, epigenomica și genetica aplicată.
GPT‑Rosalind folosește cu 31% mai puține tokenuri decât GPT‑5.5, îmbunătățind totodată acuratețea.
Introducem o nouă evaluare pentru a testa capacitatea GPT‑Rosalind de a ajuta oamenii de știință care desfășoară activitate de laborator în lumea reală. LabWorkBench testează capacitatea modelului de a lega perturbările de rezultatele experimentale în protocoale reale de laborator umed folosite de oamenii de știință, în scopuri de la depanare la optimizare. Datele folosite de LabWorkBench sunt proprietare și, prin urmare, necontaminate. GPT‑Rosalind obține 63,2% față de 55,8% pentru GPT‑5.5, folosind cu 5,3% mai puține tokenuri.
În ceea ce privește asistența pentru protocoale reale de laborator, GPT‑Rosalind înregistrează îmbunătățiri semnificative față de GPT‑5.5, utilizând în același timp tokenuri mai eficient.
Am construit pluginurile Life Sciences Research(se deschide într-o fereastră nouă) și Life Sciences NGS Analysis(se deschide într-o fereastră nouă) pentru a extinde inteligența sporită a GPT‑Rosalind cu un strat practic de execuție pentru fluxuri de lucru științifice repetabile. Împreună, aceste pluginuri aduc recuperarea dovezilor cu surse, interpretarea biologică și execuția bioinformatică în același spațiu de lucru, ajutând cercetătorii să conecteze dovezile externe cu analizele omice interne, păstrând artefactele și proveniența. Toți utilizatorii pot accesa acum ambele pluginuri prin Codex. Utilizatorii enterprise GPT‑Rosalind calificați pot folosi suplimentar GPT‑Rosalind pentru a alimenta aceste pluginuri.
Pentru a valorifica mai bine Codex ca banc de lucru dinamic pentru oamenii de știință, am adăugat vizualizatoare interactive pentru tipuri de fișiere native biologic. Setul inițial de vizualizatoare pentru secvențe, alinieri și structuri este conceput pentru a menține oamenii de știință aproape de dovezi pe măsură ce GPT‑Rosalind raționează de-a lungul unui flux de lucru și răspunde direct la întrebări ulterioare folosind vizualizatorul activ în context.
Demonstrația de mai sus arată aceste capabilități în acțiune, orchestrate de GPT‑Rosalind. Urmărim un om de știință care investighează o biopsie lichidă tumorală pentru a identifica mutații și alte modificări moleculare care ar putea informa tratamentul. Pluginul Life Sciences NGS Analysis transformă o revizuire a înregistrărilor ctDNA procesate într-un notebook interactiv, evidențiind alterări recurente, apeluri cu frecvență joasă și traiectorii ale probelor care concentrează investigația pe KRAS G12C. De acolo, pluginul Life Sciences Research adaugă context cu surse despre țintă, inhibitor și rezistență, în timp ce vizualizatoarele native de secvențe, alinieri și structuri îi permit omului de știință să inspecteze direct reziduul mutant 12, conservarea sa în familia RAS și buzunarul de legare ocupat de inhibitor. Fluxul de lucru se încheie prin traducerea acelor dovezi în opțiuni concrete de urmărire, fiecare pas și artefact fiind disponibil pentru revizuire de către experți.

Plugin Life Sciences NGS Analysis
QC și adnotare scRNA-seq

Transformă un pachet de matrice în stil 10x în artefacte single-cell filtrate QC, adnotări și UMAP-uri pe care le poți inspecta și revizui în Codex. Pluginul Life Sciences NGS Analysis direcționează solicitarea către scrna-seq-qc, alege praguri QC din date, păstrează proveniența filtrării și adnotării și evidențiază blocaje precum dependențele lipsă pentru detectarea dubletelor.
QC FASTQ pentru RNA-seq bulk

Transformă o fișă de probe RNA-seq bulk, un pachet FASTQ și fișiere de referință într-un pachet de conturi revizuit QC, pe care îl poți inspecta și reutiliza în Codex. Pluginul Life Sciences NGS Analysis direcționează solicitarea, validează intrările și returnează un pachet de rulare auditabil cu MultiQC, matrice Salmon, proveniență și avertismente explicite.
Extindem accesul la seria GPT‑Rosalind pentru organizațiile eligibile la nivel global. GPT‑Rosalind va fi disponibil în previzualizare de cercetare prin structura noastră de implementare cu acces de încredere pentru organizațiile care desfășoară cercetare științifică legitimă cu beneficii publice clare, au guvernanță solidă și supraveghere a siguranței, precum și acces controlat cu securitate de nivel enterprise.
Ca parte a acestei extinderi globale, suntem încântați să sprijinim misiunea Novo Nordisk de a aduce mai rapid pacienților opțiuni de tratament inovatoare, ajutând la scalarea cercetării lor medicale cu GPT‑Rosalind. Novo Nordisk valorifică capabilități AI de frontieră pentru a ajuta cercetătorii să analizeze seturi de date complexe, să descopere tipare utile și să testeze ipoteze mai rapid. Înțelegerea biologică mai puternică a GPT‑Rosalind va ajuta echipele să conecteze dovezi din literatură, genomică, transcriptomică, secvențe, structuri și rezultate experimentale, facilitând trecerea de la date la decizii de cercetare mai clare.
„Cercetarea în științele vieții este complexă, bogată în date și interdisciplinară. Pentru a oferi valoare semnificativă cercetătorilor, modelele AI avansate trebuie să fie ancorate în date științifice de încredere, conectate la instrumente validate și integrate în fluxurile de lucru reale pe care cercetătorii le folosesc zilnic. Suntem mulțumiți de parteneriatul nostru cu OpenAI și de oportunitatea de a explora modul în care GPT‑Rosalind poate susține abordări mai riguroase și practice ale descoperirii de medicamente.”
Mishal Patel, Vicepreședinte de grup, AI și inovație digitală, R&D - Novo Nordisk
Oferim acum și un spațiu de lucru gestionat de OpenAI pentru organizațiile calificate fără cont Enterprise.
GPT‑Rosalind actualizat este următorul pas în angajamentul nostru mai amplu de a construi sisteme AI care pot ajuta la accelerarea descoperirii științifice, asigurând în același timp că capabilitățile biologice avansate sunt implementate cu garanții adecvate. Vom continua să îmbunătățim raționamentul biologic al modelului, să extindem suportul pentru fluxuri de lucru de cercetare intensive în instrumente și pe orizont lung și să colaborăm cu organizații calificate din diverse regiuni pentru a evalua impactul în lumea reală.
Aceasta înseamnă și aplicarea AI pentru științele vieții în activități cu impact mare și beneficiu public, de la descoperirea de medicamente și medicina translațională până la sănătate publică, pregătire și apărare biologică. Prin Rosalind Biodefense și modelul nostru de implementare cu acces de încredere, ne propunem să punem capabilități biologice de frontieră în mâinile cercetătorilor, instituțiilor și apărătorilor care lucrează pentru a îmbunătăți sănătatea umană și a întări reziliența societății.
Vom continua să dezvoltăm GPT‑Rosalind pentru a deveni un partener mai capabil pe întregul ciclu de viață al cercetării științifice, ajutând oamenii de știință să treacă mai rapid de la întrebările potrivite la dovezi mai clare, experimente mai bune și, în cele din urmă, tratamente noi pentru pacienți.


