Přeskoč na hlavní obsah
OpenAI

3. června 2026

ProduktVýzkumVydání

Představujeme nové schopnosti GPT‑Rosalind

Přinášíme vyšší inteligenci ukotvenou v reálných vědeckých workflow pro odvětví biologických věd.

Představujeme novou aktualizaci modelu v naší řadě GPT‑Rosalind, cíleně vytvořenou pro výzkum v biologických vědách v podnikovém měřítku. Kombinuje schopnosti GPT‑5.5 v oblasti agentního kódování a používání nástrojů se silnější inteligencí modelu v klíčových doménách objevování léčiv, jako je medicinální chemie a genomika, a zároveň zlepšuje výkon v širší analýze, návrhu a experimentálních workflow biologických věd.

Pokrok v biologických vědách závisí na syntéze dat a důkazů napříč měřítky a modalitami: molekulami, geny, drahami a živými systémy. V našich hodnoceních aktualizovaný GPT‑Rosalind vykazuje široké zlepšení výkonu v úlohách od biologických expertů, složitých dotazech z medicinální chemie, kvantitativní biologii a řešení problémů v mokré laboratoři.

GPT‑Rosalind je nyní dostupný v režimu výzkumného preview způsobilým organizacím po celém světě prostřednictvím naší struktury nasazení s důvěryhodným přístupem.

Zlepšování výkonu ve vědecky hodnotných úlohách

Abychom mohli měřit a průběžně zlepšovat reálný dopad GPT‑Rosalind, navrhli jsme LifeSciBench, benchmark posuzovaný externími experty a zaměřený na základní aspekty výzkumu v biologických vědách. Na rozdíl od existujících benchmarků, které izolovaně hodnotí jednu složku výkonu modelu nebo biologickou doménu, LifeSciBench nahlíží vědecky hodnotnou práci od začátku do konce a čerpá úlohy ze šesti oblastí workflow zásadních pro výzkum v biologických vědách: práce s důkazy, analýza, návrh a optimalizace, vědecké uvažování, validace a provoz, překlad a komunikace. Tento benchmark používáme k tomu, abychom sladili pokrok s potřebami a realitou výzkumu v biologických vědách.

GPT‑Rosalind vede ve výkonu napříč vědecky hodnotnými úlohami identifikovanými odborníky z průmyslu a akademické sféry.

Extrakce, slaďování a audit vědeckých důkazů z článků, obrázků, tabulek a experimentálních záznamů.

Příklad hodnocení

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Odpověď kandidáta

To podstatné: V předložené podobě není tento balíček dostatečně silný, aby podpořil zrychlené schválení na základě exprese mikrodystrofinu jako náhradního koncového bodu, u nějž je přiměřeně pravděpodobné, že predikuje klinický přínos. Skeptický hodnotitel FDA by pravděpodobně považoval důkazy o biomarkeru, funkci, trvanlivosti, bezpečnosti a zobecnitelnosti za podstatně nedostatečně podložené.

Položka balíčku

Klíčový způsob selhání

Co by bylo potřeba

Kvantifikace Western blot

MANEX1A váže N-terminální epitop sdílený endogenním plnohodnotným dystrofinem a mikrodystrofinovým transgenem, takže test čistě nerozlišuje transgen od reziduálního/revertantního dystrofinu. Kvantifikace 138 kDa mikrodystrofinu vůči zdravému standardu plnohodnotného dystrofinu je také neplatná.

Použijte rekombinantní standard mikrodystrofinu a ortogonální metodu, která rozlišuje transgen od endogenního dystrofinu, například cílenou hmotnostní spektrometrii nebo transgenově specifický/epitopově specifický test.

Imunofluorescence

Polyklonální protilátka namířená proti C-konci není vhodná, protože konstruktu o molekulové hmotnosti 138 kDa chybí C-koncová doména. Mnoho pacientů s DMD má revertantní vlákna a revertantní dystrofin si může zachovat epitopy na C-konci. Revertantní vlákna se s věkem mohou klonálně rozšiřovat, což může zkreslovat signál imunofluorescence, zejména u starších chlapců.

Opakujte test IF s protilátkou namířenou proti epitopu, který je přítomen v transgenu, ale chybí v revertantním dystrofinu. Počet vláken pozitivních na transgen stanovte odděleně od počtu revertantních vláken.

Platnost náhradního koncového bodu

Balíček zaměňuje množství bílkoviny a klinickou funkci. „38 % bílkovinné hmoty zdravé kontrolní skupiny“ neznamená 38 % normální funkce dystrofinu, protože mikrodystrofin je strukturálně zkrácený.

Empiricky validujte vztah mezi hmotnostním procentem mikrodystrofinu, sarkolemální lokalizací, downstream funkční obnovou a klinickým přínosem, než budete expresi považovat za náhradní koncový bod.

Návrh biopsie

Kontralaterální biopsie m. vastus lateralis před léčbou a po ní zavádějí levo-pravou a intramuskulární prostorovou variabilitu. Progrese onemocnění a fibro-tuková náhrada mohou také měnit signál normalizovaný na celkový protein.

Standardizujte místo biopsie pomocí konzistentních anatomických orientačních bodů, normalizujte na svalově specifické proteiny a paralelně měřte fibro-tukové složení.

Komparátor/statistika NSAA

Externí kohorta přirozené historie není randomizovaná souběžná kontrola. Způsobilost do studie, podpůrná péče, efekty účasti, výchozí NSAA, steroidní režim, věk a třída exonu mohou srovnání zkreslit. Nepárový t-test není dostačující. Změna NSAA o +1,4 je navíc v rámci variability test-retest pro tuto věkovou skupinu.

Proveďte randomizovanou souběžnou placebem kontrolovanou studii, nebo minimálně použijte upravené analýzy zohledňující výchozí NSAA, věk, steroidní režim, třídu exonu a další matoucí faktory.

Matoucí vliv věkového okna

Chlapci ve věku 4–7 let jsou ve vývojovém okně, kdy neléčení ambulantní pacienti s DMD mohou získávat motorickou funkci, než začne dominovat pokles. 48týdenní změna NSAA mísí vývojový zisk, progresi onemocnění a možný léčebný efekt.

Použijte souběžnou randomizovanou kontrolu se stratifikací podle věku, aby bylo možné oddělit vývojovou trajektorii od léčebného efektu.

Předchozí klinický precedent

Otevřené funkční signály mikrodystrofinu spolehlivě nepředpověděly konfirmační přínos; mezi publikovanými příklady jsou potvrzující studie genové terapie mikrodystrofinem, které nedokázaly reprodukovat zlepšení zaznamenaná v otevřených studiích s NSAA.

Nespoléhejte na otevřenou změnu NSAA jako rozhodující podporu. Vyžadujte kontrolované funkční důkazy.

Strukturální limity konstruktu

138 kDa konstrukt odstraňuje spektrinové repetice R16/17, které obsahují vazebná místa pro nNOS. Ztráta náboru nNOS může zhoršit funkční sympatolýzu a ochranu před ischemií během cvičení, čímž vytváří mechanistický strop záchrany nezávislý na úrovni exprese.

Doplňte mechanistické studie ukazující, zda tento konkrétní konstrukt obnovuje relevantní funkci komplexu asociovaného s dystrofinem, lokalizaci nNOS, fyziologii cvičení a ochranu svalu.

Trvanlivost AAV

Vektorové genomy po 12 týdnech neprokazují trvalou expresi. Genomy AAV9 jsou převážně neintegrující episomy a mohou v čase klesat. Perzistence vektorového genomu není totéž co přetrvávající exprese proteinu.

Měřte longitudinální expresi transgenového proteinu a trvanlivost funkčních biomarkerů nad rámec 12 týdnů.

Imunitní/bezpečnostní profil

Transaminitida u 8/12 pacientů je v souladu s imunitní odpovědí na buňky transdukované AAV, ale mechanismus není stanoven. Jeden případ myokarditidy je znepokojivý vzhledem ke kardiálnímu tropismu AAV9.

Poskytněte hlubší imunitní monitorování, charakterizaci jaterní/kardiální bezpečnosti a zesílené kardiální sledování.

Výběr pacientů/zobecnitelnost

Vyloučení pacientů pozitivních na neutralizační protilátky proti AAV9 omezuje zobecnitelnost. Vyloučení delecí exonu 44 omezuje použitelnost pro tuto podskupinu DMD. n=12 je příliš málo pro charakterizaci bezpečnosti a účinnosti napříč širší populací DMD.

Pokud je to možné, rozšířte kritéria způsobilosti nebo předem stanovte stratifikované analýzy podle protilátkového statusu, genotypu/třídy exonů, věku a výchozího stavu, než výsledky použijete k podpoře širokého schválení.

Regulační závěr: Balíček může ukazovat biologickou aktivitu, ale zatím neprokazuje, že měřená exprese mikrodystrofinu je spolehlivý náhradní ukazatel, u nějž je přiměřeně pravděpodobné, že predikuje klinický přínos. Hlavní mezery jsou specificita testu, neplatné kvantifikační standardy, možné matoucí vlivy revertantních vláken, absence randomizované kontroly, věkem podmíněné zkreslení NSAA, nejistá trvanlivost a nevyřešené otázky bezpečnosti/zobecnitelnosti.

K uzavření mezery by program potřeboval kontrolovaný, věkově stratifikovaný klinický design s transgenově specifickými testy exprese, ortogonální kvantifikací proteinu, kontrolami tkáňového složení, longitudinálními daty o trvanlivosti, mechanistickými funkčními testy zkráceného konstruktu a silnějším bezpečnostním monitorováním, zejména jaterním a kardiálním.

Kritéria hodnotící rubriky a známkování

Kritérium
Body
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Silnější vědecké uvažování

Medicinální chemie

GPT‑Rosalind dosahuje špičkového výkonu v medicinální chemii, oboru zaměřeném na přeměnu molekul v užitečná léčiva. MedChemBench jsme navrhli tak, aby odrážel realistická workflow medicinální chemie: hodnotí multimodální porozumění chemickým strukturám; vztah struktury a aktivity (SAR); predikci účinnosti, toxicity a absorpce, distribuce, metabolismu a exkrece (ADME) léčiv; rozhodování při multiparametrické optimalizaci leadů; a retrosyntézu. GPT‑Rosalind překonává GPT‑5.5 na MedChemBench výsledkem 27,5 % oproti 25,1 % a zároveň používá o 7,2 % méně tokenů.

GPT‑Rosalind vykazuje lepší multimodální syntézu a mechanistické uvažování v medicinální chemii.

Genomika a kvantitativní biologie

Na GeneBench, našem agentním hodnocení dlouhodobé end-to-end analýzy v genomice a kvantitativní biologii, používá GPT‑Rosalind o 31 % méně tokenů než GPT‑5.5 a dosahuje vyšší přesnosti 21,6 % oproti 20,4 %. GeneBench hodnotí agentní výkon v dlouhodobých kvantitativních úlohách: dokáže agent na základě realistických vědeckých dat naplánovat validní analýzu, kontrolu kvality, modelování a korekce a dojít k odpovědím relevantním pro rozhodnutí? Zahrnuté problémy pokrývají různé domény včetně funkční genomiky, prostorové transkriptomiky, proteomiky, epigenomiky a aplikované genetiky.

GPT‑Rosalind používá o 31 % méně tokenů než GPT‑5.5 a zároveň zlepšuje přesnost.

Podpora reálné laboratorní práce

Zavádíme nové hodnocení, které testuje schopnost GPT‑Rosalind pomáhat vědcům provádějícím laboratorní práci v reálném světě. LabWorkBench testuje schopnost modelu propojit perturbace s experimentálními výsledky ve skutečných protokolech mokré laboratoře používaných vědci, a to pro účely od řešení problémů po optimalizaci. Data používaná LabWorkBench jsou proprietární, a tedy nekontaminovaná. GPT‑Rosalind dosahuje 63,2 % oproti 55,8 % u GPT‑5.5 a zároveň používá o 5,3 % méně tokenů.

Pokud jde o pomoc s protokoly v reálných podmínkách mokré laboratoře, vykazuje GPT‑Rosalind významné zlepšení oproti GPT‑5.5 a zároveň zvyšuje efektivitu tokenů.

Od uvažování k prováděným workflows

Vytvořili jsme pluginy Life Sciences Research(otevře se v novém okně) a Life Sciences NGS Analysis(otevře se v novém okně), které rozšiřují zvýšenou inteligenci GPT‑Rosalind o praktickou realizační vrstvu pro opakovatelná vědecká workflow. Společně tyto pluginy přinášejí vyhledávání ozdrojovaných důkazů, biologickou interpretaci a bioinformatické provádění do stejného pracovního prostoru a pomáhají výzkumníkům propojovat externí důkazy s interními omickými analýzami při zachování artefaktů a původu dat. Všichni uživatelé nyní mohou k oběma pluginům přistupovat prostřednictvím Codexu. Kvalifikovaní podnikoví uživatelé GPT‑Rosalind mohou navíc používat GPT‑Rosalind k pohonu těchto pluginů.

Abychom lépe využili Codex jako dynamickou pracovní plochu pro vědce, přidali jsme interaktivní prohlížeče pro biologicky nativní typy souborů. Počáteční sada prohlížečů sekvencí, zarovnání a struktur je navržena tak, aby vědce držela blízko důkazům, zatímco GPT‑Rosalind uvažuje napříč workflow, a aby na následné otázky odpovídala přímo s využitím aktivního prohlížeče v kontextu.

Ukázka výše předvádí tyto schopnosti v praxi, kdy je orchestrátorem GPT‑Rosalind. Sledujeme vědce zkoumajícího tekutou biopsii nádoru s cílem identifikovat mutace a další molekulární změny, které by mohly napovědět při léčbě. Plugin Life Sciences NGS Analysis promění revizi zpracovaných záznamů ctDNA v interaktivní notebook, který odhaluje opakující se alterace, nízkofrekvenční volání a trajektorie vzorků zaměřující vyšetřování na KRAS G12C. Odtud plugin Life Sciences Research doplňuje ozdrojovaný kontext cíle, inhibitoru a rezistence, zatímco nativní prohlížeče sekvencí, zarovnání a struktur umožňují vědci přímo prozkoumat mutantní zbytek 12, jeho konzervovanost napříč rodinou RAS a kapsu vázanou na inhibitor. Workflow končí převedením těchto důkazů do konkrétních možností následného postupu, přičemž každý krok a artefakt je dostupný pro expertní kontrolu.

Obrazovka počítače zobrazuje pracovní prostor s pokynem použít plugin NGS Analysis k prozkoumání dat mutací ctDNA. Obrazovka obsahuje několik sloupcových grafů označených „Nejčastější detailní histologie“ a „Nejčastější změněné geny podle vzorků mutované cfDNA“, zobrazujících data o typech rakoviny a genových alteracích. Text popisuje datovou sadu, klíčová zjištění a parametry analýzy.

Plugin Life Sciences NGS Analysis

Kontrola kvality a anotace scRNA-seq

Snímek obrazovky bioinformatického workflow rozděleného na dvě části. Levý panel ukazuje asistenta AI shrnujícího dokončenou analýzu kontroly kvality jednobuněčného sekvenování RNA (scRNA-seq), včetně vygenerovaných souborů, metrik QC, vizualizací UMAP a anotací typů buněk. Pravý panel zobrazuje zprávu „Kontrola QC scRNA“ s histogramy celkových počtů, detekovaných genů a mitochondriálního procenta vedle sloupcových grafů ukazujících počty vyhovělo/nevyhovělo QC a filtrované buněčné populace. Rozhraní je zobrazeno na modro-zeleném gradientním pozadí.

Převeďte balíček matic ve stylu 10x na jednobuněčné artefakty filtrované kontrolou kvality, anotace a UMAPy, které můžete prohlížet a upravovat v Codexu. Plugin Life Sciences NGS Analysis směruje požadavek na scrna-seq-qc, volí prahy QC z dat, zachovává původ dat kolem filtrování a anotace a odhaluje blokátory, jako jsou chybějící závislosti pro detekci doubletů.

Kontrola kvality bulk RNA-seq FASTQ

Rozdělený pohled na workflow RNA-seq: vlevo asistent AI shrnuje dokončené výsledky kontroly kvality bulk RNA-seq, vpravo je zobrazen interaktivní report MultiQC se statistikami sekvenování a metrikami Salmon.

Ze vzorkového listu bulk RNA-seq, balíčku FASTQ a referenčních souborů vytvořte balíček počtů zkontrolovaný kontrolou kvality, který můžete prohlížet a znovu použít v Codexu. Plugin Life Sciences NGS Analysis směruje požadavek, validuje vstupy a vrací auditovatelný obal běhu s MultiQC, maticemi Salmon, původem dat a explicitními výhradami.

Rozšířený přístup pro důvěryhodné organizace

Rozšiřujeme přístup k řadě GPT‑Rosalind pro způsobilé organizace po celém světě. GPT‑Rosalind bude dostupný ve výzkumném preview prostřednictvím naší struktury nasazení s důvěryhodným přístupem pro organizace, které provádějí legitimní vědecký výzkum s jasným veřejným přínosem, mají silné řízení a bezpečnostní dohled a kontrolovaný přístup se zabezpečením podnikové úrovně.

V rámci tohoto globálního rozšíření rádi pomůžeme podpořit misi společnosti Novo Nordisk přinášet pacientům inovativní možnosti léčby rychleji tím, že jí pomůžeme škálovat lékařský výzkum pomocí GPT‑Rosalind. Novo Nordisk využívá špičkové schopnosti AI, aby pomohl výzkumníkům analyzovat složité datové sady, odhalovat užitečné vzorce a rychleji testovat hypotézy. Silnější biologické porozumění GPT‑Rosalind pomůže týmům propojovat důkazy napříč literaturou, genomikou, transkriptomikou, sekvencemi, strukturami a experimentálními výsledky, takže bude snazší přecházet od dat k jasnějším výzkumným rozhodnutím.

„Výzkum v biologických vědách je složitý, bohatý na data a interdisciplinární. Aby pokročilé modely AI přinášely výzkumníkům smysluplnou hodnotu, musí být ukotveny v důvěryhodných vědeckých datech, propojeny s validovanými nástroji a integrovány do reálných workflow, která výzkumníci používají každý den. Těší nás naše partnerství s OpenAI a příležitost zkoumat, jak může GPT‑Rosalind podporovat přísnější a praktičtější přístupy k objevování léčiv.“

Mishal Patel, Group Vice President, AI & Digital Innovation, R&D - Novo Nordisk

Nyní také nabízíme pracovní prostor spravovaný OpenAI pro kvalifikované organizace bez účtu Enterprise.

Co bude dál

Aktualizovaný GPT‑Rosalind je dalším krokem v našem širším závazku budovat systémy AI, které mohou pomáhat urychlovat vědecké objevy a zároveň zajišťovat, aby pokročilé biologické schopnosti byly nasazovány s vhodnými ochrannými opatřeními. Budeme dál zlepšovat biologické uvažování modelu, rozšiřovat podporu pro výzkumná workflow náročná na nástroje a s dlouhým horizontem a spolupracovat s kvalifikovanými organizacemi napříč regiony na hodnocení reálného dopadu.

To také znamená aplikovat AI pro biologické vědy na práci s vysokým dopadem a veřejným přínosem, od objevování léčiv a translační medicíny po veřejné zdraví, připravenost a biologickou obranu. Prostřednictvím Rosalind Biodefense a našeho modelu nasazení s důvěryhodným přístupem chceme dostat špičkové biologické schopnosti do rukou výzkumníků, institucí a obránců, kteří pracují na zlepšení lidského zdraví a posílení společenské odolnosti.

Budeme nadále budovat GPT‑Rosalind, aby se stal schopnějším partnerem napříč celým životním cyklem vědeckého výzkumu a pomáhal vědcům rychleji postupovat od správných otázek k jasnějším důkazům, lepším experimentům a nakonec k tvorbě nové léčby pro pacienty.