Predstavujeme nové schopnosti pre GPT‑Rosalind
Prinášame vyššiu inteligenciu ukotvenú v reálnych vedeckých pracovných postupoch pre odvetvie biologických vied.
Predstavujeme novú aktualizáciu modelu v našej sérii GPT‑Rosalind, cielene vytvorenú pre výskum v biologických vedách v podnikovom rozsahu. Spája agentické programovanie a schopnosti používania nástrojov modelu GPT‑5.5 so silnejšou inteligenciou modelu v kľúčových oblastiach objavovania liekov, ako sú medicínska chémia a genomika, a zároveň zvyšuje výkon v širších analýzach, návrhu a experimentálnych pracovných postupoch biologických vied.
Pokrok v biologických vedách závisí od syntézy dát a dôkazov naprieč mierkami a modalitami: molekulami, génmi, dráhami a živými systémami. V našich hodnoteniach aktualizovaný GPT‑Rosalind vykazuje široké zlepšenia výkonu pri výskumných úlohách od odborníkov na biológiu, zložitých otázkach medicínskej chémie, kvantitatívnej biológii a riešení problémov v mokrom laboratóriu.
GPT‑Rosalind je teraz dostupný v režime výskumného náhľadu pre oprávnené organizácie na celom svete prostredníctvom našej štruktúry nasadenia s dôveryhodným prístupom.
Aby sme merali a priebežne zlepšovali reálny vplyv GPT‑Rosalind, navrhli sme LifeSciBench, benchmark posudzovaný externými odborníkmi so zameraním na základné aspekty výskumu v biologických vedách. Na rozdiel od existujúcich benchmarkov, ktoré hodnotia jednu zložku výkonu modelu alebo biologickú doménu izolovane, LifeSciBench sa pozerá na vedecky hodnotnú prácu od začiatku do konca pomocou úloh zo šiestich oblastí pracovných postupov kľúčových pre výskum v biologických vedách: práca s dôkazmi, analýza, návrh a optimalizácia, vedecké uvažovanie, validácia a prevádzka a preklad a komunikácia. Tento benchmark používame na zosúladenie pokroku s potrebami a realitou výskumu v biologických vedách.
GPT‑Rosalind vedie vo výkone naprieč vedecky hodnotnými úlohami identifikovanými odborníkmi z priemyslu a akademickej sféry.
Extrahovanie, zosúlaďovanie a auditovanie vedeckých dôkazov z článkov, obrázkov, tabuliek a experimentálnych záznamov.
Príklad hodnotenia
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Odpoveď kandidáta
Záver: V predloženej podobe tento balík nie je dostatočne silný na podporu zrýchleného schválenia na základe expresie mikrodystrofínu ako náhradného koncového bodu, pri ktorom je primerane pravdepodobné, že predpovedá klinický prínos. Skeptický hodnotiteľ FDA by pravdepodobne považoval dôkazy o biomarkeri, funkčnosti, trvácnosti, bezpečnosti a zovšeobecniteľnosti za materiálne nedostatočne podporené.
Položka balíka | Kľúčový režim zlyhania | Čo by bolo potrebné |
|---|---|---|
Kvantifikácia western blot | MANEX1A sa viaže na N-terminálny epitop zdieľaný endogénnym plnodĺžkovým dystrofínom a transgénom mikrodystrofínu, takže test čisto nerozlišuje transgén od reziduálneho/revertantného dystrofínu. Kvantifikácia 138 kDa mikrodystrofínu voči zdravému štandardu plnodĺžkového dystrofínu je tiež neplatná. | Použiť rekombinantný štandard mikrodystrofínu a ortogonálnu metódu, ktorá odlišuje transgén od endogénneho dystrofínu, napríklad cielenú hmotnostnú spektrometriu alebo test špecifický pre transgén/epitop. |
Imunofluorescencia | C-terminálna polyklonálna protilátka je nevhodná, pretože 138 kDa konštrukt nemá C-terminálnu doménu. Mnohí pacienti s DMD majú revertantné vlákna a revertantný dystrofín si môže zachovať C-terminálne epitopy. Revertantné vlákna sa môžu klonálne rozširovať s vekom, čo skresľuje IF signál, najmä u starších chlapcov. | Zopakovať IF s protilátkou proti epitopu prítomnému v transgéne, ale neprítomnému v revertantnom dystrofíne. Kvantifikovať transgén-pozitívne vlákna oddelene od revertantných vlákien. |
Platnosť náhradného koncového bodu | Balík stotožňuje množstvo proteínu s klinickou funkciou. „38 % hmotnosti proteínu zdravých kontrol“ neznamená 38 % normálnej funkcie dystrofínu, pretože mikrodystrofín je štrukturálne skrátený. | Empiricky validovať vzťah medzi hmotnostným percentom mikrodystrofínu, sarkolemálnou lokalizáciou, následnou funkčnou obnovou a klinickým prínosom predtým, než sa expresia bude považovať za náhradný koncový bod. |
Dizajn biopsie | Kontralaterálne biopsie vastus lateralis pred liečbou a po nej zavádzajú ľavo-pravú a intramuskulárnu priestorovú variabilitu. Progresia ochorenia a fibro-tuková náhrada môžu tiež meniť signál normalizovaný na celkový proteín. | Štandardizovať miesto biopsie pomocou konzistentných anatomických orientačných bodov, normalizovať na svalovo špecifické proteíny a paralelne merať fibro-tukové zloženie. |
Komparátor/štatistika NSAA | Externá kohorta prirodzeného priebehu nie je randomizovaná súbežná kontrola. Kritériá zaradenia do štúdie, podporná starostlivosť, účinky účasti, východiskové NSAA, steroidný režim, vek a trieda exónu môžu porovnanie skresliť. Nepárový t-test nestačí. Okrem toho zmena NSAA +1,4 je v rámci variability test-retest pre túto vekovú skupinu. | Vykonať randomizovanú súbežnú placebom kontrolovanú štúdiu alebo prinajmenšom použiť upravené analýzy zohľadňujúce východiskové NSAA, vek, steroidný režim, triedu exónu a ďalšie konfúzory. |
Konfúzia vekového okna | Chlapci vo veku 4 – 7 rokov sú vo vývojovom okne, v ktorom môžu neliečení ambulantní pacienti s DMD získať motorickú funkciu skôr, než začne dominovať pokles. 48-týždňová zmena NSAA mieša vývojový zisk, progresiu ochorenia a možný účinok liečby. | Použiť súbežnú randomizovanú kontrolu so stratifikáciou podľa veku na oddelenie vývojovej trajektórie od účinku liečby. |
Predchádzajúci klinický precedens | Funkčné signály mikrodystrofínu v otvorených štúdiách spoľahlivo nepredpovedali konfirmačný prínos; publikovaný precedens zahŕňa konfirmačné štúdie génovej terapie mikrodystrofínom, ktoré nedokázali reprodukovať zlepšenia NSAA z otvorených štúdií. | Nespoliehať sa na zmenu NSAA v otvorenej štúdii ako rozhodujúcu podporu. Vyžadovať kontrolované funkčné dôkazy. |
Štrukturálne limity konštruktu | 138 kDa konštrukt odstraňuje spektrínové opakovania R16/17, ktoré obsahujú väzbové miesta pre nNOS. Strata náboru nNOS môže zhoršiť funkčnú sympatolýzu a ochranu pred ischémiou počas cvičenia, čím vytvára mechanistický strop záchrany nezávislý od úrovne expresie. | Pridať mechanistické štúdie ukazujúce, či tento konkrétny konštrukt obnovuje relevantnú funkciu komplexu asociovaného s dystrofínom, lokalizáciu nNOS, fyziológiu cvičenia a ochranu svalu. |
Trvácnosť AAV | Vektorové genómy po 12 týždňoch nepreukazujú trvalú expresiu. Genómy AAV9 sú prevažne neintegrujúce epizómy a môžu časom klesať. Perzistencia vektorového genómu nie je to isté ako perzistentná expresia proteínu. | Merať longitudinálnu expresiu transgénového proteínu a trvácnosť funkčných biomarkerov po viac než 12 týždňoch. |
Imunitný/bezpečnostný profil | Transaminitída u 8/12 pacientov je konzistentná s imunitnou odpoveďou na bunky transdukované AAV, ale mechanizmus nie je stanovený. Jeden prípad myokarditídy je znepokojujúci vzhľadom na kardiálny tropizmus AAV9. | Poskytnúť hlbšie imunitné monitorovanie, charakterizáciu bezpečnosti pečene/srdca a zintenzívnené kardiálne sledovanie. |
Výber pacientov/zovšeobecniteľnosť | Vylúčenie pacientov pozitívnych na neutralizačné protilátky proti AAV9 obmedzuje zovšeobecniteľnosť. Vylúčenie delécií exónu 44 obmedzuje použiteľnosť pre túto podskupinu DMD. n=12 je príliš málo na charakterizáciu bezpečnosti a účinnosti v širšej populácii DMD. | Rozšíriť oprávnenosť, kde je to možné, alebo vopred špecifikovať stratifikované analýzy podľa stavu protilátok, genotypu/triedy exónu, veku a východiskovej funkcie pred použitím výsledku na podporu širokého schválenia. |
Regulačný záver: Balík môže ukazovať biologickú aktivitu, ale zatiaľ nepreukazuje, že meraná expresia mikrodystrofínu je spoľahlivý náhradný ukazovateľ s primeranou pravdepodobnosťou predpovedať klinický prínos. Hlavné medzery sú špecificita testu, neplatné kvantifikačné štandardy, možné skreslenie revertantnými vláknami, chýbajúca randomizovaná kontrola, vekové skreslenie NSAA, neistá trvácnosť a nevyriešené otázky bezpečnosti/zovšeobecniteľnosti.
Na odstránenie medzery by program potreboval kontrolovaný, podľa veku stratifikovaný klinický dizajn s testami expresie špecifickými pre transgén, ortogonálnou kvantifikáciou proteínu, kontrolami zloženia tkaniva, longitudinálnymi údajmi o trvácnosti, mechanistickými funkčnými testami pre skrátený konštrukt a silnejším bezpečnostným monitorovaním, najmä hepatálnym a kardiálnym.
Kritériá hodnotenia a známky
GPT‑Rosalind dosahuje špičkový výkon v odvetví medicínskej chémie, oblasti zameranej na premenu molekúl na užitočné lieky. MedChemBench sme navrhli tak, aby odrážal realistické pracovné postupy medicínskej chémie a hodnotil multimodálne porozumenie chemickým štruktúram, vzťah štruktúry a aktivity (SAR), predikciu účinnosti, toxicity a absorpcie, distribúcie, metabolizmu a exkrécie liekov (ADME), rozhodovanie pri multiparametrickej optimalizácii lídrov a retrosyntézu. GPT‑Rosalind prekonáva GPT‑5.5 v MedChemBench s výsledkom 27,5 % oproti 25,1 %, pričom používa o 7,2 % menej tokenov.
GPT‑Rosalind vykazuje lepšiu multimodálnu syntézu a mechanistické uvažovanie v medicínskej chémii.
V GeneBench, našom agentickom hodnotení dlhodobých end-to-end analýz v genomike a kvantitatívnej biológii, používa GPT‑Rosalind o 31 % menej tokenov než GPT‑5.5 a zároveň dosahuje vyššiu presnosť 21,6 % oproti 20,4 %. GeneBench hodnotí agentický výkon pri dlhodobých kvantitatívnych úlohách: dokáže agent na základe realistických vedeckých dát naplánovať platnú analýzu, kontrolu kvality, modelovanie a korekcie tak, aby dospel k odpovediam relevantným pre rozhodnutie? Zahrnuté problémy pokrývajú rôzne domény vrátane funkčnej genomiky, priestorovej transkriptomiky, proteomiky, epigenomiky a aplikovanej genetiky.
GPT‑Rosalind používa o 31 % menej tokenov než GPT‑5.5 a zároveň zlepšuje presnosť.
Predstavujeme nové hodnotenie na testovanie schopnosti GPT‑Rosalind pomáhať vedcom vykonávajúcim laboratórnu prácu v reálnom svete. LabWorkBench testuje schopnosť modelu prepojiť perturbácie s experimentálnymi výsledkami v reálnych protokoloch mokrého laboratória používaných vedcami, na účely od riešenia problémov až po optimalizáciu. Dáta používané benchmarkom LabWorkBench sú proprietárne, a preto nekontaminované. GPT‑Rosalind dosahuje 63,2 % oproti 55,8 % pri GPT‑5.5, pričom používa o 5,3 % menej tokenov.
Pri asistencii s reálnymi protokolmi mokrého laboratória vykazuje GPT‑Rosalind výrazné zlepšenia oproti GPT‑5.5 a zároveň zvyšuje tokenovú efektivitu.
Vytvorili sme pluginy Life Sciences Research(otvorí sa v novom okne) a Life Sciences NGS Analysis(otvorí sa v novom okne), aby rozšírili zvýšenú inteligenciu GPT‑Rosalind o praktickú vrstvu vykonávania opakovateľných vedeckých pracovných postupov. Spolu tieto pluginy prinášajú vyhľadávanie zdrojovaných dôkazov, biologickú interpretáciu a bioinformatické vykonávanie do toho istého pracovného priestoru, čím pomáhajú výskumníkom prepájať externé dôkazy s internými omickými analýzami pri zachovaní artefaktov a pôvodu dát. Všetci používatelia teraz môžu pristupovať k obom pluginom prostredníctvom Codex. Kvalifikovaní podnikoví používatelia GPT‑Rosalind môžu navyše používať GPT‑Rosalind na pohon týchto pluginov.
Aby sme lepšie využili Codex ako dynamickú pracovnú lavicu pre vedcov, pridali sme interaktívne prehliadače pre biologicky natívne typy súborov. Počiatočná sada prehliadačov sekvencií, zarovnaní a štruktúr je navrhnutá tak, aby vedcov držala blízko pri dôkazoch, zatiaľ čo GPT‑Rosalind uvažuje naprieč pracovným postupom a priamo odpovedá na doplňujúce otázky pomocou aktívneho prehliadača v kontexte.
Ukážka vyššie predvádza tieto schopnosti v praxi, orchestruje ju GPT‑Rosalind. Sledujeme vedca, ktorý skúma tekutú biopsiu nádoru s cieľom identifikovať mutácie a ďalšie molekulárne zmeny, ktoré by mohli informovať liečbu. Plugin Life Sciences NGS Analysis mení kontrolu spracovaných záznamov ctDNA na interaktívny notebook, ktorý zvýrazňuje opakujúce sa alterácie, nízkofrekvenčné volania a trajektórie vzoriek, ktoré zameriavajú vyšetrovanie na KRAS G12C. Odtiaľ plugin Life Sciences Research pridáva zdrojovaný kontext cieľa, inhibítora a rezistencie, zatiaľ čo natívne prehliadače sekvencií, zarovnaní a štruktúr umožňujú vedcovi priamo preskúmať mutantný zvyšok 12, jeho konzerváciu naprieč rodinou RAS a vrecko viazané na inhibítor. Pracovný postup sa uzatvára prekladom týchto dôkazov do konkrétnych možností následných krokov, pričom každý krok a artefakt je dostupný na odbornú kontrolu.

Plugin Life Sciences NGS Analysis
Kontrola kvality scRNA-seq a anotácia

Premeňte maticový balík v štýle 10x na jednobunkové artefakty, anotácie a UMAP filtrované podľa kontroly kvality, ktoré môžete kontrolovať a upravovať v Codex. Plugin Life Sciences NGS Analysis smeruje požiadavku na scrna-seq-qc, vyberá prahy QC z dát, zachováva pôvod údajov okolo filtrovania a anotácie a zvýrazňuje blokátory, ako sú chýbajúce závislosti detekcie dubletov.
Kontrola kvality FASTQ pre hromadné RNA-seq

Premeňte vzorový hárok hromadného RNA-seq, balík FASTQ a referenčné súbory na balík počtov skontrolovaný z hľadiska kvality, ktorý môžete kontrolovať a opakovane použiť v Codex. Plugin Life Sciences NGS Analysis smeruje požiadavku, validuje vstupy a vracia auditovateľnú obálku behu s MultiQC, maticami Salmon, pôvodom dát a explicitnými výhradami.
Rozširujeme prístup k sérii GPT‑Rosalind pre oprávnené organizácie na celom svete. GPT‑Rosalind bude dostupný vo výskumnom náhľade prostredníctvom našej štruktúry nasadenia s dôveryhodným prístupom pre organizácie, ktoré vykonávajú legitímny vedecký výskum s jasným verejným prínosom, majú silné riadenie a bezpečnostný dohľad a kontrolovaný prístup so zabezpečením podnikovej úrovne.
V rámci tohto globálneho rozšírenia sa tešíme, že môžeme podporiť misiu spoločnosti Novo Nordisk prinášať pacientom inovatívne možnosti liečby rýchlejšie tým, že pomôžeme škálovať jej medicínsky výskum pomocou GPT‑Rosalind. Novo Nordisk využíva hraničné schopnosti AI na pomoc výskumníkom analyzovať zložité súbory dát, odhaľovať užitočné vzorce a rýchlejšie testovať hypotézy. Silnejšie biologické porozumenie GPT‑Rosalind pomôže tímom prepájať dôkazy naprieč literatúrou, genomikou, transkriptomikou, sekvenciami, štruktúrou a experimentálnymi výsledkami, čo uľahčí prechod od dát k jasnejším výskumným rozhodnutiam.
„Výskum v biologických vedách je komplexný, bohatý na dáta a interdisciplinárny. Aby pokročilé modely AI prinášali výskumníkom zmysluplnú hodnotu, musia byť ukotvené v dôveryhodných vedeckých dátach, prepojené s validovanými nástrojmi a integrované do reálnych pracovných postupov, ktoré výskumníci používajú každý deň. Teší nás naše partnerstvo s OpenAI a príležitosť preskúmať, ako môže GPT‑Rosalind podporiť rigoróznejšie a praktickejšie prístupy k objavovaniu liekov.“
Mishal Patel, Group Vice President, AI & Digital Innovation, R&D - Novo Nordisk
Teraz ponúkame aj pracovný priestor spravovaný OpenAI pre kvalifikované organizácie bez účtu Enterprise.
Aktualizovaný GPT‑Rosalind je ďalším krokom v našom širšom záväzku budovať systémy AI, ktoré pomáhajú urýchľovať vedecké objavy a zároveň zabezpečujú, aby sa pokročilé biologické schopnosti nasadzovali s primeranými ochrannými opatreniami. Budeme naďalej zlepšovať biologické uvažovanie modelu, rozširovať podporu pre výskumné pracovné postupy náročné na nástroje a s dlhým horizontom a spolupracovať s kvalifikovanými organizáciami naprieč regiónmi na hodnotení reálneho vplyvu.
Znamená to aj uplatňovanie AI pre biologické vedy v práci s vysokým verejným prínosom, od objavovania liekov a translačnej medicíny až po verejné zdravie, pripravenosť a biologickú obranu. Prostredníctvom Rosalind Biodefense a nášho modelu nasadenia s dôveryhodným prístupom chceme dostať hraničné biologické schopnosti do rúk výskumníkov, inštitúcií a obrancov pracujúcich na zlepšovaní ľudského zdravia a posilňovaní spoločenskej odolnosti.
Budeme ďalej budovať GPT‑Rosalind, aby sa stal schopnejším partnerom v celom životnom cykle vedeckého výskumu a pomáhal vedcom rýchlejšie prechádzať od správnych otázok k jasnejším dôkazom, lepším experimentom a napokon k novým liečbam pre pacientov.


