3. júna 2026

Predstavujeme nové schopnosti pre GPT‑Rosalind

Prinášame vyššiu inteligenciu ukotvenú v reálnych vedeckých pracovných postupoch pre odvetvie biologických vied.

Predstavujeme novú aktualizáciu modelu v našej sérii GPT‑Rosalind, cielene vytvorenú pre výskum v biologických vedách v podnikovom rozsahu. Spája agentické programovanie a schopnosti používania nástrojov modelu GPT‑5.5 so silnejšou inteligenciou modelu v kľúčových oblastiach objavovania liekov, ako sú medicínska chémia a genomika, a zároveň zvyšuje výkon v širších analýzach, návrhu a experimentálnych pracovných postupoch biologických vied.

Pokrok v biologických vedách závisí od syntézy dát a dôkazov naprieč mierkami a modalitami: molekulami, génmi, dráhami a živými systémami. V našich hodnoteniach aktualizovaný GPT‑Rosalind vykazuje široké zlepšenia výkonu pri výskumných úlohách od odborníkov na biológiu, zložitých otázkach medicínskej chémie, kvantitatívnej biológii a riešení problémov v mokrom laboratóriu.

GPT‑Rosalind je teraz dostupný v režime výskumného náhľadu pre oprávnené organizácie na celom svete prostredníctvom našej štruktúry nasadenia s dôveryhodným prístupom.

Zlepšovanie výkonu v vedecky hodnotných úlohách

Aby sme merali a priebežne zlepšovali reálny vplyv GPT‑Rosalind, navrhli sme LifeSciBench, benchmark posudzovaný externými odborníkmi so zameraním na základné aspekty výskumu v biologických vedách. Na rozdiel od existujúcich benchmarkov, ktoré hodnotia jednu zložku výkonu modelu alebo biologickú doménu izolovane, LifeSciBench sa pozerá na vedecky hodnotnú prácu od začiatku do konca pomocou úloh zo šiestich oblastí pracovných postupov kľúčových pre výskum v biologických vedách: práca s dôkazmi, analýza, návrh a optimalizácia, vedecké uvažovanie, validácia a prevádzka a preklad a komunikácia. Tento benchmark používame na zosúladenie pokroku s potrebami a realitou výskumu v biologických vedách.

GPT‑Rosalind vedie vo výkone naprieč vedecky hodnotnými úlohami identifikovanými odborníkmi z priemyslu a akademickej sféry.

Extrahovanie, zosúlaďovanie a auditovanie vedeckých dôkazov z článkov, obrázkov, tabuliek a experimentálnych záznamov.

Príklad hodnotenia

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Odpoveď kandidáta

Záver: V predloženej podobe tento balík nie je dostatočne silný na podporu zrýchleného schválenia na základe expresie mikrodystrofínu ako náhradného koncového bodu, pri ktorom je primerane pravdepodobné, že predpovedá klinický prínos. Skeptický hodnotiteľ FDA by pravdepodobne považoval dôkazy o biomarkeri, funkčnosti, trvácnosti, bezpečnosti a zovšeobecniteľnosti za materiálne nedostatočne podporené.

Položka balíka	Kľúčový režim zlyhania	Čo by bolo potrebné
Kvantifikácia western blot	MANEX1A sa viaže na N-terminálny epitop zdieľaný endogénnym plnodĺžkovým dystrofínom a transgénom mikrodystrofínu, takže test čisto nerozlišuje transgén od reziduálneho/revertantného dystrofínu. Kvantifikácia 138 kDa mikrodystrofínu voči zdravému štandardu plnodĺžkového dystrofínu je tiež neplatná.	Použiť rekombinantný štandard mikrodystrofínu a ortogonálnu metódu, ktorá odlišuje transgén od endogénneho dystrofínu, napríklad cielenú hmotnostnú spektrometriu alebo test špecifický pre transgén/epitop.
Imunofluorescencia	C-terminálna polyklonálna protilátka je nevhodná, pretože 138 kDa konštrukt nemá C-terminálnu doménu. Mnohí pacienti s DMD majú revertantné vlákna a revertantný dystrofín si môže zachovať C-terminálne epitopy. Revertantné vlákna sa môžu klonálne rozširovať s vekom, čo skresľuje IF signál, najmä u starších chlapcov.	Zopakovať IF s protilátkou proti epitopu prítomnému v transgéne, ale neprítomnému v revertantnom dystrofíne. Kvantifikovať transgén-pozitívne vlákna oddelene od revertantných vlákien.
Platnosť náhradného koncového bodu	Balík stotožňuje množstvo proteínu s klinickou funkciou. „38 % hmotnosti proteínu zdravých kontrol“ neznamená 38 % normálnej funkcie dystrofínu, pretože mikrodystrofín je štrukturálne skrátený.	Empiricky validovať vzťah medzi hmotnostným percentom mikrodystrofínu, sarkolemálnou lokalizáciou, následnou funkčnou obnovou a klinickým prínosom predtým, než sa expresia bude považovať za náhradný koncový bod.
Dizajn biopsie	Kontralaterálne biopsie vastus lateralis pred liečbou a po nej zavádzajú ľavo-pravú a intramuskulárnu priestorovú variabilitu. Progresia ochorenia a fibro-tuková náhrada môžu tiež meniť signál normalizovaný na celkový proteín.	Štandardizovať miesto biopsie pomocou konzistentných anatomických orientačných bodov, normalizovať na svalovo špecifické proteíny a paralelne merať fibro-tukové zloženie.
Komparátor/štatistika NSAA	Externá kohorta prirodzeného priebehu nie je randomizovaná súbežná kontrola. Kritériá zaradenia do štúdie, podporná starostlivosť, účinky účasti, východiskové NSAA, steroidný režim, vek a trieda exónu môžu porovnanie skresliť. Nepárový t-test nestačí. Okrem toho zmena NSAA +1,4 je v rámci variability test-retest pre túto vekovú skupinu.	Vykonať randomizovanú súbežnú placebom kontrolovanú štúdiu alebo prinajmenšom použiť upravené analýzy zohľadňujúce východiskové NSAA, vek, steroidný režim, triedu exónu a ďalšie konfúzory.
Konfúzia vekového okna	Chlapci vo veku 4 – 7 rokov sú vo vývojovom okne, v ktorom môžu neliečení ambulantní pacienti s DMD získať motorickú funkciu skôr, než začne dominovať pokles. 48-týždňová zmena NSAA mieša vývojový zisk, progresiu ochorenia a možný účinok liečby.	Použiť súbežnú randomizovanú kontrolu so stratifikáciou podľa veku na oddelenie vývojovej trajektórie od účinku liečby.
Predchádzajúci klinický precedens	Funkčné signály mikrodystrofínu v otvorených štúdiách spoľahlivo nepredpovedali konfirmačný prínos; publikovaný precedens zahŕňa konfirmačné štúdie génovej terapie mikrodystrofínom, ktoré nedokázali reprodukovať zlepšenia NSAA z otvorených štúdií.	Nespoliehať sa na zmenu NSAA v otvorenej štúdii ako rozhodujúcu podporu. Vyžadovať kontrolované funkčné dôkazy.
Štrukturálne limity konštruktu	138 kDa konštrukt odstraňuje spektrínové opakovania R16/17, ktoré obsahujú väzbové miesta pre nNOS. Strata náboru nNOS môže zhoršiť funkčnú sympatolýzu a ochranu pred ischémiou počas cvičenia, čím vytvára mechanistický strop záchrany nezávislý od úrovne expresie.	Pridať mechanistické štúdie ukazujúce, či tento konkrétny konštrukt obnovuje relevantnú funkciu komplexu asociovaného s dystrofínom, lokalizáciu nNOS, fyziológiu cvičenia a ochranu svalu.
Trvácnosť AAV	Vektorové genómy po 12 týždňoch nepreukazujú trvalú expresiu. Genómy AAV9 sú prevažne neintegrujúce epizómy a môžu časom klesať. Perzistencia vektorového genómu nie je to isté ako perzistentná expresia proteínu.	Merať longitudinálnu expresiu transgénového proteínu a trvácnosť funkčných biomarkerov po viac než 12 týždňoch.
Imunitný/bezpečnostný profil	Transaminitída u 8/12 pacientov je konzistentná s imunitnou odpoveďou na bunky transdukované AAV, ale mechanizmus nie je stanovený. Jeden prípad myokarditídy je znepokojujúci vzhľadom na kardiálny tropizmus AAV9.	Poskytnúť hlbšie imunitné monitorovanie, charakterizáciu bezpečnosti pečene/srdca a zintenzívnené kardiálne sledovanie.
Výber pacientov/zovšeobecniteľnosť	Vylúčenie pacientov pozitívnych na neutralizačné protilátky proti AAV9 obmedzuje zovšeobecniteľnosť. Vylúčenie delécií exónu 44 obmedzuje použiteľnosť pre túto podskupinu DMD. n=12 je príliš málo na charakterizáciu bezpečnosti a účinnosti v širšej populácii DMD.	Rozšíriť oprávnenosť, kde je to možné, alebo vopred špecifikovať stratifikované analýzy podľa stavu protilátok, genotypu/triedy exónu, veku a východiskovej funkcie pred použitím výsledku na podporu širokého schválenia.

Regulačný záver: Balík môže ukazovať biologickú aktivitu, ale zatiaľ nepreukazuje, že meraná expresia mikrodystrofínu je spoľahlivý náhradný ukazovateľ s primeranou pravdepodobnosťou predpovedať klinický prínos. Hlavné medzery sú špecificita testu, neplatné kvantifikačné štandardy, možné skreslenie revertantnými vláknami, chýbajúca randomizovaná kontrola, vekové skreslenie NSAA, neistá trvácnosť a nevyriešené otázky bezpečnosti/zovšeobecniteľnosti.

Na odstránenie medzery by program potreboval kontrolovaný, podľa veku stratifikovaný klinický dizajn s testami expresie špecifickými pre transgén, ortogonálnou kvantifikáciou proteínu, kontrolami zloženia tkaniva, longitudinálnymi údajmi o trvácnosti, mechanistickými funkčnými testami pre skrátený konštrukt a silnejším bezpečnostným monitorovaním, najmä hepatálnym a kardiálnym.

Kritériá hodnotenia a známky

Kritérium

Body

Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.

+24

Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.

+22

Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.

+19

Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.

+12

Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.

+15

Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.

Silnejšie vedecké uvažovanie

Medicínska chémia

GPT‑Rosalind dosahuje špičkový výkon v odvetví medicínskej chémie, oblasti zameranej na premenu molekúl na užitočné lieky. MedChemBench sme navrhli tak, aby odrážal realistické pracovné postupy medicínskej chémie a hodnotil multimodálne porozumenie chemickým štruktúram, vzťah štruktúry a aktivity (SAR), predikciu účinnosti, toxicity a absorpcie, distribúcie, metabolizmu a exkrécie liekov (ADME), rozhodovanie pri multiparametrickej optimalizácii lídrov a retrosyntézu. GPT‑Rosalind prekonáva GPT‑5.5 v MedChemBench s výsledkom 27,5 % oproti 25,1 %, pričom používa o 7,2 % menej tokenov.

GPT‑Rosalind vykazuje lepšiu multimodálnu syntézu a mechanistické uvažovanie v medicínskej chémii.

Genomika a kvantitatívna biológia

V GeneBench, našom agentickom hodnotení dlhodobých end-to-end analýz v genomike a kvantitatívnej biológii, používa GPT‑Rosalind o 31 % menej tokenov než GPT‑5.5 a zároveň dosahuje vyššiu presnosť 21,6 % oproti 20,4 %. GeneBench hodnotí agentický výkon pri dlhodobých kvantitatívnych úlohách: dokáže agent na základe realistických vedeckých dát naplánovať platnú analýzu, kontrolu kvality, modelovanie a korekcie tak, aby dospel k odpovediam relevantným pre rozhodnutie? Zahrnuté problémy pokrývajú rôzne domény vrátane funkčnej genomiky, priestorovej transkriptomiky, proteomiky, epigenomiky a aplikovanej genetiky.

GPT‑Rosalind používa o 31 % menej tokenov než GPT‑5.5 a zároveň zlepšuje presnosť.

Pomoc pri reálnej laboratórnej práci

Predstavujeme nové hodnotenie na testovanie schopnosti GPT‑Rosalind pomáhať vedcom vykonávajúcim laboratórnu prácu v reálnom svete. LabWorkBench testuje schopnosť modelu prepojiť perturbácie s experimentálnymi výsledkami v reálnych protokoloch mokrého laboratória používaných vedcami, na účely od riešenia problémov až po optimalizáciu. Dáta používané benchmarkom LabWorkBench sú proprietárne, a preto nekontaminované. GPT‑Rosalind dosahuje 63,2 % oproti 55,8 % pri GPT‑5.5, pričom používa o 5,3 % menej tokenov.

Pri asistencii s reálnymi protokolmi mokrého laboratória vykazuje GPT‑Rosalind výrazné zlepšenia oproti GPT‑5.5 a zároveň zvyšuje tokenovú efektivitu.

Od uvažovania k vykonaným pracovným postupom

Vytvorili sme pluginy Life Sciences Research⁠(otvorí sa v novom okne) a Life Sciences NGS Analysis⁠(otvorí sa v novom okne), aby rozšírili zvýšenú inteligenciu GPT‑Rosalind o praktickú vrstvu vykonávania opakovateľných vedeckých pracovných postupov. Spolu tieto pluginy prinášajú vyhľadávanie zdrojovaných dôkazov, biologickú interpretáciu a bioinformatické vykonávanie do toho istého pracovného priestoru, čím pomáhajú výskumníkom prepájať externé dôkazy s internými omickými analýzami pri zachovaní artefaktov a pôvodu dát. Všetci používatelia teraz môžu pristupovať k obom pluginom prostredníctvom Codex. Kvalifikovaní podnikoví používatelia GPT‑Rosalind môžu navyše používať GPT‑Rosalind na pohon týchto pluginov.

Aby sme lepšie využili Codex ako dynamickú pracovnú lavicu pre vedcov, pridali sme interaktívne prehliadače pre biologicky natívne typy súborov. Počiatočná sada prehliadačov sekvencií, zarovnaní a štruktúr je navrhnutá tak, aby vedcov držala blízko pri dôkazoch, zatiaľ čo GPT‑Rosalind uvažuje naprieč pracovným postupom a priamo odpovedá na doplňujúce otázky pomocou aktívneho prehliadača v kontexte.

Ukážka vyššie predvádza tieto schopnosti v praxi, orchestruje ju GPT‑Rosalind. Sledujeme vedca, ktorý skúma tekutú biopsiu nádoru s cieľom identifikovať mutácie a ďalšie molekulárne zmeny, ktoré by mohli informovať liečbu. Plugin Life Sciences NGS Analysis mení kontrolu spracovaných záznamov ctDNA na interaktívny notebook, ktorý zvýrazňuje opakujúce sa alterácie, nízkofrekvenčné volania a trajektórie vzoriek, ktoré zameriavajú vyšetrovanie na KRAS G12C. Odtiaľ plugin Life Sciences Research pridáva zdrojovaný kontext cieľa, inhibítora a rezistencie, zatiaľ čo natívne prehliadače sekvencií, zarovnaní a štruktúr umožňujú vedcovi priamo preskúmať mutantný zvyšok 12, jeho konzerváciu naprieč rodinou RAS a vrecko viazané na inhibítor. Pracovný postup sa uzatvára prekladom týchto dôkazov do konkrétnych možností následných krokov, pričom každý krok a artefakt je dostupný na odbornú kontrolu.

Obrazovka počítača zobrazuje pracovný priestor s pokynmi na použitie pluginu NGS Analysis na skúmanie údajov o mutáciách ctDNA. Obrazovka obsahuje niekoľko stĺpcových grafov označených „Najčastejšie podrobné histológie“ a „Najčastejšie zmenené gény podľa vzoriek mutovanej cfDNA“, ktoré zobrazujú údaje o typoch rakoviny a génových zmenách. Text opisuje súbor dát, kľúčové zistenia a parametre analýzy. — Plugin Life Sciences NGS Analysis

Kontrola kvality scRNA-seq a anotácia

Snímka obrazovky bioinformatického pracovného postupu na rozdelenej obrazovke. Ľavý panel zobrazuje asistenta AI, ktorý sumarizuje dokončenú analýzu kontroly kvality jednobunkového sekvenovania RNA (scRNA-seq) vrátane vygenerovaných súborov, metrík QC, vizualizácií UMAP a anotácií typov buniek. Pravý panel zobrazuje report „Kontrola scRNA QC“ s histogramami celkových počtov, detegovaných génov a mitochondriálneho percenta spolu so stĺpcovými grafmi počtov vyhovelo/nevyhovelo QC a filtrovaných bunkových populácií. Rozhranie je zobrazené na modro-zelenom gradientnom pozadí. — Premeňte maticový balík v štýle 10x na jednobunkové artefakty, anotácie a UMAP filtrované podľa kontroly kvality, ktoré môžete kontrolovať a upravovať v Codex. Plugin Life Sciences NGS Analysis smeruje požiadavku na scrna-seq-qc, vyberá prahy QC z dát, zachováva pôvod údajov okolo filtrovania a anotácie a zvýrazňuje blokátory, ako sú chýbajúce závislosti detekcie dubletov.

Kontrola kvality FASTQ pre hromadné RNA-seq

Pohľad na rozdelenú obrazovku pracovného postupu RNA-seq: asistent AI vľavo sumarizuje dokončené výsledky kontroly kvality hromadného RNA-seq, zatiaľ čo vpravo je zobrazený interaktívny report MultiQC so štatistikami sekvenovania a metrikami Salmon. — Premeňte vzorový hárok hromadného RNA-seq, balík FASTQ a referenčné súbory na balík počtov skontrolovaný z hľadiska kvality, ktorý môžete kontrolovať a opakovane použiť v Codex. Plugin Life Sciences NGS Analysis smeruje požiadavku, validuje vstupy a vracia auditovateľnú obálku behu s MultiQC, maticami Salmon, pôvodom dát a explicitnými výhradami.

Rozšírený prístup pre dôveryhodné organizácie

Rozširujeme prístup k sérii GPT‑Rosalind pre oprávnené organizácie na celom svete. GPT‑Rosalind bude dostupný vo výskumnom náhľade prostredníctvom našej štruktúry nasadenia s dôveryhodným prístupom pre organizácie, ktoré vykonávajú legitímny vedecký výskum s jasným verejným prínosom, majú silné riadenie a bezpečnostný dohľad a kontrolovaný prístup so zabezpečením podnikovej úrovne.

V rámci tohto globálneho rozšírenia sa tešíme, že môžeme podporiť misiu spoločnosti Novo Nordisk prinášať pacientom inovatívne možnosti liečby rýchlejšie tým, že pomôžeme škálovať jej medicínsky výskum pomocou GPT‑Rosalind. Novo Nordisk využíva hraničné schopnosti AI na pomoc výskumníkom analyzovať zložité súbory dát, odhaľovať užitočné vzorce a rýchlejšie testovať hypotézy. Silnejšie biologické porozumenie GPT‑Rosalind pomôže tímom prepájať dôkazy naprieč literatúrou, genomikou, transkriptomikou, sekvenciami, štruktúrou a experimentálnymi výsledkami, čo uľahčí prechod od dát k jasnejším výskumným rozhodnutiam.

„Výskum v biologických vedách je komplexný, bohatý na dáta a interdisciplinárny. Aby pokročilé modely AI prinášali výskumníkom zmysluplnú hodnotu, musia byť ukotvené v dôveryhodných vedeckých dátach, prepojené s validovanými nástrojmi a integrované do reálnych pracovných postupov, ktoré výskumníci používajú každý deň. Teší nás naše partnerstvo s OpenAI a príležitosť preskúmať, ako môže GPT‑Rosalind podporiť rigoróznejšie a praktickejšie prístupy k objavovaniu liekov.“

Mishal Patel, Group Vice President, AI & Digital Innovation, R&D - Novo Nordisk

Teraz ponúkame aj pracovný priestor spravovaný OpenAI pre kvalifikované organizácie bez účtu Enterprise.

Požiadať o prístup

Čo bude ďalej

Aktualizovaný GPT‑Rosalind je ďalším krokom v našom širšom záväzku budovať systémy AI, ktoré pomáhajú urýchľovať vedecké objavy a zároveň zabezpečujú, aby sa pokročilé biologické schopnosti nasadzovali s primeranými ochrannými opatreniami. Budeme naďalej zlepšovať biologické uvažovanie modelu, rozširovať podporu pre výskumné pracovné postupy náročné na nástroje a s dlhým horizontom a spolupracovať s kvalifikovanými organizáciami naprieč regiónmi na hodnotení reálneho vplyvu.

Znamená to aj uplatňovanie AI pre biologické vedy v práci s vysokým verejným prínosom, od objavovania liekov a translačnej medicíny až po verejné zdravie, pripravenosť a biologickú obranu. Prostredníctvom Rosalind Biodefense a nášho modelu nasadenia s dôveryhodným prístupom chceme dostať hraničné biologické schopnosti do rúk výskumníkov, inštitúcií a obrancov pracujúcich na zlepšovaní ľudského zdravia a posilňovaní spoločenskej odolnosti.

Budeme ďalej budovať GPT‑Rosalind, aby sa stal schopnejším partnerom v celom životnom cykle vedeckého výskumu a pomáhal vedcom rýchlejšie prechádzať od správnych otázok k jasnejším dôkazom, lepším experimentom a napokon k novým liečbam pre pacientov.

Pokračovať v čítaní

Zobraziť všetko

Posúvame hranice pomeru ceny a výkonu s GPT-5.6

Produkt30. 7. 2026

Ako dve nastavenia strojnásobili naše skóre v benchmarku ARC-AGI-3

Vyhľadávanie29. 7. 2026

oai Science Academic Research Academic Research 1x1

Urýchľujeme vedecké objavy s ChatGPT pre akademických výskumníkov

Spoločnosť29. 7. 2026