Перейти до основного вмісту
OpenAI

Представляємо нові можливості GPT‑Rosalind

Більший інтелект, заснований на реальних наукових робочих процесах для галузі наук про життя.

Ми представляємо нове оновлення моделі в серії GPT‑Rosalind, спеціально створеній для досліджень у галузі наук про життя в корпоративному масштабі. Вона поєднує можливості автономної розробки коду й використання інструментів GPT‑5.5 із потужнішим інтелектом моделі в ключових напрямах відкриття ліків, як-от медична хімія і геноміка, одночасно покращуючи продуктивність у ширшому аналізі, проєктуванні та експериментальних робочих процесах наук про життя.

Прогрес у науках про життя залежить від збору даних і доказів на різних рівнях і в різних модальностях: молекули, гени, шляхи та живі системи. У наших оцінюваннях оновлена GPT‑Rosalind демонструє широкі прирости продуктивності в дослідницьких завданнях від експертів із біології, складних запитах із медичної хімії, кількісній біології та усуненні проблем у практичній лабораторії.

GPT‑Rosalind тепер доступна в попередній дослідницькій версії для відповідних організацій у всьому світі через нашу структуру розгортання з довіреним доступом.

Підвищення продуктивності в науково цінних завданнях

Щоб вимірювати й постійно покращувати реальний вплив GPT‑Rosalind, ми розробили LifeSciBench — бенчмарк із зовнішнім експертним оцінюванням, зосереджений на фундаментальних аспектах досліджень у науках про життя. На відміну від наявних бенчмарків, що оцінюють один компонент продуктивності моделі або біологічну галузь ізольовано, LifeSciBench розглядає науково цінну роботу наскрізно, використовуючи завдання з шести сфер робочих процесів, центральних для досліджень у науках про життя: робота з доказами, аналіз, проєктування й оптимізація, наукове міркування, валідація й операції, а також переклад і комунікація. Ми використовуємо цей бенчмарк, щоб узгоджувати прогрес із потребами та реаліями досліджень у науках про життя.

GPT‑Rosalind лідирує за продуктивністю в науково цінних завданнях, визначених галузевими та академічними експертами.

Видобування, узгодження й аудит наукових доказів зі статей, рисунків, таблиць та експериментальних записів.

Приклад Eval

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

  • Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
  • 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
  • Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
  • 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
  • Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
  • Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
  • Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

Відповідь кандидата

Підсумок: у представленому вигляді цей пакет недостатньо сильний, щоб підтримати прискорене схвалення на основі експресії мікро-дистрофіну як сурогатної кінцевої точки, що з достатньою ймовірністю прогнозує клінічну користь. Скептичний рецензент FDA, ймовірно, вважав би докази щодо біомаркера, функції, тривалості, безпеки й узагальнюваності суттєво недостатньо підкріпленими.

Елемент пакета

Ключовий режим невдачі

Що було б потрібно

Кількісне визначення Western blot

MANEX1A зв’язує N-кінцевий епітоп, спільний для ендогенного повнорозмірного дистрофіну й трансгену мікро-дистрофіну, тож аналіз нечітко відрізняє трансген від залишкового/ревертантного дистрофіну. Кількісне визначення 138 kDa мікро-дистрофіну відносно стандарту здорового повнорозмірного дистрофіну також є недійсним.

Використати рекомбінантний стандарт мікро-дистрофіну та ортогональний метод, що відрізняє трансген від ендогенного дистрофіну, наприклад таргетну мас-спектрометрію або трансген-специфічний/епітоп-специфічний аналіз.

Імунофлуоресценція

C-кінцеве поліклональне антитіло погано придатне, бо конструкція 138 kDa не має C-кінцевого домену. Багато пацієнтів із DMD мають ревертантні волокна, а ревертантний дистрофін може зберігати C-кінцеві епітопи. Ревертантні волокна можуть клонально розширюватися з віком, зміщуючи IF-сигнал, особливо в старших хлопчиків.

Повторити IF з антитілом до епітопу, наявного в трансгені, але відсутнього в ревертантному дистрофіні. Кількісно визначати трансген-позитивні волокна окремо від ревертантних.

Валідність сурогатної кінцевої точки

Пакет змішує кількість білка з клінічною функцією. «38% маси білка здорового контролю» не означає 38% нормальної функції дистрофіну, бо мікро-дистрофін структурно усічений.

Емпірично валідувати зв’язок між масовим відсотком мікро-дистрофіну, сарколемною локалізацією, відновленням нижчестоящих функцій і клінічною користю, перш ніж трактувати експресію як сурогатну кінцеву точку.

План біопсії

Контралатеральні біопсії vastus lateralis до й після лікування вносять ліво-праву та внутрішньом’язову просторову варіабельність. Прогресування хвороби й фіброзно-жирове заміщення також можуть змінювати сигнал, нормалізований на загальний білок.

Стандартизувати місце біопсії за сталими анатомічними орієнтирами, нормалізувати на м’яз-специфічні білки й паралельно вимірювати фіброзно-жировий склад.

Компаратор/статистика NSAA

Зовнішня когорта природного перебігу не є рандомізованим одночасним контролем. Критерії участі, підтримувальна допомога, ефекти участі, базовий NSAA, режим стероїдів, вік і клас екзону можуть зміщувати порівняння. Непарного t-тесту недостатньо. Крім того, зміна NSAA +1,4 перебуває в межах варіабельності test-retest для цієї вікової групи.

Провести рандомізоване одночасне плацебо-контрольоване дослідження або щонайменше застосувати скориговані аналізи з урахуванням базового NSAA, віку, режиму стероїдів, класу екзону та інших змішувальних чинників.

Змішування через вікове вікно

Хлопчики віком 4–7 років перебувають у вікні розвитку, коли неліковані амбулаторні пацієнти з DMD можуть набирати моторну функцію до того, як почне домінувати зниження. 48-тижнева зміна NSAA змішує розвитковий приріст, прогресування хвороби й можливий ефект лікування.

Використати одночасний рандомізований контроль із віковою стратифікацією, щоб відокремити розвиткову траєкторію від ефекту лікування.

Попередній клінічний прецедент

Відкриті функціональні сигнали мікро-дистрофіну ненадійно прогнозували підтверджувану користь; опублікований прецедент містить підтверджувальні випробування генної терапії мікро-дистрофіном, які не відтворили відкриті покращення NSAA.

Не покладатися на відкриту зміну NSAA як вирішальну підтримку. Вимагати контрольованих функціональних доказів.

Структурні обмеження конструкції

Конструкція 138 kDa видаляє спектринові повтори R16/17, які містять сайти зв’язування nNOS. Втрата рекрутування nNOS може порушити функціональний симпатоліз і захист від ішемії під час фізичного навантаження, створюючи механістичну стелю порятунку незалежно від рівня експресії.

Додати механістичні дослідження, які покажуть, чи ця конкретна конструкція відновлює відповідну функцію дистрофін-асоційованого комплексу, локалізацію nNOS, фізіологію навантаження та захист м’язів.

Тривалість AAV

Геноми вектора на 12 тижні не встановлюють тривалої експресії. Геноми AAV9 здебільшого є неінтегрувальними епісомами й можуть зменшуватися з часом. Збереження геному вектора — не те саме, що стійка експресія білка.

Виміряти поздовжню експресію білка трансгену й тривалість функціональних біомаркерів після 12 тижнів.

Імунний/безпековий профіль

Трансаміназа у 8/12 пацієнтів узгоджується з імунною відповіддю на AAV-трансдуковані клітини, але механізм не встановлено. Один випадок міокардиту викликає занепокоєння з огляду на серцевий тропізм AAV9.

Надати глибший імунний моніторинг, характеристику безпеки печінки/серця та посилене кардіологічне спостереження.

Відбір пацієнтів/узагальнюваність

Виключення пацієнтів, позитивних на нейтралізувальні антитіла anti-AAV9, обмежує узагальнюваність. Виключення делецій екзону 44 обмежує застосовність до цієї підгрупи DMD. n=12 занадто мало, щоб характеризувати безпеку й ефективність у ширшій популяції DMD.

Розширити критерії, де можливо, або заздалегідь визначити стратифіковані аналізи за статусом антитіл, генотипом/класом екзону, віком і базовою функцією, перш ніж використовувати результат для підтримки широкого схвалення.

Регуляторний висновок: пакет може демонструвати біологічну активність, але ще не встановлює, що виміряна експресія мікро-дистрофіну є надійним сурогатом, який з достатньою ймовірністю прогнозує клінічну користь. Основні прогалини — специфічність аналізу, недійсні стандарти кількісного визначення, можливе змішування через ревертантні волокна, відсутність рандомізованого контролю, вікове змішування NSAA, невизначена тривалість і нерозв’язані питання безпеки/узагальнюваності.

Щоб закрити прогалину, програмі потрібен контрольований, стратифікований за віком клінічний дизайн із трансген-специфічними аналізами експресії, ортогональним кількісним визначенням білка, контролями складу тканини, поздовжніми даними тривалості, механістичними функціональними аналізами усіченої конструкції та сильнішим моніторингом безпеки, особливо печінкової й серцевої.

Критерії оцінювання та оцінки

Критерій
Пункти
Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.
+24
Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.
+22
Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.
+19
Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.
+12
Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.
+15
Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.
+8

Сильніше наукове міркування

Медична хімія

GPT‑Rosalind досягає провідної в галузі продуктивності в медичній хімії — сфері, зосередженій на перетворенні молекул на корисні ліки. Ми розробили MedChemBench так, щоб він відображав реалістичні робочі процеси медичної хімії, оцінюючи мультимодальне розуміння хімічних структур; зв’язок «структура—активність» (SAR); прогнозування ефективності, токсичності, всмоктування, розподілу, метаболізму й виведення (ADME) ліків; багатопараметричне ухвалення рішень щодо оптимізації лід-сполук; і ретросинтез. GPT‑Rosalind перевершує GPT‑5.5 на MedChemBench: 27,5% проти 25,1%, використовуючи на 7,2% менше токенів.

GPT‑Rosalind демонструє кращий мультимодальний синтез і механістичне міркування в медичній хімії.

Геноміка та кількісна біологія

На GeneBench, нашому агентному оцінюванні довготривалого наскрізного аналізу в геноміці та кількісній біології, GPT‑Rosalind використовує на 31% менше токенів, ніж GPT‑5.5, досягаючи вищої точності: 21,6% проти 20,4%. GeneBench оцінює агентну продуктивність у довготривалих кількісних завданнях: чи може агент на основі реалістичних наукових даних спланувати коректний аналіз, QC, моделювання й корекції, щоб дійти відповідей, релевантних для рішень? Включені задачі охоплюють різні галузі, зокрема функціональну геноміку, просторову транскриптоміку, протеоміку, епігеноміку та прикладну генетику.

GPT‑Rosalind використовує на 31% менше токенів, водночас підвищуючи точність.

Допомога в реальній лабораторній роботі

Ми представляємо нове оцінювання для перевірки здатності GPT‑Rosalind допомагати науковцям, які виконують лабораторну роботу в реальних умовах. LabWorkBench перевіряє здатність моделі пов’язувати збурення з експериментальними результатами в реальних протоколах практичної лабораторії, які використовують науковці, для цілей від усунення несправностей до оптимізації. Дані, які використовує LabWorkBench, є власницькими, а отже не забрудненими. GPT‑Rosalind набирає 63,2% проти 55,8% у GPT‑5.5, використовуючи на 5,3% менше токенів.

У реальній допомозі з протоколами практичної лабораторії GPT‑Rosalind демонструє значні переваги над GPT‑5.5, водночас підвищуючи ефективність використання токенів.

Від міркування до виконаних робочих процесів

Ми створили плагіни Life Sciences Research(відкривається у новому вікні) і Life Sciences NGS Analysis(відкривається у новому вікні), щоб доповнити зрослий інтелект GPT‑Rosalind практичним рівнем виконання для повторюваних наукових робочих процесів. Разом ці плагіни об’єднують пошук доказів із джерелами, біологічну інтерпретацію та біоінформатичне виконання в одному робочому просторі, допомагаючи дослідникам пов’язувати зовнішні докази з внутрішніми omics-аналізами, зберігаючи артефакти й походження даних. Усі користувачі тепер можуть отримати доступ до обох плагінів через Codex. Кваліфіковані корпоративні користувачі GPT‑Rosalind також можуть використовувати GPT‑Rosalind для роботи цих плагінів.

Щоб краще використовувати Codex як динамічний робочий стенд для науковців, ми додали інтерактивні переглядачі для біологічно нативних типів файлів. Початковий набір переглядачів послідовностей, вирівнювань і структур створено, щоб науковці залишалися близько до доказів, поки GPT‑Rosalind міркує в межах робочого процесу, і могли напряму відповідати на уточнювальні запитання з активним переглядачем у контексті.

Демонстрація вище показує ці можливості в дії під оркестрацією GPT‑Rosalind. Ми спостерігаємо за науковцем, який досліджує рідинну біопсію пухлини, щоб виявити мутації та інші молекулярні зміни, здатні вплинути на лікування. Плагін Life Sciences NGS Analysis перетворює огляд оброблених записів ctDNA на інтерактивний блокнот, виявляючи повторювані зміни, низькочастотні виклики й траєкторії зразків, що фокусують дослідження на KRAS G12C. Звідти плагін Life Sciences Research додає контекст цілі, інгібітора та резистентності з джерелами, а нативні переглядачі послідовностей, вирівнювань і структур дають науковцю змогу безпосередньо оглянути мутантний залишок 12, його консервативність у родині RAS і кишеню, зв’язану з інгібітором. Робочий процес завершується перетворенням цих доказів на конкретні варіанти подальших дій, причому кожен крок і артефакт доступні для експертного перегляду.

На екрані комп’ютера показано робочий простір з інструкцією використовувати плагін NGS Analysis для дослідження даних мутацій ctDNA. На екрані є кілька стовпчикових діаграм із підписами «Провідні детальні гістології» та «Провідні змінені гени за мутованими зразками cfDNA», що відображають дані про типи раку та генні зміни. Текст описує набір даних, ключові висновки та параметри аналізу.

Плагін Life Sciences NGS Analysis

QC та анотація scRNA-seq

Знімок екрана розділеного біоінформатичного робочого процесу. Ліва панель показує ШІ-асистента, який підсумовує завершений аналіз контролю якості одноклітинного секвенування РНК (scRNA-seq), включно зі згенерованими файлами, метриками QC, візуалізаціями UMAP та анотаціями типів клітин. Права панель відображає звіт «Огляд QC scRNA» з гістограмами загальної кількості зчитувань, виявлених генів і мітохондріального відсотка, а також стовпчиковими діаграмами кількостей QC pass/fail і відфільтрованих клітинних популяцій. Інтерфейс показано на синьо-зеленому градієнтному тлі.

Перетворіть пакет матриць у стилі 10x на відфільтровані за QC одноклітинні артефакти, анотації та UMAP, які можна інспектувати й переглядати в Codex. Плагін Life Sciences NGS Analysis маршрутизує запит до scrna-seq-qc, обирає пороги QC з даних, зберігає походження фільтрації й анотації та виявляє блокери, як-от відсутні залежності для виявлення дублетів.

QC FASTQ для bulk RNA-seq

Розділений екран робочого процесу RNA-seq: ліворуч ШІ-асистент підсумовує завершені результати контролю якості bulk RNA-seq, а праворуч показано інтерактивний звіт MultiQC зі статистикою секвенування та метриками Salmon.

Перетворіть таблицю зразків bulk RNA-seq, пакет FASTQ і референсні файли на перевірений QC пакет підрахунків, який можна інспектувати й повторно використовувати в Codex. Плагін Life Sciences NGS Analysis маршрутизує запит, перевіряє вхідні дані й повертає придатну до аудиту оболонку запуску з MultiQC, матрицями Salmon, походженням даних і явними застереженнями.

Розширений доступ для довірених організацій

Ми розширюємо доступ до серії GPT‑Rosalind для відповідних організацій у всьому світі. GPT‑Rosalind буде доступна в попередній дослідницькій версії через нашу структуру розгортання з довіреним доступом для організацій, що проводять легітимні наукові дослідження з чіткою суспільною користю, мають сильне управління й нагляд за безпекою, а також контрольований доступ із безпекою корпоративного рівня.

У межах цього глобального розширення ми раді допомогти підтримати місію Novo Nordisk — швидше надавати пацієнтам інноваційні варіанти лікування, допомагаючи масштабувати їхні медичні дослідження за допомогою GPT‑Rosalind. Novo Nordisk використовує передові можливості ШІ, щоб допомагати дослідникам аналізувати складні набори даних, виявляти корисні закономірності та швидше перевіряти гіпотези. Сильніше біологічне розуміння GPT‑Rosalind допоможе командам пов’язувати докази з літератури, геноміки, транскриптоміки, послідовностей, структур і експериментальних результатів, полегшуючи перехід від даних до чіткіших дослідницьких рішень.

«Дослідження в науках про життя складні, багаті на дані та міждисциплінарні. Щоб приносити дослідникам значущу цінність, передові моделі ШІ мають спиратися на довірені наукові дані, бути пов’язаними з валідованими інструментами та інтегрованими в реальні робочі процеси, якими дослідники користуються щодня. Ми задоволені нашим партнерством з OpenAI і можливістю дослідити, як GPT‑Rosalind може підтримати суворіші й практичніші підходи до відкриття ліків».

Мішал Пател, груповий віцепрезидент з ШІ та цифрових інновацій, R&D — Novo Nordisk

Ми також тепер пропонуємо керований OpenAI робочий простір для кваліфікованих організацій без облікового запису Enterprise.

Що далі

Оновлена GPT‑Rosalind — наступний крок у нашому ширшому зобов’язанні створювати системи ШІ, які допомагають прискорювати наукові відкриття, забезпечуючи розгортання розширених біологічних можливостей із належними запобіжниками. Ми й надалі покращуватимемо біологічне міркування моделі, розширюватимемо підтримку інструментально насичених і довготривалих дослідницьких робочих процесів та працюватимемо з кваліфікованими організаціями в різних регіонах, щоб оцінювати реальний вплив.

Це також означає застосування ШІ для наук про життя в роботі з високим суспільним впливом — від відкриття ліків і трансляційної медицини до громадського здоров’я, готовності та біозахисту. Через Rosalind Biodefense і нашу модель розгортання з довіреним доступом ми прагнемо передати передові біологічні можливості дослідникам, установам і захисникам, які працюють над поліпшенням здоров’я людей і зміцненням стійкості суспільства.

Ми й надалі розвиватимемо GPT‑Rosalind, щоб вона стала спроможнішим партнером у повному життєвому циклі наукових досліджень, допомагаючи науковцям швидше переходити від правильних запитань до чіткіших доказів, кращих експериментів і зрештою нових методів лікування для пацієнтів.