Представляем новые возможности GPT‑Rosalind
Более высокий интеллект, основанный на реальных научных рабочих процессах для отрасли наук о жизни.
Мы представляем новое обновление модели в серии GPT‑Rosalind, специально созданной для исследований в науках о жизни в корпоративном масштабе. Оно сочетает возможности агентного программирования и использования инструментов GPT‑5.5 с более сильным интеллектом модели в ключевых областях разработки лекарств, таких как медицинская химия и геномика, одновременно улучшая результаты в более широких задачах анализа, проектирования и экспериментальных рабочих процессов в науках о жизни.
Прогресс в науках о жизни зависит от синтеза данных и доказательств на разных масштабах и в разных модальностях: молекулах, генах, путях и живых системах. В наших оценках обновленная GPT‑Rosalind демонстрирует широкий прирост производительности в исследовательских задачах от экспертов-биологов, сложных запросах по медицинской химии, количественной биологии и устранении неполадок в «мокрой» лаборатории.
GPT‑Rosalind теперь доступна в исследовательском предпросмотре для соответствующих организаций по всему миру через нашу структуру развертывания с доверенным доступом.
Чтобы измерять и постоянно улучшать реальное влияние GPT‑Rosalind, мы разработали LifeSciBench — бенчмарк с внешней экспертной оценкой, сосредоточенный на фундаментальных аспектах исследований в науках о жизни. В отличие от существующих бенчмарков, которые оценивают отдельный компонент производительности модели или биологическую область изолированно, LifeSciBench рассматривает научно ценную работу сквозным образом, формируя задачи из шести областей рабочих процессов, ключевых для исследований в науках о жизни: работа с доказательствами, анализ, дизайн и оптимизация, научные рассуждения, валидация и операции, а также трансляция и коммуникация. Мы используем этот бенчмарк, чтобы согласовывать прогресс с потребностями и реалиями исследований в науках о жизни.
GPT‑Rosalind показывает лучшие результаты в научно значимых задачах, определенных отраслевыми и академическими экспертами.
Извлечение, согласование и аудит научных доказательств из статей, рисунков, таблиц и экспериментальных записей.
Пример оценки
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Ответ кандидата
Итог: В представленном виде этот пакет недостаточно убедителен, чтобы обосновать ускоренное одобрение на основании экспрессии микродистрофина как суррогатной конечной точки, которая с разумной вероятностью прогнозирует клиническую пользу. Скептически настроенный эксперт FDA, вероятно, сочтет данные по биомаркеру, функциональным эффектам, сохранению эффекта, безопасности и обобщаемости существенно недостаточно подкрепленными.
Элемент пакета | Ключевая причина несостоятельности | Что потребуется |
|---|---|---|
Количественная оценка методом Western blot | MANEX1A связывает N-концевой эпитоп, общий для эндогенного полноразмерного дистрофина и трансгена микродистрофина, поэтому анализ не позволяет надежно отличить трансген от остаточного/ревертантного дистрофина. Количественно оценивать микродистрофин 138 kDa относительно стандарта полноразмерного дистрофина здорового контроля также некорректно. | Использовать рекомбинантный стандарт микродистрофина и ортогональный метод, отличающий трансген от эндогенного дистрофина, например таргетную масс-спектрометрию или трансген-специфичный/эпитоп-специфичный анализ. |
Иммунофлуоресценция | C-концевое поликлональное антитело плохо подходит, потому что конструкция 138 kDa не содержит C-концевого домена. У многих пациентов с DMD есть ревертантные волокна, а ревертантный дистрофин может сохранять C-концевые эпитопы. Ревертантные волокна могут проходить клональную экспансию с возрастом, смещая IF-сигнал, особенно у мальчиков старшего возраста. | Повторить IF с антителом к эпитопу, присутствующему в трансгене, но отсутствующему в ревертантном дистрофине. Количественно оценивать трансген-положительные волокна отдельно от ревертантных волокон. |
Валидность суррогатной конечной точки | Пакет отождествляет количество белка с клинической функцией. «38% массы белка у здорового контроля» не означает 38% нормальной функции дистрофина, потому что микродистрофин структурно укорочен. | Эмпирически подтвердить связь между долей массы микродистрофина, сарколеммальной локализацией, последующим восстановлением функциональных эффектов и клинической пользой, прежде чем рассматривать экспрессию как суррогатную конечную точку. |
Дизайн биопсии | Контралатеральные биопсии латеральной широкой мышцы бедра до и после лечения вносят межстороннюю и внутримышечную пространственную вариабельность. Прогрессирование болезни и фиброзно-жировое замещение также могут менять сигнал, нормализованный по общему белку. | Стандартизировать место биопсии по единым анатомическим ориентирам, нормализовать по мышечно-специфическим белкам и параллельно измерять фиброзно-жировой состав. |
Компаратор/статистика NSAA | Внешняя когорта естественного течения не является рандомизированным параллельным контролем. Критерии включения, поддерживающая терапия, эффект участия в исследовании, исходный NSAA, режим стероидов, возраст и класс экзона могут смещать сравнение. Непарного t-теста недостаточно. Кроме того, изменение NSAA на +1,4 находится в пределах вариабельности при повторном тестировании для этой возрастной группы. | Провести рандомизированное параллельное плацебо-контролируемое исследование или как минимум использовать скорректированный анализ с учетом исходного NSAA, возраста, режима стероидов, класса экзона и других смешивающих факторов. |
Смешение из-за возрастного окна | Мальчики 4–7 лет находятся в возрастном окне развития, когда нелеченные амбулаторные пациенты с DMD могут демонстрировать прирост моторной функции до того, как начнет преобладать снижение. Изменение NSAA за 48 недель смешивает прирост, связанный с развитием, прогрессирование болезни и возможный эффект лечения. | Использовать параллельный рандомизированный контроль со стратификацией по возрасту, чтобы отделить траекторию развития от эффекта лечения. |
Предыдущий клинический прецедент | Функциональные сигналы микродистрофина, наблюдавшиеся в открытых исследованиях, не всегда надежно предсказывали пользу в подтверждающих исследованиях; опубликованные прецеденты включают подтверждающие исследования генной терапии микродистрофином, в которых не удалось воспроизвести улучшения NSAA, наблюдавшиеся в открытых исследованиях. | Не полагаться на изменение NSAA в открытом исследовании как на решающее подтверждение. Требовать контролируемые функциональные доказательства. |
Структурные ограничения конструкции | Конструкция 138 kDa не содержит спектриноподобные повторы R16/17, в которых находятся сайты связывания nNOS. Потеря рекрутирования nNOS может нарушать функциональный симпатолиз и защиту от ишемии при нагрузке, создавая механистическое ограничение восстановления, не зависящее от уровня экспрессии. | Добавить механистические исследования, показывающие, восстанавливает ли эта конкретная конструкция релевантные функции дистрофин-ассоциированного комплекса, локализацию nNOS, физиологический ответ на нагрузку и защиту мышц. |
Стойкость экспрессии AAV | Наличие геномов вектора на 12-й неделе не доказывает устойчивую экспрессию. Геномы AAV9 в основном сохраняются как неинтегрирующие эписомы, и число их копий может со временем снижаться. Сохранение генома вектора не равнозначно стойкой экспрессии белка. | Измерять экспрессию трансгенного белка в динамике и стойкость функциональных биомаркеров после 12 недель. |
Иммунный профиль/безопасность | Повышение активности трансаминаз у 8 из 12 пациентов согласуется с иммунным ответом на AAV-трансдуцированные клетки, но механизм не установлен. Один случай миокардита вызывает обеспокоенность с учетом кардиального тропизма AAV9. | Обеспечить более углубленный иммунный мониторинг, подробную оценку безопасности со стороны печени и сердца, а также усиленное кардиологическое наблюдение. |
Отбор пациентов/обобщаемость | Исключение пациентов с нейтрализующими антителами к AAV9 ограничивает обобщаемость. Исключение пациентов с делециями экзона 44 ограничивает применимость к этой подгруппе DMD. n=12 слишком мало, чтобы охарактеризовать безопасность и эффективность в более широкой популяции DMD. | По возможности расширить критерии включения или заранее определить стратифицированный анализ по статусу антител, генотипу/классу экзона, возрасту и исходному функциональному статусу, прежде чем использовать результат для обоснования широкого одобрения. |
Регуляторный вывод: Пакет может показывать биологическую активность, но пока не доказывает, что измеренная экспрессия микродистрофина является надежной суррогатной конечной точкой, которая с разумной вероятностью прогнозирует клиническую пользу. Основные пробелы — специфичность анализа, некорректные стандарты количественной оценки, возможное смешение из-за ревертантных волокон, отсутствие рандомизированного контроля, возрастное смешение NSAA, неопределенная стойкость экспрессии и нерешенные вопросы безопасности/обобщаемости.
Чтобы устранить этот пробел, программе нужен контролируемый, стратифицированный по возрасту клинический дизайн с трансген-специфичными анализами экспрессии, ортогональной количественной оценкой белка, контролем состава ткани, данными о стойкости эффекта в динамике, механистическими функциональными анализами укороченной конструкции и более строгим мониторингом безопасности, особенно со стороны печени и сердца.
Критерии оценивания и оценки
GPT‑Rosalind достигает лидирующих в отрасли результатов в медицинской химии — области, направленной на превращение молекул в эффективные лекарственные препараты. Мы разработали MedChemBench, чтобы он отражал реалистичные рабочие процессы медицинской химии: оценку мультимодального понимания химических структур; связи «структура — активность» (SAR); прогнозирование активности, токсичности, а также всасывания, распределения, метаболизма и выведения лекарств (ADME); принятие решений при многопараметрической оптимизации соединений-лидеров; и ретросинтез. GPT‑Rosalind превосходит GPT‑5.5 на MedChemBench: 27,5% против 25,1%, используя при этом на 7,2% меньше токенов.
GPT‑Rosalind демонстрирует более качественный мультимодальный анализ и механистическое рассуждение в медицинской химии.
На GeneBench, нашей агентной оценке сквозного анализа с длинным горизонтом выполнения в геномике и количественной биологии, GPT‑Rosalind использует на 31% меньше токенов, чем GPT‑5.5, при более высокой точности: 21,6% против 20,4%. GeneBench оценивает агентную эффективность в количественных задачах с длинным горизонтом выполнения: может ли агент на основе реалистичных научных данных спланировать корректный анализ, контроль качества, моделирование и коррекции, чтобы прийти к ответам, значимым для принятия решения? Задачи охватывают разные области, включая функциональную геномику, пространственную транскриптомику, протеомику, эпигеномику и прикладную генетику.
GPT‑Rosalind использует на 31 % меньше токенов, чем GPT‑5.5, одновременно повышая точность.
Мы представляем новую оценку, чтобы проверить способность GPT‑Rosalind помогать ученым, которые проводят лабораторную работу в реальных условиях. LabWorkBench проверяет способность модели связывать экспериментальные воздействия с результатами экспериментов в реальных протоколах «мокрой» лаборатории, которые используют ученые, для задач от устранения неполадок до оптимизации. Данные LabWorkBench закрыты, поэтому они не попали в обучающие данные. GPT‑Rosalind набирает 63,2% против 55,8% у GPT‑5.5, используя при этом на 5,3% меньше токенов.
В помощи с реальными протоколами «мокрой» лаборатории GPT‑Rosalind показывает значительный прирост по сравнению с GPT‑5.5, одновременно повышая эффективность использования токенов.
Мы создали плагины Life Sciences Research(открывается в новом окне) и Life Sciences NGS Analysis(открывается в новом окне), чтобы дополнить расширенные интеллектуальные возможности GPT‑Rosalind практическим уровнем выполнения для воспроизводимых научных рабочих процессов. Вместе эти плагины объединяют поиск научных подтверждений с указанием источников, биологическую интерпретацию и выполнение биоинформатических задач в одной рабочей области. Это помогает исследователям связывать внешние подтверждающие данные с внутренним анализом омиксных данных, сохраняя артефакты и сведения о происхождении данных. Теперь оба плагина доступны всем пользователям через Codex. Квалифицированные корпоративные пользователи GPT‑Rosalind также могут использовать GPT‑Rosalind как основу для работы этих плагинов.
Чтобы Codex лучше работал как динамическая рабочая среда для ученых, мы добавили интерактивные средства просмотра для типов файлов, характерных для биологических данных. Первоначальный набор средств просмотра последовательностей, выравниваний и структур помогает ученым работать непосредственно с подтверждающими данными, пока GPT‑Rosalind выполняет рассуждения по рабочему процессу и отвечает на уточняющие вопросы с учетом содержимого активного средства просмотра.
Демонстрация выше показывает эти возможности в действии под управлением GPT‑Rosalind. Мы следим за ученым, который изучает жидкостную биопсию опухоли, чтобы выявить мутации и другие молекулярные изменения, способные повлиять на лечение. Плагин Life Sciences NGS Analysis превращает анализ обработанных данных ctDNA в интерактивный блокнот, выявляя повторяющиеся изменения, низкочастотные варианты и траектории образцов, которые фокусируют исследование на KRAS G12C. Затем плагин Life Sciences Research добавляет контекст по мишеням, ингибиторам и резистентности с указанием источников, а встроенные средства просмотра последовательностей, выравниваний и структур позволяют ученому напрямую изучить аминокислотный остаток 12 с мутацией, его консервативность в семействе RAS и карман связывания ингибитора. Рабочий процесс завершается преобразованием этих доказательств в конкретные варианты последующих действий, причем каждый шаг и артефакт доступны для экспертной проверки.

Плагин Life Sciences NGS Analysis
QC и аннотация scRNA-seq

Преобразуйте пакет матриц в формате 10x в отфильтрованные по QC артефакты одноклеточного анализа, аннотации и визуализации UMAP, которые можно просматривать и дорабатывать в Codex. Плагин Life Sciences NGS Analysis направляет запрос в scrna-seq-qc, выбирает пороги QC на основе данных, сохраняет сведения о происхождении данных и шагах фильтрации и аннотации, а также показывает блокеры, например отсутствующие зависимости для выявления дублетов.
QC bulk RNA-seq FASTQ

Преобразуйте таблицу образцов bulk RNA-seq, пакет FASTQ и референсные файлы в проверенный по QC пакет результатов с матрицами подсчетов, который можно просматривать и повторно использовать в Codex. Плагин Life Sciences NGS Analysis направляет запрос, проверяет входные данные и возвращает аудируемый пакет результатов запуска с MultiQC, матрицами Salmon, сведениями о происхождении данных и четко указанными ограничениями.
Мы расширяем доступ к серии GPT‑Rosalind для отвечающих требованиям организаций по всему миру. GPT‑Rosalind будет доступна в исследовательской предварительной версии через нашу модель развертывания с доверенным доступом для организаций, которые проводят добросовестные научные исследования с очевидной общественной пользой, имеют надежную систему управления и надзора за безопасностью, а также контролируемый доступ с защитой корпоративного уровня.
В рамках этого глобального расширения мы рады помочь поддержать миссию Novo Nordisk — быстрее предоставлять пациентам инновационные варианты лечения, помогая масштабировать их медицинские исследования с GPT‑Rosalind. Novo Nordisk использует передовые возможности ИИ, чтобы помогать исследователям анализировать сложные наборы данных, выявлять полезные закономерности и быстрее проверять гипотезы. Более сильное биологическое понимание GPT‑Rosalind поможет командам связывать доказательства из литературы, геномики, транскриптомики, последовательностей, структур и экспериментальных результатов, упрощая переход от данных к более ясным исследовательским решениям.
«Исследования в науках о жизни сложны, насыщены данными и междисциплинарны. Чтобы приносить исследователям значимую пользу, передовые модели ИИ должны опираться на надежные научные данные, быть связаны с валидированными инструментами и интегрироваться в реальные рабочие процессы, которыми исследователи пользуются каждый день. Мы рады партнерству с OpenAI и возможности изучить, как GPT‑Rosalind может поддержать более строгие и практичные подходы к поиску и разработке лекарств».
Мишал Пател, вице-президент группы по ИИ и цифровым инновациям, R&D, Novo Nordisk
Мы также теперь предлагаем управляемую OpenAI рабочую область для квалифицированных организаций без аккаунта Enterprise.
Обновленная GPT‑Rosalind — следующий шаг в нашем более широком обязательстве создавать системы ИИ, которые помогают ускорять научные открытия, обеспечивая при этом развертывание передовых биологических возможностей с надлежащими мерами защиты. Мы продолжим улучшать биологические рассуждения модели, расширять поддержку насыщенных инструментами и долгосрочных исследовательских рабочих процессов и работать с квалифицированными организациями в разных регионах, чтобы оценивать реальное влияние.
Это также означает применение ИИ для наук о жизни в работе с высокой общественной пользой: от открытия лекарств и трансляционной медицины до общественного здравоохранения, готовности и биозащиты. Через Rosalind Biodefense и нашу модель развертывания с доверенным доступом мы стремимся передать передовые биологические возможности исследователям, учреждениям и защитникам, работающим над улучшением здоровья людей и укреплением устойчивости общества.
Мы продолжим развивать GPT‑Rosalind, чтобы она стала более способным партнером на всем жизненном цикле научных исследований, помогая ученым быстрее переходить от правильных вопросов к более ясным доказательствам, лучшим экспериментам и в конечном счете новым методам лечения для пациентов.


