GPT‑Rosalind: новая эра наук о жизни
Новая специализированная модель для ускорения научных исследований и разработки лекарств.
Сегодня мы представляем GPT‑Rosalind — нашу передовую модель рассуждений, созданную для поддержки исследований в области биологии, разработки лекарств и трансляционной медицины. Эта серия моделей для наук о жизни оптимизирована для научных рабочих процессов. Она сочетает в себе улучшенные навыки использования инструментов с глубоким пониманием химии, белковой инженерии и геномики.
В среднем в США путь от открытия цели (мишени) до одобрения нового лекарства регуляторами занимает от 10 до 15 лет. Успехи, достигнутые на самых ранних этапах открытия, дают кумулятивный эффект на последующих стадиях: в более точном выборе целей, формировании сильных биологических гипотез и проведении более качественных экспериментов. Прогресс в медико-биологических науках сдерживается не только сложностью лежащих в их основе научных проблем, но и сложностью самих исследовательских процессов. Ученые должны работать с большими объемами литературы, специализированными базами данных, экспериментальными данными и развивающимися гипотезами, чтобы выдвигать и оценивать новые идеи. Эти рабочие процессы часто трудозатратны, фрагментированы и с трудом поддаются масштабированию.
Мы верим, что передовые системы ИИ могут помочь исследователям проходить через эти этапы быстрее — не только за счет повышения эффективности текущей работы, но и помогая ученым изучать больше возможностей, выявлять скрытые связи и быстрее приходить к верным гипотезам. Поддерживая синтез доказательств, генерацию гипотез, планирование экспериментов и другие многоэтапные исследовательские задачи, эта модель призвана помочь ученым ускорить ранние стадии открытий. Со временем такие системы могут помочь организациям медико-биологической сферы совершать прорывы, которые иначе были бы невозможны, и достигать гораздо более высоких показателей успеха.
GPT‑Rosalind открыта для тестирования в ChatGPT, Codex и через API. Квалифицированные клиенты могут получить к ней доступ через нашу программу доверенного партнерства. Мы также представляем бесплатный исследовательский плагин для наук о жизни (Life Sciences research plugin) для Codex, который поможет ученым подключать модели к более чем 50 научным инструментам и источникам данных. Мы работаем с такими клиентами, как Amgen, Moderna, Allen Institute, Thermo Fisher Scientific и другие, чтобы внедрять GPT‑Rosalind в различные рабочие процессы, которые ускоряют исследования и открытия.
Модель названа в честь Розалинд Франклин, чьи фундаментальные исследования помогли раскрыть структуру ДНК и заложили основы современной молекулярной биологии.
От необработанных данных до обоснованных решений, связанных с открытиями: узнайте, как наша специализированная модель ускоряет исследовательские процессы.
Серия моделей GPT‑Rosalind для наук о жизни разработана для современной научной деятельности, охватывающей работу с публикациями, данными, инструментами и экспериментами. Согласно нашим оценкам, она демонстрирует лучшие показатели в задачах, требующих рассуждений о молекулах, белках, генах, биологических путях и биологии заболеваний. Она более эффективна при использовании научных инструментов и баз данных в многоэтапных процессах, таких как обзор литературы, интерпретация связи «последовательность — функция», планирование экспериментов и анализ данных.
Это первый релиз GPT‑Rosalind для наук о жизни, и мы продолжим расширять передовые способности модели к биохимическим рассуждениям в долгосрочных научных рабочих процессах с активным использованием инструментов. Вычислительная инфраструктура OpenAI дает нам возможность продолжать обучать, оценивать и совершенствовать всё более мощные предметные модели на реальных научных задачах, делая эти системы всё более полезными по мере того, как сами рабочие процессы становятся всё более сложными.
От выводов, основанных на фактических данных и полученных в ходе исследований, до экспериментов с высоким потенциалом воздействия — узнайте, как наш набор решений превращается в измеримые улучшения ваших исследовательских процессов.
Мы сотрудничаем с ведущими фармацевтическими, биотехнологическими и научно-исследовательскими организациями, а также с технологическими компаниями в медико-биологической сфере, чтобы внедрять GPT‑Rosalind в рабочие процессы, способствующим новых открытиям.
«Медико-биологическая отрасль требует точности на каждом этапе. Вопросы чрезвычайно сложны, данные исключительно уникальны, а ставки невероятно высоки. Уникальное сотрудничество с OpenAI позволяет нам применять их самые передовые возможности и инструменты новыми и инновационными способами, что потенциально может ускорить процесс доставки лекарств пациентам».
Мы оценили возможности GPT‑Rosalind в ряде областей, имеющих основополагающее значение для научных открытий и отраслевых исследований. Эти испытания измеряют базовые навыки рассуждения в научных поддоменах, включая механизмы химических реакций, структуру белков, эффекты мутаций и их взаимодействия, а также филогенетическую интерпретацию последовательностей ДНК. Они также оценивают, могут ли модели поддерживать реальные исследовательские процессы, интерпретируя экспериментальные результаты, выявляя закономерности, значимые для экспертов, и синтезируя внешнюю информацию для разработки последующих экспериментов. Наконец, они проверяют, могут ли модели выбирать и использовать подходящие вычислительные инструменты, базы данных и предметно-специфические возможности, чтобы дополнять свои рассуждения. В совокупности эти оценки демонстрируют прогресс на всех этапах научного поиска и подтверждают увеличившийся потенциал модели в решении сложных задач на стадии открытия новых соединений и методов.
Мы протестировали GPT‑Rosalind на ряде общедоступных бенчмарков. В тесте BixBench, разработанном на основе реальных задач биоинформатики и анализа данных, GPT‑Rosalind продемонстрировала лучшие результаты среди всех моделей с опубликованными показателями.
В тесте LABBench2, который оценивает эффективность выполнения ряда исследовательских задач — таких как поиск литературы, доступ к базам данных, манипуляции с последовательностями и разработка протоколов — GPT‑Rosalind превосходит GPT‑5.4 в 6 из 11 категорий. Наиболее заметное улучшение наблюдается в тесте CloningQA, который требует сквозного проектирования последовательностей ДНК и подбора ферментативных реагентов для протоколов молекулярного клонирования.
Мы также сотрудничали с Dyno Therapeutics — компанией, являющейся первопроходцем в области разработки генной терапии с помощью ИИ, — чтобы оценить возможности модели в задачах прогнозирования и генерации РНК-последовательностей на основе их функции, используя неопубликованные и «чистые» (не встречавшиеся в обучающей выборке) данные. Результаты сравнивались с 57 историческими показателями экспертов в области ИИ-биологии. При оценке непосредственно в приложении Codex лучший из десяти вариантов, предложенных моделью, превзошел результаты 95% экспертов-людей в задаче прогнозирования и около 84% экспертов в задаче генерации последовательностей.
Эти оценки дают значимый показатель эффективности в тех рабочих процессах, на которые ученые ежедневно полагаются, чтобы получать доказательные результаты, анализировать сложные данные и приходить к обоснованным биологическим выводам.
Ученые могут использовать наш новый исследовательский плагин для наук о жизни (Life Sciences research plugin)(открывается в новом окне) для Codex, уже сегодня доступный на GitHub. Этот пакет включает широкий набор модульных навыков для большинства распространенных исследовательских процессов, разработанных, чтобы помочь пользователям работать в таких областях, как генетика человека, функциональная геномика, структура белков, биохимия, клинические данные и поиск общедоступных исследований.

Эти навыки выступают в роли уровня оркестрации (координационного слоя), который помогает ученым эффективнее решать масштабные, неоднозначные и многоэтапные задачи. Они обеспечивают доступ к более чем 50 публичным мультиомным базам данных, источникам литературы и биологическим инструментам, а также предлагают гибкую основу для типовых повторяющихся процессов, таких как поиск структуры белков и последовательностей, обзор литературы и поиск общедоступных наборов данных.
Пользователи Enterprise, имеющие соответствующий уровень доступа, могут использовать этот плагин в своих исследованиях совместно с GPT‑Rosalind для более глубокого биологического анализа, в то время как всем остальным пользователям пакет плагинов доступен для работы с нашими основными моделями.
Мы стремимся сделать эти возможности доступными для ученых и исследовательских организаций, которые обладают наилучшим потенциалом для развития здравоохранения, сохраняя при этом строгие меры защиты от неправомерного использования биоматериалов. На начальном этапе модель для медико-биологической отрасли запускается в рамках структуры доверенного доступа для квалифицированных клиентов Enterprise в США, с контролем соответствия требованиям, управлением доступом и организационным надзором. В то же время мы делаем набор коннекторов и исследовательский плагин доступными для более широкой аудитории, чтобы исследователи могли эффективнее использовать наши основные модели для задач в области исследований в сфере наук о жизни.
GPT‑Rosalind была разработана с усиленным контролем безопасности корпоративного уровня и ужесточенным управлением доступом, что позволяет использовать её в профессиональных научных целях в контролируемых исследовательских средах. Мы оцениваем предоставление доступа на основе трех основных принципов: полезное использование, строгий контроль и надзор за безопасностью, а также контролируемый доступ с защитой корпоративного уровня. На практике это означает, что участвующие организации должны проводить законные научные исследования с очевидной общественной пользой; поддерживать надлежащие механизмы управления, соблюдения требований и предотвращения злоупотреблений; а также ограничивать доступ только одобренными пользователями внутри защищенных и управляемых сред. Организации также должны согласиться с условиями предварительного доступа к программе исследований в области наук о жизни, соблюдать политики использования OpenAI; мы также можем запросить дополнительную информацию в процессе регистрации или участия.
Организации могут запросить доступ в рамках нашего процесса квалификационной проверки и проверки безопасности.
В период предварительного исследования использование этой модели не будет расходовать существующие кредиты или токены (с учетом ограничений по предотвращению злоупотреблений). Мы сообщим подробности о ценообразовании и доступности по мере расширения программы.
GPT‑Rosalind создана, чтобы помогать научным организациям выполнять более качественную работу быстрее в условиях, где необходимы как технические возможности, так и операционный контроль. Наша команда, специализирующаяся на медико-биологическом направлении, а также партнеры-консультанты, включая McKinsey & Company, Boston Consulting Group (BCG) и Bain & Company, помогают организациям выявлять наиболее перспективные сценарии применения, интегрировать модель в корпоративные среды и добиваться измеримых результатов. Если вы хотите узнать, как OpenAI может поддержать вашу работу, вы можете связаться с нашей командой.
Это первый релиз в нашей серии моделей для наук о жизни, и мы рассматриваем его как начало долгосрочного обязательства по созданию ИИ, способного ускорить научные открытия в жизненно важных для общества областях — от здоровья человека до широких биологических исследований. Мы продолжим совершенствовать биологические рассуждения модели, расширять поддержку исследовательских процессов, предполагающих активное использование инструментов и долгосрочное планирование, а также тесно сотрудничать с ведущими научными учреждениями для оценки практического влияния в реальных условиях. Это включает постоянные партнерства с национальными лабораториями, такими как Лос-Аламосская национальная лаборатория (Los Alamos National Laboratory), где мы изучаем разработку белков и катализаторов с использованием ИИ, включая способность систем ИИ модифицировать биологические структуры, сохраняя или улучшая ключевые функциональные свойства.
Со временем мы ожидаем, что эти системы станут всё более эффективными партнёрами в научных открытиях, помогая учёным быстрее переходить от вопроса к доказательствам, от доказательств к инсайту, а от инсайта — к новым методам лечения для пациентов.


