Представляємо GPT‑Rosalind для біомедичних досліджень
Нова спеціалізована модель для прискорення наукових досліджень і розробки лікарських засобів
Сьогодні ми представляємо GPT‑Rosalind — нашу передову модель міркування, створену для підтримки досліджень у біології, розробці лікарських засобів і трансляційній медицині. Ця серія моделей для біомедичної сфери оптимізована для наукових робочих процесів і поєднує вдосконалене використання інструментів із глибшим розумінням хімії, білкової інженерії та геноміки.
У середньому шлях від виявлення мішені до отримання регуляторного дозволу на новий лікарський засіб у США займає близько 10–15 років. Досягнення на ранніх етапах накопичуються та згодом дають кращий відбір мішеней, більш обґрунтовані біологічні гіпотези та якісніші експерименти. Розвиток біомедицини стримується не лише складністю науки як такої, а й складністю самих дослідницьких процесів. Науковцям доводиться опрацьовувати великі масиви наукових публікацій, спеціалізовані бази даних, експериментальні дані та постійно уточнювані гіпотези, щоб створювати й перевіряти нові ідеї. Ці процеси зазвичай потребують багато часу, є розрізненими та важко піддаються масштабуванню.
Ми переконані, що передові системи ШІ можуть пришвидшити ці процеси, не лише підвищуючи ефективність наявних підходів, а й даючи змогу науковцям досліджувати більше можливостей, виявляти зв’язки, які інакше могли б залишитися непоміченими, і швидше формувати якісніші гіпотези. Ця модель підтримує узагальнення доказів, формування гіпотез, планування експериментів та інші багатокрокові дослідницькі процеси, допомагаючи прискорити ранні етапи відкриттів. У перспективі такі системи можуть сприяти досягненню проривних результатів у біомедичній сфері, які інакше були б недосяжними, з істотно вищою ймовірністю успіху.
GPT‑Rosalind уже доступна у межах дослідницького попереднього доступу в ChatGPT, Codex і через API для клієнтів, які відповідають вимогам, у рамках нашої програми довіреного доступу. Ми також запускаємо безкоштовний дослідницький плагін для Codex у сфері біомедицини, який дає змогу науковцям під’єднувати моделі до понад 50 наукових інструментів і джерел даних. Ми працюємо з такими компаніями та організаціями, як Amgen, Moderna, Інститут Аллена, Thermo Fisher Scientific та іншими, щоб застосовувати GPT‑Rosalind у процесах, які прискорюють дослідження й відкриття.
Модель отримала назву на честь Розалінд Франклін, чиї ретельні дослідження сприяли відкриттю структури ДНК і заклали підґрунтя для сучасної молекулярної біології.
Від первинних даних до обґрунтованих рішень у наукових дослідженнях — ознайомтеся з тим, як наша спеціалізована модель сприяє прискоренню дослідницьких процесів.
Серія моделей GPT‑Rosalind для біомедицини створена для сучасної наукової роботи з публікаціями, даними, інструментами та експериментами. За результатами наших оцінювань, вона демонструє найкращі результати у завданнях, що потребують міркування щодо молекул, білків, генів, біологічних шляхів і біології, пов’язаної із захворюваннями, а також ефективніше працює з науковими інструментами та базами даних у багатокрокових процесах, зокрема під час огляду літератури, інтерпретації «послідовність—функція», планування експериментів і аналізу даних.
Це перший реліз у серії моделей GPT‑Rosalind для біомедичної сфери, і ми й надалі розширюватимемо можливості моделі в галузі біохімічного міркування у складних, багатокрокових наукових процесах із широким використанням інструментів. Обчислювальна інфраструктура OpenAI дає нам змогу постійно навчати, оцінювати та вдосконалювати дедалі потужніші спеціалізовані моделі на основі реальних наукових завдань, роблячи їх більш корисними у міру зростання складності самих процесів.
Від доказово обґрунтованих наукових висновків до результативних експериментів — дізнайтеся, як наші рішення допомагають досягати відчутних покращень у дослідницьких процесах.
Ми працюємо з провідними фармацевтичними, біотехнологічними та дослідницькими організаціями, а також технологічними компаніями у сфері біомедицини, щоб використовувати GPT‑Rosalind у процесах, що допомагають здійснювати відкриття.
«Галузь біомедицини вимагає високої точності на кожному етапі. Питання є надзвичайно складними, дані — унікальними, а ставки — винятково високими. Наша унікальна співпраця з OpenAI дає змогу застосовувати їхні найсучасніші можливості та інструменти новими й інноваційними способами з потенціалом прискорити розробку та доставку лікарських засобів пацієнтам.»
Ми оцінили GPT‑Rosalind за низкою ключових можливостей, що лежать в основі наукових відкриттів і галузевих досліджень. Ці оцінювання вимірюють базові здібності до міркування в різних наукових підгалузях, зокрема щодо механізмів хімічних реакцій; структури білків, ефектів мутацій і взаємодій; а також філогенетичної інтерпретації послідовностей ДНК. Вони також оцінюють, чи здатні моделі підтримувати реальні дослідницькі процеси, зокрема інтерпретувати результати експериментів, виявляти значущі для фахівців закономірності та узагальнювати зовнішню інформацію для планування подальших експериментів. Також перевіряється, чи можуть моделі правильно обирати та використовувати потрібні обчислювальні інструменти, бази даних і спеціалізовані можливості для покращення міркування. У підсумку ці оцінки показують прогрес на всіх етапах наукового дослідження й свідчать про кращу здатність допомагати дослідникам у вирішенні складних завдань, пов’язаних із науковими відкриттями.
Ми перевірили GPT‑Rosalind на низці відкритих тестів. У BixBench, наборі тестів, створеному на основі реальних завдань біоінформатики та аналізу даних, GPT‑Rosalind продемонстрував найкращі результати серед моделей із опублікованими показниками.
У LABBench2, тестовому наборі, що оцінює виконання різних дослідницьких завдань, зокрема пошук літератури, доступ до баз даних, роботу з послідовностями та розробку протоколів, GPT‑Rosalind перевершує GPT‑5.4 у 6 із 11 завдань. Найпомітніший прогрес спостерігається в CloningQA, де потрібно виконати повний цикл проєктування ДНК і ферментних реагентів для протоколів молекулярного клонування.
Ми також співпрацювали з Dyno Therapeutics, компанією, що є піонером у розробці генних терапій із використанням ШІ, щоб оцінити модель на завданні прогнозування та генерації функцій РНК-послідовностей із використанням неопублікованих, чистих даних. Результати порівнювали з 57 попередніми оцінками експертів (людей) у сфері ШІ-біології. Під час тестування безпосередньо в застосунку Codex найкращі результати серед десяти запусків моделі перевищили 95-й перцентиль експертів (людей) у завданні прогнозування та досягли приблизно 84-го перцентиля у завданні генерації послідовностей.
Ці оцінювання дають змістовне уявлення про ефективність моделі в тих процесах, на які науковці щодня спираються для отримання доказів, аналізу складних даних і формування обґрунтованих біологічних висновків.
Науковці вже сьогодні можуть використовувати наш новий дослідницький плагін для біомедицини(відкривається у новому вікні) для Codex, доступний на GitHub. Цей пакет містить широкий набір модульних навичок для найпоширеніших дослідницьких процесів і допомагає працювати з генетикою людини, функціональною геномікою, структурою білків, біохімією, клінічними даними та пошуком відкритих досліджень.

Ці навички працюють як координаційний шар, який допомагає науковцям ефективніше розбиратися з широкими, нечітко сформульованими та багатокроковими запитаннями. Вони надають доступ до понад 50 відкритих баз даних мультиомних досліджень, джерел наукової літератури та біологічних інструментів, а також слугують гнучкою відправною точкою для типових відтворюваних процесів, зокрема пошуку структури білків, пошуку послідовностей, огляду літератури та виявлення загальнодоступних наборів даних.
Користувачі рівня Enterprise, які відповідають вимогам, можуть використовувати цей плагін у дослідницьких процесах разом із GPT‑Rosalind для поглибленого біологічного аналізу, тоді як усі користувачі можуть застосовувати пакет плагінів із нашими основними моделями.
Ми хочемо надати ці можливості науковцям і дослідницьким організаціям, які найкраще здатні сприяти розвитку охорони здоров’я, водночас зберігаючи надійний захист від потенційного зловживання біологічними технологіями. Модель для біомедицини на початковому етапі запускається у США за схемою впровадження з довіреним доступом для корпоративних клієнтів рівня Enterprise, які відповідають установленим вимогам, із передбаченими механізмами контролю відповідності критеріям, управління доступом та організаційного врядування. Водночас ми розширюємо доступ до набору конекторів і плагіна Life Sciences Research Plugin, щоб дослідники могли ефективніше використовувати наші основні моделі для виконання дослідницьких завдань у сфері біомедицини.
Модель для біомедицини була розроблена з посиленими механізмами безпеки рівня Enterprise та вдосконаленим управлінням доступом, що забезпечує можливість професійного наукового використання в контрольованих дослідницьких середовищах. Ми оцінюємо доступ на основі трьох ключових принципів: корисне застосування, належне врядування та контроль безпеки, а також контрольований доступ із безпекою рівня Enterprise. На практиці це означає, що організації-учасники мають здійснювати законні наукові дослідження з чітко визначеною суспільною користю, забезпечувати належне управління, дотримання вимог і механізми запобігання зловживанням, а також обмежувати доступ лише для затверджених користувачів у захищених і належно керованих середовищах. Організації також мають погодитися з умовами попереднього доступу до дослідницьких можливостей у сфері біомедицини та дотримуватися політик використання OpenAI. Крім того, ми можемо запитувати додаткову інформацію під час реєстрації або в межах подальшої участі.
Організації можуть подати запит на доступ, пройшовши процедуру відбору та перевірки безпеки.
Під час етапу попереднього дослідницького доступу використання цієї моделі не передбачає списання наявних кредитів або токенів, за умови дотримання встановлених обмежень проти зловживань. Додаткову інформацію щодо вартості та доступності буде надано з розширенням програми.
Модель для біомедицини створена для того, щоб допомагати науковим організаціям виконувати роботу вищої якості швидше в середовищах, що потребують як технічних можливостей, так і операційного контролю. Наша спеціалізована команда з біомедицини, а також консультативні партнери, зокрема McKinsey & Company, Boston Consulting Group (BCG) і Bain & Company, допомагають організаціям визначати пріоритетні напрями застосування, інтегрувати модель у корпоративні середовища та досягати вимірюваних результатів. Якщо ви хочете дізнатися, як OpenAI Life Sciences може підтримати вашу діяльність, ви можете зв’язатися з нашою командою Life Sciences.
Це перший реліз у серії моделей для біомедицини, і ми розглядаємо його як старт довгострокового розвитку штучного інтелекту, який допомагатиме прискорювати наукові відкриття в напрямах, важливих для суспільства: від здоров’я людини до ширших біологічних досліджень. Ми й надалі вдосконалюватимемо здатність моделі до біологічного міркування, розширюватимемо підтримку інструментально насичених і довготривалих дослідницьких процесів, а також тісно співпрацюватимемо з провідними науковими установами для оцінювання реального впливу. Це включає тривалі партнерства з національними лабораторіями, зокрема з Los Alamos National Laboratory, де ми досліджуємо можливості проєктування білків і каталізаторів із використанням ШІ, зокрема здатність таких систем змінювати біологічні структури зі збереженням або покращенням ключових функціональних властивостей.
З часом ми очікуємо, що ці системи стануть усе більш ефективними партнерами в наукових відкриттях, допомагаючи науковцям швидше рухатися від запитання до доказів, від доказів до розуміння і від розуміння до нових методів лікування для пацієнтів.


