Представяме GPT‑Rosalind за научни изследвания в областта на биологичните науки
Нов специализиран модел, създаден за ускоряване на научните изследвания и откриването на лекарства.
Днес представяме GPT‑Rosalind, нашия авангарден модел със структурирано анализиране, създаден да подпомага изследванията в биологията, откриването на лекарства и транслационната медицина. Серията модели в областта на биологичните науки е оптимизирана за научни работни процеси, като съчетава подобрено използване на инструментите с по-задълбочено разбиране в областта на химията, инженерството на протеини и геномиката.
Средно отнема приблизително 10-15 години, за да се премине от откриването на терапевтична цел до регулаторно одобрение на ново лекарство в Съединените щати. Постигнатите резултати в най-ранните етапи на откривателската дейност оказват ефект на натрупване по веригата под формата на по-добър подбор на цели, по-силни биологични хипотези и по-качествени експерименти. Напредъкът в биологичните науки е ограничен не само от сложността на самата наука, но и от комплексността на самите научноизследователски работни процеси. Учените трябва да работят с огромни обеми от литература, специализирани бази данни, експериментални данни и развиващи се хипотези, за да създават и оценяват нови идеи. Тези работни процеси често отнемат много време и са фрагментирани и трудни за мащабиране.
Вярваме, че усъвършенстваните системи с изкуствен интелект могат да помогнат на изследователите да преминават по-бързо през тези работни процеси – не само като повишават ефективността на съществуващата работа, но и като подпомагат учените да проучват повече възможности, да откриват връзки, които иначе биха били пропуснати, и да достигат по-бързо до по-добри хипотези. Като подпомага синтеза на доказателства, формулирането на хипотези, планирането на експерименти и други многоетапни изследователски задачи, този модел е създаден, за да помогне на изследователите да ускорят ранните етапи на научните открития. С течение на времето тези системи биха могли да помогнат на организациите в областта на биологичните науки да направят пробиви, които иначе не биха били възможни, с много по-висок процент на успеваемост.
GPT‑Rosalind вече е достъпен като изследователски предварителен преглед в ChatGPT, Codex и API за отговарящи на условията за допустимост клиенти чрез нашата програма за доверен достъп. Въвеждаме също така свободно достъпен плъгин „Life Sciences Research“ за изследвания в областта на биологичните науки за Codex, който помага на учените да свързват модели с над 50 научни инструмента и източници на данни. Работим с клиенти като Amgen, Moderna, Института „Алън“, Thermo Fisher Scientific и други, за да прилагаме GPT‑Rosalind в различни работни процеси, които ускоряват научните изследвания и откритията.
Моделът носи името на Розалинд Франклин, чиито методични изследвания спомагат за разкриването на структурата на ДНК и полагат основите на съвременната молекулярна биология.
От сурови данни до обосновани решения за научни открития – вижте как нашият специализиран модел ускорява научноизследователските работни процеси.
Серията модели GPT‑Rosalind за биологични науки е създадена за съвременна научна дейност в областта на публикуваните доказателства, данните, инструментите и експериментите. В нашите оценки тя показва най-добра производителност при задачи, които изискват структурирано анализиране на молекули, протеини, гени, биологични пътища и биология, свързана със заболявания, и е по-ефективна при използването на научни инструменти и бази данни в многоетапни работни процеси като преглед на литература, интерпретация на връзката между последователност и функция, експериментално планиране и анализ на данни.
Това е първата версия на нашата серия модели GPT‑Rosalind за биологични науки и ще продължим да разширяваме границите на възможностите на модела за биохимично структурирано анализиране в рамките на дългосрочни научни работни процеси, изискващи интензивното използване на инструменти. Изчислителната инфраструктура на OpenAI ни дава възможност да продължим да обучаваме, оценяваме и усъвършенстваме все по-мощни модели за конкретни области въз основа на реални научни задачи, като по този начин помагаме на тези системи да стават по-полезни, докато самите работни процеси стават все по-сложни.
От научнообосновани прозрения за открития до експерименти с голямо въздействие – вижте как нашият пакет от решения се превръща в измерими подобрения във Вашите научноизследователски работни процеси.
Работим с водещи клиенти от фармацевтичния, биотехнологичния и научноизследователския сектор, както и с организации в областта на технологиите за биологичните науки, за да внедрим GPT‑Rosalind в работните процеси, които насърчават научните открития.
„Областта на биологичните науки изисква прецизност на всяка стъпка. Въпросите са изключително сложни, данните са строго специфични, а залогът е невероятно висок. Уникалното ни сътрудничество с OpenAI ни позволява да прилагаме нейните най-усъвършенствани възможности и инструменти по нови и иновативни начини, които имат потенциал да ускорят предоставянето на лекарства на пациентите.“
Оценихме GPT‑Rosalind по отношение на различни способности, които са от основно значение за научните открития и индустриалните изследвания. Тези оценки измерват основното структурирано анализиране в различни научни подобласти, включително механизми на химичните реакции; структура на протеините, ефекти от мутации и взаимодействия; и филогенетична интерпретация на ДНК последователности. Те също така оценяват дали моделите могат да подкрепят реални научноизследователски работни процеси, като интерпретират експериментални резултати, идентифицират значими за експертите модели и синтезират външна информация за проектиране на последващи експерименти. Накрая проверяват дали моделите могат да избират и използват подходящите изчислителни инструменти, бази данни и специфични за областта възможности, за да подобрят своето структурирано анализиране. Взети заедно, тези оценки показват напредък в целия процес на научните изследвания от край до край и предполагат по-голяма способност за предоставяне на помощ на изследователите за справяне с трудни задачи, свързани с открития.
Оценихме GPT‑Rosalind по серия от публични еталони. По BixBench, еталон, проектиран около реални задачи по биоинформатика и анализ на данни, GPT‑Rosalind постигна водеща производителност сред моделите с публикувани резултати.
По LABBench2, еталон, който измерва производителността при изпълнението на редица изследователски задачи, като извличане на литература, достъп до бази данни, манипулиране на последователности и проектиране на протоколи, GPT‑Rosalind превъзхожда GPT‑5.4 в 6 от 11 задачи. Най-забележителното подобрение се наблюдава при CloningQA, която изисква цялостно проектиране на ДНК и ензимни реагенти за протоколи за молекулярно клониране.
Също така си партнирахме с Dyno Therapeutics, компания, която е пионер в разработването на генни терапии, проектирани с изкуствен интелект, за да оценим модела върху задача за прогнозиране и генериране на функция от РНК последователности, използвайки непубликувани, неконтаминирани последователности. Производителността беше сравнена с 57 предходни резултата на човешки експерти в областта на изкуствения интелект и биологията. При директна оценка в приложението Codex най-добрите от десетте модела се представиха по-добре от около 95% от човешките експерти при задачата за прогнозиране и по-добре от около 84% от тях при задачата за генериране на последователности.
Тези оценки предоставят значим сигнал за производителността при различните работни процеси, на които учените разчитат всеки ден, за да генерират доказателства, да анализират сложни данни и да достигат до обосновани биологични заключения.
Учените могат да използват нашия нов плъгин за изследвания в областта на биологичните науки(отваря се в нов прозорец) за Codex, който е достъпен от днес в GitHub. Този пакет включва широк набор от модулни умения за най-често срещаните изследователски работни процеси, предназначени да помогнат на потребителите да работят в областите на човешката генетика, функционалната геномика, протеиновата структура, биохимията, клиничните доказателства и откриването на публични проучвания.

Тези умения служат като координиращ слой, който помага на учените да се справят по-ефективно с по-обширни, неясни и многоетапни въпроси. Те осигуряват достъп до над 50 публични мултиомични бази данни, литературни източници и биологични инструменти и предлагат гъвкава отправна точка за често прилагани, повторяеми работни процеси, като търсене на протеинови структури, търсене на последователности, преглед на литературата и откриване на публични набори от данни.
Отговарящите на условията потребители на Enterprise могат да използват този плъгин в изследователски работни процеси с GPT‑Rosalind за по-задълбочено биологично структурирано анализиране, докато всички потребители могат да използват пакета с плъгини с основните ни модели.
Искаме да направим тези възможности достъпни за учените и изследователските организации, които са най-добре позиционирани да допринесат за напредъка в човешкото здраве, като същевременно поддържаме строги предпазни мерки срещу биологични злоупотреби. Моделът за биологични науки стартира чрез схема за внедряване с доверен достъп, първоначално за отговарящи на условията корпоративни клиенти на плана Enterprise в САЩ, с механизми за контрол на допустимостта, управлението на достъпа и организационното управление. Същевременно предоставяме по-широк достъп до набор от конектори и плъгина „Life Sciences Research“, така че изследователите да могат да използват основните ни модели по-ефективно за задачи, свързани с научни изследвания в областта на биологичните науки.
Моделът за биологични науки е разработен с повишени контролни механизми за сигурност от корпоративен клас и засилено управление на достъпа, което позволява професионално използване за научни цели в регулирани изследователски среди. Оценяваме достъпа въз основа на три основни принципа: полза за обществото, стриктно управление и надзор върху безопасността и контролиран достъп със сигурност от корпоративен клас. На практика това означава, че участващите организации трябва да извършват легитимни научни изследвания с ясна полза за обществото; да поддържат подходящи механизми за управление, съответствие и контрол за предотвратяване на злоупотреби; и да ограничават достъпа до одобрени потребители в сигурни, добре управлявани среди. Организациите трябва също така да се съгласят с условията за изследователски предварителен преглед в областта на биологичните науки и да спазват политиките за използване на OpenAI, като е възможно да поискаме допълнителна информация като част от процеса на одобрение или продължаващо участие.
Организациите могат да заявят достъп чрез процедурата ни за проверка на квалификациите и безопасността.
По време на изследователския предварителен преглед при използването на този модел няма да се изразходват съществуващите кредити или токени – като се прилагат ограничения за злоупотреба. Ще споделим повече подробности за цените и достъпността с разширяването на програмата.
Моделът за биологични науки е създаден, за да помага на научните организации да извършват по-качествена работа по-бързо, в среди, които изискват технически възможности и оперативен контрол. Нашият специализиран екип в областта на биологичните науки, както и консултантските ни партньори, сред които McKinsey & Company, Boston Consulting Group (BCG) и Bain & Company, помагат на организациите да идентифицират случаи на използване с голямо въздействие, да интегрират модела в корпоративни среди и да постигат измерими резултати. Ако искате да разгледате начините, по които OpenAI в областта на биологичните науки може да подкрепи работата Ви, можете да се свържете с нашия екип по биологични науки.
Това е първата версия на нашата серия модели за биологични науки и я разглеждаме като началото на дългосрочен ангажимент за създаване на изкуствен интелект, който може да ускори научните открития в области, които са от голямо значение за обществото – от човешкото здраве до по-широките биологични изследвания. Ще продължим да подобряваме структурираното анализиране на модела в областта на биологията, да разширяваме поддръжката за дългосрочни изследователски работни процеси, които изискват интензивното използване на инструменти, и да работим в тясно сътрудничество с водещи научни институции, за да оценим въздействието в реалния свят. Това включва текущи партньорства с национални лаборатории като Национална лаборатория в Лос Аламос, където проучваме дизайн на протеини и катализатори, подпомаган от изкуствен интелект, включително способността на системите с изкуствен интелект да модифицират биологични структури, като същевременно запазват или подобряват ключови функционални свойства.
С течение на времето очакваме тези системи да се превърнат във все по-компетентни партньори в научните открития, като помагат на учените да преминават по-бързо от въпроса към доказателствата, от доказателствата към изводите и от изводите към нови методи на лечение за пациентите.


