Прескокни до главната содржина
OpenAI

Ви го претставуваме GPT‑Rosalind за истражување во биолошките науки

Нов, специјално создаден модел за да ги забрза научните истражувања и откривањето лекови.

Денес, го претставуваме GPT‑Rosalind, нашиот граничен модел со расудување, изграден за да поддржи истражување во биологијата, откривањето лекови и транслациската медицина. Серијата модели за биолошки науки е оптимизирана за научни работни процеси, комбинирајќи подобрено користење алатки со подлабоко разбирање на хемијата, инженерингот на протеини и геномиката.

Во просек, потребни се приближно 10 до 15 години за да се премине од откривање на целта до регулаторно одобрување на нов лек во САД. Придобивките постигнати во најраните фази на откривањето се акумулираат понатаму во подобар избор на цели, посилни биолошки хипотези и поквалитетни експерименти. Напредокот во биолошките науки е ограничен не само од сложеноста на основната наука, туку и од сложеноста на истражувачките работни текови. Научниците мора да работат со големи томови литература, специјализирани бази на податоци, експериментални податоци и хипотези во развој, за да создаваат и оценуваат нови идеи. Овие работни процеси често бараат многу време, фрагментирани се и тешко се прошируваат.

Веруваме дека напредните системи за вештачка интелигенција можат да им помогнат на истражувачите побрзо да се движат низ овие работни процеси - не само со тоа што ќе ја направат постојната работа поефикасна, туку и помагајќи им на научниците да истражуваат повеќе можности, да откриваат врски што инаку би можеле да бидат пропуштени и побрзо да дојдат до подобри хипотези. Со поддршка на синтеза на докази, генерирање хипотези, експериментално планирање и други истражувачки задачи во повеќе чекори, овој модел е создаден за да им помогне на истражувачите да ги забрзаат раните фази на откривањето. Со текот на времето, овие системи би можеле да им помогнат на организациите во биолошките науки да дојдат до напредоци кои инаку не би биле можни, со многу повисока стапка на успех. 

GPT‑Rosalind сега е достапен како истражувачки преглед во ChatGPT, Codex и API за квалификувани корисници преку нашата програма за доверлив пристап. Исто така, воведуваме и слободно достапен приклучок за Codex за истражување во биолошките науки, кој им помага на научниците да ги поврзат моделите со повеќе од 50 научни алатки и извори на податоци. Работиме со клиенти како Amgen, Moderna, Allen Institute, Thermo Fisher Scientific и други за да го примениме GPT‑Rosalind во работни текови што ги забрзуваат истражувањето и откритијата.

Моделот е именуван по Розалинд Френклин, чие ригорозно истражување помогна да се открие структурата на ДНК и ги постави темелите на современата молекуларна биологија.

Од необработени податоци до поткрепени одлуки за откритија, погледнете како нашиот специјализиран модел ги забрзува истражувачките работни процеси.

Создадено за научни работни процеси

Серијата модели GPT‑Rosalind за биолошки науки е создадена за современа научна работа врз основа на објавени докази, податоци, алатки и експерименти. Во нашите проценки, тој обезбедува најдобри перформанси за задачи што бараат расудување за молекули, протеини, гени, патеки и биологија поврзана со болести, и е поефикасен во користење научни алатки и бази на податоци во работни процеси со повеќе чекори, како што се преглед на литература, интерпретација од секвенца до функција, планирање експерименти и анализа на податоци.

Ова е првото издание во нашата серија модели GPT‑Rosalind за биолошки науки, и ќе продолжиме да ги прошируваме границите на способностите на моделот за биохемиско расудување во долгорочни научни работни процеси што во голема мера се потпираат на алатки. Компјутерската инфраструктура на OpenAI ни овозможува да продолжиме со обучување, евалуација и подобрување на сè поспособни модели за одредени домени во однос на реални научни задачи - помагајќи им на овие системи да станат покорисни како што и самите работни текови стануваат посложени.

Од сознанија за откритија засновани на докази до експерименти со големо влијание, погледнете како нашата палета решенија се претвора во мерливи подобрувања во вашите истражувачки работни текови.

Клиенти и екосистемот

Работиме со водечки фармацевтски, биотехнолошки и истражувачки клиенти, како и со технолошки организации за биолошки науки, за да го примениме GPT‑Rosalind во работните текови што го поттикнуваат откривањето.

„Областа на биолошките науки бара прецизност на секој чекор. Прашањата се многу сложени, податоците се многу уникатни, а влоговите се неверојатно високи. „Нашата единствена соработка со OpenAI ни овозможува да ги примениме нивните најнапредни можности и алатки на нови и иновативни начини, со потенцијал да го забрза начинот на кој им доставуваме лекови на пациентите.“
- Шон Бруич, висок потпретседател на вештачка интелигенција и податоци, Amgen

Перформанси и евалуација

Го оценивме GPT‑Rosalind во низа способности што се фундаментални за научните откритија и индустриското истражување. Овие проценки го мерат основното расудување во повеќе научни подобласти, вклучувајќи механизми на хемиски реакции; структура на протеини, ефекти од мутации и интеракции; и филогенетско толкување на секвенци на ДНК. Тие исто така проценуваат дали моделите можат да поддржат реални истражувачки работни текови преку толкување на експериментални резултати, идентификување обрасци релевантни за експерти и синтетизирање надворешни информации за да се осмислат последователни експерименти. И на крајот, тие тестираат дали модел можат да ги изберат и користат соодветните пресметковни алатки, бази на податоци и способности специфични за доменот за да го унапредат своето расудување. Земени заедно, овие проценки покажуваат напредок низ процесот на научното истражување од крај до крај и укажуваат на поголема способност да им помогнат на истражувачите да работат на предизвикувачки задачи за откривање.

Промпт

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

Индустриски евалуации

Го оценивме GPT‑Rosalind според низа јавни репери. На BixBench, репер дизајниран околу биоинформатика и анализа на податоци од реалниот свет, GPT‑Rosalind постигна водечки перформанси меѓу модел со објавени резултати.

На LABBench2, репер што ги мери перформансите на низа истражувачки задачи како што се пребарување литература, пристап до бази на податоци, манипулација со секвенци и дизајнирање протоколи, GPT‑Rosalind го надминува GPT‑5.4 во 6 од 11 задачи. Најзабележителното подобрување доаѓа од CloningQA, кој бара дизајнирање на ДНК од почеток до крај и ензимски реагенси за протоколи за молекуларно клонирање.

Исто така, соработувавме со Dyno Therapeutics, компанија-пионер во генски терапии дизајнирани со ВИ, за да го оцениме моделот на задача за предвидување и генерирање од РНК-секвенца до функција користејќи необјавени, неконтаминирани секвенци. Перформансите беа споредени со 57 историски резултати од човечки експерти во областа на ВИ-био. Кога беа евалуирани директно во апликацијата Codex, најдобрите од десет поднесоци од модели се рангираа над 95-тиот перцентил на човечките експерти на задачата за предвидување и околу 84-тиот перцентил на човечките експерти на задачата за генерирање секвенци.

Овие евалуации обезбедуваат значаен сигнал за перформансите на типовите работни текови, на кои научниците се потпираат секој ден за да генерираат докази, да анализираат сложени податоци и да се движат кон одбранливи биолошки заклучоци.


Поврзување со алатките што ги користат научниците

Научниците може да го користат нашиот нов приклучок за истражување за биолошки науки(се отвора во нов прозорец) за Codex, достапен денес во GitHub. Овој пакет вклучува широк комплет модуларни вештини за најчестите истражувачки работни текови, дизајнирани да им помогнат на корисниците да работат низ хумана генетика, функционална геномика, структура на протеини, биохемија, клинички докази и откривање јавни студии.

Демо статична слика за приклучок за биолошки науки

Овие вештини дејствуваат како слој за оркестрација што им помага на научниците поефикасно да работат на широки, нејасни и повеќечекорни прашања. Тие обезбедуваат пристап до повеќе од 50 јавни мулти-омикс бази на податоци, извори од литература и биолошки алатки, и нудат флексибилна почетна точка за вообичаени повторливи работни текови како што се пребарување на протеинска структура, пребарување на секвенци, преглед на литература и пронаоѓање на јавни бази на податоци.

Подобните корисници на Enterprise може да го искористат овој приклучок во истражувачки работни текови со GPT‑Rosalind за подлабоко биолошко расудување, додека сите корисници може да го користат пакетот со приклучоци со нашите главни модели.

Доверлив пристап

Сакаме да ги направиме овие можности достапни за научниците и истражувачките организации кои се во најдобра позиција да го унапредат здравјето на луѓето, истовремено одржувајќи силни заштитни мерки против биолошка злоупотреба. Моделот за биолошки науки се воведува преку доверлив пристап за квалификувани клиенти на Enterprise во САД, со контроли околу подобноста, управувањето со пристап и организациското управување. Во исто време, пошироко ги ставаме на располагање конекторите и приклучокот за истражување биолошки науки, за да можат истражувачите поефикасно да ги користат нашите стандардни модели за истражувачки задачи во областа на биолошките науки. 

Моделот за биолошки науки беше развиен со засилени безбедносни контроли на ниво на претпријатие и зајакнато управување со пристапот, овозможувајќи професионална научна употреба во контролирани истражувачки средини. Го оценуваме пристапот врз основа на три основни принципи: корисна употреба, силно управување и надзор на безбедноста и контролиран пристап со безбедност на ниво на претпријатие. Во пракстика, ова значи дека организациите што учествуваат мора да спроведуваат легитимно научно истражување со јасна јавна корист; да одржуваат соодветно управување, усогласеност и контроли за спречување злоупотреба; и да го ограничат пристапот на одобрени корисници во безбедни средини со добро управување. Организациите мора исто така да се согласат со условите за прегледот на истражувањето во областа на биолошките науки и да ги почитуваат политиките за користење на OpenAI, а можеме да побараме дополнителни информации како дел од воведувањето или континуираното учество.

Започнете

Организациите можат да побараат пристап преку нашиот процес за квалификација и безбедносен преглед.

За време на истражувачкиот преглед, користењето на овој модел нема да ги троши постојните кредити или токени, што подлежи на заштитни мерки против злоупотреба. Ќе споделиме повеќе детали за цени и достапност како што се проширува програмата.

Моделот за биолошки науки е создаден за да им помогне на научните организации да работат побрзо и поквалитетно, во средини што бараат и техничка способност и оперативна контрола. Нашиот посветен тим за биолошки науки - како и советодавните партнери, вклучувајќи ги McKinsey & Company, Boston Consulting Group (BCG) и Bain & Company - им помагаат на организациите да идентификуваат случаи на употреба со големо влијание, да го интегрираат моделот во претприемнички средини и да поттикнат мерливи резултати. Ако сакате да истражите на кои начини OpenAI Life Sciences може да ја поддржи вашата работа, можете да контактирате со нашиот тим за биолошки науки.

Што е следно

Ова е првото издание од нашата серија модели за биолошки науки, и го гледаме како почеток на долгорочна посветеност за создавање вештачка интелигенција што може да ги забрза научните откритија во области од суштинско значење за општеството, од човековото здравје до пошироките биолошки истражувања. Ќе продолжиме да го подобруваме биолошкото расудување на моделот, да ја прошируваме поддршката за истражувачки работни текови што се потпираат на алатки и се долгорочни, и тесно ќе соработуваме со водечки научни институции за да го оцениме влијанието во реалниот свет. Тоа вклучува тековни партнерства со национални лаборатории, како што е националната лабораторија Лос Аламос, каде што истражуваме дизајн на протеини и катализатори воден од вештачка интелигенција, вклучувајќи ја способноста на системите со вештачка интелигенција да ги модифицираат биолошките структури, притоа зачувувајќи или подобрувајќи ги клучните функционални својства. 

Со текот на времето, очекуваме овие системи да станат сè поспособни партнери во откривањето, помагајќи им на научниците побрзо да преминат од прашање до докази, од докази до сознанија и од сознанија до нови третмани за пациентите.