Անցնել հիմնական բովանդակությանը
OpenAI

Ներկայացնում ենք կենսաբանական գիտությունների հետազոտությունների համար նախատեսված GPT‑Rosalind‑ը

Գիտական հետազոտություններն ու դեղերի հայտնաբերումն արագացնելու համար նախատեսված նոր հատուկ նպատակով մոդել։

Այսօր մենք ներկայացնում ենք GPT‑Rosalind‑ը՝ մեր առաջադեմ հիմնավորման մոդելը, որը ստեղծված է կենսաբանության, դեղերի հայտնաբերման և տրանսլյացիոն բժշկության ոլորտներում հետազոտություններին աջակցելու համար։ Կենսաբանական գիտությունների մոդելների շարքը օպտիմալացված է գիտական աշխատանքային հոսքերի համար՝ միավորելով գործիքների ավելի արդյունավետ օգտագործումը քիմիայի, սպիտակուցային ինժեներիայի և գենոմիկայի ոլորտներում ավելի խորը ըմբռնման հետ։

Միջին հաշվով, Միացյալ Նահանգներում նոր դեղամիջոցի թիրախի հայտնաբերումից մինչև կարգավորող հաստատում ստանալը տևում է մոտ 10-15 տարի։ Հայտնաբերման ամենավաղ փուլերում ձեռք բերված հաջողությունները հետագա փուլերում նպաստում են թիրախների ավելի լավ ընտրությանը, կենսաբանական ավելի ամուր հիպոթեզների ձևավորմանը և փորձերի որակի բարձրացմանը։ Կենսաբանական գիտությունների առաջընթացը սահմանափակվում է ոչ միայն գիտության բարդությամբ, այլև հետազոտական աշխատանքային հոսքերի բարդությամբ։ Գիտնականները պետք է աշխատեն գրականության մեծ ծավալների, մասնագիտացված տվյալների շտեմարանների, փորձարարական տվյալների և զարգացող վարկածների հետ՝ նոր գաղափարներ առաջադրելու և դրանք գնահատելու համար։ Այս աշխատանքները հաճախ ժամանակատար, մասնատված և դժվար մասշտաբավորվող են։

Մենք հավատում ենք, որ առաջադեմ ԱԲ համակարգերը կարող են օգնել հետազոտողներին ավելի արագ անցնել այս աշխատանքային հոսքերով՝ ոչ միայն առկա աշխատանքն ավելի արդյունավետ դարձնելով, այլև օգնելով գիտնականներին ուսումնասիրել ավելի շատ հնարավորություններ, բացահայտել կապեր, որոնք հակառակ դեպքում կարող էին աննկատ մնալ, և ավելի շուտ հանգել ավելի լավ վարկածների։ Աջակցելով ապացույցների համադրմանը, վարկածների ձևակերպմանը, փորձարարական պլանավորմանը և այլ բազմափուլ հետազոտական առաջադրանքներին՝ այս մոդելը ստեղծվել է, որպեսզի օգնի հետազոտողներին արագացնել հայտնագործության վաղ փուլերը։ Ժամանակի ընթացքում այս համակարգերը կարող են օգնել կենսաբանական գիտությունների կազմակերպություններին անել շրջադարձային հայտնագործություններ՝ հաջողության շատ ավելի բարձր հավանականությամբ, որոնք այլ կերպ հնարավոր չէին լինի։ 

GPT‑Rosalind‑ն այժմ հասանելի է որպես հետազոտական նախադիտում ChatGPT‑ում, Codex-ում և API-ում՝ որակավորված հաճախորդների համար մեր վստահելի հասանելիության ծրագրի միջոցով։ Մենք նաև ներկայացնում ենք Codex-ի՝ ազատ հասանելիությամբ կենսաբանական գիտությունների հետազոտական փլագին, որն օգնում է գիտնականներին միացնել մոդելներ ավելի քան 50 գիտական գործիքների և տվյալների աղբյուրների։ Մենք աշխատում ենք այնպիսի հաճախորդների հետ, ինչպիսիք են Amgen-ը, Moderna-ն, Ալենի ինստիտուտը, Thermo Fisher Scientific-ը և այլն, որպեսզի GPT‑Rosalind‑ը կիրառենք աշխատանքային հոսքերում, որոնք արագացնում են հետազոտությունն ու հայտնագործությունները։

Մոդելն անվանվել է Ռոզալինդ Ֆրանկլինի անունով, ում մանրակրկիտ ու հիմնավոր հետազոտություններն օգնեցին բացահայտել ԴՆԹ-ի կառուցվածքը և հիմք դրեցին ժամանակակից մոլեկուլային կենսաբանությանը։

Սկզբնական տվյալներից մինչև հիմնավորված գիտական որոշումներ․ տեսեք, թե ինչպես է մեր հատուկ այս նպատակի համար ստեղծված մոդելը արագացնում հետազոտական աշխատանքը։

Նախատեսված է գիտական աշխատանքային հոսքերի համար

GPT‑Rosalind կենսաբանական գիտությունների մոդելների շարքը ստեղծվել է ժամանակակից գիտական աշխատանքի՝ հրապարակված գիտական նյութերի, տվյալների, գործիքների և փորձերի հետ աշխատելու նպատակով Մեր գնահատումներում այն ապահովում է լավագույն արդյունավետությունը այն առաջադրանքներում, որոնք պահանջում են հիմնավորում մոլեկուլների, սպիտակուցների, գեների, ուղիների և հիվանդությանը վերաբերող կենսաբանության վերաբերյալ, և ավելի արդյունավետ է գիտական գործիքներ և տվյալների բազաներ օգտագործելու հարցում բազմափուլ աշխատանքային հոսքերում, ինչպիսիք են գրականության ուսումնասիրությունը, հաջորդականությունից ֆունկցիայի մեկնաբանությունը, փորձարարական պլանավորումը և տվյալների վերլուծությունը։

Սա մեր GPT‑Rosalind կենսաբանական գիտությունների մոդելային շարքի առաջին թողարկումն է, և մենք կշարունակենք ընդլայնել մոդելի կենսաքիմիական հիմնավորման առաջադեմ հնարավորությունները՝ երկարաժամկետ, գործիքներով հագեցած գիտական աշխատանքային հոսքերի շրջանակներում։ OpenAI-ի հաշվարկային ենթակառուցվածքը մեզ հնարավորություն է տալիս շարունակել ավելի ու ավելի հզոր մասնագիտացված մոդելների ուսուցումը, գնահատումն ու կատարելագործումը՝ դրանք ստուգելով իրական գիտական առաջադրանքների վրա, որպեսզի այս համակարգերն ավելի օգտակար դառնան, քանի որ աշխատանքային գործընթացներն էլ ավելի են բարդանում։

Ապացույցների վրա հիմնված բացահայտումների գաղափարներից մինչև բարձր ազդեցություն ունեցող փորձարկումներ․ տեսեք, թե ինչպես է լուծումների մեր փաթեթը վերածվում ձեր հետազոտական աշխատանքային հոսքերի չափելի բարելավումների։

Հաճախորդներ և էկոհամակարգ

Մենք աշխատում ենք դեղագործության, կենսատեխնոլոգիայի և հետազոտությունների ոլորտի առաջատար հաճախորդների, ինչպես նաև կենսաբանական գիտությունների տեխնոլոգիական կազմակերպությունների հետ՝ GPT‑Rosalind‑ը կիրառելու այն աշխատանքային հոսքերում, որոնք խթանում են բացահայտումները։

«Կենսաբանական գիտությունների ոլորտը յուրաքանչյուր քայլում պահանջում է ճշգրտություն։ Հարցերը չափազանց բարդ են, տվյալները՝ չափազանց յուրահատուկ, իսկ խաղադրույքները՝ աներևակայելի բարձր են։ OpenAI-ի հետ մեր եզակի համագործակցությունը մեզ հնարավորություն է տալիս նոր և նորարարական եղանակներով կիրառել նրանց ամենաառաջադեմ հնարավորություններն ու գործիքները՝ արագացնելու դեղամիջոցները հիվանդներին հասցնելու մեր գործընթացը»։
Շոն Բրուիչ, Amgen-ում արհեստական բանականության և տվյալների ավագ փոխնախագահ

Կատարողականություն և գնահատում

Մենք գնահատեցինք GPT‑Rosalind‑ը մի շարք կարողությունների շրջանակներում, որոնք հիմնարար են գիտական հայտնագործությունների և ոլորտի հետազոտությունների համար։ Այս գնահատումները չափում են տրամաբանական հիմնավորման կարողությունը գիտության տարբեր ենթաոլորտներում՝ ներառյալ քիմիական ռեակցիաների մեխանիզմները, սպիտակուցների կառուցվածքը, մուտացիաների ազդեցությունն ու փոխազդեցությունները, ինչպես նաև ԴՆԹ հաջորդականությունների ֆիլոգենետիկական մեկնաբանությունը։ Դրանք նաև գնահատում են, թե արդյոք մոդելները կարող են աջակցել իրական հետազոտական աշխատանքային հոսքերին և մեկնաբանել փորձարարական արդյունքները, նույնականացնել փորձագետների համար կարևոր օրինաչափությունները և արտաքին տեղեկությունը համադրելու միջոցով նախագծել հետագա փորձարկումները։ Վերջապես, դրանք ստուգում են, թե արդյոք մոդելները կարող են ընտրել և օգտագործել համապատասխան հաշվողական գործիքներ, տվյալների բազաներ և ոլորտին հատուկ հնարավորություններ՝ ուժեղացնելու իրենց հիմնավորումը։ Ընդհանուր առմամբ, այս գնահատումներն առաջընթաց են գրանցում գիտական հետազոտության ամբողջական գործընթացի տարբեր փուլերում և վկայում են այն մասին, որ մոդելն ավելի լավ կարող է օգնել հետազոտողներին հաղթահարել բացահայտումների բարդ առաջադրանքները։

Հարցում

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

Ոլորտի գնահատումներ

Մենք GPT‑Rosalind‑ը գնահատել ենք մի շարք հանրային չափորոշիչներով։ BixBench-ում՝ իրական կենսաինֆորմատիկ և տվյալների վերլուծության խնդիրների վրա հիմնված գնահատման համակարգում, հրապարակված գնահատականներ ունեցող մոդելների շարքում GPT‑Rosalind‑ը գրանցել է առաջատար արդյունք։

LABBench2 գնահատման համակարգում, որը չափում է արդյունքները տարբեր հետազոտական առաջադրանքներում, օրինակ՝ գրականության որոնում, տվյալների շտեմարանների օգտագործում, հաջորդականությունների մշակում և պրոտոկոլների նախագծում, GPT‑Rosalind‑ը 11 առաջադրանքից 6-ում գերազանցում է GPT‑5.4‑ին։ Առավել նշանակալի բարելավումը գալիս է CloningQA-ից, որը պահանջում է ԴՆԹ և ֆերմենտային ռեագենտների սկզբից մինչև վերջ նախագծում մոլեկուլային կլոնավորման պրոտոկոլների համար։

Մենք նաև համագործակցել ենք արհեստական բանականությամբ նախագծվող գենային թերապիաների ոլորտում առաջատար Dyno Therapeutics ընկերության հետ, որպեսզի գնահատենք մոդելը ՌՆԹ հաջորդականությունից գործառույթի կանխատեսման և ստեղծման առաջադրանքի հիման վրա՝ կիրառելով չհրապարակված, մաքուր հաջորդականություններ։ Արդյունքները համեմատվել են AI-bio ոլորտի մասնագետների պատմական 57 գնահատականի հետ։ Երբ գնահատումն իրականացվել է անմիջապես Codex հավելվածում, մոդելի տասը փորձից ընտրված լավագույն արդյունքները կանխատեսման առաջադրանքում ավելի բարձր է եղել, քան մարդ-փորձագետների 95 տոկոսի արդյունքը, իսկ հաջորդականություն ստեղծելու առաջադրանքում՝ ավելի բարձր, քան նրանց մոտ 84 տոկոսի արդյունքը։

Այս գնահատումները կարևոր պատկերացում են տալիս այն մասին, թե մոդելը որքան արդյունավետ է այնպիսի աշխատանքային գործընթացներում, որոնց վրա գիտնականները ամեն օր հենվում են, որպեսզի ստանան ապացույցներ, վերլուծեն բարդ տվյալները և գան կենսաբանական հիմնավորված եզրահանգումների։


Միացում գիտնականների կողմից օգտագործվող գործիքներին

Գիտնականները կարող են օգտագործել Codex-ի համար նախատեսված մեր նոր Կենսաբանական գիտությունների հետազոտական փլագին(բացվում է նոր պատուհանում), որն այսօրվանից հասանելի է GitHub-ում։ Այս փաթեթը ներառում է մոդուլային հմտությունների լայն շրջանակ՝ ամենատարածված հետազոտական աշխատանքային հոսքերի համար, որն օգնում է օգտատերերին աշխատել մարդու գենետիկայի, ֆունկցիոնալ գենոմիկայի, սպիտակուցների կառուցվածքի, կենսաքիմիայի, կլինիկական ապացույցների և հանրային ուսումնասիրությունների բացահայտման ոլորտներում։

Կենսագիտությունների փլագինի ցուցադրական ստատիկ պատկեր

Այս հմտությունները ծառայում են որպես կազմակերպման շերտ, որը գիտնականներին օգնում է ավելի արդյունավետ կերպով լուծել լայնածավալ, երկիմաստ և բազմափուլ հարցերը։ Դրանք հասանելիություն են տալիս ավելի քան 50 հանրային բազմաօմիքս տվյալների բազայի, գիտական աղբյուրների և կենսաբանական գործիքների, և ճկուն մեկնարկային հիմք են ծառայում կրկնվող աշխատանքների համար, ինչպիսիք են սպիտակուցի կառուցվածք գտնելը, հաջորդականությունների որոնումը, գրականության ուսումնասիրությունը և հանրային տվյալների հավաքածուների որոնումը։

Enterprise-ի՝ պահանջներին համապատասխանող օգտատերերը կարող են հետազոտական աշխատանքային հոսքերում օգտագործել այս փլագինը GPT‑Rosalind‑ի հետ՝ ավելի խորը կենսաբանական հիմնավորման համար, մինչդեռ բոլոր օգտատերերը կարող են օգտագործել փլագինների փաթեթը մեր հիմնական մոդելների հետ։

Վստահելի հասանելիություն

Մենք ուզում ենք այս հնարավորությունները հասանելի դարձնել այն գիտնականներին և հետազոտական կազմակերպություններին, որոնք կարող են ամենաշատը նպաստել մարդու առողջությանը՝ միաժամանակ կանխելով կենսաբանական ոլորտում հնարավոր չարաշահումները։ Կենսաբանական գիտությունների մոդելը սկզբում հասանելի է դառնալու ԱՄՆ-ում, Enterprise-ի որակավորված հաճախորդներին՝ վստահելի հասանելիության հատուկ համակարգով, որտեղ սահմանված են կանոններ, թե ով կարող է օգտվել, ինչպես է կառավարվում հասանելիությունը և ինչպես է դա վերահսկվում կազմակերպության ներսում։ Միաժամանակ մենք ավելի լայնորեն հասանելի ենք դարձնում մի շարք միակցիչներ և Կենսաբանական գիտությունների հետազոտական փլագինը, որպեսզի հետազոտողները կարողանան մեր հիմնական մոդելներն ավելի արդյունավետ կերպով օգտագործել կենսաբանական գիտությունների հետազոտական առաջադրանքների համար։ 

Կենսաբանական գիտությունների մոդելը մշակվել է ձեռնարկային մակարդակի անվտանգության ուժեղացված վերահսկողությամբ և մուտքի ուժեղացված կառավարմամբ, ինչը մասնագիտական գիտական օգտագործումը հնարավոր է դարձնում կառավարվող հետազոտական միջավայրերում։ Մենք գնահատում ենք հասանելիությունը երեք հիմնարար սկզբունքների հիման վրա՝ շահավետ օգտագործում, ուժեղ կառավարում և անվտանգության վերահսկողություն, ինչպես նաև վերահսկվող հասանելիություն՝ ձեռնարկային մակարդակի անվտանգությամբ։ Գործնականում սա նշանակում է, որ մասնակցող կազմակերպությունները պետք է զբաղվեն օրինական և հանրային հստակ օգուտ ունեցող գիտական հետազոտությամբ, ունենան պատշաճ կառավարման, համապատասխանության և չարաշահումների կանխարգելման վերահսկող մեխանիզմներ, և հասանելիությունը սահմանափակեն միայն հաստատված օգտատերերով՝ անվտանգ ու լավ կառավարվող միջավայրերում։ Կազմակերպությունները պետք է նաև համաձայնեն կենսաբանական գիտությունների հետազոտության նախադիտման պայմաններին և համապատասխանեն OpenAI-ի օգտագործման կանոններին․ գրանցման գործընթացի կամ շարունակական մասնակցության շրջանակներում կարող ենք նաև լրացուցիչ տեղեկություններ պահանջել։

Աշխատանքի սկիզբ

Կազմակերպությունները կարող են մուտքի թույլտվության հայտ ներկայացնել մեր որակավորման և անվտանգության գնահատման գործընթացի միջոցով։

Հետազոտական նախադիտման ընթացքում այս մոդելի օգտագործումը չի սպառի առկա կրեդիտները կամ թոքենները, եթե չխախտվեն չարաշահումները կանխելու համար սահմանված կանոնները։ Ծրագրի ընդլայնմանը զուգընթաց մենք ավելի մանրամասն տեղեկություններ կտրամադրենք գների և հասանելիության մասին։

Կենսաբանական գիտությունների մոդելը ստեղծված է, որպեսզի օգնի գիտական կազմակերպություններին ավելի արագ և ավելի բարձր որակով աշխատել այնպիսի միջավայրերում, որոնք պահանջում են և՛ տեխնիկական կարողություններ, և՛ գործառնական վերահսկողություն։ Կենսաբանական գիտությունների մեր հատուկ թիմը, ինչպես նաև խորհրդատվական գործընկերները, այդ թվում՝ McKinsey & Company-ն, Boston Consulting Group-ը (BCG) և Bain & Company-ն, օգնում են կազմակերպություններին բացահայտել բարձր ազդեցություն ունեցող կիրառման դեպքեր, ինտեգրել մոդելը ձեռնարկության միջավայրերում և ապահովել չափելի արդյունքներ։ Եթե ուզում եք ուսումնասիրել, թե OpenAI-ի Կենսաբանական գիտությունների մոդելն ինչ կերպ կարող է աջակցել ձեր աշխատանքին, կարող եք կապ հաստատել մեր կենսաբանական գիտությունների թիմի հետ։

Ի՞նչ է հաջորդը

Սա մեր Կենսաբանական գիտությունների մոդելների շարքի առաջին թողարկումն է, և մենք այն դիտարկում ենք որպես այնպիսի մի ԱԲ ստեղծելու երկարաժամկետ հանձնառության սկիզբ, որը կարող է արագացնել գիտական հայտնագործությունները հասարակության համար խիստ կարևոր ոլորտներում՝ մարդու առողջությունից մինչև ավելի լայն կենսաբանական հետազոտություններ։ Մենք կշարունակենք բարելավել մոդելի կենսաբանական հիմնավորումը, ընդլայնել աջակցությունը գործիքներով հագեցած և երկարաժամկետ հետազոտական աշխատանքային հոսքերի համար, և աշխատել առաջատար գիտական հաստատությունների հետ սերտ համագործակցությամբ՝ գնահատելու իրական աշխարհի ազդեցությունը։ Դա ներառում է շարունակական գործընկերություն ազգային լաբորատորիաների հետ, ինչպիսին է Լոս Ալամոսի ազգային լաբորատորիան, որտեղ մենք ուսումնասիրում ենք ԱԲ-ի կողմից ուղղորդվող սպիտակուցների և կատալիզատորների նախագծումը՝ ներառյալ կենսաբանական կառուցվածքները փոփոխելու ԱԲ համակարգերի կարողությունը՝ պահպանելով կամ բարելավելով հիմնական ֆունկցիոնալ հատկությունները։ 

Մենք ակնկալում ենք, որ ժամանակի ընթացքում այս համակարգերը կդառնան բացահայտումների ոլորտում գնալով ավելի ունակ գործընկերներ՝ օգնելով գիտնականներին ավելի արագ անցնել հարցից դեպի ապացույցներ, ապացույցներից դեպի պատկերացում, իսկ պատկերացումից՝ հիվանդների համար նոր բուժումներ։