Predstavujeme GPT‑Rosalind pre výskum v oblasti biologických vied
Nový, účelovo navrhnutý model na urýchlenie vedeckého výskumu a objavovania liekov.
Dnes predstavujeme GPT‑Rosalind, náš prelomový uvažovací model navrhnutý na podporu výskumu v oblasti biológie, objavovania liekov a translačnej medicíny. Séria modelov pre biovedy je optimalizovaná pre vedecké pracovné postupy a spája lepšie využívanie nástrojov s hlbším porozumením naprieč chémiou, proteínovým inžinierstvom a genomikou.
V priemere trvá približne 10 až 15 rokov, kým nový liek v Spojených štátoch prejde od identifikácie cieľa k regulačnému schváleniu. Prínosy dosiahnuté v najskorších fázach objavovania sa v ďalších fázach znásobujú v podobe lepšieho výberu cieľov, presvedčivejších biologických hypotéz a kvalitnejších experimentov. Pokrok v biologických vedách nie je obmedzovaný len náročnosťou samotnej vedy, ktorá je základom, ale aj komplexnosťou samotných výskumných pracovných postupov. Vedci musia pracovať s rozsiahlym objemom literatúry, špecializovanými databázami, experimentálnymi údajmi a vyvíjajúcimi sa hypotézami, aby mohli vytvárať a vyhodnocovať nové myšlienky. Tieto pracovné postupy sú často časovo náročné, fragmentované a ťažko škálovateľné.
Veríme, že pokročilé systémy umelej inteligencie môžu pomôcť výskumníkom rýchlejšie prechádzať týmito pracovnými postupmi, a to nielen tým, že zefektívnia existujúcu prácu, ale aj tým, že vedcom pomôžu skúmať viac možností, odhaľovať súvislosti, ktoré by inak mohli zostať nepovšimnuté, a skôr dospieť k lepším hypotézam. Podporou syntézy dôkazov, generovania hypotéz, plánovania experimentov a ďalších viackrokových výskumných úloh je tento model navrhnutý tak, aby pomohol výskumníkom urýchliť počiatočné fázy objavovania. Postupom času by tieto systémy mohli organizáciám v oblasti biologických vied pomôcť dosahovať prelomové objavy, ktoré by inak neboli možné, s oveľa vyššou mierou úspešnosti.
GPT‑Rosalind je teraz k dispozícii ako výskumná ukážka v ChatGPT, Codex a API pre kvalifikovaných zákazníkov prostredníctvom nášho programu prístupu založeného na dôvere. Taktiež predstavujeme voľne dostupný výskumný plugin Life Sciences pre Codex, ktorý vedcom pomáha prepájať modely s viac ako 50 vedeckými nástrojmi a zdrojmi dát. Na nasadení GPT‑Rosalind v pracovných postupoch, ktoré urýchľujú výskum a objavovanie spolupracujeme so zákazníkmi ako je Amgen, Moderna, Allen Institute, Thermo Fisher Scientific, a i s ďalšími.
Model nesie meno Rosalind Franklin, ktorej dôkladný výskum pomohol odhaliť štruktúru DNA a položil základy modernej molekulárnej biológie.
Pozrite sa, ako náš účelovo navrhnutý model urýchľuje výskumné pracovné postupy od nespracovaných údajov po podložené rozhodnutia pri objavovaní.
Séria modelov GPT‑Rosalind pre biologické vedy je vytvorená pre modernú vedeckú prácu naprieč publikovanými dôkazmi, dátami, nástrojmi a experimentmi. V našich hodnoteniach dosahuje najlepší výkon pri úlohách, ktoré vyžadujú uvažovanie o molekulách, proteínoch, génoch, dráhach a biológii relevantnej pre ochorenia, a je efektívnejšia pri používaní vedeckých nástrojov a databáz vo viackrokových pracovných postupoch, ako je prehľad literatúry, interpretácia vzťahu medzi sekvenciou a funkciou, plánovanie experimentov a analýza dát.
Toto je prvé vydanie v našej sérii modelov GPT‑Rosalind pre biologické vedy a budeme naďalej rozširovať prelomové biochemické uvažovanie modelu vrámci dlhodobých vedeckých pracovných postupov, ktoré intenzívne využívajú nástroje. Infraštruktúra výpočtovej sily OpenAI nám umožňuje naďalej trénovať, vyhodnocovať a zlepšovať čoraz schopnejšie modely pre konkrétne oblasti na reálnych vedeckých úlohách. To pomáha týmto systémom stávať sa užitočnejšími, keďže samotné pracovné postupy sú čoraz zložitejšie.
Pozrite sa, ako náš balík riešení prináša merateľné zlepšenia vo vašich výskumných procesoch od poznatkov založených na dôkazoch až po experimenty s vysokým dopadom.
Spolupracujeme s poprednými zákazníkmi z oblasti farmácie, biotechnológií a výskumu, ako aj s organizáciami v oblasti technológií pre biologické vedy, aby sme nasadili GPT‑Rosalind do pracovných postupov, ktoré podporujú objavy.
„Oblasť biologických vied vyžaduje presnosť v každom kroku. Otázky sú veľmi zložité, údaje sú veľmi jedinečné a cieľe sú neuveriteľne vysoké. Naša jedinečná spolupráca s OpenAI nám umožňuje využívať ich najpokročilejšie možnosti a nástroje novými a inovatívnymi spôsobmi s potenciálom urýchliť zabezpečovanie liekov pre pacientov.“
Hodnotili sme GPT‑Rosalind v rozsahu schopností, ktoré sú kľúčové pre vedecké objavy a priemyselný výskum. Tieto hodnotenia merajú základné uvažovanie naprieč vedeckými podoblasťami vrátane mechanizmov chemických reakcií, štruktúry proteínov, účinkov mutácií a interakcií a fylogenetickej interpretácie sekvencií DNA. Takisto posudzujú, či modely dokážu podporiť reálne výskumné pracovné postupy tým, že interpretujú experimentálne výstupy, identifikujú vzory relevantné pre odborníkov a syntetizujú externé informácie, aby navrhli nadväzujúce experimenty. Napokon testujú, či modely dokážu vybrať a používať správne výpočtové nástroje, databázy a schopnosti špecifické pre danú oblasť, aby posilnili svoje uvažovanie. Celkovo tieto hodnotenia ukazujú pokrok v celom procese vedeckého výskumu od začiatku do konca a naznačujú väčšiu schopnosť pomáhať výskumníkom zvládať náročné úlohy spojené s objavmi.
GPT‑Rosalind sme hodnotili na sérii verejných benchmarkov. Na BixBench, benchmarku navrhnutom podľa bioinformatiky a analýzy dát z reálneho sveta, GPT‑Rosalind dosiahol vedúci výkon spomedzi modelov so zverejnenými výsledkami.
V LABBench2, benchmarku merajúcom výkon v rôznych výskumných úlohách, ako sú vyhľadávanie literatúry, prístup k databázam, manipulácia so sekvenciami a návrh protokolov, GPT‑Rosalind prekonáva GPT‑5.4 v 6 z 11 úloh. Najvýraznejšie zlepšenie prináša CloningQA, ktorý si vyžaduje komplexný návrh reagencií DNA a enzýmov pre protokoly molekulárneho klonovania.
Spolupracovali sme aj so spoločnosťou Dyno Therapeutics, ktorá je priekopníkom v oblasti génových terapií navrhnutých pomocou umelej inteligencie, aby sme vyhodnotili model na úlohe predikcie a generovania funkcie sekvencií RNA s použitím nepublikovaných a nekontaminovaných sekvencií. Výkon bol porovnaný s 57 historickými skóre od ľudských expertov v oblasti umelej inteligencie a biológie. Pri priamom hodnotení v aplikácii Codex sa najlepšie z desiatich výstupov modelu umiestnili nad 95. percentilom ľudských expertov v úlohe predikcie a približne na 84. percentile v úlohe generovania sekvencií.
Tieto hodnotenia prinášajú zmysluplný pohľad na výkon pracovných postupov, ktoré vedci denne využívajú na vytváranie dôkazov, analýzu komplexných údajov a dosahovanie obhájiteľných biologických záverov.
Vedci môžu používať náš nový výskumný plugin Biologické vedy(otvorí sa v novom okne) pre Codex, ktorý je dnes k dispozícii v službe GitHub. Tento balík obsahuje širokú sadu modulárnych zručností pre najbežnejšie výskumné pracovné postupy, ktoré sú navrhnuté tak, aby používateľom pomohli pracovať v humánnej genetike, funkčnej genomike, štruktúre proteínov, biochémii, pri klinických dôkazoch a vyhľadávaním verejne dostupných štúdií.

Tieto schopnosti fungujú ako vrstva orchestrácie, ktorá vedcom pomáha efektívnejšie pracovať na široko koncipovaných, nejednoznačných a viackrokových otázkach. Poskytujú prístup k viac ako 50 verejným multiomickým databázam, zdrojom literatúry a biologickým nástrojom a ponúkajú flexibilný východiskový bod pre bežné opakovateľné pracovné postupy, ako sú vyhľadávanie štruktúry proteínov, vyhľadávanie sekvencií, prehľad literatúry a objavovanie verejných súborov údajov.
Oprávnení používatelia Enterprise môžu využiť tento plugin vo výskumných pracovných postupoch s GPT‑Rosalind na hlbšie biologické uvažovanie, zatiaľ čo všetci používatelia môžu používať balík pluginov s našimi hlavnými modelmi.
Chceme sprístupniť tieto schopnosti vedcom a výskumným organizáciám, ktoré sú najlepšie pripravené na zlepšenie zdravia ľudí, pričom zachovávame silné opatrenia proti biologickému zneužitiu. Model Life Sciences sa zavádza prostredníctvom štruktúry nasadenia s dôveryhodným prístupom pre oprávnených zákazníkov Enterprise v Spojených štátoch, pričom sa kontroluje oprávnenosť, správa prístupu a organizačné riadenie. Zároveň sprístupňujeme súbor konektorov a plugin pre výskum biologických vied širšiemu okruhu používateľov, aby mohli výskumníci efektívnejšie využívať naše hlavné modely na úlohy výskumu v oblasti biologických vied.
Model Life Sciences bol vyvinutý s rozšírenými bezpečnostnými kontrolami na podnikovej úrovni a posilneným riadením prístupu, čo umožňuje profesionálne vedecké využitie v riadených výskumných prostrediach. Prístup posudzujeme na základe troch základných princípov: prínosného používania, dôsledného riadenia a dohľadu nad bezpečnosťou a kontrolovaného prístupu a bezpečnosti na podnikovej úrovni. V praxi to znamená, že zúčastnené organizácie musia vykonávať legitímny vedecký výskum s jasným verejným prínosom. Musia udržiavať primeranú správu, súlad a kontroly na predchádzanie zneužitiu. Prístup musia obmedziť na schválených používateľov v bezpečných a dobre spravovaných prostrediach. Organizácie musia súhlasiť s podmienkami ukážky výskumu v oblasti biologických vied a dodržiavať pravidlá používania OpenAI. Môžeme požiadať o dodatočné informácie v rámci registrácie alebo pokračujúcej účasti.
Organizácie môžu požiadať o prístup prostredníctvom nášho procesu kvalifikačného a bezpečnostného preskúmania.
Počas výskumnej ukážky sa pri používaní tohto modelu nebudú spotrebúvať existujúce kredity ani tokeny. To je predmetom ochranných opatrení brániacim zneužitiu. Čoskoro sa podelíme o ďalšie informácie o cenách a dostupnosti s rozširovaním programu.
Model pre biovedy je navrhnutý tak, aby pomáhal vedeckým organizáciám vykonávať kvalitnejšiu prácu rýchlejšie v prostrediach, ktoré vyžadujú technické schopnosti aj prevádzkovú kontrolu. Náš špecializovaný tím pre oblasť biologických vied a poradenskí partneri ako McKinsey & Company, Boston Consulting Group (BCG) a Bain & Company, pomáhajú organizáciám identifikovať prípady použitia s vysokým dopadom, integrovať model do podnikových prostredí a dosahovať merateľné výsledky. Ak by ste chceli preskúmať spôsoby, ktorými môže OpenAI Life Sciences pomôcť s vašou prácou, môžete sa obrátiť na náš tím pre biologické vedy.
Toto je prvé vydanie v našej sérii modelov pre biologické vedy a vnímame ho ako začiatok dlhodobého záväzku budovať AI, ktorá môže urýchliť vedecké objavy v oblastiach, ktoré majú pre spoločnosť zásadný význam – od oblasti ľudského zdravia až po širší biologický výskum. Budeme pokračovať v zlepšovaní biologického uvažovania modelu, rozširovaní podpory pre pracovné postupy vo výskume, ktoré vo veľkej miere využívajú nástroje a majú dlhodobý charakter, a v úzkej spolupráci s poprednými vedeckými inštitúciami hodnotiť reálny dopad. To zahŕňa aj prebiehajúcu spoluprácu s národnými laboratóriami, ako je Los Alamos National Laboratory, kde skúmame návrh proteínov a katalyzátorov riadený AI vrátane schopnosti AI systémov upravovať biologické štruktúry pri zachovaní alebo zlepšení kľúčových funkčných vlastností.
Postupom času očakávame, že sa tieto systémy stanú stále lepšími partnermi pri objavovaní – že pomôžu vedcom rýchlejšie prejsť od otázky k dôkazom, od dôkazov k poznatkom a od poznatkov k novým liečbam pre pacientov.


