Predstavljamo GPT‑Rosalind za istraživanja u oblasti prirodnih nauka
Novi namjenski model za ubrzavanje naučnih istraživanja i otkrivanja lijekova.
Danas predstavljamo GPT‑Rosalind, naš granični model rezonovanja osmišljen da podrži istraživanja u biologiji, otkrivanju lijekova i translacijskoj medicini. Serija modela za prirodne nauke optimizirana je za naučne procese, kombinujući unaprijeđeno korištenje alata s dubljim razumijevanjem hemije, inženjeringa proteina i genomike.
U prosjeku, potrebno je otprilike 10 do 15 godina da se od otkrivanja ciljne mete dođe do regulatornog odobrenja za novi lijek u Sjedinjenim Američkim Državama. Dobici ostvareni u najranijim fazama otkrivanja kumuliraju se kasnije kroz bolji odabir ciljeva, snažnije biološke hipoteze i kvalitetnije eksperimente. Napredak u prirodnim naukama ograničen je ne samo teškoćom same nauke u osnovi, već i složenošću tokova istraživačkog rada. Naučnici moraju raditi s velikim obimom literature, specijaliziranim bazama podataka, eksperimentalnim podacima i hipotezama koje se razvijaju kako bi generirali i evaluirali nove ideje. Ovi radni tokovi često oduzimaju mnogo vremena, fragmentirani su i teško ih je skalirati.
Vjerujemo da napredni AI sistemi mogu pomoći istraživačima da brže prolaze kroz ove radne tokove—not just by making existing work more efficient, but by helping scientists explore more possibilities, surface connections that might otherwise be missed, and arrive at better hypotheses sooner. Podržavajući sintezu dokaza, generiranje hipoteza, planiranje eksperimenata i druge višestepene istraživačke zadatke, ovaj model je osmišljen da pomogne istraživačima da ubrzaju rane faze otkrivanja. S vremenom, ovi sistemi bi mogli pomoći organizacijama u prirodnim naukama da dođu do revolucionarnih otkrića do kojih inače ne bi bilo moguće doći, uz mnogo veću stopu uspješnosti.
GPT‑Rosalind je sada dostupan kao istraživački pregled u ChatGPT‑u, Codex-u i API-ju za kvalifikovane korisnike kroz naš program pouzdanog pristupa. Također uvodimo slobodno dostupan dodatak za istraživanje u biomedicinskim znanostima za Codex, koji pomaže naučnicima povezati modele s više od 50 naučnih alata i izvora podataka. Radimo s klijentima kao što su Amgen, Moderna, Allen Institute, Thermo Fisher Scientific i drugi kako bismo primijenili GPT‑Rosalind u različitim radnim tokovima koji ubrzavaju istraživanja i otkrića.
Model je nazvan po Rosalind Franklin, čija su rigorozna istraživanja pomogla otkrivanju strukture DNK i postavljanju temelja moderne molekularne biologije.
Od sirovih podataka do utemeljenih odluka o otkrićima, pogledajte kako naš namjenski model ubrzava istraživačke tokove rada.
Serija modela GPT‑Rosalind za nauke o životu napravljena je za savremeni naučni rad u objavljenim dokazima, podacima, alatima i eksperimentima. U našim evaluacijama postiže najbolje rezultate na zadacima koji zahtijevaju rezonovanje o molekulima, proteinima, genima, putanjama i biologiji relevantnoj za bolesti, a efikasniji je i u korištenju naučnih alata i baza podataka u višekoračnim radnim tokovima kao što su pregled literature, tumačenje odnosa između sekvence i funkcije, planiranje eksperimenata i analiza podataka.
Ovo je prvo izdanje u našoj seriji GPT‑Rosalind modela za nauke o životu, a nastavit ćemo širiti granice biohemijskih sposobnosti rezonovanja modela kroz dugoročne, alatima bogate naučne tokove rada. OpenAI-jeva računarska infrastruktura daje nam mogućnost da nastavimo trenirati, evaluirati i unapređivati sve sposobnije modele za određene domene na stvarnim naučnim zadacima — pomažući ovim sistemima da postanu korisniji kako sami tokovi rada postaju složeniji.
Od uvida u otkrića zasnovanih na dokazima do eksperimenata sa velikim uticajem, pogledajte kako se naš paket rješenja pretvara u mjerljiva poboljšanja u vašim istraživačkim tokovima rada.
Radimo s vodećim klijentima iz farmaceutske, biotehnološke i istraživačke industrije, kao i s tehnološkim organizacijama u oblasti nauka o životu, kako bismo primijenili GPT‑Rosalind u radnim tokovima koji omogućavaju otkrića.
„Područje nauka o životu zahtijeva preciznost na svakom koraku. Pitanja su veoma složena, podaci su potpuno jedinstveni, a ulozi su izuzetno visoki. Naša jedinstvena saradnja s OpenAI-jem omogućava nam da njihove najnaprednije mogućnosti i alate primijenimo na nove i inovativne načine, s potencijalom da ubrzamo isporuku lijekova pacijentima.”
Procijenili smo GPT‑Rosalind kroz niz sposobnosti ključnih za naučna otkrića i industrijska istraživanja. Ove procjene mjere osnovno rezonovanje kroz naučne podoblasti, uključujući mehanizme hemijskih reakcija; strukturu proteina, efekte mutacija i interakcije; te filogenetsko tumačenje DNK sekvenci. Takođe procjenjuju mogu li modeli podržati stvarne tokove naučnoistraživačkog rada tumačenjem eksperimentalnih rezultata, identifikovanjem obrazaca relevantnih stručnjacima i sintetiziranjem vanjskih informacija za osmišljavanje naknadnih eksperimenata. Konačno, testiraju mogu li modeli odabrati i koristiti odgovarajuće računske alate, baze podataka i sposobnosti specifične za određenu oblast kako bi unaprijedili svoje rezonovanje. Kada se uzmu zajedno, ove procjene pokazuju napredak kroz end-to-end proces naučnog istraživanja i ukazuju na snažniju sposobnost pomaganja istraživačima da rade na zahtjevnim zadacima otkrivanja.
Procijenili smo GPT‑Rosalind na nizu javno dostupnih benchmarkova. Na BixBenchu, referentnom testu osmišljenom za bioinformatiku i analizu podataka u stvarnim uslovima, GPT‑Rosalind je ostvario vodeće performanse među modelima s javno objavljenim rezultatima.
Na LABBench2, testu performansi koji mjeri uspješnost u nizu istraživačkih zadataka kao što su pretraživanje literature, pristup bazama podataka, manipulacija sekvencama i dizajn protokola, GPT‑Rosalind nadmašuje GPT‑5.4 u 6 od 11 zadataka. Najznačajnije poboljšanje dolazi od CloningQA, koji zahtijeva cjelovit dizajn DNK i enzimskih reagensa za protokole molekularnog kloniranja.
Također smo sarađivali s kompanijom Dyno Therapeutics, koja predvodi razvoj genskih terapija dizajniranih pomoću AI-ja, kako bismo evaluirali model na zadatku predviđanja i generiranja funkcije na osnovu RNA sekvence koristeći neobjavljene, nekontaminirane sekvence. Performanse su upoređene s 57 historijskih rezultata ljudskih stručnjaka iz oblasti AI-bio. Kada su direktno evaluirane u aplikaciji Codex, najbolje od deset prijava modela bile su rangirane iznad 95. percentila ljudskih stručnjaka na zadatku predviđanja i oko 84. percentila ljudskih stručnjaka na zadatku generiranja sekvenci.
Ove procjene pružaju značajan pokazatelj učinka na vrstama radnih tokova na koje se naučnici svakodnevno oslanjaju za prikupljanje dokaza, analizu složenih podataka i kretanje ka biološkim zaključcima koji se mogu braniti.
Naučnici mogu koristiti naš novi istraživački dodatak za Biološke nauke(otvara se u novom prozoru) za Codex, dostupan danas na GitHubu. Ovaj paket uključuje širok skup modularnih vještina za najčešće istraživačke radne tokove, osmišljen da pomogne korisnicima u radu u oblastima humane genetike, funkcionalne genomike, strukture proteina, biohemije, kliničkih dokaza i otkrivanja javno dostupnih studija.

Ove vještine djeluju kao orkestracijski sloj koji pomaže naučnicima da efikasnije rade na širokim, nejasnim i višestepenim pitanjima. Omogućavaju pristup za više od 50 javnih multi-omskih baza podataka, izvora literature i bioloških alata te nude fleksibilnu početnu tačku za uobičajene ponovljive radne tokove kao što su pretraživanje strukture proteina, pretraga sekvenci, pregled literature i otkrivanje javno dostupnih skupova podataka.
Enterprise korisnici koji ispunjavaju uslove mogu koristiti ovaj plugin u tokovima rada za istraživanje s GPT‑Rosalind za dublje biološko rezonovanje, dok svi korisnici mogu koristiti paket pluginova s našim glavnim modelima.
Želimo ove sposobnosti učiniti dostupnim naučnicima i istraživačkim organizacijama koje su u najboljoj poziciji da unaprijede zdravlje ljudi, uz održavanje snažnih zaštitnih mjera protiv biološke zloupotrebe. Model Life Sciences se za početak pokreće kroz strukturu implementacije s pouzdanim pristupom za kvalificirane Enterprise korisnike u SAD-u, uz kontrole vezane za ispunjavanje uslova, upravljanje pristupom i organizacijsko upravljanje. Istovremeno, šire stavljamo na raspolaganje skup konektora i dodatak Life Sciences Research Plugin, kako bi istraživači mogli efikasnije koristiti naše glavne modele za zadatke istraživanja u oblasti prirodnih nauka.
Model Life Sciences razvijen je s pojačanim sigurnosnim kontrolama na nivou preduzeća i unaprijeđenim upravljanjem pristupom, što omogućava profesionalnu naučnu upotrebu u upravljanim istraživačkim okruženjima. Pristup procjenjujemo na osnovu tri osnovna principa: korisna upotreba, snažno upravljanje i nadzor sigurnosti te kontrolisani pristup uz sigurnost na nivou preduzeća. U praksi, to znači da organizacije koje učestvuju moraju provoditi legitimna naučna istraživanja s jasnom javnom koristi; održavati odgovarajuće upravljanje, usklađenost i kontrole za sprečavanje zloupotrebe; te ograničiti pristup na odobrene korisnike unutar sigurnih okruženja kojima se dobro upravlja. Organizacije također moraju prihvatiti uslove istraživačkog pregleda za Life Sciences i biti u skladu s OpenAI-jevim pravilima upotrebe, a možemo zatražiti i dodatne informacije kao dio procesa uključivanja ili nastavka učešća.
Organizacije mogu zatražiti pristup putem našeg procesa kvalifikacije i sigurnosnog pregleda.
Tokom istraživačkog pregleda, korištenje ovog modela neće trošiti postojeće kredite ili tokene—podložno zaštitnim mjerama protiv zloupotrebe. Uskoro ćemo podijeliti više detalja o cijenama i dostupnosti kako se program bude širio.
Model za prirodne nauke dizajniran je da pomogne naučnim organizacijama da obavljaju kvalitetniji rad, brže, u okruženjima koja zahtijevaju i tehničke sposobnosti i operativnu kontrolu. Naš posvećeni tim za nauke o životu—kao i savjetodavni partneri, uključujući McKinsey & Company, Boston Consulting Group (BCG) i Bain & Company—pomažu organizacijama da identificiraju slučajeve upotrebe s velikim učinkom, integriraju model u okruženja na nivou preduzeća i ostvare mjerljive rezultate. Ako želite istražiti načine na koje OpenAI za prirodne nauke može podržati vaš rad, možete kontaktirati naš tim za prirodne nauke.
Ovo je prvo izdanje u našoj seriji modela za nauke o životu i smatramo ga početkom dugoročne posvećenosti izgradnji AI-a koji može ubrzati naučna otkrića u oblastima koje su od dubokog značaja za društvo, od ljudskog zdravlja do širih bioloških istraživanja. Nastavit ćemo poboljšavati biološko rezonovanje modela, širiti podršku za istraživačke radne tokove koji se u velikoj mjeri oslanjaju na alate i koji su dugoročni te blisko sarađivati s vodećim naučnim institucijama kako bismo procijenili uticaj u stvarnom svijetu. To uključuje tekuća partnerstva s nacionalnim laboratorijama kao što su Los Alamos National Laboratory, gdje istražujemo dizajn proteina i katalizatora vođen umjetnom inteligencijom, uključujući sposobnost AI sistema da modificira biološke strukture uz očuvanje ili poboljšanje ključnih funkcionalnih svojstava.
S vremenom očekujemo da ovi sistemi postanu sve sposobniji partneri u otkrivanju — pomažući naučnicima da brže prelaze od pitanja do dokaza, od dokaza do uvida, a zatim od uvida do novih tretmana za pacijente.


