GPT‑Rosalind dla badań z zakresu nauk przyrodniczych
Nowy wyspecjalizowany model stworzony z myślą o przyspieszaniu badań naukowych i odkrywaniu leków.
Przedstawiamy GPT‑Rosalind, nasz pionierski model rozumujący stworzony, aby wspierać badania w dziedzinie biologii, odkrywania leków i medycyny translacyjnej. Seria modeli dla sektora nauk przyrodniczych została zoptymalizowana pod kątem procesów naukowych i łączy ulepszone korzystanie z narzędzi z głębszym zrozumieniem chemii, inżynierii białek i genomiki.
Średnio przejście od odkrycia celu terapeutycznego do uzyskania zgody regulacyjnej na nowy lek w Stanach Zjednoczonych zajmuje około 10 do 15 lat. Korzyści osiągnięte na najwcześniejszych etapach procesu badawczego kumulują się na dalszych etapach w postaci lepszego doboru celów, trafniejszych hipotez biologicznych i wyższej jakości eksperymentów. Postęp w naukach przyrodniczych ogranicza nie tylko poziom złożoności samej nauki leżącej u ich podstaw, lecz także skomplikowanie procesów badawczych. Naukowcy muszą pracować z obszernymi zasobami literatury, specjalistycznymi bazami danych, danymi eksperymentalnymi i ewoluującymi hipotezami, aby generować i oceniać nowe pomysły. Praca w takim środowisku jest często czasochłonna, rozdrobniona i trudno ją skalować.
Wierzymy, że zaawansowane systemy AI mogą pomóc badaczom szybciej realizować ich zadania, nie tylko poprzez zwiększanie efektywności pracy, ale także poprzez wspieranie ich w eksplorowaniu większej liczby możliwości, ujawnianiu powiązań, które w innym przypadku mogłyby zostać przeoczone, oraz szybszym formułowaniu trafniejszych hipotez. Usprawniając syntezę danych, generowanie hipotez, planowanie eksperymentów i inne wieloetapowe zadania badawcze, model ten pomaga badaczom przyspieszyć prace na wczesnych etapach odkryć. Z czasem systemy te mogłyby pomóc organizacjom z obszaru nauk przyrodniczych w bardziej sprawnym dokonywaniu przełomowych odkryć, które w innym przypadku nie byłyby możliwe.
Model GPT‑Rosalind jest teraz dostępny jako badawcza wersja poglądowa w ChatGPT, Codex i API dla uprawnionych klientów w ramach naszego programu zaufanego dostępu. Wprowadzamy również ogólnodostępną wtyczkę badawczą Life Sciences dla Codex, która pomaga naukowcom łączyć modele z ponad 50 narzędziami naukowymi i źródłami danych. Współpracujemy z firmami takimi jak Amgen, Moderna, Allen Institute, Thermo Fisher Scientific i innymi w celu wdrożenia GPT‑Rosalind w różnych procesach, które przyspieszają tok badań i odkryć.
Inspiracją do nadania takiej a nie innej nazwy modelowi była Rosalind Franklin, której badania pomogły odkryć strukturę DNA i położyły podwaliny pod współczesną biologię molekularną.
Od surowych danych po trafne decyzje dotyczące odkryć – zobacz, jak nasz wyjątkowy model przyspiesza przepływy pracy badawczej.
Seria modeli GPT‑Rosalind dla nauk przyrodniczych została stworzona z myślą o nowoczesnej pracy naukowej obejmującej opublikowane dowody, dane, narzędzia i eksperymenty. W naszych ocenach model ten zapewnia najlepszą wydajność w zadaniach wymagających rozumowania dotyczącego cząsteczek, białek, genów, szlaków i biologii istotnej z punktu widzenia chorób, a także skuteczniej korzysta z narzędzi naukowych i baz danych w wieloetapowych przepływach pracy, takich jak przegląd literatury, interpretacja zależności między sekwencją a funkcją, planowanie eksperymentów i analiza danych.
To pierwsze wydanie w naszej serii modeli GPT‑Rosalind dla nauk przyrodniczych, w ramach którego będziemy poszerzać pionierskie możliwości biochemicznego rozumowania modelu w długoterminowych naukowych przepływach pracy intensywnie wykorzystujących narzędzia. Infrastruktura obliczeniowa OpenAI pozwala nam trenować, oceniać i ulepszać coraz bardziej zaawansowane modele dziedzinowe w rzeczywistych zadaniach naukowych, usprawniając je w miarę wzrostu poziomu złożoności samych przepływów pracy.
Od wniosków z odkryć opartych na dowodach po eksperymenty o dużym wpływie – zobacz, jak nasz zestaw rozwiązań przekłada się na wymierne usprawnienia w Twoich procesach badawczych.
Współpracujemy z czołowymi klientami z branży farmaceutycznej, biotechnologicznej i badawczej oraz z organizacjami technologicznymi z obszaru nauk przyrodniczych, aby usprawniać wdrażanie GPT‑Rosalind w przepływach pracy skupiających się na odkryciach.
„Nauki przyrodnicze wymagają precyzji na każdym etapie. Pytania są nadzwyczaj złożone, dane są wyjątkowe, a stawka jest niezwykle wysoka. Współpraca z OpenAI umożliwia nam wykorzystywanie ich najbardziej zaawansowanych możliwości oraz narzędzi w nowe i innowacyjne sposoby, co może przyspieszyć zapewnianie leków pacjentom”,
Model GPT‑Rosalind oceniliśmy pod kątem szeregu zdolności mających fundamentalne znaczenie dla odkryć naukowych i badań przemysłowych. Testy te oceniają podstawowe rozumowanie w różnych subdyscyplinach naukowych, w tym mechanizmy reakcji chemicznych, strukturę białek, skutki mutacji i interakcje, oraz interpretację filogenetyczną sekwencji DNA. Pozwalają również ocenić, czy modele mogą wspierać rzeczywiste procesy badawcze poprzez interpretowanie wyników eksperymentów, identyfikowanie wzorców istotnych dla ekspertów oraz syntetyzowanie informacji zewnętrznych w celu projektowania kolejnych eksperymentów. Ponadto sprawdzają, czy modele potrafią wybierać i wykorzystywać odpowiednie narzędzia obliczeniowe, bazy danych oraz funkcje określone dla danej dziedziny, aby wspomagać swoje rozumowanie. Łącznie oceny te pokazują postęp w całym, kompleksowym procesie badań naukowych i wskazują na większą zdolność do wspierania naukowców w realizacji wymagających zadań odkrywczych.
Oceniliśmy GPT‑Rosalind z użyciem serii publicznych testów. W teście porównawczym BixBench, opracowanym z myślą o rzeczywistych zastosowaniach w bioinformatyce i analizie danych, GPT‑Rosalind osiągnął najlepszy wynik wśród modeli z opublikowanymi wynikami.
W teście LABBench2, mierzącym wydajność w szeregu zadań badawczych, takich jak wyszukiwanie literatury, dostęp do baz danych, manipulacja sekwencjami i projektowanie protokołów, wynik modelu GPT‑Rosalind był wyższy niż GPT‑5.4 w 6 z 11 zadań. Najbardziej znacząca poprawa wystąpiła w przypadku testu CloningQA, który wymaga kompleksowego projektowania odczynników DNA i enzymatycznych na potrzeby protokołów klonowania molekularnego.
Nawiązaliśmy współpracę z pionierską firmą Dyno Therapeutics projektującą terapie genowe z użyciem AI, aby ocenić nasz model w zadaniu przewidywania funkcji sekwencji RNA oraz generowania sekwencji z użyciem niepublikowanych, niezanieczyszczonych danych. Wyniki porównaliśmy z 57 historycznymi ocenami ekspertów z dziedziny AI-bio. Podczas oceny bezpośrednio w aplikacji Codex najlepsze z dziesięciu rezultatów modelu znalazły się powyżej 95. percentyla wyników ekspertów w zadaniu przewidywania oraz w okolicach 84. percentyla wyników ekspertów w zadaniu generowania sekwencji.
Oceny te zapewniają miarodajny sygnał wskazujący na zwiększenie skuteczności przepływów pracy realizowanych przez naukowców podczas gromadzenia dowodów, analizowania złożonych danych i dochodzenia do uzasadnionych biologicznych wniosków.
Naukowcy mogą korzystać z naszej nowej wtyczki badawczej Life Sciences(otwiera nowe okno) do Codex, dostępnej od dziś w serwisie GitHub. Pakiet ten obejmuje szeroki zestaw modułowych umiejętności opracowanych dla najczęściej spotykanych procesów badawczych, które wspomagają pracę w obszarach genetyki człowieka, genomiki funkcjonalnej, struktury białek, biochemii, danych klinicznych oraz podczas wyszukiwania publicznie dostępnych badań.

Umiejętności działają jako warstwa zarządzająca, która pomaga naukowcom skuteczniej szukać odpowiedzi na szerokie, niejednoznaczne i wieloetapowe pytania. Zapewniają też dostęp do ponad 50 publicznych baz danych multiomicznych, źródeł literatury i narzędzi biologicznych oraz oferują elastyczny punkt wyjścia dla typowych, powtarzalnych przepływów pracy, takich jak wyszukiwanie struktur białek, wyszukiwanie sekwencji, przegląd literatury i przeszukiwanie publicznie dostępnych zbiorów danych.
Uprawnieni użytkownicy planu Enterprise mogą korzystać z tej wtyczki w przepływach pracy badawczej z GPT‑Rosalind w celu uzyskania głębszego rozumowania biologicznego, a wszyscy użytkownicy mogą używać pakietu wtyczek z naszymi głównymi modelami.
Chcemy oferować te możliwości naukowcom i organizacjom badawczym, które w największym stopniu wspierają postępy w zakresie ochrony zdrowia, zapewniając jednocześnie silne zabezpieczenia przed nadużyciami biologicznymi. Na początek model Life Sciences jest oferowany w ramach struktury wdrożenia opartej na zaufanym dostępie dla kwalifikujących się klientów planów Enterprise w USA i jest obwarowany mechanizmami kontroli dotyczącymi kwalifikowalności, zarządzania dostępem i nadzoru organizacyjnego. Jednocześnie szerzej grupie odbiorców przekazujemy zestaw łączników oraz wtyczkę Life Sciences Research Plugin, aby badacze mogli skuteczniej wykorzystywać nasze podstawowe modele do zadań badawczych w obszarze nauk przyrodniczych.
Model Life Sciences został opracowany z zastosowaniem wzmocnionych mechanizmów kontroli bezpieczeństwa klasy korporacyjnej oraz zawiera ulepszone funkcje zarządzania dostępem, co pozwala na realizowanie profesjonalnych operacji naukowych w środowiskach badawczych podlegających nadzorowi. Dostęp oceniamy na podstawie trzech podstawowych zasad: korzystnego wykorzystania, silnych mechanizmów zarządzania i nadzoru nad bezpieczeństwem oraz kontrolowanego dostępu z zabezpieczeniami klasy korporacyjnej. W praktyce oznacza to, że organizacje uczestniczące muszą prowadzić uprawnione badania naukowe przynoszące wyraźne korzyści publiczne, utrzymywać odpowiednie mechanizmy nadzoru, procedury zgodności i zapobiegania nadużyciom oraz ograniczać dostęp do rozwiązania tylko do zatwierdzonych użytkowników w bezpiecznych, właściwie zarządzanych środowiskach. Organizacje muszą również zaakceptować warunki wersji poglądowej dotyczące badań z zakresu nauk biologicznych oraz przestrzegać zasad użytkowania opracowanych przez OpenAI. Ponadto możemy poprosić o dodatkowe informacje w ramach procesu wdrożenia lub dalszego uczestnictwa.
Organizacje mogą wnioskować o dostęp do modelu w ramach naszego procesu kwalifikacji i oceny bezpieczeństwa.
Podczas korzystania z tej wersji poglądowej modelu istniejące środki ani tokeny nie będą zużywane z zastrzeżeniem stosowania zabezpieczeń przed nadużyciami. Więcej informacji o cenach i dostępności przekażemy w miarę rozwoju programu.
Model Life Sciences został stworzony, aby pomagać organizacjom naukowym pracować szybciej i na wyższym poziomie w środowiskach wymagających zarówno zaawansowanych możliwości technicznych, jak i kontroli operacyjnej. Nasz dedykowany zespół ds. nauk przyrodniczych – wraz z partnerami doradczymi, takimi jak McKinsey & Company, Boston Consulting Group (BCG) oraz Bain & Company – pomaga organizacjom identyfikować przypadki użycia o dużym wpływie, integrować model ze środowiskami korporacyjnymi i osiągać mierzalne wyniki. Jeśli chcesz sprawdzić, jak OpenAI Life Sciences może usprawnić Twoją pracę, skontaktuj się z naszym zespołem ds. nauk przyrodniczych.
To pierwsze wydanie w naszej serii modeli Life Sciences i traktujemy je jako początek długoterminowego procesu tworzenia AI, która może przyspieszać odkrycia naukowe w obszarach mających ogromne znaczenie dla społeczeństwa – od opieki zdrowotnej po szerzej zakrojone badania biologiczne. Będziemy nadal ulepszać biologiczne rozumowanie modelu, rozszerzać wsparcie dla procesów badawczych intensywnie wykorzystujących narzędzia i obejmujących długie horyzonty czasowe oraz ściśle współpracować z czołowymi instytucjami naukowymi, aby oceniać rzeczywiste korzyści płynące z wdrażania tego rozwiązania. Działania te obejmują trwające partnerstwa z krajowymi laboratoriami, takimi jak Los Alamos National Laboratory, gdzie badamy projektowanie białek i katalizatorów wspomagane przez AI, w tym zdolność systemów AI do modyfikowania struktur biologicznych przy jednoczesnym zachowaniu lub poprawie kluczowych właściwości funkcjonalnych.
Z czasem spodziewamy się, że systemy te staną się coraz bardziej kompetentnymi partnerami w badaniach i będą pomagać naukowcom szybciej pokonywać drogę od pytań do dowodów, od dowodów do wniosków, a od wniosków do nowych metod leczenia pacjentów.


