Vi introduserer GPT‑Rosalind for forskning innen livsvitenskap
En ny, spesialutviklet modell for akselerering av vitenskapelig forskning og utvikling av nye legemidler.
Nå introduserer vi GPT‑Rosalind; vår banebrytende resonneringsmodell utviklet for å støtte forskning innen biologi, legemiddeloppdagelse og translasjonsmedisin. Modellserien for livsvitenskap er optimalisert for vitenskapelige arbeidsflyter og kombinere forbedret verktøybruk med dypere innsikt i kjemi, proteinteknikk og genomikk.
I gjennomsnitt tar det 10 til 15 år fra et målmolekyl er identifisert til et nytt legemiddel får myndighetsgodkjennelse i USA. Fremgang i de aller tidligste forskningsfasene gir ringvirkninger videre i prosessen, i form av bedre målvalg, sterkere biologiske hypoteser og eksperimenter av høyere kvalitet. Fremskritt innen livsvitenskapen hemmes ikke bare av den underliggende vitenskapens kompleksitet, men også av kompleksiteten i selve forskningsprosessen. Forskere må jobbe seg gjennom store mengder litteratur, spesialiserte databaser, eksperimentelle data og hypoteser i stadig utvikling for å kunne utvikle og vurdere nye ideer. Disse arbeidsflytene er ofte tidkrevende, fragmenterte og vanskelige å skalere.
Vi tror avanserte KI-systemer kan hjelpe forskere med å komme raskere igjennom disse arbeidsflytene – ikke kun ved å effektivisere eksisterende arbeid, men også ved å utforske flere muligheter, finne sammenhenger som ellers kunne blitt oversett og tidligere komme frem til bedre hypoteser. Ved å støtte bevissyntetisering, hypoteseutvikling, eksperimentplanlegging og andre forskningsoppgaver som består av flere trinn, er denne modellen utformet for at forskere skal kunne akselerere de tidlige forskningsfasene. Over tid kan disse systemene hjelpe organisasjoner innen livsvitenskap med å få gjennombrudd som ellers ikke ville vært mulige, og med en langt høyere suksessrate.
Gjennom programmet vårt for pålitelig tigang er GPT‑Rosalind nå tilgjengelig som utprøvingsversjon i ChatGPT, Codex og API-et for kvalifiserte kunder. Vi introduserer også en fritt tilgjengelig forsknings-plugin for livsvitenskap for Codex. Med denne kan forskere koble modeller til over 50 vitenskapelige verktøy og datakilder. Vi samarbeider med kunder som Amgen, Moderna, Allen Institute, Thermo Fisher Scientific for å ta i bruk GPT‑Rosalind på tvers av arbeidsflyter som akselererer forskning og oppdagelser.
Modellen er oppkalt etter Rosalind Franklin, hvis grundige forskning bidro til å avdekke DNA-strukturen og la grunnlaget for moderne molekylærbiologi.
Fra rådata til velbegrunnede oppdagelsesbeslutninger: Se hvordan spesialmodellen vår effektiviserer forskningsarbeidsflyten.
GPT‑Rosalind‑modellserien for livsvitenskap er utviklet for moderne vitenskapelig arbeid som omfatter publisert dokumentasjon, data, verktøy og eksperimenter. I våre evalueringer leverer den best ytelse på oppgaver som krever resonnering rundt molekyler, proteiner, gener, signalveier og sykdomsrelevant biologi. Den er mer effektiv i benyttelsen av vitenskapelige verktøy og databaser i flertrinns arbeidsflyter, som litteraturgjennomgang, tolkning av sekvens-til-funksjon, eksperimentplanlegging og dataanalyse.
Dette er den første utgivelsen i vår GPT‑Rosalind‑modellserie for livsvitenskap. Vi vil fortsette å utvide modellens banebrytende evner til biokjemiske resonnering på tvers av langsiktige, verktøytunge vitenskapelige arbeidsflyter. Med OpenAIs databehandlingsinfrastruktur kan vi fortsette å trene, evaluere og forbedre stadig mer avanserte domenemodeller opp mot reelle vitenskapelige oppgaver, noe som bidrar til at disse systemene blir nyttigere i takt med at arbeidsflytene i seg selv blir mer komplekse.
Fra evidensbasert innsikt til eksperimenter med stor påvirkning: Se hvordan løsningspakken vår bidrar til målbare forbedringer i forskningsarbeidsflyten din.
Vi samarbeider med ledende kunder innen farmasi, bioteknologi og forskning, samt teknologiorganisasjoner innen livsvitenskap, for å ta i bruk GPT‑Rosalind i arbeidsflyter som akselererer forskningen og utviklingen.
«Livsvitenskapsfeltet krever presisjon i hvert trinn. Spørsmålene er svært komplekse, dataene er svært unike og det står utrolig mye på spill. Gjennom det unike samarbeidet vårt med OpenAI kan vi ta i bruk de mest avanserte funksjonene og verktøyene deres på nye og innovative måter, noe som kan bidra til å fremskynde leveringen av medisiner til pasientene.»
Vi har evaluert GPT‑Rosalind på en rekke områder som er avgjørende for vitenskapelige gjennombrudd og forskning. Disse evalueringene måler grunnleggende resonneringsevne innenfor ulike vitenskapelige underområder, som kjemiske reaksjonsmekanismer; proteinstruktur, mutasjonseffekter og interaksjoner; samt fylogenetisk tolkning av DNA-sekvenser. Det er også vurdert om modell kan støtte reelle forskningsarbeidsflyter, ved å tolke eksperimentelle resultater, identifisere ekspertrelevante mønstre og syntetisere ekstern informasjon for å utforme oppfølgingseksperimenter. Til slutt undersøkes det om modellene kan velge og bruke de riktige beregningsverktøyene, databasene og fagspesifikke funksjonene for å styrke resonneringsevnen sin. Samlet sett viser disse evalueringene fremgang gjennom hele den vitenskapelige forskningsprosessen, og de tyder på økt evne til å hjelpe forskere med å løse krevende forskningsoppgaver.
Vi har evaluert GPT‑Rosalind ved hjelp av en rekke offentlig tilgjengelige referansemålinger. I BixBench, en referansemåling utviklet med utgangspunkt i praktisk bioinformatikk og dataanalyse, presterte GPT‑Rosalind i tet blant modeller med publiserte resultater.
I LABBench2, en referansemåling som måler ytelse på en rekke forskningsoppgaver, som litteratursøk, databasetilgang, sekvensmanipulering og protokollutforming, blir OpenAI GPT‑5.4 overgått av GPT‑Rosalind i 6 av 11 oppgaver. Den mest bemerkelsesverdige forbedringen kommer fra CloningQA, som krever ende-til-ende-utforming av DNA- og enzymreagenser for protokoller for molekylær kloning.
Vi har også inngått et samarbeid med Dyno Therapeutics; et ledende selskap innen KI-designede genterapier, for å evaluere modellen i en oppgave for prediksjon og generering av funksjoner ut fra RNA-sekvenser, ved hjelp av upubliserte, uforurensede sekvenser. Resultatene ble sammenlignet med 57 tidligere resultater fra menneskelige eksperter på KI-biofeltet. Da de ble evaluert direkte i Codex-appen, lå de beste ti modellforslagene over den 95. persentilen blant menneskelige eksperter på prediksjonsoppgaven, og rundt den 84. persentilen blant menneskelige eksperter på sekvensgenereringsoppgaven.
Disse evalueringene gir et meningsfullt bilde av ytelsen i arbeidsflytene som forskere hver dag er avhengige av for å frembringe bevis, analysere komplekse data og komme frem til holdbare biologiske konklusjoner.
Forskere kan bruke vår nye forsknings-plugin for livsvitenskap(åpnes i et nytt vindu) for Codex, som nå er tilgjengelig i GitHub. Denne pakken inneholder et bredt utvalg modulbaserte verktøy for de vanligste forskningsarbeidsflytene. Disse er utviklet for at brukerne skal kunne jobbe på tvers av fagområder som humangenetikk, funksjonell genomikk, proteinstruktur, biokjemi, klinisk dokumentasjon og kartlegging av offentlige studier.

Disse verktøyene fungerer som et koordineringslag som hjelper forskerne med å håndtere omfattende, tvetydige og flerstegsoppgaver på en mer effektiv måte. De gir tilgang til mer enn 50 offentlige multiomikkdatabaser, litteraturkilder og biologiverktøy, og tilbyr et fleksibelt utgangspunkt for vanlige repeterbare arbeidsflyter som oppslag av proteinstrukturer, sekvenssøk, litteraturgjennomgang og oppdagelse av offentlige datasett.
Kvalifiserte Enterprise-brukere kan bruke denne pluginen i forskningsarbeidsflyter med GPT‑Rosalind for å få dypere biologiske resonnement, og alle brukere kan bruke plugin-pakken med hovedmodellene våre.
Vi ønsker å gjøre disse mulighetene tilgjengelige for de forskerne og forskningsorganisasjonene som er best rustet til å akselerere folkehelsen, samtidig som vi opprettholder strenge sikkerhetstiltak mot biologisk misbruk. Livsvitenskapsmodellen lanseres i første omgang gjennom en utrullingsstruktur med pålitelig tilgang for kvalifiserte bedriftskunder i USA, med kontrollmekanismer for kvalifisering, tilgangsstyring og organisatorisk styring. Samtidig gjør vi en rekke koblinger og pluginer for livsvitenskapsforskning tilgjengelig for et bredere publikum, slik at forskere kan bruke hovedmodellene mer effektivt i forskningsoppgavene sine.
Livsvitenskapsmodellen er utviklet med forbedrede sikkerhetskontroller i bedriftsklassen og forbedret tilgangsstyring, hvilket muliggjør profesjonell vitenskapelig bruk i regulerte forskningsmiljøer. Vi vurderer tilgang ut fra tre grunnleggende prinsipper: samfunnstjenlig bruk, robust styrings- og sikkerhetstilsyn, samt kontrollert tilgang med sikkerhet i bedriftsklassen. I praksis betyr dette at deltakende organisasjoner må drive legitim vitenskapelig forskning med klar samfunnsnytte, gjennomføre hensiktsmessige kontroller for styring, samsvar og forebygging av misbruk, og begrense tilgangen for godkjente brukere innenfor sikre, godt administrerte miljøer. Organisasjonene må også ssamtykke til vilkårene for utprøvingsversjonen og overholde OpenAIs retningslinjer for bruk. Vi kan be om ytterligere opplysninger som en del av registreringsprosessen eller ved vedvarende deltakelse.
Organisasjoner kan be om tilgang gjennom vår kvalifiserings- og sikkerhetsvurderingsprosess.
Med utprøvingsversjonen vil ikke eksisterende kreditter eller tokens blir brukt. Dette er med forbehold om tiltak mot misbruk. Vi vil gi mer informasjon om priser og tilgjengelighet etter hvert som programmet utvides.
Livsvitenskapsmodellen er utviklet for at vitenskapsorganisasjoner raskere skal kunne utføre arbeid av høyere kvalitet, i miljøer som krever både teknisk kompetanse og operativ kontroll. Livsvitenskapsteamet vårt, samt rådgivningspartnere som McKinsey & Company, Boston Consulting Group (BCG) og Bain & Company, hjelper organisasjoner med å identifisere bruksområder med stor nytteverdi, integrere modellen i bedriftsmiljøer og få målbare resultater. Kontakt livsvitenskapsteamet vårt hvis du vil utforske hvordan OpenAI kan bidra i arbeidet ditt.
Dette er den første utgivelsen i modellserien vår for livsvitenskap. Vi anser den som starten på et langsiktig engasjement for å utvikle kunstig intelligens som kan akselerere vitenskapelige gjennombrudd på områder som er viktige for samfunnet; fra folkehelse til biologisk forskning i bredere forstand. Vi vil fortsette å forbedre modellens biologiske resonnering, utvide støtten for forskningsarbeidsflyter som krever mye bruk av verktøy og har lang tidshorisont, og samarbeide tett med ledende vitenskapelige institusjoner for å vurdere den praktiske virkningen. Dette omfatter løpende samarbeid med nasjonale laboratorier som Los Alamos National Laboratory, hvor vi utforsker KI-styrt design av proteiner og katalysatorer, herunder KI-systemenes evne til å modifisere biologiske strukturer samtidig som viktige funksjonelle egenskaper bevares eller forbedres.
Med tiden forventer vi at disse systemene vil bli stadig mer kompetente samarbeidspartnere i forskningsarbeidet, og hjelpe forskere med å komme raskere fra spørsmål til bevis, fra bevis til innsikt og fra innsikt til nye behandlingsformer for pasientene.


