Gå til hovedindhold
OpenAI

16. april 2026

ResearchUdgivelse

Introduktion af GPT‑Rosalind til biovidenskabelig forskning

En ny specialbygget model til at accelerere videnskabelig forskning og lægemiddeludvikling.

I dag introducerer vi GPT‑Rosalind, vores banebrydende ræsonneringsmodel, der er udviklet til at understøtte forskning inden for biologi, lægemiddeludvikling og translationel medicin. Modellen til biovidenskab er optimeret til videnskabelige arbejdsgange og kombinerer forbedret brug af værktøjer med en dybere forståelse inden for kemi, proteinteknologi og genomik.

I gennemsnit tager det cirka 10 til 15 år at gå fra identifikation af et mål til myndighedsgodkendelse for et nyt lægemiddel i USA. Fremskridt opnået i de tidligste faser af opdagelsesarbejdet forplanter sig længere fremme i processen i form af bedre måludvælgelse, stærkere biologiske hypoteser og eksperimenter af højere kvalitet. Fremskridt inden for biovidenskab begrænses ikke kun af vanskeligheden ved den underliggende videnskab, men også af kompleksiteten i selve forskningsarbejdsgangene. Forskere skal arbejde på tværs af store mængder litteratur, specialiserede databaser, eksperimentelle data og hypoteser under udvikling for at generere og evaluere nye idéer. Disse arbejdsgange er ofte tidskrævende, fragmenterede og svære at skalere.

Vi mener, at avancerede AI-systemer kan hjælpe forskere med at komme hurtigere gennem disse arbejdsgange, ikke kun ved at gøre det eksisterende arbejde mere effektivt, men også ved at hjælpe forskere med at udforske flere muligheder, afdække forbindelser, der ellers kunne blive overset, og nå frem til bedre hypoteser hurtigere. Ved at understøtte evidenssyntese, hypotesedannelse, eksperimentel planlægning og andre flertrins forskningsopgaver er denne model designet til at hjælpe forskere med at fremskynde de tidlige stadier af opdagelsesprocessen. Med tiden kan disse systemer hjælpe organisationer inden for biovidenskab med at udvikle nye muligheder, som ellers ikke ville være mulige, med en langt højere succesrate. 

GPT‑Rosalind er nu tilgængelig som en forskningsmæssig forhåndsvisning i ChatGPT, Codex og API'en for kvalificerede kunder gennem vores program for betroet adgang. Vi introducerer også et frit tilgængeligt biovidenskabeligt forskningsplugin til Codex, som hjælper forskere med at forbinde model med over 50 videnskabelige værktøjer og datakilder. Vi samarbejder med kunder som Amgen, Moderna, Allen Institute, Thermo Fisher Scientific m.fl. om at anvende GPT‑Rosalind på tværs af arbejdsgange, der fremskynder forskning og opdagelser.

Modellen er opkaldt efter Rosalind Franklin, hvis grundige forskning hjalp med at afdække DNA's struktur og lagde grundlaget for moderne molekylærbiologi.

Se, hvordan vores specialdesignede model accelererer forskningsarbejdsgange lige fra rådata til velunderbyggede beslutninger om opdagelser.

Udviklet til videnskabelige arbejdsgange

GPT‑Rosalind‑serien af model til biovidenskab er udviklet til moderne videnskabeligt arbejde på tværs af publiceret evidens, data, værktøjer og eksperimenter. I vores evalueringer leverer den den bedste ydeevne på opgaver, der kræver ræsonnering over molekyler, proteiner, gener, signalveje og sygdomsrelevant biologi. Den er også mere effektiv til at bruge videnskabelige værktøjer og databaser i arbejdsgange med flere trin, såsom litteraturgennemgang, fortolkning af sekvens-til-funktion, eksperimentel planlægning og dataanalyse.

Dette er den første udgivelse i vores GPT‑Rosalind‑modelserie inden for biovidenskab, og vi vil fortsætte med at udvide grænserne for modellens biokemiske ræsonnementsmuligheder på tværs af langsigtede, værktøjstunge videnskabelige arbejdsgange. OpenAIs computerinfrastruktur giver os mulighed for fortsat at træne, evaluere og forbedre stadig mere kapable domænemodeller i forhold til virkelige videnskabelige opgaver. Dette hjælper disse systemer med at blive mere nyttige, efterhånden som arbejdsgangene i sig selv bliver mere komplekse.

Fra evidensbaserede indsigter i forskning og opdagelse til eksperimenter med stor effekt – se, hvordan vores løsningsportefølje omsættes til målbare forbedringer i jeres forskningsarbejdsgange.

Kunder og økosystem

Vi samarbejder med førende kunder inden for lægemiddelindustrien, bioteknologi og forskning samt organisationer inden for life science-teknologi for at anvende GPT‑Rosalind på tværs af arbejdsgange, der fremmer opdagelser.

“Inden for biovidenskab kræves præcision i hvert trin. Spørgsmålene er yderst komplekse, dataene er unikke, og indsatsen er utrolig høj. Vores unikke samarbejde med OpenAI gør det muligt for os at anvende deres mest avancerede værktøjer og kapaciteter på innovative måder med potentiale til at fremskynde leveringen af lægemidler til patienter.”
– Sean Bruich, senior vicepræsident for kunstig intelligens og data, Amgen

Ydeevne og evaluering

Vi evaluerede GPT‑Rosalind på tværs af en række kapabiliteter, der er grundlæggende for videnskabelige opdagelser og industriel forskning. Disse evalueringer måler grundlæggende ræsonnering på tværs af videnskabelige delområder, herunder mekanismer for kemiske reaktioner (proteinstruktur, mutationseffekter og interaktioner) samt fylogenetisk fortolkning af DNA-sekvenser. De vurderer også, om modeller kan understøtte reelle forskningsworkflows ved at fortolke eksperimentelle output, identificere mønstre, der er relevante for eksperter, og syntetisere eksterne oplysninger for at designe opfølgende eksperimenter. Endelig tester de, om modeller kan vælge og bruge de rigtige beregningsværktøjer, databaser og domænespecifikke funktioner til at styrke deres ræsonnering. Samlet set viser disse evalueringer fremskridt på tværs af den videnskabelige forskningsproces og antyder en stærkere evne til at hjælpe forskere med at bearbejde udfordrende opdagelsesopgaver.

Forespørgsel

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

Brancheevalueringer

Vi evaluerede GPT‑Rosalind på en række offentlige benchmarks. På BixBench, et benchmark designet til praktisk bioinformatik og dataanalyse, opnåede GPT‑Rosalind førende ydeevne blandt model med offentliggjorte scorer.

På LABBench2, som er et benchmark-test, der måler ydeevnen på en række forskningsopgaver såsom litteratursøgning, databaseadgang, sekvensmanipulation og protokoldesign, klarer GPT‑Rosalind sig bedre end GPT‑5.4 i 6 ud af 11 opgaver. Den mest bemærkelsesværdige forbedring kommer fra CloningQA, som kræver end-to-end-design af DNA- og enzymreagenser til molekylære kloningsprotokoller.

Vi indgik også et samarbejde med Dyno Therapeutics, en virksomhed, der er pioner inden for AI-designede genterapier, for at evaluere modellen på en opgave med prædiktion og generering af RNA-sekvens-til-funktion ved hjælp af upublicerede, ukontaminerede sekvenser. Præstationen blev sammenlignet med 57 historiske resultater fra menneskelige eksperter inden for AI-biofeltet. Når de blev evalueret direkte i Codex-appen, placerede de bedste modelindsendelser ud af ti sig over den 95. percentil blandt menneskelige eksperter på forudsigelsesopgaven og omkring den 84. percentil blandt menneskelige eksperter på sekvensgenereringsopgaven.

Disse evalueringer giver et meningsfuldt billede af, hvordan de arbejdsgange, som forskere dagligt benytter til at generere beviser, analysere komplekse data og nå frem til forsvarlige biologiske konklusioner, fungerer.


Forbinder til de værktøjer, forskere bruger

Forskere kan bruge vores nye forskningsplugin til biovidenskab(åbner i et nyt vindue) til Codex, som er tilgængeligt i GitHub i dag. Denne pakke indeholder et bredt udvalg af modulære funktioner til de mest almindelige forskningsarbejdsgange, designet til at hjælpe brugere med at arbejde på tværs af human genetik, funktionel genomik, proteinstruktur, biokemi, klinisk evidens og identifikation af offentligt tilgængelige studier.

Statisk billede af plugin-demo for Biovidenskab

Disse færdigheder fungerer som et orkestreringslag, der hjælper forskere med at arbejde sig gennem brede, tvetydige spørgsmål og spørgsmål i flere trin mere effektivt. De giver adgang til mere end 50 offentlige multi-omics-databaser, litteraturkilder og biologiske værktøjer og tilbyder et fleksibelt udgangspunkt for almindelige, gentagelige arbejdsgange såsom opslag af proteinstruktur, sekvenssøgning, litteraturgennemgang og identifikation af offentlige datasæt.

Berettigede Enterprise-brugere kan bruge dette plugin i forskningsarbejdsgange med GPT‑Rosalind for at opnå dybere biologisk ræsonnering, mens alle brugere kan bruge pluginpakken med vores primære model.

Sikker adgang

Vi ønsker at gøre disse funktioner tilgængelige for de forskere og forskningsorganisationer, der er bedst kvalificerede til at fremme menneskers sundhed, samtidig med at vi opretholder stærke sikkerhedsforanstaltninger mod biologisk misbrug. Life Sciences-modellen lanceres i første omgang i USA gennem en implementeringsstruktur med betroet adgang for kvalificerede Enterprise-kunder, med kontroller for kvalificering, adgangshåndtering og organisatorisk styring. Samtidig gør vi et sæt connectorer og Life Sciences Research Plugin mere bredt tilgængelige, så forskere kan bruge vores primære model mere effektivt til forskningsopgaver inden for life science. 

Life Sciences-modellen blev udviklet med skærpede sikkerhedskontroller på virksomhedsniveau og styrket adgangsstyring, hvilket muliggør professionel videnskabelig brug i regulerede forskningsmiljøer. Vi vurderer adgang ud fra tre grundlæggende principper: gavnlig brug, stærk styring og sikkerhedstilsyn samt kontrolleret adgang med sikkerhed på virksomhedsniveau. I praksis betyder det, at deltagende organisationer skal udføre legitim videnskabelig forskning med en tydelig offentlig nytte; opretholde passende styring, overholdelse og kontroller til forebyggelse af misbrug; og begrænse adgangen til godkendte brugere inden for sikre, veladministrerede miljøer. Organisationer skal også acceptere vilkårene for forhåndsversionen af forskning inden for life sciences og overholde OpenAI's brugspolitikker, og vi kan anmode om yderligere oplysninger som en del af onboarding eller fortsat deltagelse.

Sådan kommer du i gang

Organisationer kan anmode om adgang via vores kvalifikations- og sikkerhedsgennemgangsproces.

Under forskningsforhåndsvisningen vil brugen af denne model ikke forbruge eksisterende credits eller token, dog underlagt foranstaltninger mod misbrug. Vi vil dele flere oplysninger om priser og tilgængelighed i takt med, at programmet udvides.

Life Sciences-modellen er designet til at hjælpe videnskabelige organisationer med at udføre arbejde af højere kvalitet, hurtigere, i miljøer, der kræver både teknisk ekspertise og operationel kontrol. Vores dedikerede Life Sciences-team samt rådgivende partnere såsom McKinsey & Company, Boston Consulting Group (BCG) og Bain & Company hjælper organisationer med at identificere anvendelser med stor effekt, integrere modellen i virksomhedsmiljøer og opnå målbare resultater. Hvis du gerne vil undersøge, hvordan OpenAI Life Sciences kan understøtte dit arbejde, kan du kontakte vores Life Sciences-team.

Kommende tiltag

Dette er den første udgivelse i vores Life Sciences-modellerserie, og vi ser den som begyndelsen på en langsigtet forpligtelse til at udvikle AI, der kan accelerere videnskabelige opdagelser på områder, der har stor betydning for samfundet, fra menneskers sundhed til bredere biologisk forskning. Vi vil fortsætte med at forbedre modellens biologiske ræsonnering, udvide understøttelsen af værktøjstunge forskningsarbejdsprocesser med lange tidshorisonter og arbejde tæt sammen med førende videnskabelige institutioner for at evaluere effekten i den virkelige verden. Det omfatter løbende partnerskaber med nationale laboratorier såsom Los Alamos National Laboratory, hvor vi undersøger AI-guidet design af proteiner og katalysatorer, herunder AI-systemers evne til at ændre biologiske strukturer, samtidig med at centrale funktionelle egenskaber bevares eller forbedres. 

Med tiden forventer vi, at disse systemer bliver stadigt mere kompetente partnere i forskningsarbejdet og hjælper forskere med hurtigere at gå fra spørgsmål til evidens, fra evidens til indsigt og fra indsigt til nye behandlinger til patienter.