Zum Hauptinhalt springen
OpenAI

Neu: GPT‑Rosalind für die biowissenschaftliche Forschung

Ein neues, speziell entwickeltes Modell, um die wissenschaftliche Forschung und Arzneimittelentwicklung zu beschleunigen.

Heute stellen wir GPT‑Rosalind vor, unser Frontier-Reasoning-Modell, das entwickelt wurde, um die Forschung in den Bereichen Biologie, Arzneimittelforschung und translationale Medizin zu unterstützen. Die Modellreihe für die Biowissenschaften ist für wissenschaftliche Workflows optimiert und kombiniert verbesserte Tool-Nutzung mit einem tieferen Verständnis in den Bereichen Chemie, Protein-Engineering und Genomik.

Im Durchschnitt dauert es in den Vereinigten Staaten etwa 10 bis 15 Jahre von der Entdeckung eines Wirkstoffziels bis zur behördlichen Zulassung eines neuen Medikaments. Fortschritte in den frühesten Stadien der Entdeckungsphase wirken sich in den nachgelagerten Phasen kumulativ aus – in Form einer besseren Zielauswahl, fundierterer biologischer Hypothesen und qualitativ hochwertigerer Experimente. Der Fortschritt in den Biowissenschaften wird nicht nur durch die Schwierigkeit der zugrunde liegenden wissenschaftlichen Fragestellungen, sondern auch durch die Komplexität der Forschungsabläufe selbst eingeschränkt. Wissenschaftler:innen müssen mit großen Mengen an Fachliteratur, spezialisierten Datenbanken, experimentellen Daten und sich weiterentwickelnden Hypothesen arbeiten, um neue Ideen zu entwickeln und zu bewerten. Diese Arbeitsabläufe sind oft zeitaufwändig, fragmentiert und schwer zu skalieren.

Wir glauben, dass fortschrittliche KI-Systeme Forschenden helfen können, diese Abläufe schneller zu bewältigen – nicht nur, indem sie bestehende Arbeit effizienter machen, sondern auch, indem sie Wissenschaftler:innen dabei unterstützen, mehr Möglichkeiten zu erkunden, Zusammenhänge aufzudecken, die andernfalls möglicherweise übersehen würden, und schneller zu besseren Hypothesen zu gelangen. Durch Unterstützung bei Evidenzsynthese, Hypothesengenerierung, Versuchsplanung und anderen mehrstufigen Forschungsaufgaben soll dieses Modell Forschenden dabei helfen, die frühen Phasen der Entdeckung zu beschleunigen. Mit der Zeit könnten diese Systeme Organisationen in den Biowissenschaften dabei helfen, bahnbrechende Entdeckungen zu machen, die sonst nicht möglich wären – und das mit einer deutlich höheren Erfolgsquote. 

GPT‑Rosalind ist jetzt als Forschungsvorschau in ChatGPT, Codex und der API im Rahmen unseres Trusted-Access-Programms für qualifizierte Kund:innen verfügbar. Wir führen außerdem ein frei zugängliches biowissenschaftliches Forschungs-Plugin für Codex ein, das Wissenschaftler:innen dabei unterstützt, Modelle mit über 50 wissenschaftlichen Tools und Datenquellen zu verbinden. Wir arbeiten mit Kunden wie Amgen, Moderna, dem Allen Institute, Thermo Fisher Scientific und weiteren zusammen, um GPT‑Rosalind in diversen Workflows einzusetzen, die Forschung und Entdeckungen beschleunigen.

Das Modell ist nach Rosalind Franklin benannt, deren rigorose Forschung dazu beigetragen hat, die Struktur der DNA aufzudecken und Grundlagen für die moderne Molekularbiologie geschaffen hat.

Von Rohdaten bis hin zu fundierten Forschungsentscheidungen: Erfahre, wie unser speziell entwickeltes Modell Forschungsabläufe beschleunigt.

Für wissenschaftliche Arbeitsabläufe entwickelt

Die GPT‑Rosalind‑Modellreihe für die Biowissenschaften wurde für die moderne wissenschaftliche Arbeit entwickelt, die veröffentlichte Erkenntnisse, Daten, Tools und Experimente umfasst. In unseren Evaluierungen liefert sie die beste Leistung bei Aufgaben, die Reasoning (Schlussfolgern) in Bezug auf Moleküle, Proteine, Gene, Signalwege und krankheitsrelevante Biologie erfordern, und sie ist effektiver bei der Nutzung wissenschaftlicher Tools und Datenbanken in mehrstufigen Arbeitsabläufen wie Literaturrecherche, Interpretation von Sequenz-Funktions-Beziehungen, Versuchsplanung und Datenanalyse.

Dies ist die erste Veröffentlichung in unserer GPT‑Rosalind‑Modellreihe für die Biowissenschaften, und wir werden die Grenzen der biochemischen Reasoning-Fähigkeiten des Modells in wissenschaftlichen Arbeitsabläufen mit langem Zeithorizont und hohem Tool-Aufwand auch weiter ausbauen. Die Recheninfrastruktur von OpenAI gibt uns die Möglichkeit, zunehmend leistungsfähige fachgebietsspezifische Modelle an realen wissenschaftlichen Aufgaben weiter zu trainieren, zu evaluieren und zu verbessern – wodurch diese Systeme mit zunehmender Komplexität der Arbeitsabläufe immer nützlicher werden.

Von evidenzbasierten Erkenntnissen aus der Forschung bis hin zu wirkungsstarken Experimenten – erfahre, wie unsere Lösungssuite zu messbaren Verbesserungen in deinen Forschungsabläufen beiträgt.

Kunden und Ökosystem

Wir arbeiten mit führenden Kunden aus den Bereichen Pharmazie, Biotechnologie und Forschung sowie mit Technologieunternehmen aus dem Bereich der Biowissenschaften zusammen, um GPT‑Rosalind in einer Vielzahl von Arbeitsabläufen einzusetzen, die die Forschung vorantreiben.

„Der Bereich der Biowissenschaften erfordert Präzision bei jedem Schritt.“ Die Fragen sind äußerst komplex, die Daten sind einzigartig, und es steht unglaublich viel auf dem Spiel. „Unsere einzigartige Zusammenarbeit mit OpenAI ermöglicht es uns, die fortschrittlichsten Fähigkeiten und Tools des Unternehmens auf neue und innovative Weise einzusetzen – mit dem Potenzial, die Bereitstellung von Medikamenten für Patient:innen zu beschleunigen.“
– Sean Bruich, Senior Vice President of Artificial Intelligence and Data, Amgen

Leistung und Evaluierung

Wir haben GPT‑Rosalind hinsichtlich einer Reihe von Fähigkeiten bewertet, die für wissenschaftliche Entdeckungen und die industrielle Forschung grundlegend sind. Diese Evaluierungen messen grundlegendes Reasoning in wissenschaftlichen Teilbereichen, darunter chemische Reaktionsmechanismen; Proteinstruktur, Mutationseffekte und Interaktionen; sowie die phylogenetische Interpretation von DNA-Sequenzen. Sie bewerten außerdem, ob Modelle reale Forschungsabläufe unterstützen können, indem sie Versuchsergebnisse interpretieren, für Fachleute relevante Muster identifizieren und externe Informationen synthetisieren, um Folgeexperimente zu konzipieren. Und zu guter Letzt prüfen sie, ob Modelle die richtigen Rechentools, Datenbanken und bereichsspezifischen Fähigkeiten auswählen und nutzen können, um ihre Argumentation zu verbessern. In ihrer Gesamtheit zeigen diese Evaluierungen Fortschritte über den gesamten End-to-End-Prozess der wissenschaftlichen Forschung hinweg und deuten auf eine stärkere Fähigkeit hin, Forschenden dabei zu helfen, anspruchsvolle Entdeckungsaufgaben zu bewältigen.

Prompt

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

Branchenevaluierungen

Wir haben GPT‑Rosalind anhand einer Reihe öffentlicher Benchmarks bewertet. Bei BixBench, einem Benchmark, der auf realer Bioinformatik und Datenanalyse basiert, erzielte GPT‑Rosalind die beste Leistung unter den Modellen mit veröffentlichten Ergebnissen.

Bei LABBench2, einem Benchmark zur Messung der Leistung bei einer Reihe von Forschungsaufgaben wie Literaturrecherche, Datenbankzugriff, Sequenzmanipulation und Protokolldesign, übertrifft GPT‑Rosalind GPT‑5.4 bei 6 von 11 Aufgaben. Die bemerkenswerteste Verbesserung geht auf CloningQA zurück, das eine durchgängige Entwicklung von DNA- und Enzymreagenzien für molekulare Klonierungsprotokolle erfordert.

Wir haben außerdem mit Dyno Therapeutics zusammengearbeitet, einem Unternehmen, das Pionierarbeit auf dem Gebiet KI-entwickelter Gentherapien leistet, um das Modell anhand einer Aufgabe zur Vorhersage und Generierung von RNA-Sequenzen und deren Funktionen unter Verwendung unveröffentlichter, unverfälschter Sequenzen zu evaluieren. Die Leistung wurde mit 57 historischen Bewertungen von menschlichen Expert:innen im Bereich KI-Biologie verglichen. Bei der direkten Evaluierung in der Codex-App lagen die besten Modelleinsendungen aus zehn Versuchen bei der Vorhersageaufgabe über dem 95. Perzentil menschlicher Expert:innen und bei der Sequenzgenerierungsaufgabe bei etwa dem 84. Perzentil menschlicher Expert:innen.

Diese Evaluierungen liefern aussagekräftige Hinweise auf die Leistungsfähigkeit bei den Arten von Arbeitsabläufen, auf die Wissenschaftler:innen jeden Tag angewiesen sind, um Erkenntnisse zu gewinnen, komplexe Daten zu analysieren und zu wissenschaftlich belastbaren biologischen Schlussfolgerungen zu gelangen.


Verbindung mit den Tools, die Wissenschaftler:innen verwenden

Wissenschaftler:innen können unser neues Plugin für biowissenschaftliche Forschung(wird in einem neuen Fenster geöffnet) für Codex verwenden, das ab sofort auf GitHub verfügbar ist. Dieses Paket umfasst eine breite Palette modularer Funktionen für die gängigsten Forschungs-Workflows und soll Nutzer:innen bei ihrer Arbeit in den Bereichen Humangenetik, funktionelle Genomik, Proteinstruktur, Biochemie, klinische Evidenz und der Recherche öffentlich verfügbarer Studien unterstützen.

Statisches Bild: Biowissenschaften-Plugin-Demo

Diese Fähigkeiten dienen als Orchestrierungsebene, die Wissenschaftler:innen dabei hilft, umfassende, mehrdeutige und mehrstufige Fragestellungen effektiver zu bearbeiten. Sie bieten Zugang zu mehr als 50 öffentlichen Multi-Omics-Datenbanken, Literaturquellen und Biologie-Tools und bieten einen flexiblen Ausgangspunkt für gängige wiederholbare Workflows wie die Suche nach Proteinstrukturen, Sequenzsuche, Literaturrecherche und das Auffinden öffentlicher Datensätze.

Qualifizierte Enterprise-Nutzer:innen können dieses Plugin in Forschungs-Workflows mit GPT‑Rosalind für tiefergehendes biologisches Reasoning nutzen, während alle Nutzer:innen das Plugin-Paket mit unseren Hauptmodellen verwenden können.

Trusted Access

Wir möchten diese Fähigkeiten den Wissenschaftler:innen und Forschungsorganisationen zugänglich machen, die am besten aufgestellt sind, die menschliche Gesundheit zu fördern, und gleichzeitig starke Schutzmaßnahmen gegen biologischen Missbrauch aufrechterhalten. Das Biowissenschaften-Modell wird zunächst über eine Trusted-Access-Bereitstellungsstruktur für qualifizierte Enterprise-Kund:innen in den USA eingeführt, mit Kontrollen zu Berechtigung, Zugriffsmanagement und organisatorischer Governance. Gleichzeitig stellen wir eine Reihe von Konnektoren und das Plugin für biowissenschaftliche Forschung einer breiteren Öffentlichkeit zur Verfügung, damit Forschende unsere Hauptmodelle für Forschungsaufgaben in den Biowissenschaften effektiver nutzen können. 

Das Biowissenschaften-Modell wurde mit erhöhten Sicherheitskontrollen auf Unternehmensniveau und verstärktem Zugriffsmanagement entwickelt und ermöglicht so die professionelle wissenschaftliche Nutzung in regulierten Forschungsumgebungen. Wir bewerten den Zugriff anhand von drei Kernprinzipien: Nutzung mit gesellschaftlichem Nutzen, starke Governance und Sicherheitsaufsicht sowie kontrollierter Zugriff mit Sicherheit auf Unternehmensniveau. In der Praxis bedeutet dies, dass teilnehmende Organisationen legitime wissenschaftliche Forschung mit klarem gesellschaftlichem Nutzen betreiben müssen; angemessene Governance, Compliance und Kontrollen zur Verhinderung von Missbrauch aufrechterhalten müssen; und den Zugriff auf genehmigte Benutzer:innen innerhalb sicherer, gut verwalteter Umgebungen beschränken müssen. Organisationen müssen außerdem den Nutzungsbedingungen für die Biowissenschaften-Forschungsvorschau zustimmen und die Nutzungsrichtlinien von OpenAI einhalten. Wir können außerdem im Rahmen des Onboardings oder der fortgesetzten Teilnahme zusätzliche Informationen anfordern.

Erste Schritte

Organisationen können über unser Qualifizierungs- und Sicherheitsprüfverfahren Zugriff beantragen.

Während der Forschungsvorschau werden durch die Nutzung dieses Modells keine vorhandenen Credits oder Tokens verbraucht (mit Schutz vor Missbrauch). Wir werden weitere Details zu Preisen und Verfügbarkeit bekannt geben, wenn das Programm erweitert wird.

Das Biowissenschaften-Modell wurde entwickelt, um wissenschaftliche Organisationen dabei zu unterstützen, hochwertigere Arbeit schneller zu leisten – in Umgebungen, die sowohl technische Leistungsfähigkeit als auch operative Kontrolle erfordern. Unser spezialisiertes Biowissenschaften-Team sowie Beratungspartner wie McKinsey & Company, Boston Consulting Group (BCG) und Bain & Company helfen Organisationen dabei, vielversprechende Anwendungsfälle zu identifizieren, das Modell in Unternehmensumgebungen zu integrieren und messbare Resultate zu erzielen. Wenn du mehr darüber erfahren möchtest, wie OpenAI Biowissenschaften dich bei deiner Arbeit unterstützen kann, kannst du unser Biowissenschaften-Team kontaktieren.

Wie geht‘s weiter?

Dies ist die erste Veröffentlichung in unserer Modellreihe für die Biowissenschaften, und wir betrachten sie als den Beginn eines langfristigen Engagements für die Entwicklung von KI, die wissenschaftliche Entdeckungen in Bereichen beschleunigen kann, die für die Gesellschaft von großer Bedeutung sind – von der menschlichen Gesundheit bis hin zur allgemeinen biologischen Forschung. Wir werden das biologische Reasoning des Modells weiter verbessern, die Unterstützung für Tool-intensive und langfristige Forschungs-Workflows ausbauen und eng mit führenden wissenschaftlichen Institutionen zusammenarbeiten, um die Auswirkungen in der Praxis zu bewerten. Dazu gehören laufende Partnerschaften mit nationalen Forschungszentren wie dem Los Alamos National Laboratory, wo wir KI-gestützte Protein- und Katalysatorentwicklung erforschen, einschließlich der Fähigkeit von KI-Systemen, biologische Strukturen zu verändern und dabei zentrale funktionale Eigenschaften zu erhalten oder zu verbessern. 

Mit der Zeit erwarten wir, dass diese Systeme zu immer leistungsfähigeren Partnern bei der Forschung werden und Wissenschaftler:innen dabei helfen werden, schneller von der Fragestellung zur Evidenz, von der Evidenz zur Erkenntnis und von der Erkenntnis zu neuen Behandlungsmethoden für Patient:innen zu gelangen.