Frühe Experimente zur Beschleunigung wissenschaftlicher Forschung mit GPT‑5
Was wir aus der Zusammenarbeit mit Wissenschaftler:innen lernen

Die Wissenschaft prägt alles – von der menschlichen Gesundheit über die Energieerzeugung bis hin zur nationalen Sicherheit und unserem Verständnis des Universums. Wenn KI die Wissenschaft beschleunigen kann – indem sie die Zeit verkürzt, die benötigt wird, um neue Ideen zu generieren oder von einer Idee zu einem getesteten Ergebnis zu gelangen –, vervielfachen sich die Vorteile für die gesamte Gesellschaft.
Doch das Innovationstempo bleibt ein limitierender Faktor. Selbst wenn die richtige Idee bereits existiert, kann es Jahre dauern, daraus ein Produkt oder eine Behandlung zu machen. In einer aktuellen Umfrage(wird in einem neuen Fenster geöffnet) gaben 60 % der Befragten in den USA an, dass wissenschaftliche und medizinische Durchbrüche sie zu langsam erreichen; 73 % sagten, wir bräuchten bessere Möglichkeiten, um Entdeckungen zu beschleunigen; und 69 % nannten eine Führungsrolle in der Wissenschaft als eine der wichtigsten nationalen Prioritäten.
Heute veröffentlichen wir „Early science acceleration experiments with GPT‑5(wird in einem neuen Fenster geöffnet)” (Frühe Experimente zur Beschleunigung wissenschaftlicher Forschung mit GPT‑5), einen Artikel, der gemeinsam mit Mitwirkenden von Universitäten und nationalen Forschungseinrichtungen wie Vanderbilt, UC Berkeley, Columbia, Oxford, Cambridge, Lawrence Livermore National Laboratory und The Jackson Laboratory verfasst wurde. Der Artikel sammelt frühe Fallstudien aus Mathematik, Physik, Biologie, Informatik, Astronomie und Materialwissenschaften, in denen GPT‑5 Forschenden geholfen hat, bekannte Ergebnisse auf neuartige Weise zu synthetisieren, eine umfassende Literaturrecherche durchzuführen, schwierige Berechnungen zu beschleunigen und sogar neue Beweise für ungelöste Thesen zu generieren. Der Artikel dokumentiert auch Einschränkungen. Unser Ziel ist es, der Gemeinschaft einen klaren Überblick darüber zu geben, was diese Systeme heute in Forschungskontexten leisten können und was nicht.
Diese Fallstudien zeigen, wie GPT‑5 in den Händen von Expert:innen die wissenschaftliche Entdeckung beschleunigt und warum diese Beschleunigung wichtig ist:
- Biologie: In einer von Derya Unutmaz, M.D., geleiteten Studie versuchten Wissenschaftler:innen monatelang, eine rätselhafte Veränderung in menschlichen Immunzellen zu erklären. GPT‑5 identifizierte den wahrscheinlichen Mechanismus innerhalb von Minuten anhand eines unveröffentlichten Diagramms und schlug ein Experiment vor, das ihn bestätigte. Diese Art von Geschwindigkeit könnte Forschenden helfen, Krankheiten schneller zu verstehen und bessere Behandlungsmethoden zu entwickeln.
- Mathematik: In einem anderen Fall befassten sich die Forscher Mehtaab Sawhney und Mark Sellke mit einem seit Jahrzehnten ungelösten Problem, das ursprünglich von Paul Erdős aufgestellt worden war. Sie steckten im letzten Schritt fest, und GPT‑5 brachte eine neue Idee ein – nämlich wie eine einzelne ungerade Zahl das Muster durchbricht –, was ihnen half, den Beweis abzuschließen. Solche Fortschritte stärken die mathematischen Grundlagen, auf denen viele Algorithmen und Sicherheitstechniken letztlich beruhen.
- Algorithmen & Optimierung: Die Forscher Sébastien Bubeck und Christian Coester untersuchten, ob eine in Robotik und Routing weit verbreitete Entscheidungsmethode wirklich so zuverlässig ist, wie allgemein angenommen. GPT‑5 fand ein neues Beispiel, das deutlich zeigt, dass die Methode versagen kann, und verbesserte zudem ein klassisches Ergebnis in der Optimierung, also in der Mathematik, die dazu dient, den besten Lösungsweg für ein Problem zu bestimmen. Diese Art von Fortschritt hilft Ingenieur:innen, die Entscheidungssysteme, die in der Robotik, im Routing und in anderen praxisnahen Anwendungen verwendet werden, besser zu verstehen.
Die Mission von OpenAI for Science besteht darin, wissenschaftliche Entdeckungen zu beschleunigen: Forschende dabei zu unterstützen, mehr Ideen zu erkunden, Hypothesen schneller zu testen und Erkenntnisse zu gewinnen, die sonst nur mit erheblichem Zeitaufwand möglich wären. Das erreichen wir, indem wir Frontier-Modelle (Spitzenmodelle) mit den richtigen Tools, Workflows und Kooperationen kombinieren.
Wir arbeiten eng mit Forschenden aus Wissenschaft, Industrie und nationalen Forschungseinrichtungen zusammen. Diese Kooperationen helfen uns zu verstehen, wo die Modelle nützlich sind, wo sie versagen und wie sie in den wissenschaftlichen Prozess integriert werden können – von der Literaturrecherche und Beweiserstellung über Modellierung und Simulation bis hin zur Versuchsplanung.
Unser Ansatz vereint zwei sich ergänzende Überzeugungen. Spezialisierte wissenschaftliche Tools, wie Simulationsprogramme, Proteindatenbanken und Computeralgebrasysteme, sind für Effizienz und Präzision unerlässlich. Gleichzeitig erschließt die Skalierung von Foundation-Modellen (Grundlagenmodellen) weiterhin neue Denkfähigkeiten: Ideen über Fachgrenzen hinweg miteinander zu verbinden, Beweise zu skizzieren, Mechanismen vorzuschlagen und große Literaturbestände konzeptionell statt anhand von Stichwörtern zu durchforsten. Wo spezialisierte Tools existieren, möchten wir sie nutzen; wo allgemeines Denken und Schlussfolgern (Reasoning) erforderlich ist, entwickeln wir Modelle, die dafür ausgelegt sind. Beide Ansätze verstärken sich gegenseitig.
Die bedeutendsten Fortschritte werden von Teams aus Menschen und KI erzielt. Wissenschaftler:innen geben den Ton an: Sie definieren Fragen, wählen Methoden, hinterfragen Ideen und validieren Ergebnisse. GPT‑5 bietet Umfang, Geschwindigkeit und die Möglichkeit, viele Richtungen parallel zu erkunden.
GPT‑5 effektiv zu nutzen, ist eine Fähigkeit für sich. Forschende lernen, wie sie Fragen formulieren, wann sie nachhaken sollten, wie sie Probleme in Schritte zerlegen und was sie unabhängig validieren müssen. Produktive Arbeit sieht dabei oft wie ein Dialog aus – Forscher:in und Modell iterieren miteinander, bis sich eine vielversprechende Richtung abzeichnet oder die Idee verworfen wird.
In diesen frühen Studien scheint GPT‑5 in der Lage zu sein, Teile des Forschungs-Workflows zu verkürzen, wenn es von Expert:innen eingesetzt wird. Es führt keine Projekte eigenständig durch und löst keine wissenschaftlichen Probleme autonom, doch es kann die Bandbreite der Forschung erweitern und Forschenden helfen, schneller zu korrekten Ergebnissen zu gelangen
- Eine aufkommende Fähigkeit ist die konzeptionelle Literaturrecherche. GPT‑5 kann häufig tiefere Beziehungen zwischen Ideen erkennen und relevantes Material über verschiedene Sprachen hinweg sowie aus weniger zugänglichen Quellen abrufen. Forschende berichten, dass sie Referenzen, Zusammenhänge und Thesen gefunden haben, die ihnen zuvor unbekannt waren.
- In der Mathematik und theoretischen Informatik, wo die Strukturen explizit und Feedback-Schleifen schnell sind, ist GPT‑5 besonders hilfreich. Mathematiker:innen haben GPT‑5 verwendet, um innerhalb von Minuten brauchbare Beweisentwürfe zu erstellen, wodurch Arbeiten, die sonst Tage oder Wochen in Anspruch genommen hätten, transformiert wurden. In der Physik und in computergestützten Bereichen kann das Modell vereinfachende Transformationen vorschlagen oder auf analoge Strukturen in anderen Fachgebieten hinweisen.
- In der Biologie und anderen empirischen Wissenschaften kann das Modell Mechanismen vorschlagen und Experimente entwerfen, um diese Hypothesen im Nasslabor zu überprüfen.
Wir sind über den Punkt hinaus, an dem Modelle nur vorhandenes Wissen zusammenfassen. Mittlerweile können frühe Beiträge von GPT‑5 unter fachkundiger Aufsicht Forschende sinnvoll unterstützen. Das aktuelle Verbesserungstempo deutet darauf hin, dass mit wachsender Leistungsfähigkeit und besseren Tools noch deutlich umfassendere Beschleunigungen möglich sind.
Diese Fallstudien sind kuratierte Beispiele dafür, wo GPT‑5 hilfreich war; sie stellen keine systematische Stichprobe dar und erfassen nicht die gesamte Bandbreite möglicher Fehlermodi. Die Aufsicht durch Expert:innen bleibt unerlässlich. GPT‑5 kann manchmal Literaturangaben, Mechanismen oder Beweise halluzinieren, die plausibel wirken; es kann empfindlich auf Scaffolding und Warm-up-Probleme reagieren; mitunter übersieht es fachspezifische Feinheiten; und es kann unproduktiven Gedankengängen folgen, wenn es nicht korrigiert wird. Das sind aktive Forschungsfelder, und wir arbeiten mit unseren Partner:innen daran, diese Schwächen zu messen und zu mindern, während wir zukünftige Systeme weiter verfeinern.
In ihrer Gesamtheit zeigen diese frühen Studien, dass GPT‑5 beginnt, bei neuen Arten wissenschaftlicher Arbeit zu helfen. Das Modell ist nicht autonom, aber in den Händen von Expert:innen kann es helfen, Theoreme zu beweisen, Strukturen wiederzuentdecken und zu erweitern, fachgebietsübergreifende Zusammenhänge aufzudecken und Mechanismen und Experimente zu generieren, die Wissenschaftler:innen validieren können.
Wir sehen außerdem eine Entwicklung, bei der diese Systeme sich mit mehr Zeit und Rechenleistung weiter verbessern. Wenn GPT‑5 in 20 Minuten bei einigen Forschungsfragen sinnvoll helfen kann, erwarten wir tiefere Ergebnisse, wenn Modelle stunden- oder tagelang über ein Problem nachdenken können. In Kombination mit Wissenschaftler:innen von Weltrang deutet dies auf die Möglichkeit eines deutlichen Sprungs in der wissenschaftlichen Produktivität im Laufe der Zeit hin.


