20. November 2025

Frühe Experimente zur Beschleunigung wissenschaftlicher Forschung mit GPT‑5

Was wir aus der Zusammenarbeit mit Wissenschaftler:innen lernen

Eine Grafik im Collage-Stil mit abstrakten Formen und Farben. Oben links ist ein gedämpft orangefarbener Block mit teilweise sichtbarem Text zu sehen. Oben rechts befindet sich ein Verzweigungsdiagramm mit dünnen schwarzen Pfeilen, die von einem zentralen schwarzen Punkt abzweigen, sowie kleinen orangefarbenen Kreisen, die verschiedene Punkte markieren. Unten links wird eine sanfte Mischung aus orangefarbenen, rosa und violetten Farbverläufen angezeigt. Unten rechts befindet sich eine große schwarze Zahl „5“ auf einem hellblauen Hintergrund.

Laden …

Die Wissenschaft prägt alles – von der menschlichen Gesundheit über die Energieerzeugung bis hin zur nationalen Sicherheit und unserem Verständnis des Universums. Wenn KI die Wissenschaft beschleunigen kann – indem sie die Zeit verkürzt, die benötigt wird, um neue Ideen zu generieren oder von einer Idee zu einem getesteten Ergebnis zu gelangen –, vervielfachen sich die Vorteile für die gesamte Gesellschaft.

Doch das Innovationstempo bleibt ein limitierender Faktor. Selbst wenn die richtige Idee bereits existiert, kann es Jahre dauern, daraus ein Produkt oder eine Behandlung zu machen. In einer aktuellen Umfrage⁠(wird in einem neuen Fenster geöffnet) gaben 60 % der Befragten in den USA an, dass wissenschaftliche und medizinische Durchbrüche sie zu langsam erreichen; 73 % sagten, wir bräuchten bessere Möglichkeiten, um Entdeckungen zu beschleunigen; und 69 % nannten eine Führungsrolle in der Wissenschaft als eine der wichtigsten nationalen Prioritäten.

Heute veröffentlichen wir „Early science acceleration experiments with GPT‑5⁠(wird in einem neuen Fenster geöffnet)” (Frühe Experimente zur Beschleunigung wissenschaftlicher Forschung mit GPT‑5), einen Artikel, der gemeinsam mit Mitwirkenden von Universitäten und nationalen Forschungseinrichtungen wie Vanderbilt, UC Berkeley, Columbia, Oxford, Cambridge, Lawrence Livermore National Laboratory und The Jackson Laboratory verfasst wurde. Der Artikel sammelt frühe Fallstudien aus Mathematik, Physik, Biologie, Informatik, Astronomie und Materialwissenschaften, in denen GPT‑5 Forschenden geholfen hat, bekannte Ergebnisse auf neuartige Weise zu synthetisieren, eine umfassende Literaturrecherche durchzuführen, schwierige Berechnungen zu beschleunigen und sogar neue Beweise für ungelöste Thesen zu generieren. Der Artikel dokumentiert auch Einschränkungen. Unser Ziel ist es, der Gemeinschaft einen klaren Überblick darüber zu geben, was diese Systeme heute in Forschungskontexten leisten können und was nicht.

Diese Fallstudien zeigen, wie GPT‑5 in den Händen von Expert:innen die wissenschaftliche Entdeckung beschleunigt und warum diese Beschleunigung wichtig ist:

Biologie: In einer von Derya Unutmaz, M.D., geleiteten Studie versuchten Wissenschaftler:innen monatelang, eine rätselhafte Veränderung in menschlichen Immunzellen zu erklären. GPT‑5 identifizierte den wahrscheinlichen Mechanismus innerhalb von Minuten anhand eines unveröffentlichten Diagramms und schlug ein Experiment vor, das ihn bestätigte. Diese Art von Geschwindigkeit könnte Forschenden helfen, Krankheiten schneller zu verstehen und bessere Behandlungsmethoden zu entwickeln.
Mathematik: In einem anderen Fall befassten sich die Forscher Mehtaab Sawhney und Mark Sellke mit einem seit Jahrzehnten ungelösten Problem, das ursprünglich von Paul Erdős aufgestellt worden war. Sie steckten im letzten Schritt fest, und GPT‑5 brachte eine neue Idee ein – nämlich wie eine einzelne ungerade Zahl das Muster durchbricht –, was ihnen half, den Beweis abzuschließen. Solche Fortschritte stärken die mathematischen Grundlagen, auf denen viele Algorithmen und Sicherheitstechniken letztlich beruhen.
Algorithmen & Optimierung: Die Forscher Sébastien Bubeck und Christian Coester untersuchten, ob eine in Robotik und Routing weit verbreitete Entscheidungsmethode wirklich so zuverlässig ist, wie allgemein angenommen. GPT‑5 fand ein neues Beispiel, das deutlich zeigt, dass die Methode versagen kann, und verbesserte zudem ein klassisches Ergebnis in der Optimierung, also in der Mathematik, die dazu dient, den besten Lösungsweg für ein Problem zu bestimmen. Diese Art von Fortschritt hilft Ingenieur:innen, die Entscheidungssysteme, die in der Robotik, im Routing und in anderen praxisnahen Anwendungen verwendet werden, besser zu verstehen.

Was ist OpenAI for Science?

Die Mission von OpenAI for Science besteht darin, wissenschaftliche Entdeckungen zu beschleunigen: Forschende dabei zu unterstützen, mehr Ideen zu erkunden, Hypothesen schneller zu testen und Erkenntnisse zu gewinnen, die sonst nur mit erheblichem Zeitaufwand möglich wären. Das erreichen wir, indem wir Frontier-Modelle (Spitzenmodelle) mit den richtigen Tools, Workflows und Kooperationen kombinieren.

Wir arbeiten eng mit Forschenden aus Wissenschaft, Industrie und nationalen Forschungseinrichtungen zusammen. Diese Kooperationen helfen uns zu verstehen, wo die Modelle nützlich sind, wo sie versagen und wie sie in den wissenschaftlichen Prozess integriert werden können – von der Literaturrecherche und Beweiserstellung über Modellierung und Simulation bis hin zur Versuchsplanung.

Unser Ansatz vereint zwei sich ergänzende Überzeugungen. Spezialisierte wissenschaftliche Tools, wie Simulationsprogramme, Proteindatenbanken und Computeralgebrasysteme, sind für Effizienz und Präzision unerlässlich. Gleichzeitig erschließt die Skalierung von Foundation-Modellen (Grundlagenmodellen) weiterhin neue Denkfähigkeiten: Ideen über Fachgrenzen hinweg miteinander zu verbinden, Beweise zu skizzieren, Mechanismen vorzuschlagen und große Literaturbestände konzeptionell statt anhand von Stichwörtern zu durchforsten. Wo spezialisierte Tools existieren, möchten wir sie nutzen; wo allgemeines Denken und Schlussfolgern (Reasoning) erforderlich ist, entwickeln wir Modelle, die dafür ausgelegt sind. Beide Ansätze verstärken sich gegenseitig.

Wie Wissenschaftler:innen heute mit GPT‑5 arbeiten

Die bedeutendsten Fortschritte werden von Teams aus Menschen und KI erzielt. Wissenschaftler:innen geben den Ton an: Sie definieren Fragen, wählen Methoden, hinterfragen Ideen und validieren Ergebnisse. GPT‑5 bietet Umfang, Geschwindigkeit und die Möglichkeit, viele Richtungen parallel zu erkunden.

GPT‑5 effektiv zu nutzen, ist eine Fähigkeit für sich. Forschende lernen, wie sie Fragen formulieren, wann sie nachhaken sollten, wie sie Probleme in Schritte zerlegen und was sie unabhängig validieren müssen. Produktive Arbeit sieht dabei oft wie ein Dialog aus – Forscher:in und Modell iterieren miteinander, bis sich eine vielversprechende Richtung abzeichnet oder die Idee verworfen wird.

Der aktuelle Stand von GPT‑5 in der wissenschaftlichen Arbeit

In diesen frühen Studien scheint GPT‑5 in der Lage zu sein, Teile des Forschungs-Workflows zu verkürzen, wenn es von Expert:innen eingesetzt wird. Es führt keine Projekte eigenständig durch und löst keine wissenschaftlichen Probleme autonom, doch es kann die Bandbreite der Forschung erweitern und Forschenden helfen, schneller zu korrekten Ergebnissen zu gelangen

Eine aufkommende Fähigkeit ist die konzeptionelle Literaturrecherche. GPT‑5 kann häufig tiefere Beziehungen zwischen Ideen erkennen und relevantes Material über verschiedene Sprachen hinweg sowie aus weniger zugänglichen Quellen abrufen. Forschende berichten, dass sie Referenzen, Zusammenhänge und Thesen gefunden haben, die ihnen zuvor unbekannt waren.
In der Mathematik und theoretischen Informatik, wo die Strukturen explizit und Feedback-Schleifen schnell sind, ist GPT‑5 besonders hilfreich. Mathematiker:innen haben GPT‑5 verwendet, um innerhalb von Minuten brauchbare Beweisentwürfe zu erstellen, wodurch Arbeiten, die sonst Tage oder Wochen in Anspruch genommen hätten, transformiert wurden. In der Physik und in computergestützten Bereichen kann das Modell vereinfachende Transformationen vorschlagen oder auf analoge Strukturen in anderen Fachgebieten hinweisen.
In der Biologie und anderen empirischen Wissenschaften kann das Modell Mechanismen vorschlagen und Experimente entwerfen, um diese Hypothesen im Nasslabor zu überprüfen.

Wir sind über den Punkt hinaus, an dem Modelle nur vorhandenes Wissen zusammenfassen. Mittlerweile können frühe Beiträge von GPT‑5 unter fachkundiger Aufsicht Forschende sinnvoll unterstützen. Das aktuelle Verbesserungstempo deutet darauf hin, dass mit wachsender Leistungsfähigkeit und besseren Tools noch deutlich umfassendere Beschleunigungen möglich sind.

Wie das in der Praxis aussieht: einige Fallstudien

Unabhängige Wiederentdeckung bekannter Ergebnisse an der wissenschaftlichen Frontlinie

Verschärfung eines Satzes in der konvexen Optimierung

Optimierung ist die Mathematik der Suche nach der „besten“ Option – etwa dem geringsten Trainingsverlust oder der kürzesten Route in einem Netzwerk. Der Gradientenabstieg ist ein elementares Optimierungsverfahren, bei dem eine Funktion durch sukzessive kleine Abwärtsschritte minimiert wird. Ein aktuelles Theorem⁠(wird in einem neuen Fenster geöffnet) von Guy Barzilai, Ohad Shamir und Moslem Zamani befasst sich mit der Frage, wann die Folge der durch Gradientenabstieg besuchten Werte im Laufe der Zeit eine konvexe Kurve bildet (eine Kurve ohne Einbrüche), wodurch das Verhalten des Algorithmus leichter zu analysieren und zu steuern ist. Die erste Version des Artikels zeigte dies nur für sehr kleine, konservative Schrittgrößen.

Sébastien Bubeck gab GPT‑5 die schwächere Version des Ergebnisses und fragte, ob sich die Bedingung verschärfen ließe. Das Modell schlug daraufhin eine schärfere Schranke für die Schrittweite sowie einen klareren, in der Fachliteratur üblichen Beweis vor, den Bubeck anschließend sorgfältig von Hand überprüfte; mit mehr Denkzeit leitete ein interner Lauf des Modells sogar die optimale Schranke vollständig von Grund auf her.

Beitrag von GPT‑5: GPT‑5 half Sébastien Bubeck dabei, eine schärfere Bedingung für die Schrittweite zu untersuchen und einen klareren Beweis für einen aktuellen Satz der konvexen Optimierung vorzuschlagen, den er anschließend unabhängig überprüfte.

Lies mehr auf Seite 3(wird in einem neuen Fenster geöffnet)

Wiederherstellung verborgener Symmetrien um Schwarze Löcher

In der allgemeinen Relativitätstheorie werden rotierende Schwarze Löcher durch die Kerr-Lösung beschrieben, und Wellen, die sich um sie herum bewegen, erfüllen eine komplizierte Differentialgleichung. Physiker:innen suchen nach Symmetrien solcher Gleichungen – Transformationen, die sie unverändert lassen –, weil Symmetrien zu Erhaltungsgrößen und einer einfachen Struktur führen. Jüngste Arbeiten von Alex Lupsasca haben gezeigt, dass die Kerr-Wellengleichung eine verborgene Symmetriestruktur aufweist, die eine SL(2,ℝ)-Algebra bildet, was erklärt, warum bestimmte Gezeitenantworten verschwinden.

Als wir GPT‑5 Pro direkt nach dem vollständigen Kerr-Problem fragten, scheiterte es zunächst und meldete keine interessanten Symmetrien. Nachdem Lupsasca eine einfachere „Aufwärmversion“ derselben Struktur im flachen Raum gegeben hatte, kehrten wir zum Kerr-Fall zurück; diesmal erzeugte das Modell nach etwa 18 Minuten internem Reasoning die vollständige Menge an Symmetriegeneratoren, die sich zu SL(2,ℝ) schließen und mit dem menschlichen Ergebnis übereinstimmen.

Der Beitrag von GPT‑5: GPT‑5 Pro rekonstruierte die verborgene SL(2,ℝ)-Symmetriealgebra der Kerr-Wellengleichung für Schwarze Löcher, sobald ein geeignetes Aufwärmproblem vorgelegt wurde, und Lupsasca bestätigte das Ergebnis.

Mechanistische Erkenntnisse in der Immunologie

Eine zentrale Frage in der modernen Immuntherapie, insbesondere bei CAR-T-Krebsbehandlungen, die auf modifizierten T-Zellen basieren, ist, wie man nützliche T-Zellen aktiv und langlebig halten kann, ohne sie in einen erschöpften, funktionsunfähigen Zustand zu versetzen. Etablierte Literatur hat gezeigt, dass eine vorübergehende Einschränkung des Glukosestoffwechsels T-Zellen dauerhaft so umprogrammieren kann, dass sie stärker proinflammatorisch werden. In einer früheren Studie behandelten Derya Unutmaz und Kolleg:innen menschliche CD4+ T-Zellen (eine wichtige Klasse von Immunzellen) kurzzeitig mit 2-Desoxyglukose (2DG), einer Verbindung, die den Glukosestoffwechsel beeinträchtigt. Nachdem 2DG entfernt worden war und die CD4+ T-Zellen mit IL-2 (einem Signalmolekül, das T-Zellen zur Proliferation anregt) stimuliert worden waren, beobachteten sie eine anhaltende Verschiebung hin zu einem proinflammatorischen Th17-ähnlichen Zustand – einem Subtyp von T-Zellen, der sowohl an Schutzmechanismen als auch an Autoimmunerkrankungen beteiligt ist – und verbrachten Monate mit Experimenten und Recherchen, um einen plausiblen Mechanismus zu finden, der diesen Effekt erklärt.

Jahre später gab er GPT‑5 Pro eine unveröffentlichte Abbildung mit Durchflusszytometrie-Streudiagrammen, die verschiedene T-Zell-Subtypen nach Behandlung mit unterschiedlichen Glukose- und 2DG-Werten zeigen – und fragte, was die Daten erklären könnte und welche Experimente als Nächstes durchzuführen wären. Nach etwa einem Dutzend Minuten Hin und Her schlug das Modell vor, dass eine gestörte N-verknüpfte Glykosylierung (wie Zellen Zuckerketten an Proteine anhängen) während der Priming-Phase der Auslöser sei und prognostizierte, dass Gedächtnis-T-Zellen (und nicht naive T-Zellen) dafür verantwortlich seien. GPT‑5 schlug daraufhin spezifische Folgeexperimente vor, darunter ein elegantes Mannose-Rettungsexperiment, das die N-Glykosylierung wiederherstellte, ohne die Glykolyse zu reaktivieren. Das Labor hatte zuvor das Mannose-Rettungsexperiment durchgeführt, und die Ergebnisse stimmten genau mit den Modellvorhersagen überein.

GPT‑5 Pro war anschließend in der Lage, unveröffentlichte Daten von mit 2DG behandelten CD8+ T-Zellen zu analysieren und zu prognostizieren, dass eine vorübergehende 2DG-Exposition während der CAR-T-Zellherstellung zu einer erhöhten Effizienz der Abtötung von Zielkrebszelllinien führen würde. Die Vorhersagen von GPT‑5 Pro stimmten mit den unveröffentlichten experimentellen Daten des Labors überein.

Der Beitrag von GPT‑5: GPT‑5 analysierte unveröffentlichte Daten, um nicht offensichtliche und wertvolle mechanistische Hypothesen abzuleiten, identifizierte die aktive T-Zell-Subpopulation und schlug Folgeexperimente vor, die später von Unutmaz' Labor getestet und bestätigt wurden.

Lies mehr auf Seite 11(wird in einem neuen Fenster geöffnet)

Tiefgehende Literaturrecherche

Verknüpfung eines neuen geometrischen Ergebnisses mit anderen Fachgebieten

Nikita Zhivotovskiy und seine Mitautor:innen bewiesen einen neuen Satz der konvexen Geometrie – dem Studium „wohlgeformter“ Formen, in denen jede Verbindungslinie zwischen zwei Punkten vollständig innerhalb der Form verläuft. Konvexe Geometrie bildet die Grundlage vieler Modelle im maschinellen Lernen und in der Statistik. Nachdem der Satz bewiesen war, stellte sich die naheliegende Anschlussfrage: Wo könnte dieses Resultat sonst noch nützlich sein?

Anstatt Suchbegriffe zu raten und die Literatur manuell zu durchsuchen, gab Zhivotovskiy GPT‑5 die formale Formulierung des Satzes und fragte, mit welchen Bereichen er in Verbindung stehen könnte. Das Modell verwies auf Arbeiten in den Bereichen Dichteschätzung, Lerntheorie und multikriterielle Optimierung und lieferte konkrete Referenzen, darunter einige, die er noch nicht kannte, und einige in anderen Sprachen.

Der Beitrag von GPT‑5: GPT‑5 half Nikita Zhivotovskiy dabei, konkrete Zusammenhänge und Referenzen über mehrere Fachgebiete hinweg zu identifizieren, einschließlich Materialien, mit denen er zuvor noch nicht in Berührung gekommen war.

Bereinigung der – und Beiträge zur – Erdős-Problemdatenbank

Paul Erdős formulierte mehr als tausend Probleme, von denen viele auf einer öffentlichen Website verfolgt werden. Einige Probleme werden noch immer als „offen“ geführt, obwohl Lösungen in wenig bekannten Fachzeitschriften oder nicht-englischsprachigen Publikationen existieren. Mehtaab Sawhney und Mark Sellke nutzten GPT‑5 als Literaturrecherche-Assistenten für diese Datenbank: Für jedes vermeintlich offene Problem baten sie das Modell, nach Lösungen oder wesentlichen Teilfortschritten zu suchen.

GPT‑5 fand vollständige Lösungen für mehrere noch als offen markierte Probleme, identifizierte wesentliche Teilergebnisse für andere und wies auf einen Tippfehler in einer Aufgabenstellung hin. Für Erdős-Problem Nr. 848 hatten menschliche Kommentare auf der Website bereits einen Großteil der Struktur umrissen; GPT‑5 schlug eine entscheidende Dichteschätzung vor, und Sawhney und Sellke korrigierten und strafften sie zu einem vollständigen Beweis, der das Problem löste.

Der Beitrag von GPT‑5: GPT‑5 half dabei, übersehene Lösungen zu finden, und schlug eine Dichteschätzung vor, die Sawhney und Sellke zu einem vollständigen Beweis des Erdős-Problems Nr. 848 weiterentwickelten.

Cliquenfreie Codes: ein warnendes Beispiel

Fehlerkorrigierende Codes fügen Daten Redundanz hinzu, damit sich Informationen selbst dann wiederherstellen lassen, wenn Bits beschädigt werden. Dieses Projekt untersuchte eine spezielle Art von Binärcode, bei dem jede Position einer Kante in einem Graphen entspricht und das Ziel darin besteht, alle Codewörter auszuschließen, die wie eine „Clique“ (eine vollständig verbundene Menge von Knoten) aussehen. Die Herausforderung bestand darin, festzustellen, wie viele Paritätsprüfungen grundsätzlich erforderlich sind, um diese strukturierten Fehler zu verhindern. GPT‑5 stellte die Frage mithilfe quadratischer Gleichungen über einem endlichen Körper neu dar und hob ein klassisches Resultat hervor: den Satz von Warning, der unmittelbar auf die richtige untere Schranke verwies und zeigte, dass nur etwa halb so viele Nebenbedingungen benötigt wurden wie zuvor angenommen.

Im Nachhinein ergab sich eine unerwartete Wendung: Die exakt gleiche Schranke und im Wesentlichen derselbe Beweis waren Jahre zuvor in einer kurzen Forschungsarbeit erschienen. GPT‑5 hatte das Argument ohne Quellenangabe reproduziert und erst in einer neuen Sitzung auf Nachfrage auf die frühere Arbeit hingewiesen. Dies unterstrich eine wichtige Lektion für die KI-gestützte Mathematik: Modelle können korrekte und elegante Schlussfolgerungen generieren, aber sie ordnen nicht immer zuverlässig zu, woher diese Ideen ursprünglich stammen. Eine sorgfältige Überprüfung und die genaue Beachtung der Quellenangaben bleiben weiterhin unerlässlich.

Der Beitrag von GPT‑5: GPT‑5 lieferte die entscheidende Umformulierung sowie den klassischen Satz, der zur optimalen unteren Schranke führte. Allerdings identifizierte das Modell die frühere Veröffentlichung erst, als es ausdrücklich danach gefragt wurde – ein Hinweis darauf, wie wichtig sorgfältige menschliche Prüfungen der korrekten Zuschreibung bleiben.

Lies mehr auf Seite 28(wird in einem neuen Fenster geöffnet)

Gemeinsam mit KI arbeiten

Einsatz von GPT-5 als Forschungspartner in der Kombinatorik

Tim Gowers, ein mit der Fields-Medaille ausgezeichneter Kombinatoriker, führte eine Reihe von Experimenten durch, bei denen er GPT‑5 eher als „Forschungspartner“ denn als Werkzeug für hausaufgabenähnliche Probleme betrachtete. Er stellte dem Modell schwierige kombinatorische Fragen, über die er aktiv nachdachte, und bat es, Konstruktionen vorzuschlagen, Gegenbeispiele zu finden oder Teilargumente zu kritisieren.

In mehreren Fällen erkannte GPT‑5 schnell Fehler oder fehlende Fälle in Kandidatenkonstruktionen und schlug einfachere Alternativen oder Gegenbeispiele vor; in anderen Fällen kam es zum Stillstand oder es gelang ihm nicht, Fortschritte zu erzielen. Insgesamt kam Gowers zu dem Schluss, dass das Modell bereits als sehr schneller, sehr sachkundiger Kritiker nützlich ist, der Ideen einem Stresstest unterziehen und Zeit sparen kann, auch wenn es seine Anforderungen für eine vollständige Mitautorschaft noch nicht erfüllt.

Der Beitrag von GPT‑5: GPT‑5 fungierte als schneller Kritiker für Tim Gowers und entdeckte während der explorativen Kombinatorikarbeit Fehler, fehlende Fälle und einfachere Alternativen.

Lies mehr auf Seite 31(wird in einem neuen Fenster geöffnet)

Interpretation von kosmologischen Modellen

In der Kosmologie werden vereinfachte Modelle eingesetzt, um das Verhalten des Universums im großen Maßstab zu beschreiben, einschließlich Dunkler Energie und Expansionsgeschichte. Diese Modelle existieren oft in mehreren mathematisch äquivalenten Formen, und schon kleine algebraische Fehler können eine Berechnung scheitern lassen. Robert Scherrer nutzte GPT‑5, um Ableitungen auf Plausibilität zu prüfen, vereinfachte Spielversionen kosmologischer Modelle zu erkunden und zwischen verschiedenen Parametrisierungen der Dunklen Energie zu übersetzen.

GPT‑5 war besonders nützlich, um algebraische Fehler zu finden, gleichwertige Formulierungen derselben physikalischen Idee vorzuschlagen und Scherrer auf bestehende Ergebnisse in der Literatur hinzuweisen, die mit den Modellen übereinstimmten, die er unabhängig davon abgeleitet hatte. Dies verringerte die Reibung zwischen dem Entwerfen einer Idee auf Papier und ihrer Umsetzung in eine Form, die mit Daten verglichen werden kann.

Beitrag von GPT‑5: GPT‑5 unterstützte Robert Scherrer, indem es Ableitungen überprüfte, gleichwertige Formulierungen vorschlug und auf übereinstimmende Ergebnisse in der Literatur hinwies.

Lies mehr auf Seite 37(wird in einem neuen Fenster geöffnet)

Unterstützung der Fusions- und Plasmaphysik

In der Fusions- und Plasmaphysik geht es darum, heiße, dichte Plasmen zu modellieren, bei denen kleine Änderungen der Anfangsbedingungen zu einem sehr unterschiedlichen Verhalten führen können. Die Durchführung und Auswertung dieser Simulationen ist kostspielig und zeitaufwändig. Bei dieser Arbeit wurde GPT‑5 verwendet, um ein vereinfachtes Reaktions-Diffusionsmodell der Ausbreitung thermonuklearer Verbrennungen zu erstellen und zu analysieren, komplexe Ergebnisse zu interpretieren und zu untersuchen, wie sich unterschiedliche Dichteprofile auf die Verbrennungsleistung auswirken. Das Modell half dabei, Parameterdurchläufe durchzuführen und einen Bereich mit optimalen Profilen zu identifizieren, in dem sich die Brandfronten am schnellsten ausbreiten.

GPT‑5 unterstützte außerdem dabei, eine theoretische Erklärung für diese numerischen Muster zu entwickeln: Es nutzte Leistungsbilanz-Argumente, um zu erklären, warum bestimmte Profile eine bessere Leistung erzielen, und schlug einfache ingenieurwissenschaftliche Regeln vor, die künftige Designs leiten können. Obwohl das Modell gelegentlich instabile Simulationen oder übermäßig selbstsichere Schlussfolgerungen produzierte, ermöglichte die Aufsicht durch Expert:innen eine schnelle Korrektur, wodurch der Übergang von „etwas Seltsames passiert in diesem Regime“ zu „hier ist eine plausible Erklärung und ein konkreter Test“ erheblich beschleunigt wurde.

Der Beitrag von GPT‑5: GPT‑5 half dabei, das vereinfachte physikalische Modell zu konstruieren, den Parameterraum zu erkunden und physikalische Erklärungen vorzuschlagen.

Lies mehr auf Seite 40.(wird in einem neuen Fenster geöffnet)

Neue wissenschaftliche Ergebnisse, die mit KI erzielt wurden

Lösung eines Problems aus der Zahlentheorie von Erdős

Paul Erdős stellte ein Problem zur Suche nach der größten Menge positiver ganzer Zahlen mit einer überraschenden Regel: Für zwei beliebige Zahlen in der Menge muss das Produkt dieser beiden Zahlen plus eins immer durch einen perfekten quadratischen Primfaktor teilbar sein. Erdős vermutete, wie die größte solche Menge aussehen müsste, aber das Problem blieb jahrzehntelang ungelöst.

Sawhney und Sellke untersuchten die Struktur des Problems und baten GPT‑5 anschließend um Hilfe dabei, zu analysieren, wie sich eine einzelne „fehlplatzierte“ Zahl auf die gesamte Menge auswirken würde. GPT‑5 schlug eine klarere Methode vor, um zu zeigen, dass bereits eine einzige Zahl, die nicht in ein bestimmtes Muster passt, zu Widersprüchen bei fast allen anderen Zahlen führt. Diese Idee erwies sich als der fehlende Schritt. Damit gelang es den Forschern, einen vollständigen Beweis zu führen, der zeigt, dass Erdős’ ursprüngliche Vermutung korrekt war.

Der Beitrag von GPT‑5: GPT‑5 lieferte die entscheidende Erkenntnis darüber, wie eine einzelne Zahl alle anderen einschränkt, was es den Autoren ermöglichte, den Beweis des Erdős-Problems 848 abzuschließen.

Neue untere Schranken für Online-Algorithmen

Online-Algorithmen treffen Entscheidungen Schritt für Schritt, ohne die Zukunft zu kennen – etwa wenn ein System gesteuert werden muss, während sich seine Randbedingungen erst nach und nach offenbaren. Im Convex-Body-Chasing-Problem (Problem der Verfolgung eines konvexen Körpers) muss der Algorithmus innerhalb einer sich bewegenden konvexen Region bleiben und dabei die Gesamtbewegung möglichst gering halten. Eine zentrale Frage ist das bestmögliche Competitive Ratio: Wie viel schlechter kann ein Online-Algorithmus im schlimmsten Fall sein als ein idealer Offline-Algorithmus, der die gesamte Sequenz im Voraus kennt?

Christian Coester nutzte GPT‑5, um schwierige Instanzen und Konstruktionen zu brainstormen, die jeden Online-Algorithmus zu schlechter Leistung zwingen könnten. Das Modell hob eine bestimmte geometrische Konstruktion hervor, die – nach Verfeinerung und Überprüfung durch Coester – zu einer klareren und stärkeren unteren Schranke für das Competitive Ratio führte als zuvor bekannt.

Der Beitrag von GPT‑5: GPT‑5 schlug eine geometrische Konstruktion vor, die Christian Coester zu einer stärkeren unteren Schranke für ein Online-Algorithmus-Problem verfeinerte.

Lies mehr auf Seite 61(wird in einem neuen Fenster geöffnet)

Beweis neuer Ungleichungen in der Graphentheorie

Das Team untersuchte ein Problem der Graphentheorie, bei dem es darum ging, kleine Muster – Pfade, Sterne und „Wyes“ (3-Sterne) – innerhalb von Bäumen (Graphen ohne Zyklen) zu zählen. Frühere Arbeiten hatten eine Ungleichung zwischen diesen Zählungen bewiesen und eine zweite vermutet, die jedoch bislang unbewiesen geblieben war. Mit einem maßgeschneiderten mathematischen Scaffolding um GPT‑5 baten die Autor:innen das Modell zunächst, die bekannte Ungleichung erneut zu beweisen, und anschließend, die vermutete Ungleichung anzugehen.

GPT‑5 lieferte kurze, in sich geschlossene Beweise für beide Ungleichungen und stützte sich dabei auf ein anderes und eleganteres Argument als der ursprüngliche menschliche Beweis; Bubeck, Sellke und Yin überprüften und übernahmen dann das Argument des Modells in ihre Veröffentlichung.

Der Beitrag von GPT‑5: GPT‑5 generierte kurze Beweise für zwei Ungleichungen in Bäumen, darunter eine vermutete, und die Autoren überprüften das Argument unabhängig und übernahmen es.

Lies mehr auf Seite 69(wird in einem neuen Fenster geöffnet)

Identifizierung versteckter Parameter in sich entwickelnden Netzwerken

Forschende untersuchten ein einfaches Modell eines wachsenden Netzwerks, bei dem sich jeder neue Knoten mit einer Wahrscheinlichkeit an frühere Knoten anbindet, die von einem versteckten Parameter www beeinflusst wird. Die Herausforderung besteht darin, dass, sobald das Netzwerk gewachsen ist, nur noch der endgültige, unbeschriftete Baum sichtbar ist – nicht aber die verborgenen Labels oder die Anbindungsregeln, die ihn erzeugt haben. Die offene Frage war, ob www überhaupt aus dieser endgültigen Struktur wiederhergestellt werden könnte.

Das Team bat GPT‑5, darüber nachzudenken, welche globalen Muster im endgültigen Baum zuverlässig den Wert von www widerspiegeln könnten. Das Modell schlug vor, sich auf eine überraschend einfach zugängliche Statistik zu konzentrieren: den langfristigen Anteil der Knoten, die schließlich Blätter werden. GPT‑5 zeigte auf, dass dieser Blattanteil gegen eine einfache, streng monoton steigende Funktion von www konvergiert, was bedeutet, dass sich der Wert von www direkt aus der Form des Baumes ablesen lässt. Mit dieser Anleitung erarbeiteten die Autor:innen einen vollständigen Beweis dafür, dass der Parameter tatsächlich identifizierbar ist.

Der Beitrag von GPT‑5: GPT‑5 hob die entscheidende Beobachtungsgröße – den Blattanteil – hervor, die eine saubere, nachweisbare Methode zur Wiederherstellung des verborgenen Parameters www aus einer einzigen Momentaufnahme des endgültigen Netzwerks ermöglicht.

Lies mehr auf Seite 75(wird in einem neuen Fenster geöffnet)

Einschränkungen

Diese Fallstudien sind kuratierte Beispiele dafür, wo GPT‑5 hilfreich war; sie stellen keine systematische Stichprobe dar und erfassen nicht die gesamte Bandbreite möglicher Fehlermodi. Die Aufsicht durch Expert:innen bleibt unerlässlich. GPT‑5 kann manchmal Literaturangaben, Mechanismen oder Beweise halluzinieren, die plausibel wirken; es kann empfindlich auf Scaffolding und Warm-up-Probleme reagieren; mitunter übersieht es fachspezifische Feinheiten; und es kann unproduktiven Gedankengängen folgen, wenn es nicht korrigiert wird. Das sind aktive Forschungsfelder, und wir arbeiten mit unseren Partner:innen daran, diese Schwächen zu messen und zu mindern, während wir zukünftige Systeme weiter verfeinern.

Wie geht‘s weiter?

In ihrer Gesamtheit zeigen diese frühen Studien, dass GPT‑5 beginnt, bei neuen Arten wissenschaftlicher Arbeit zu helfen. Das Modell ist nicht autonom, aber in den Händen von Expert:innen kann es helfen, Theoreme zu beweisen, Strukturen wiederzuentdecken und zu erweitern, fachgebietsübergreifende Zusammenhänge aufzudecken und Mechanismen und Experimente zu generieren, die Wissenschaftler:innen validieren können.

Wir sehen außerdem eine Entwicklung, bei der diese Systeme sich mit mehr Zeit und Rechenleistung weiter verbessern. Wenn GPT‑5 in 20 Minuten bei einigen Forschungsfragen sinnvoll helfen kann, erwarten wir tiefere Ergebnisse, wenn Modelle stunden- oder tagelang über ein Problem nachdenken können. In Kombination mit Wissenschaftler:innen von Weltrang deutet dies auf die Möglichkeit eines deutlichen Sprungs in der wissenschaftlichen Produktivität im Laufe der Zeit hin.

2025

Autor

Kevin Weil

Mehr lesen

Alles anzeigen

Signal und Rauschen bei Code-Bewertungen trennen

Forschung8. Juli 2026

Einführung von GeneBench-Pro

Forschung30. Juni 2026

A near-autonomous AI chemist improves a challenging reaction

Ein nahezu autonomer KI-Chemiker verbessert eine anspruchsvolle Reaktion in der medizinischen Chemie

Forschung17. Juni 2026