12. September 2024

OpenAI o1‑preview ist da

Eine neue Reihe schlussfolgernder Modelle zur Lösung schwieriger Probleme. Jetzt verfügbar.

Laden …

Update vom 17. September 2024: Die Ratenbegrenzungen betragen jetzt 50 Abfragen pro Woche für o1‑preview und 50 Abfragen pro Tag für o1‑mini.

Wir haben eine neue Reihe von KI-Modellen entwickelt, die länger nachdenken, bevor sie reagieren. Sie können komplexe Aufgaben in den Bereichen Wissenschaft, Programmierung und Mathematik durchdenken und schwierigere Probleme lösen als frühere Modelle.

Heute veröffentlichen wir das erste Modell dieser Reihe in ChatGPT und unserer API. Dies ist eine Vorschau, und es wird regelmäßige Updates und Verbesserungen geben. Neben dieser Veröffentlichung fügen wir auch Bewertungen für das nächste Update hinzu, das sich derzeit in der Entwicklung befindet.

Funktionsweise

Wir haben diese Modelle darauf trainiert, mehr Zeit damit zu verbringen, über Probleme nachzudenken, bevor sie reagieren, ähnlich wie es ein Mensch tun würde. Durch Training lernen sie, ihren Denkprozess zu verfeinern, verschiedene Strategien auszuprobieren und ihre Fehler zu erkennen.

In unseren Tests schneidet das nächste Modellupdate bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie ähnlich ab wie Doktoranden. Wir haben außerdem festgestellt, dass es sich hervorragend in den Bereichen Mathematik und Codierung macht. In einer Qualifikationsprüfung für die International Mathematics Olympiad (IMO) löste GPT‑4o nur 13 % der Aufgaben richtig, während das schlussfolgernde Modell 83 % erreichte. Ihre Codierungsfähigkeiten wurden in Wettbewerben bewertet und erreichten bei Codeforces-Wettbewerben das 89. Perzentil. Mehr dazu erfährst du in unserem technischen Forschungsbeitrag.

Als frühes Modell verfügt es noch nicht über viele der Funktionen, die ChatGPT so nützlich machen, wie etwa das Durchsuchen des Internets nach Informationen und das Hochladen von Dateien und Bildern. Für viele gängige Anwendungsfälle wird GPT‑4o in naher Zukunft leistungsfähiger sein.

Für komplexe Reasoning-Aufgaben ist dies jedoch ein bedeutender Fortschritt und stellt eine neue Ebene der KI-Fähigkeiten dar. Aus diesem Grund setzten wir den Zähler auf 1 zurück und nennen diese Reihe OpenAI o1.

Sicherheit

Im Rahmen der Entwicklung dieser neuen Modelle haben wir einen neuen Ansatz für das Sicherheitstraining entwickelt, der ihre Reasoningfähigkeiten nutzt, um sie dazu zu bringen, Sicherheits- und Ausrichtungsrichtlinien einzuhalten. Indem es über unsere Sicherheitsregeln im Kontext nachdenkt, kann es sie effektiver anwenden.

Eine Möglichkeit, die Sicherheit zu messen, besteht darin, zu testen, wie gut unser Modell weiterhin seinen Sicherheitsregeln folgt, wenn ein Benutzer versucht, diese zu umgehen (auch bekannt als „Jailbreaking“). Bei einem unserer schwierigsten Jailbreaking-Tests erreichte GPT‑4o 22 (auf einer Skala von 0 bis 100), während unser o1‑preview‑Modell 84 erreichte. Mehr dazu erfährst du in derSystemkart und unserem Forschungsbeitrag.

Um den neuen Fähigkeiten dieser Modelle gerecht zu werden, haben wir unsere Arbeit im Bereich, unsere interne Governance und die Zusammenarbeit mit der Bundesregierung verstärkt. Hierzu gehören strenge Tests und Bewertungen unter Verwendung unseres Preparedness Frameworks⁠(wird in einem neuen Fenster geöffnet), erstklassiges Red Teaming und Überprüfungsprozesse auf Vorstandsebene, unter anderem durch unser Safety & Security Committee.

Um unser Engagement für die KI-Sicherheit voranzutreiben, haben wir vor Kurzem Vereinbarungen mit den USA und dem Vereinigten Königreich formalisiert. KI-Sicherheitsinstitute. Wir haben mit der Umsetzung dieser Vereinbarungen begonnen und gewähren den Instituten unter anderem frühzeitigen Zugriff auf eine Forschungsversion dieses Modells. Dies war ein wichtiger erster Schritt in unserer Partnerschaft und hat dabei geholfen, einen Prozess für die Erforschung, Bewertung und Prüfung zukünftiger Modelle vor und nach ihrer öffentlichen Veröffentlichung zu etablieren.

Für wen ist es entwickelt

Diese verbesserten Reasoningfähigkeiten können besonders nützlich sein, wenn Sie komplexe Probleme in den Bereichen der Wissenschaft, Programmierung, Mathematik und ähnlichen angehen. Beispielsweise kann o1 von Forschern im Gesundheitswesen zum Annotieren von Zellsequenzierungsdaten, von Physikern zum Generieren komplizierter mathematischer Formeln, die für die Quantenoptik benötigt werden, und von Entwicklern in allen Bereichen zum Erstellen und Ausführen mehrstufiger Arbeitsabläufe verwendet werden.

OpenAI o1-mini

Die o1‑Reihe zeichnet sich durch die präzise Generierung und Fehlerbehebung komplexer Codes aus. Um Entwicklern eine effizientere Lösung zu bieten, veröffentlichen wir außerdem OpenAI o1‑mini, ein schnelleres, günstigeres schlussfolgerndes Modell, das beim Codieren besonders effektiv ist. Als kleineres Modell ist o1‑mini 80 % günstiger als o1‑preview und damit ein leistungsstarkes, kostengünstiges Modell für Anwendungen, die Reasoning, aber kein umfassendes Allgemeinwissen erfordern.

Wie du OpenAI o1 nutzt

Benutzer von ChatGPT Plus und Team können ab heute auf o1‑Modelle in ChatGPT zugreifen. Sowohl o1‑preview als auch o1‑mini können manuell im Modellwähler ausgewählt werden. Beim Start betragen die wöchentlichen Ratenlimits 30 Nachrichten für o1‑preview und 50 für o1‑mini. Wir arbeiten daran, diese Raten zu erhöhen und ChatGPT in die Lage zu versetzen, automatisch das richtige Modell für einen bestimmten Prompt auszuwählen.

Ein Bild des neuen ChatGPT-Drop-down-Menüs, das die neue Modelloption „o1-preview“ auf einem hellgelben und blauen abstrakten Hintergrund anzeigt

Benutzer vonChatGPT Enterprise und Edu haben ab nächster Woche Zugriff auf beide Modelle.

Entwickler, die sich für die API-Nutzungsstufe 5⁠(wird in einem neuen Fenster geöffnet) qualifizieren, können noch heute mit der Prototypenentwicklung beider Modelle in der API beginnen, mit einer Ratenbegrenzung von 20 RPM. Wir arbeiten daran, diese Grenzwerte nach zusätzlichen Tests zu erhöhen. Die API für diese Modelle umfasst derzeit keine Funktionsaufrufe, kein Streaming, keine Unterstützung für Systemnachrichten und keine anderen Funktionen. Um loszulegen, schau dir die API Dokumentation⁠(wird in einem neuen Fenster geöffnet) an.

Wir planen außerdem, Zugriff auf ChatGPT o1‑mini für unsere Free-Benutzer bereitzustellen.

Wie geht‘s weiter?

Dies ist eine frühe Vorschau dieser Argumentationsmodelle in ChatGPT und der API. Zusätzlich zu den Modell-Updates werden wir voraussichtlich Funktionen zum Durchsuchen, Hochladen von Dateien und Bildern sowie andere Fähigkeiten hinzufügen, um sie für alle nützlicher zu machen.

Wir planen außerdem, zusätzlich zu der neuen OpenAI o1‑Reihe weiterhin Modelle in unserer GPT‑Reihe zu entwickeln und zu veröffentlichen.

Autoren

OpenAI