12. Februar 2025

Aktuelle Modellspezifikationen

Wir haben die Modellspezifikation auf Grundlage von externem Feedback und unserer kontinuierlichen Forschung zur Gestaltung des gewünschten Modellverhaltens aktualisiert.

Modellspezifikationen lesen

Laden …

Wir veröffentlichen eine wichtige Aktualisierung der Modellspezifikationen, die das gewünschte Verhalten unserer KI-Modelle dokumentieren. Diese Aktualisierung unterstreicht unser Engagement für Anpassbarkeit, Transparenz und geistige Freiheit, um KI ohne willkürliche Einschränkungen zu erforschen, zu diskutieren und zu erschaffen. Gleichzeitig gewährleistet sie die fortgesetzte Einhaltung gewisser Leitlinien, um das Risiko tatsächlicher Schäden zu verringern. Das aktualisierte Dokument baut auf den Grundlagen auf, die wir im Mai letzten Jahres vorgestellt haben, und stützt sich auf unsere Erfahrungen bei der Anwendung in unterschiedlichen Kontexten, von der Anpassungsforschung bis zur Dienstleistung für Benutzer in aller Welt.

Zudem präsentieren wir erste Ergebnisse hinsichtlich der Einhaltung der Grundsätze aus den Modellspezifikationen in einer Vielzahl von Szenarien. Diese Ergebnisse zeigen, welche Fortschritte wir im Laufe der Zeit gemacht haben, weisen aber auch auf Bereiche hin, in denen wir uns noch verbessern können. Genau wie unsere Modelle werden auch die Modellspezifikationen im Zuge ihrer Anwendung, ihrer Veröffentlichung und des Feedbacks von Interessengruppen kontinuierlich weiterentwickelt. Um eine breite Nutzung und Zusammenarbeit zu unterstützen, veröffentlichen wir diese Version der Modellspezifikationen unter einer Creative Commons CC0-Lizenz. Somit können Entwickler und Forschende sie frei verwenden und anpassen sowie in ihrer eigenen Arbeit darauf aufbauen.

Ziele und Grundsätze

OpenAI verfolgt das Ziel, Modelle zu entwickeln, die nützlich, sicher und auf die Bedürfnisse von Benutzern und Entwicklern abgestimmt sind. Gleichzeitig sollen sie unsere Mission vorantreiben, künstliche Intelligenz zum Wohle der gesamten Menschheit bereitzustellen. Um dieses Ziel zu erreichen, müssen wir unsere Modelle iterativ bereitstellen, um Entwickler und Benutzer gleichermaßen zu unterstützen. Parallel dazu müssen wir verhindern, dass unsere Modelle ihren Benutzern oder anderen Menschen ernsthaften Schaden zufügen, und die Betriebslizenz von OpenAI aufrechterhalten.

Manchmal können diese Zielsetzungen miteinander in Konflikt geraten. Die Modellspezifikationen sorgen für einen Ausgleich und liefern Kompromisse, indem sie das Modell anweisen, einer klar definierten Befehlskette zu folgen. Außerdem legen zusätzliche Prinzipien die Grenzen und das Standardverhalten in verschiedenen Szenarien fest. Dieses Rahmenwerk legt den Schwerpunkt auf die Kontrolle durch Benutzer und Entwickler und bewegt sich dabei innerhalb klarer und genau definierter Grenzen:

Befehlskette: Die Befehlskette legt fest, wie das Modell die Anweisungen der Plattform (OpenAI), der Entwickler und der Benutzers der Reihe nach priorisiert. Der größte Teil der Modellspezifikation besteht aus Leitlinien, die unserer Meinung nach in vielen Fällen hilfreich sind, aber von Benutzern und Entwicklern außer Kraft gesetzt werden können. Dies ermöglicht es Benutzern und Entwicklern, das Modellverhalten innerhalb der auf Plattformebene gesetzten Grenzen vollständig anzupassen.
Gemeinsam nach der Wahrheit suchen: Wie ein menschlicher Assistent mit einem hohen Maß an Integrität sollen unsere Modelle ihre Benutzer in die Lage versetzen, eigenständig die besten Entscheidungen zu treffen. Dies erfordert ein sorgfältiges Gleichgewicht zwischen (1) der Vermeidung der Lenkung von Benutzern mit einer Agenda bei gleichzeitiger Vorgabe von Objektivität sowie der Bereitschaft, jedes Thema aus jeder beliebigen Perspektive zu erforschen, und (2) dem Bemühen, die Ziele des Benutzers zu verstehen, Annahmen und unsichere Details zu klären sowie gegebenenfalls kritisches Feedback zu geben. Diesbezügliche Anfragen haben wir uns zu Herzen genommen und entsprechende Verbesserungen eingeführt.
Die beste Arbeit leisten: Die Modellspezifikationen legen grundlegende Standards für Kompetenz fest, einschließlich sachlicher Richtigkeit, Kreativität und programmatischer Anwendung.
Im Rahmen bleiben: Unsere Modelle sollen die Autonomie ihrer Benutzer mit Vorsichtsmaßnahmen in Einklang bringen, um Schaden oder Missbrauch zu vermeiden. Die neue Version der Modellspezifikationen soll umfassend sein und alle Gründe abdecken, aus denen unsere Modelle gewisse Anfragen von Benutzern oder Entwicklern ablehnen können.
Aufgeschlossen sein: Das Modell soll grundsätzlich einen warmherzigen, einfühlsamen und hilfreichen Gesprächsstil verwenden, der in bestimmten Situationen angepasst werden kann.
Einen geeigneten Stil verwenden: Es wird eine Standardanleitung zur Formatierung und Auslieferung von Antworten festgelegt. Ganz gleich, ob es sich dabei um übersichtliche Aufzählungspunkte, prägnante Codeauszüge oder eine Audioausgabe handelt, soll jederzeit Klarheit und Benutzerfreundlichkeit gewährleistet werden.

Bewahrung geistiger Freiheit

Das aktualisierten Modellspezifikationen bekennen sich ausdrücklich zur geistigen Freiheit, d. h. zu der Idee, dass die KI Menschen in die Lage versetzen sollte, ohne willkürliche Einschränkungen zu forschen, zu debattieren und zu erstellen – ganz gleich, wie herausfordernd oder kontrovers ein Thema auch sein mag. In einer Welt, in der KI-Tools zunehmend den Diskurs prägen, ist der freie Austausch von Informationen und Standpunkten eine notwendige Voraussetzung für Fortschritt und Innovation.

Diese grundsätzliche Einstellung ist in den Abschnitten „im Rahmen bleiben“ und „gemeinsam nach der Wahrheit suchen“ enthalten. Während das Modell beispielsweise niemals detaillierte Anleitungen für den Bau einer Bombe oder die Verletzung der Privatsphäre liefern sollte, wird es dazu angeregt, durchdachte Antworten auf politisch oder kulturell heikle Fragen zu geben, ohne dabei eine bestimmte Agenda zu fördern oder zu verfolgen. Im Wesentlichen haben wir den Grundsatz bekräftigt, dass keine Idee von vornherein für die Diskussion tabu ist, solange das Modell dem Benutzer oder anderen Menschen keinen erheblichen Schaden zufügt (z. B. die Durchführung von Terroranschlägen).

Messung der Fortschritte

Um die Leistung unserer Modelle in der Praxis besser zu verstehen, haben wir damit begonnen, eine Reihe anspruchsvoller Aufgaben zusammenzustellen. Damit wollen wir testen, wie gut sich die Modelle an die einzelnen Grundsätze der Modellspezifikationen halten. Diese Prompts wurden durch eine Kombination aus Modellgenerierung und menschlicher Überprüfung durch Experten erstellt, sodass sowohl typische als auch komplexere Szenarien abgedeckt werden.

Ein Balkendiagramm mit abwechselnd weißen und gelben Balken auf weißem Hintergrund zur Darstellung von Datenvergleichen. Die Balken haben ein gepunktetes Muster, das der visuellen Darstellung Struktur verleiht.

Vorläufige Ergebnisse zeigen deutliche Verbesserungen bei der Einhaltung der Modellspezifikationen im Vergleich zu unserem besten System im Mai letzten Jahres. Während ein Teil dieses Unterschieds auf Aktualisierungen von Richtlinien zurückgeführt werden kann, sind wir der Meinung, dass er größtenteils einer verbesserten Anpassung zu verdanken ist. Trotz dieser ermutigenden Fortschritte sind wir uns bewusst, dass noch viel Verbesserungspotenzial vorhanden ist.

Wir betrachten dies als den Beginn eines kontinuierlichen Prozesses. Unsere Planungen sehen vor, die Aufgabenstellungen durch neue Beispiele zu erweitern. Dies betrifft insbesondere Fälle, die durch den praktischen Einsatz aufgedeckt wurden und denen unsere Modelle sowie die Modellspezifikationen noch nicht vollständig gerecht werden.

Bei der Gestaltung dieser Version der Modellspezifikationen haben wir die Rückmeldungen für die erste Version sowie die Erkenntnisse aus der Anpassungsforschung und dem praktischen Einsatz berücksichtigt. In Zukunft wollen wir eine deutlich breitere öffentliche Beteiligung in Betracht ziehen. Um entsprechende Prozesse zu entwickeln, haben wir Pilotstudien mit rund 1.000 Personen durchgeführt, die das Modellverhalten und die vorgeschlagenen Regeln überprüften und uns ihr Feedback übermittelten. Diese Studien spiegeln zwar noch keine breit gefächerten Standpunkte wider, aber erste Erkenntnisse haben bereits zu einigen Änderungen geführt. Wir betrachten dies als einen fortlaufenden, sich wiederholenden Prozess und sind weiterhin bestrebt, zu lernen und unseren Ansatz zu verfeinern.

Modellspezifikationen als Open Source

Wir stellen diese neue Version der Modellspezifikationen unter einer Creative Commons CC0-Lizenz öffentlich zur Verfügung. Demzufolge können Entwickler und Forscher die Modellspezifikationen in ihren eigenen Arbeiten frei verwenden, sie anpassen oder darauf aufbauen. Darüber hinaus veröffentlichen wir die oben verwendeten Prompts zur Bewertung und beabsichtigen, in Zukunft weitere Codes, Artefakte und Tools für die Bewertung und den Abgleich von Spezifikationen bereitzustellen.

Du findest diese Prompts und den Quellcode der Modellspezifikationen in einem neuen Github-Repository⁠(wird in einem neuen Fenster geöffnet), in dem wir in Zukunft regelmäßig aktualisierte Versionen der Modellspezifikationen veröffentlichen wollen.

Wie geht‘s weiter?

Im Zuge der Weiterentwicklung unserer KI-Systeme werden wir diese Grundsätze immer wieder überarbeiten, die Community um Feedback bitten und unsere Fortschritte offenlegen. In Zukunft werden wir nicht mehr für jede Aktualisierung der Modellspezifikationen einen Blogbeitrag veröffentlichen. Stattdessen kannst du die neuesten Updates auf model-spec.openai.com⁠(wird in einem neuen Fenster geöffnet) finden und Änderungen dort verfolgen.

Wir verfolgen das Ziel, ständig neue Anwendungsfälle in sicherer Art und Weise zu ermöglichen, indem wir unseren Ansatz auf Grundlage kontinuierlicher Forschung und Innovation weiterentwickeln. Die wachsende Rolle von KI in unserem täglichen Leben macht es unabdingbar, weiter zu lernen, Herangehensweisen zu verfeinern und sich offen zu engagieren. Dieser Ansatz spiegelt nicht nur das bisher Gelernte wider, sondern beinhaltet auch unsere Überzeugung, dass die Ausrichtung von KI eine fortlaufende Reise ist, auf der du uns hoffentlich begleiten wirst. Wenn du uns Feedback zu diesen Modellspezifikationen geben möchtest, kannst du das hier tun.

Autoren

OpenAI