3. Oktober 2024

Wir stellen vor: Canvas

Eine neue Art, mit ChatGPT zu arbeiten, um zu schreiben und zu codieren.

Das Bild zeigt eine vertikale Symbolleiste mit fünf Symbolen, die in einer Spalte auf einem Hintergrund in sanftem Pastellton angeordnet sind. Das dritte Symbol von oben, ein offenes Buch, ist hervorgehoben, und daneben befindet sich die Beschriftung „Leseniveau“.

Laden …

Wir stellen Canvas vor, eine neue Benutzeroberfläche, um mit ChatGPT an Schreib- und Codierungsprojekten zu arbeiten, die über einfaches Chatten hinausgehen. Canvas wird in einem separaten Fenster geöffnet, sodass du und ChatGPT zusammen an einem Projekt arbeiten könnt. Diese frühe Betaversion führt eine neue Art der Zusammenarbeit ein – nicht nur durch Gespräche, sondern durch die gemeinsame Entwicklung und Verfeinerung von Ideen.

Canvas wurde mit GPT‑4o erstellt und kann während der Betaphase manuell im Modellwähler ausgewählt werden. Ab heute führen wir Canvas für ChatGPT Plus- und Team-Benutzer weltweit ein. Enterprise- und Edu-Benutzer erhalten in der kommenden Woche Zugriff. Wir planen außerdem, Canvas allen ChatGPT Free-Benutzern zur Verfügung zu stellen, wenn die Betaphase abgeschlossen ist.

Bessere Zusammenarbeit mit ChatGPT

Menschen nutzen ChatGPT jeden Tag, um Hilfe beim Schreiben und Codieren zu erhalten. Obwohl die Chat-Benutzeroberfläche einfach zu nutzen ist und für viele Aufgaben gut funktioniert, ist sie bei Projekten, die Bearbeitungen und Änderungen erfordern, eingeschränkt. Canvas bietet für diese Art von Arbeit eine neue Benutzeroberfläche.

Mit Canvas kann ChatGPT besser verstehen, was du erreichen möchtest. Du kannst bestimmte Abschnitte hervorheben, um genau anzuzeigen, worauf sich ChatGPT konzentrieren soll. Wie ein Redakteur oder Code-Prüfer kann es unter Berücksichtigung des gesamten Projekts Inline-Feedback und -Vorschläge geben.

Du steuerst das Projekt in Canvas. Du kannst Text direkt bearbeiten oder codieren. Es gibt ein Menü mit Verknüpfungen, mit denen du ChatGPT bitten kannst, die Textlänge anzupassen, deinen Code zu debuggen und schnell andere nützliche Aktionen auszuführen. Du kannst auch frühere Versionen deiner Arbeit wiederherstellen, indem du die Schaltfläche „Zurück“ in Canvas verwendest.

Canvas wird automatisch geöffnet, wenn ChatGPT ein Szenario erkennt, in dem es hilfreich sein könnte. Du kannst auch „nutze Canvas“ in deinen Prompt einschließen, um Canvas zu öffnen und damit an einem vorhandenen Projekt zu arbeiten.

Schreibverknüpfungen umfassen:

Bearbeitungen vorschlagen: ChatGPT bietet Inline-Vorschläge und -Feedback.
Länge anpassen: Bearbeitet die Länge des Dokuments, um es kürzer oder länger zu machen.
Leseniveau ändern: Passt das Leseniveau an, vom Kindergarten bis zur Universität.
Letzten Feinschliff vornehmen: Überprüft Grammatik, Klarheit und Konsistenz.
Emojis hinzufügen: Fügt relevante Emojis hinzu, um Nachdruck und Farbe zu verleihen.

Codieren in Canvas

Codieren ist ein iterativer Prozess und es kann schwierig sein, alle Überarbeitungen deines Codes im Chat zu verfolgen. Canvas erleichtert das Verfolgen und Verstehen der Änderungen von ChatGPT und wir planen, die Transparenz dieser Art von Bearbeitungen weiter zu verbessern.

Codierungsverknüpfungen umfassen:

Code überprüfen: ChatGPT bietet Inline-Vorschläge zur Verbesserung deines Codes.
Protokolle hinzufügen: Fügt Druckanweisungen ein, die dir beim Debuggen und Verstehen deines Codes helfen.
Kommentare hinzufügen: Fügt dem Code Kommentare hinzu, um ihn verständlicher zu machen.
Fehler korrigieren: Erkennt und schreibt problematischen Code neu, um Fehler zu beheben.
In eine Sprache portieren: Übersetzt deinen Code in JavaScript, TypeScript, Python, Java, C++ oder PHP.

Das Modell für die Zusammenarbeit trainieren

Wir haben GPT‑4o für die Zusammenarbeit als kreativer Partner trainiert. Das Modell weiß, wann Canvas geöffnet werden sollte, gezielte Bearbeitungen hilfreich wären und etwas vollständig umgeschrieben werden sollte. Es versteht auch den breiteren Kontext, um präzises Feedback und Vorschläge zu geben.

Um dies zu unterstützen, hat unser Forschungsteam die folgenden Kernverhaltensweisen entwickelt:

Canvas zum Schreiben und Codieren auslösen
Unterschiedliche Inhaltstypen generieren
Gezielte Bearbeitungen vornehmen
Dokumente umschreiben
Inline-Kritik geben

Wir haben den Fortschritt mit über 20 automatisierten internen Bewertungen gemessen. Wir haben neuartige Techniken zur Generierung synthetischer Daten verwendet, wie z. B. das Destillieren von Outputs aus OpenAI o1‑preview, um Post-Training an dem Modell hinsichtlich seiner Kernverhaltensweisen durchzuführen. Dieser Ansatz ermöglichte es uns, die Schreibqualität und die Interaktion mit neuen Benutzern schnell zu verbessern, ohne auf von Menschen generierte Daten angewiesen zu sein.

Eine zentrale Herausforderung bestand darin, festzulegen, wann Canvas ausgelöst werden sollte. Wir haben dem Modell beigebracht, Canvas für Aufforderungen wie „Schreibe einen Blogbeitrag über die Geschichte der Kaffeebohnen“ zu öffnen und gleichzeitig eine übermäßige Auslösung für allgemeine Frage-und-Antwort-Aufgaben wie „Hilf mir, ein neues Rezept für das Abendessen zu kochen“ zu vermeiden. Bei Schreibaufgaben haben wir die Verbesserung der „korrekten Auslöser“ (auf Kosten der „korrekten Nicht-Auslöser“) priorisiert und 83 % im Vergleich zu einer Zero-Shot-GPT‑4o‑Basislinie mit Prompts erreicht.

Es ist erwähnenswert, dass die Qualität solcher Basislinien sehr stark von dem spezifischen Prompt abhängt, der verwendet wird. Bei unterschiedlichen Prompts kann die Leistung der Basislinie zwar immer noch schlecht sein, jedoch auf andere Weise – beispielsweise indem sie bei Codierungs- und Schreibaufgaben gleichmäßig ungenau ist, was zu einer anderen Fehlerverteilung und alternativen Formen suboptimaler Leistung führt. Für das Codieren haben wir das Modell absichtlich gegen das Auslösen ausgerichtet, um Störungen unserer Poweruser zu vermeiden. Wir werden dies basierend auf dem Benutzerfeedback weiter verfeinern.

Canvas Entscheidungsgrenze-Auslöser – Schreiben und Codieren

Bei Schreib- und Codierungsaufgaben haben wir die Entscheidungsgrenze für das korrekte Auslösen von Canvas verbessert und im Vergleich zu einer Zero-Shot-GPT‑4o‑Basislinie mit Prompts 83 % bzw. 94 % erreicht.

Eine zweite Herausforderung bestand darin, das Bearbeitungsverhalten des Modells anzupassen, sobald Canvas ausgelöst wurde. Insbesondere galt es zu entscheiden, wann eine gezielte Bearbeitung vorgenommen und wann der gesamte Inhalt neu geschrieben werden sollte. Wir haben das Modell darauf trainiert, gezielte Bearbeitungen vorzunehmen, wenn Benutzer Text explizit über die Benutzeroberfläche auswählen, und andernfalls Neuschreibungen zu bevorzugen. Dieses Verhalten entwickelt sich weiter, während wir das Modell verfeinern.

Canvas Bearbeitungsgrenze – Schreiben und Codieren

Bei Schreib- und Codierungsaufgaben haben wir der Verbesserung zielgerichteter Canvas-Bearbeitungen Priorität eingeräumt. GPT‑4o mit Canvas weist eine um 18 % bessere Leistung auf als eine GPT‑4o‑Basislinie mit Prompts.

Abschließend erforderte das Trainieren des Modells zur Generierung qualitativ hochwertiger Kommentare sorgfältige Iteration. Im Gegensatz zu den ersten beiden Fällen, die sich durch gründliche manuelle Überprüfungen leicht an eine automatisierte Bewertung anpassen lassen, ist die automatisierte Qualitätsmessung eine besondere Herausforderung. Daher haben wir die Qualität und Genauigkeit der Kommentare von Menschen bewerten lassen. Unser integriertes Canvas-Modell übertrifft das Zero-Shot-GPT‑4o mit Prompts um 30 % in der Genauigkeit und 16 % in der Qualität. Dies zeigt, dass synthetisches Training die Antwortqualität und das Verhalten im Vergleich zum Zero-Shot-Prompting mit detaillierten Anweisungen deutlich verbessert.

Canvas Suggested Comments

Durch menschliche Bewertungen wurde die Qualität und Genauigkeit der Canvas-Kommentare beurteilt. Unser Canvas-Modell übertrifft das Zero-Shot GPT‑4o mit Prompts um 30 % in der Genauigkeit und 16 % in der Qualität.

Wie geht‘s weiter?

Um KI nützlicher und zugänglicher zu machen, müssen wir die Art und Weise überdenken, wie wir mit ihr interagieren. Canvas ist ein neuer Ansatz und das erste größere Update der visuellen Benutzeroberfläche von ChatGPT seit unseren Anfängen vor zwei Jahren.

Canvas befindet sich in der frühen Betaphase und wir planen, seine Funktionen zügig zu verbessern.

Autor

OpenAI

Forschungsleitung

Karina Nguyen

Hauptforschung

Kai Chen, Michael Wu, Tarun Gogineni

Haupt-Engineering, Produkt, Design

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson

Beitragende

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian

Unterstützende Führung

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry