Inhaltsherkunft für ein sichereres, transparenteres KI-Ökosystem voranbringen
Menschen helfen, den Ursprung KI-generierter Inhalte durch Content Credentials, SynthID und ein frühes öffentliches Verifizierungstool zu verstehen.
Menschen nutzen OpenAI-Tools jeden Tag, um Bilder und Audio auf eine Weise zu erstellen und zu bearbeiten, die Kommunikation ausdrucksstärker, nützlicher und zugänglicher macht. Da diese Tools zunehmend Teil davon werden, wie Menschen gestalten, sich etwas vorstellen und teilen, ist es wichtig, dass sie verstehen und überprüfen können, woher Medien stammen, damit sie sie mit mehr Sicherheit einordnen können. Herkunftssignale können dabei helfen, indem sie Kontext dazu geben, woher Inhalte stammen, wie sie erstellt oder bearbeitet wurden und ob sie das sind, was sie vorgeben zu sein.
Heute stärken wir unseren Ansatz zur Inhaltsherkunft mit einem mehrschichtigen, vom Ökosystem getragenen Modell zum Aufbau von Vertrauen im Netz. Wir machen unsere Herkunftssignale für andere Tools und Plattformen leichter erkennbar – durch C2PA-Konformität, durch dauerhafte plattformübergreifende SynthID-Wasserzeichen für Bilder in Partnerschaft mit Google und mit einer Vorschau auf ein Tool, mit dem die Öffentlichkeit prüfen kann, ob Bilder von OpenAI stammen.
Zusammen bauen diese Neuerungen auf unserer früheren Arbeit auf, um offene Standards zu unterstützen, von OpenAI erzeugte Inhalte leichter erkennbar zu machen und branchenübergreifend an einem vertrauenswürdigeren Informationsökosystem zusammenzuarbeiten.
OpenAI engagiert sich seit 2024 für die Entwicklung und Einführung von Herkunftsstandards, als wir begannen, Bildern aus DALL·E 3(wird in einem neuen Fenster geöffnet) Content Credentials hinzuzufügen und später auch ImageGen(wird in einem neuen Fenster geöffnet) und Sora.(wird in einem neuen Fenster geöffnet) Wir sind außerdem dem Lenkungsausschuss der Coalition for Content Provenance and Authenticity (C2PA) beigetreten, der branchenübergreifenden Gruppe hinter dem offenen technischen Standard für Inhaltsherkunft. Der technische Ansatz von C2PA nutzt Metadaten und kryptografische Signaturen, damit Informationen über ein Medienstück sicher mit dem Inhalt selbst weitergegeben werden können. Diese Informationen umfassen Kontext, der Journalist:innen bei der Bewertung einer Quelle hilft, Plattformen bei Integritätsentscheidungen unterstützt und Menschen hilft zu verstehen, was sie online sehen.
Kürzlich haben wir OpenAI zum C2PA Conforming Generator Product(wird in einem neuen Fenster geöffnet) gemacht. Indem wir C2PA-konform sind, geben wir Plattformen eine vertrauenswürdige Möglichkeit, die Herkunftsinformationen, die wir an unsere Inhalte anhängen, zu lesen, zu bewahren und weiterzugeben. Das ist wichtig, weil Herkunft nur funktioniert, wenn sie über die erste Plattform hinaus erhalten bleibt, auf der Inhalte erstellt werden, und Konformität macht genau das möglich.
C2PA-Metadaten sind eine wichtige Grundlage für Herkunft. Mit ihnen können Inhalte Informationen darüber mittragen, woher sie stammen, wie sie erstellt oder bearbeitet wurden und wer diese Informationen signiert hat. Aber Metadaten sind nicht absolut sicher. Sie können entfernt werden, bei Uploads und Downloads verloren gehen oder durch Veränderungen wie Dateiformatwechsel, Größenänderungen oder Screenshots beschädigt werden.
Um Herkunftssignale robuster zu machen, verfolgen wir einen mehrschichtigen Ansatz und integrieren Wasserzeichen über Google DeepMinds SynthID,(wird in einem neuen Fenster geöffnet) zunächst für Bilder, die über ChatGPT, Codex oder die OpenAI API erzeugt werden. SynthID bettet eine unsichtbare Wasserzeichenebene ein, die C2PA-basierte Ansätze mit Metadaten ergänzt.
Wir arbeiten schon seit einiger Zeit darauf hin. Wir haben in Sora sichtbare Wasserzeichen und in Voice Engine ein Audio-Wasserzeichen verwendet und im Laufe der Zeit durch den Einsatz die Genauigkeit und Zuverlässigkeit kontinuierlich getestet und untersucht.
Diese beiden Systeme verstärken sich gegenseitig. Mit C2PA können Inhalte detaillierten Kontext mittragen; SynthID hilft, ein Signal zu bewahren, wenn Metadaten nicht erhalten bleiben. Wasserzeichen können Transformationen wie Screenshots besser überstehen, während Metadaten mehr Informationen liefern können als ein Wasserzeichen allein. Zusammen machen sie Herkunftssignale robuster als die beiden Ebenen für sich allein.
Vertrauenswürdige Metadaten und Wasserzeichen, die den meisten Änderungen standhalten, können Herkunftssignale beständiger machen. Aber Menschen brauchen eine Möglichkeit, diese Signale zu erkennen. Wir zeigen jetzt eine Vorschau auf ein öffentliches Verifizierungstool, das Menschen dabei helfen wird zu prüfen, ob ein hochgeladenes Bild in ChatGPT, über die OpenAI API oder mit Codex erzeugt wurde, indem kontrolliert wird, ob es Herkunftssignale enthält, darunter Content Credentials und SynthID.
Wir glauben, dass die Herkunft für Menschen leichter zu prüfen und zu interpretieren sein sollte und dass unser Tool ihnen bei der Beantwortung der Frage: „Wurde das mit KI erzeugt?“ helfen kann, indem wir mehrere Signale integrieren. Das baut auf Erkenntnissen aus der ersten Forschungsvorschau unseres Klassifikators zur Bilderkennung im Jahr 2024 auf und ermöglicht es Menschen, zuverlässig zu erkennen, ob ein von OpenAI stammendes SynthID-Wasserzeichen im Medium vorhanden ist, und zugleich C2PA-Metadaten anzuzeigen, wenn sie gefunden werden.

Keine Erkennungsmethode ist absolut sicher, daher gehen wir vorsichtig vor, wenn die Erkennung fehlschlägt. Wenn zum Beispiel keine Metadaten oder Wasserzeichen erkannt werden, zieht das Tool keine endgültige Schlussfolgerung dazu, ob das Bild mit OpenAI-Tools erzeugt wurde, da Herkunftssignale in manchen Fällen entfernt werden können.
Zum Start ist das Tool auf von OpenAI erzeugte Inhalte beschränkt. In den kommenden Monaten wollen wir branchenübergreifende Bemühungen unterstützen, um Verifizierung plattformübergreifend zu ermöglichen. Mit der Zeit wollen wir außerdem mehr Arten von Inhalten unterstützen, denen Menschen online begegnen können.
Keine einzelne Herkunftstechnik reicht für sich allein aus. Wir glauben, dass ein starker Ansatz gemeinsame Standards, beständige Wasserzeichensignale und öffentliche Verifizierung kombiniert. Indem wir auf unserer langjährigen Unterstützung für Content Credentials aufbauen, C2PA-konform werden, SynthID übernehmen und öffentliche Verifizierungstools als Vorschau bereitstellen, hoffen wir, langfristig zu einem interoperableren Herkunftsökosystem beizutragen.


