Informacje o pochodzeniu multimediów zapewniają bezpieczniejszy i bardziej przejrzysty ekosystem AI
Pomagamy użytkownikom zrozumieć pochodzenie treści generowanych przez AI dzięki Content Credentials, SynthID i publicznemu narzędziu weryfikacyjnemu.
Użytkownicy codziennie korzystają z narzędzi OpenAI do tworzenia i edycji obrazów oraz muzyki, dzięki którym komunikacja staje się bardziej wyrazista, użyteczna i dostępna. W miarę upowszechniania się tych narzędzi coraz ważniejsze się staje, aby użytkownicy potrafili rozpoznać i zweryfikować, skąd pochodzą takie obrazy i muzyka oraz umieli je właściwie interpretować. W tym pomocne mogą być sygnały pochodzenia, które zapewniają informacje o pochodzeniu treści, sposobie ich utworzenia lub edytowana oraz powiadamiają, czy treści rzeczywiście są tym, za co je uznajemy.
Dziś rozszerzamy nasze działania względem informacji o pochodzeniu treści, wprowadzając wielowarstwowy model budowania zaufania online oparty na całym ekosystemie. Ułatwiamy innym narzędziom i platformom rozpoznawanie naszych sygnałów pochodzenia dzięki zapewnieniu zgodności z normą C2PA, we współpracy z Google dodajemy trwałe, międzyplatformowe znakowanie wodne SynthID do obrazów oraz udostępniamy wersję poglądową narzędzia, za pomocą którego użytkownicy mogą sprawdzić, czy dane obrazy zostały opracowane przez OpenAI.
Wszystkie te nowości stanowią rozwinięcie naszych wcześniejszych działań odnośnie do wspierania otwartych standardów, ułatwiania identyfikacji treści generowanych przez OpenAI oraz współpracy całej branży AI na rzecz bardziej oferowania ekosystemu informacji godnego zaufania.
OpenAI uczestniczy w rozwoju i wdrażaniu standardów wskazujących pochodzenie multimediów od 2024 roku, kiedy to zaczęliśmy dodawać poświadczenia treści Content Credentials do obrazów generowanych przez DALL·E 3(otwiera nowe okno), a później przez ImageGen(otwiera nowe okno) i Sora(otwiera nowe okno). Dołączyliśmy również do komitetu Steering Committee w międzybranżowej koalicji na rzecz pochodzenia i autentyczności treści Coalition for Content Provenance and Authenticity (C2PA) odpowiedzialnej za opracowanie otwartego standardu technicznego pozwalającego weryfikować pochodzenie treści. Rozwiązania C2PA wykorzystują metadane i podpisy kryptograficzne do oznaczania treści odpowiednimi informacjami o danym materiale. Informacje te obejmują kontekst, który pomaga dziennikarzom oceniającym źródło, platformom podejmującym decyzje dotyczące prawdziwość treści oraz osobom próbującym zrozumieć to, co widzą online.
Niedawno podjęliśmy działania, dzięki którym OpenAI stało się produktem generującym zgodnym z C2PA (C2PA Conforming Generator Product)(otwiera nowe okno). Uzyskując zgodność z normami C2PA, przekazujemy platformom zaufaną metodę odczytywania, zachowywania i dalszego przekazywania informacji o pochodzeniu, które dołączamy do naszych treści. Jest to niezwykle ważne, ponieważ informacje o pochodzeniu są skuteczne tylko wtedy, gdy pozostają dostępne poza pierwszą platformą, na której treść została utworzona, a funkcje zgodności to umożliwiają.
Metadane C2PA są istotnym fundamentem informacji o pochodzeniu multimediów. Pomagają one treściom przenosić dane o tym, skąd pochodzą, jak zostały utworzone lub edytowane oraz kto je podpisał. Jednak metadane nie są niezawodne, ponieważ mogą zostać usunięte, utracone podczas przesyłania i pobierania albo uszkodzone przez przekształcenia, takie jak zmiany formatu pliku, modyfikacje rozmiaru czy zrzuty ekranu.
Aby zwiększyć niezawodność rozpoznawania pochodzenia, przyjmujemy wielowarstwowe podejście i wdrażamy znakowanie wodne poprzez SynthID od Google DeepMind(otwiera nowe okno), zaczynając od obrazów generowanych przez ChatGPT, Codex lub OpenAI API. SynthID dodaje niewidoczną warstwę znaku wodnego, który stanowi uzupełnienie podejścia opartego na metadanych C2PA.
Od pewnego czasu zmierzaliśmy w kierunku takiego rozwiązania. Stosowaliśmy widoczne znaki wodne w Sora oraz znak wodny audio w Voice Engine i testowaliśmy oraz badaliśmy ich dokładność oraz niezawodność we wdrożeniach.
Obydwa te systemy współpracują ze sobą: C2PA pomaga treściom przenosić szczegółowy kontekst; SynthID pomaga zachować sygnał, na wypadek gdyby metadane zostały utracone. Znaki wodne maja większą szansę przetrwać podczas przekształceń treści, takich jak wykonywanie zrzutów ekranu, jednak metadane mogą zapewniać więcej informacji niż sam znak wodny. Wspólnie metody te sprawiają, że informacje o pochodzeniu są bardziej odporne na utratę, niż w przypadku gdyby były stosowane osobno.
Zaufane metadane i znaki wodne odporne na większość modyfikacji mogą sprawić, że sygnały pochodzenia będą trwalsze. Jednak użytkownicy potrzebują sposobu, by wykrywać te sygnały. Przygotowaliśmy więc ogólnodostępne narzędzie weryfikacyjne, które pomoże sprawdzić, czy przesłany obraz został wygenerowany w ChatGPT, OpenAI API lub Codex, i zweryfikuje obecność sygnałów pochodzenia, w tym Content Credentials i SynthID.
Uważamy, że informacje o pochodzeniu powinny być łatwiejsze do weryfikacji i interpretacji, a nasze narzędzie integrujące wiele sygnałów może pomóc w uzyskaniu odpowiedzi na pytanie: „Czy to zostało wygenerowane przez AI?” Stanowi ono rozwinięcie naszego klasyfikatora wykrywania obrazów z 2024 roku i umożliwia wiarygodne wykrywanie, czy w materiale obecny jest znak wodny SynthID pochodzący z OpenAI, a także ujawnianie metadanych C2PA, gdy zostaną znalezione.

Żadna metoda wykrywania nie jest niezawodna, dlatego z ostrożnością należy podchodzić do sytuacji, gdy wykrywanie się nie powiedzie. Jeśli na przykład nie zostaną wykryte metadane ani znak wodny, narzędzie nie wyda jednoznacznej opinii, czy obraz został wygenerowany za pomocą narzędzi OpenAI, ponieważ sygnały pochodzenia mogą w niektórych przypadkach zostać usunięte.
Początkowo działanie narzędzia będzie ograniczone do treści generowanych przez OpenAI. W kolejnych miesiącach chcemy wspierać działania międzybranżowe, aby umożliwić weryfikację na różnych platformach. Później będziemy chcieli obsługiwać inne treści dostępne online.
Żadna pojedyncza technika badania multimediów nie wystarczy do jednoznacznego określenia ich pochodzenia. Uważamy, że skuteczne podejście sprawdzające obejmuje wspólne standardy, trwałe sygnały znakowania wodnego i publiczną weryfikację. Mamy nadzieję, że długotrwałe wsparcie dla Content Credentials, uzyskanie zgodności z C2PA, wdrożenie SynthID i zapowiedź publicznych narzędzi weryfikacyjnych pozwolą nam w dłuższej perspektywie przyczynić się do stworzenia bardziej interoperacyjnego ekosystemu określania pochodzenia multimediów.


