19 maja 2026

Informacje o pochodzeniu multimediów zapewniają bezpieczniejszy i bardziej przejrzysty ekosystem AI

Pomagamy użytkownikom zrozumieć pochodzenie treści generowanych przez AI dzięki Content Credentials, SynthID i publicznemu narzędziu weryfikacyjnemu.

Wypróbuj nasze narzędzie

Ładowanie…

Użytkownicy codziennie korzystają z narzędzi OpenAI do tworzenia i edycji obrazów oraz muzyki, dzięki którym komunikacja staje się bardziej wyrazista, użyteczna i dostępna. W miarę upowszechniania się tych narzędzi coraz ważniejsze się staje, aby użytkownicy potrafili rozpoznać i zweryfikować, skąd pochodzą takie obrazy i muzyka oraz umieli je właściwie interpretować. W tym pomocne mogą być sygnały pochodzenia, które zapewniają informacje o pochodzeniu treści, sposobie ich utworzenia lub edytowana oraz powiadamiają, czy treści rzeczywiście są tym, za co je uznajemy.

Dziś rozszerzamy nasze działania względem informacji o pochodzeniu treści, wprowadzając wielowarstwowy model budowania zaufania online oparty na całym ekosystemie. Ułatwiamy innym narzędziom i platformom rozpoznawanie naszych sygnałów pochodzenia dzięki zapewnieniu zgodności z normą C2PA, we współpracy z Google dodajemy trwałe, międzyplatformowe znakowanie wodne SynthID do obrazów oraz udostępniamy wersję poglądową narzędzia, za pomocą którego użytkownicy mogą sprawdzić, czy dane obrazy zostały opracowane przez OpenAI.

Wszystkie te nowości stanowią rozwinięcie naszych wcześniejszych działań⁠ odnośnie do wspierania otwartych standardów, ułatwiania identyfikacji treści generowanych przez OpenAI oraz współpracy całej branży AI na rzecz bardziej oferowania ekosystemu informacji godnego zaufania.

Budowanie ekosystemu zaufania dzięki zgodności z normą C2PA

OpenAI uczestniczy w rozwoju i wdrażaniu standardów wskazujących pochodzenie multimediów od 2024 roku, kiedy to zaczęliśmy dodawać poświadczenia treści Content Credentials do obrazów generowanych przez DALL·E 3⁠(otwiera nowe okno), a później przez ImageGen⁠(otwiera nowe okno) i Sora⁠(otwiera nowe okno). Dołączyliśmy również do komitetu Steering Committee w międzybranżowej koalicji na rzecz pochodzenia i autentyczności treści Coalition for Content Provenance and Authenticity (C2PA) odpowiedzialnej za opracowanie otwartego standardu technicznego pozwalającego weryfikować pochodzenie treści. Rozwiązania C2PA wykorzystują metadane i podpisy kryptograficzne do oznaczania treści odpowiednimi informacjami o danym materiale. Informacje te obejmują kontekst, który pomaga dziennikarzom oceniającym źródło, platformom podejmującym decyzje dotyczące prawdziwość treści oraz osobom próbującym zrozumieć to, co widzą online.

Niedawno podjęliśmy działania, dzięki którym OpenAI stało się produktem generującym zgodnym z C2PA (C2PA Conforming Generator Product)⁠(otwiera nowe okno). Uzyskując zgodność z normami C2PA, przekazujemy platformom zaufaną metodę odczytywania, zachowywania i dalszego przekazywania informacji o pochodzeniu, które dołączamy do naszych treści. Jest to niezwykle ważne, ponieważ informacje o pochodzeniu są skuteczne tylko wtedy, gdy pozostają dostępne poza pierwszą platformą, na której treść została utworzona, a funkcje zgodności to umożliwiają.

Wielowarstwowy model obsługi informacji o pochodzeniu obrazów wdrażany z Google SynthID

Metadane C2PA są istotnym fundamentem informacji o pochodzeniu multimediów. Pomagają one treściom przenosić dane o tym, skąd pochodzą, jak zostały utworzone lub edytowane oraz kto je podpisał. Jednak metadane nie są niezawodne, ponieważ mogą zostać usunięte, utracone podczas przesyłania i pobierania albo uszkodzone przez przekształcenia, takie jak zmiany formatu pliku, modyfikacje rozmiaru czy zrzuty ekranu.

Aby zwiększyć niezawodność rozpoznawania pochodzenia, przyjmujemy wielowarstwowe podejście i wdrażamy znakowanie wodne poprzez SynthID od Google DeepMind⁠(otwiera nowe okno), zaczynając od obrazów generowanych przez ChatGPT⁠, Codex lub OpenAI API. SynthID dodaje niewidoczną warstwę znaku wodnego, który stanowi uzupełnienie podejścia opartego na metadanych C2PA.

Od pewnego czasu zmierzaliśmy w kierunku takiego rozwiązania. Stosowaliśmy widoczne znaki wodne⁠ w Sora oraz znak wodny audio⁠ w Voice Engine i testowaliśmy oraz badaliśmy ich dokładność oraz niezawodność we wdrożeniach.

Obydwa te systemy współpracują ze sobą: C2PA pomaga treściom przenosić szczegółowy kontekst; SynthID pomaga zachować sygnał, na wypadek gdyby metadane zostały utracone. Znaki wodne maja większą szansę przetrwać podczas przekształceń treści, takich jak wykonywanie zrzutów ekranu, jednak metadane mogą zapewniać więcej informacji niż sam znak wodny. Wspólnie metody te sprawiają, że informacje o pochodzeniu są bardziej odporne na utratę, niż w przypadku gdyby były stosowane osobno.

Diagram porównujący dwa sygnały pochodzenia obrazu: C2PA dodaje podpisane metadane, które można zweryfikować, aby potwierdzić zaufanego wystawcę OpenAI, natomiast SynthID osadza sygnał na poziomie pikseli, który można wykryć, aby wskazać, czy obraz został zakodowany przez OpenAI.

Wykrywanie oraz zapowiedź naszego publicznego narzędzia weryfikacyjnego

Zaufane metadane i znaki wodne odporne na większość modyfikacji mogą sprawić, że sygnały pochodzenia będą trwalsze. Jednak użytkownicy potrzebują sposobu, by wykrywać te sygnały. Przygotowaliśmy więc ogólnodostępne narzędzie weryfikacyjne⁠, które pomoże sprawdzić, czy przesłany obraz został wygenerowany w ChatGPT, OpenAI API lub Codex, i zweryfikuje obecność sygnałów pochodzenia, w tym Content Credentials i SynthID.

Uważamy, że informacje o pochodzeniu powinny być łatwiejsze do weryfikacji i interpretacji, a nasze narzędzie integrujące wiele sygnałów może pomóc w uzyskaniu odpowiedzi na pytanie: „Czy to zostało wygenerowane przez AI?” Stanowi ono rozwinięcie naszego klasyfikatora wykrywania obrazów⁠ z 2024 roku i umożliwia wiarygodne wykrywanie, czy w materiale obecny jest znak wodny SynthID pochodzący z OpenAI, a także ujawnianie metadanych C2PA, gdy zostaną znalezione.

Strona internetowa OpenAI z wynikami weryfikacji przesłanego obrazu, potwierdzająca, że został on wygenerowany za pomocą narzędzi OpenAI, ponieważ wykryto sygnały SynthID i Content Credentials.

Żadna metoda wykrywania nie jest niezawodna, dlatego z ostrożnością należy podchodzić do sytuacji, gdy wykrywanie się nie powiedzie. Jeśli na przykład nie zostaną wykryte metadane ani znak wodny, narzędzie nie wyda jednoznacznej opinii, czy obraz został wygenerowany za pomocą narzędzi OpenAI, ponieważ sygnały pochodzenia mogą w niektórych przypadkach zostać usunięte.

Początkowo działanie narzędzia będzie ograniczone do treści generowanych przez OpenAI. W kolejnych miesiącach chcemy wspierać działania międzybranżowe, aby umożliwić weryfikację na różnych platformach. Później będziemy chcieli obsługiwać inne treści dostępne online.

Przyszłość

Żadna pojedyncza technika badania multimediów nie wystarczy do jednoznacznego określenia ich pochodzenia. Uważamy, że skuteczne podejście sprawdzające obejmuje wspólne standardy, trwałe sygnały znakowania wodnego i publiczną weryfikację. Mamy nadzieję, że długotrwałe wsparcie dla Content Credentials, uzyskanie zgodności z C2PA, wdrożenie SynthID i zapowiedź publicznych narzędzi weryfikacyjnych pozwolą nam w dłuższej perspektywie przyczynić się do stworzenia bardziej interoperacyjnego ekosystemu określania pochodzenia multimediów.