Napredek pri izvoru vsebin za varnejši in preglednejši ekosistem UI
Pomagamo ljudem razumeti izvor vsebin, ustvarjenih z UI, s Content Credentials, SynthID in zgodnjim javnim orodjem za preverjanje.
Ljudje vsak dan uporabljajo orodja OpenAI za ustvarjanje in urejanje slik ter zvoka na načine, ki komunikacijo naredijo izrazitejšo, uporabnejšo in dostopnejšo. Ker ta orodja postajajo del tega, kako ljudje ustvarjajo, si predstavljajo in delijo, je pomembno, da lahko razumejo in preverijo, od kod mediji izvirajo, da jih lahko z večjim zaupanjem razlagajo. Signali izvora lahko pri tem pomagajo, saj ljudem dajejo kontekst o tem, od kod vsebina prihaja, kako je bila ustvarjena ali urejena in ali je to, za kar se predstavlja.
Danes krepimo svoj pristop k izvoru vsebin z večplastnim modelom, ki ga vodi ekosistem, za gradnjo zaupanja na spletu. Naše signale izvora drugim orodjem in platformam olajšujemo za prepoznavanje s skladnostjo s C2PA, slikam prek partnerstva z Googlom dodajamo trajno medplatformno vodno označevanje SynthID in delimo predogled orodja, s katerim lahko javnost preveri, ali slike izvirajo iz OpenAI.
Te posodobitve skupaj nadgrajujejo naše prejšnje delo za podporo odprtim standardom, lažje prepoznavanje vsebin, ki jih ustvari OpenAI, in sodelovanje v panogi za bolj zaupanja vreden informacijski ekosistem.
OpenAI sodeluje pri razvoju in uvajanju standardov izvora že od leta 2024, ko smo slikam, ustvarjenim z DALL·E 3(odpre se v novem oknu), začeli dodajati Content Credentials, pozneje pa še ImageGen(odpre se v novem oknu) in Sora(odpre se v novem oknu). Pridružili smo se tudi usmerjevalnemu odboru Coalition for Content Provenance and Authenticity (C2PA), medpanožne skupine, ki stoji za odprtim tehničnim standardom za izvor vsebin. Tehnični pristop C2PA uporablja metapodatke in kriptografske podpise, da informacije o posameznem mediju varno potujejo skupaj s samo vsebino. Te informacije vključujejo kontekst, ki pomaga novinarjem pri ocenjevanju vira, platformam pri odločitvah o integriteti in posameznikom, ki skušajo razumeti, kaj vidijo na spletu.
Pred kratkim smo naredili korak, da je OpenAI postal produkt, skladen s C2PA(odpre se v novem oknu). S tem, ko smo postali skladni s C2PA, platformam omogočamo zaupanja vreden način za branje, ohranjanje in posredovanje informacij o izvoru, ki jih pripnemo svoji vsebini. To je pomembno, ker izvor deluje le, če preživi tudi po prvi platformi, kjer je vsebina ustvarjena, skladnost pa to omogoča.
Metapodatki C2PA so pomemben temelj izvora. Vsebini pomagajo nositi informacije o tem, od kod prihaja, kako je bila ustvarjena ali urejena in kdo je te informacije podpisal. Toda metapodatki niso nezmotljivi. Lahko se odstranijo, izgubijo pri nalaganju in prenašanju ali pa jih pokvarijo preoblikovanja, kot so spremembe oblike datoteke, spreminjanje velikosti ali posnetki zaslona.
Da bi bil izvor bolj odporen, uvajamo večplasten pristop in vključujemo vodno označevanje prek SynthID podjetja Google DeepMind(odpre se v novem oknu), začenši s slikami, ustvarjenimi prek ChatGPT, Codex ali OpenAI API-ja. SynthID vgradi nevidno plast vodnega označevanja, ki dopolnjuje pristope C2PA, ki temeljijo na metapodatkih.
K temu stremimo že nekaj časa. V Sora smo uporabljali vidne vodne žige in v Voice Engine zvočni vodni žig, obenem pa smo skozi čas nadaljevali testiranje ter raziskovanje natančnosti in zanesljivosti z uvajanjem.
Ta dva sistema se medsebojno krepita. C2PA pomaga vsebini nositi podroben kontekst; SynthID pomaga ohraniti signal, ko metapodatki ne preživijo. Vodno označevanje je lahko obstojnejše pri preoblikovanjih, kot so posnetki zaslona, medtem ko lahko metapodatki zagotovijo več informacij kot sam vodni žig. Skupaj naredijo izvor odpornejši, kot bi ga naredila katera koli plast sama zase.
Zaupanja vredni metapodatki in vodni žigi, ki se upirajo večini sprememb, lahko naredijo signale izvora trajnejše. Toda ljudje potrebujejo način za zaznavanje teh signalov. Zdaj predstavljamo predogled javnega orodja za preverjanje, ki bo ljudem pomagalo preveriti, ali je bila naložena slika ustvarjena v ChatGPT, OpenAI API-ju ali Codex, tako da preveri, ali vsebuje signale izvora, vključno s Content Credentials in SynthID.
Verjamemo, da bi moral biti izvor za ljudi lažji za preverjanje in razlago ter da lahko naše orodje ljudem pomaga sodelovati pri odgovoru na vprašanje: »Ali je bilo to ustvarjeno z UI?« tako, da združuje več signalov. To nadgrajuje spoznanja iz začetnega raziskovalnega predogleda našega klasifikatorja za zaznavanje slik leta 2024 in ljudem omogoča zanesljivo zaznavanje, ali je v mediju prisoten vodni žig SynthID, ki izvira iz OpenAI, ter prikaz metapodatkov C2PA, kadar so najdeni.

Nobena metoda zaznavanja ni nezmotljiva, zato v primerih, ko zaznavanje ne uspe, uporabljamo previden pristop. Če na primer ni zaznan noben metapodatek ali vodni žig, orodje ne bo podalo dokončnega sklepa o tem, ali je bila slika ustvarjena z orodji OpenAI, saj se lahko signali izvora v nekaterih primerih odstranijo.
Ob zagonu je orodje omejeno na vsebino, ki jo ustvari OpenAI. V prihodnjih mesecih želimo podpreti medpanožna prizadevanja, da bi bilo preverjanje mogoče na različnih platformah. Sčasoma pričakujemo tudi podporo za več vrst vsebin, na katere lahko ljudje naletijo na spletu.
Nobena posamezna tehnika izvora sama po sebi ni dovolj. Verjamemo, da močan pristop združuje skupne standarde, trajne signale vodnega označevanja in javno preverjanje. Z nadgrajevanjem naše dolgoletne podpore za Content Credentials, doseganjem skladnosti s C2PA, uvedbo SynthID in predogledom javnih orodij za preverjanje upamo, da bomo dolgoročno prispevali k bolj interoperabilnemu ekosistemu izvora.


