Unapređenje porijekla sadržaja za sigurniji i transparentniji AI ekosistem
Pomažemo ljudima da razumiju porijeklo sadržaja generisanog AI-jem kroz Content Credentials, SynthID i rani javni alat za verifikaciju.
Ljudi svakodnevno koriste OpenAI alate za kreiranje i uređivanje slika i zvuka na načine koji komunikaciju čine izražajnijom, korisnijom i pristupačnijom. Kako ovi alati postaju dio načina na koji ljudi stvaraju, zamišljaju i dijele, važno je da mogu razumjeti i provjeriti odakle mediji potiču kako bi ih tumačili s više sigurnosti. Signali porijekla mogu pomoći tako što ljudima daju kontekst o tome odakle sadržaj potiče, kako je kreiran ili uređen i da li je ono za šta se predstavlja.
Danas jačamo naš pristup porijeklu sadržaja višeslojnim modelom izgrađenim oko ekosistema za jačanje povjerenja na internetu. Naše signale porijekla činimo lakšim za prepoznavanje drugim alatima i platformama kroz usklađenost s C2PA, dodajemo trajno međusistemsko SynthID vodeno označavanje slikama kroz partnerstvo s Googleom i dijelimo pregled alata koji javnost može koristiti da provjeri da li slike potiču od OpenAI-ja.
Zajedno, ova ažuriranja nadograđuju naš raniji rad na podršci otvorenim standardima, lakšem prepoznavanju sadržaja koji generiše OpenAI i saradnji širom industrije radi podrške pouzdanijem informacijskom ekosistemu.
OpenAI učestvuje u razvoju i usvajanju standarda porijekla još od 2024. godine, kada smo počeli dodavati Content Credentials slikama generisanim pomoću DALL·E 3(otvara se u novom prozoru), a kasnije i ImageGen(otvara se u novom prozoru) i Sora(otvara se u novom prozoru). Također smo se pridružili Upravnom odboru Coalition for Content Provenance and Authenticity (C2PA), međusektorske grupe koja stoji iza otvorenog tehničkog standarda za porijeklo sadržaja. Tehnički pristup C2PA koristi metapodatke i kriptografske potpise kako bi informacije o određenom medijskom sadržaju sigurno putovale zajedno sa samim sadržajem. Te informacije uključuju kontekst koji pomaže novinarima pri procjeni izvora, platformama pri donošenju odluka o integritetu i ljudima koji pokušavaju razumjeti šta vide na internetu.
Nedavno smo poduzeli korak da OpenAI postane C2PA Conforming Generator Product(otvara se u novom prozoru). Time što smo postali usklađeni s C2PA, platformama pružamo pouzdan način da čitaju, sačuvaju i prosljeđuju informacije o porijeklu koje prilažemo svom sadržaju. To je važno jer porijeklo funkcioniše samo ako opstane i nakon prve platforme na kojoj je sadržaj kreiran, a usklađenost to omogućava.
C2PA metapodaci su važan temelj za porijeklo. Oni pomažu da sadržaj nosi informacije o tome odakle potiče, kako je kreiran ili uređen i ko je potpisao te informacije. Ali metapodaci nisu nepogrešivi. Mogu biti uklonjeni, izgubljeni tokom otpremanja i preuzimanja ili narušeni transformacijama poput promjene formata datoteke, promjene veličine ili snimaka ekrana.
Da bismo porijeklo učinili otpornijim, primjenjujemo višeslojni pristup i uvodimo vodeno označavanje kroz SynthID kompanije Google DeepMind(otvara se u novom prozoru), počevši od slika generisanih putem ChatGPT, Codexa ili OpenAI API-ja. SynthID ugrađuje nevidljivi sloj vodenog žiga koji dopunjuje pristupe zasnovane na C2PA metapodacima.
Na ovome radimo već neko vrijeme. Koristili smo vidljive vodene žigove u Sora i audio vodeni žig u Voice Engineu, te smo nastavili testirati i istraživati tačnost i pouzdanost tokom vremena. kroz primjenu.
Ova dva sistema međusobno se nadopunjuju. C2PA pomaže da sadržaj nosi detaljan kontekst; SynthID pomaže očuvati signal kada metapodaci ne opstanu. Vodeno označavanje može biti trajnije kroz transformacije poput snimaka ekrana, dok metapodaci mogu pružiti više informacija nego sam vodeni žig. Zajedno čine porijeklo otpornijim nego što bi bilo koji od ta dva sloja mogao samostalno.
Pouzdani metapodaci i vodeni žigovi koji odolijevaju većini izmjena mogu učiniti signale porijekla trajnijim. Ali ljudima je potreban način da otkriju te signale. Sada predstavljamo pregled javnog alata za verifikaciju koji će pomoći ljudima da provjere da li je učitana slika generisana u ChatGPT‑u, putem OpenAI API-ja ili Codexa, provjerom sadrži li signale porijekla, uključujući Content Credentials i SynthID.
Vjerujemo da bi ljudima trebalo biti lakše provjeriti i interpretirati porijeklo, te da naš alat može pomoći ljudima da odigraju ulogu u odgovaranju na pitanje: „Je li ovo generirano pomoću umjetne inteligencije?“ integrirajući više signala. Ovo se nadovezuje na saznanja iz početnog istraživačkog pregleda našeg klasifikatora za detekciju slika iz 2024. i omogućava ljudima da pouzdano otkriju da li je u mediju prisutan SynthID vodeni žig koji potiče od OpenAI-ja, kao i da prikažu C2PA metapodatke kada se pronađu.

Nijedna metoda detekcije nije nepogrešiva, pa u slučajevima kada detekcija ne uspijeva pristupamo oprezno. Ako se, na primjer, ne otkriju ni metapodaci ni vodeni žig, alat neće donijeti konačan zaključak o tome da li je slika generisana OpenAI alatima, jer signali porijekla u nekim slučajevima mogu biti uklonjeni.
Pri pokretanju, alat je ograničen na sadržaj koji generiše OpenAI. U narednim mjesecima cilj nam je podržati međusektorske napore da verifikacija bude moguća na različitim platformama. S vremenom očekujemo i podršku za više vrsta sadržaja s kojima se ljudi mogu susresti na internetu.
Nijedna pojedinačna tehnika porijekla sama po sebi nije dovoljna. Vjerujemo da snažan pristup kombinuje zajedničke standarde, trajne signale vodenog žiga i javnu verifikaciju. Nadovezujući se na našu dugogodišnju podršku za Content Credentials, usklađivanje s C2PA, usvajanje SynthID-a i predstavljanje javnih alata za verifikaciju, nadamo se da ćemo dugoročno doprinijeti interoperabilnijem ekosistemu porijekla.


