Satura izcelsmes noteikšanas attīstīšana drošākai un pārredzamākai AI ekosistēmai
Palīdzam sabiedrībai izprast MI ģenerēta satura izcelsmi, izmantojot Content Credentials, SynthID un publiskā verifikācijas rīka pirmo versiju.
Cilvēki katru dienu izmanto OpenAI rīkus, lai veidotu un rediģētu attēlus un audio tā, lai saziņa būtu izteiksmīgāka, noderīgāka un pieejamāka. Šiem rīkiem kļūstot par daļu no tā, kā cilvēki rada, iztēlojas un dalās, ir svarīgi, lai cilvēki varētu saprast un pārbaudīt, no kurienes medijs nāk, lai viņi to varētu interpretēt ar lielāku pārliecību. Izcelsmes signāli var palīdzēt, sniedzot cilvēkiem kontekstu par to, no kurienes saturs nāk, kā tas tika izveidots vai rediģēts un tas ir īsts un atbilst norādītajam.
Šodien mēs stiprinām savu pieeju satura izcelsmes noteikšanai, ieviešot daudzslāņainu, uz ekosistēmu balstītu modeli uzticēšanās veidošanai tiešsaistē. Nodrošinot atbilstību C2PA standartiem, mēs padarām mūsu izcelsmes signālus vieglāk atpazīstamus citiem rīkiem un platformām, sadarbībā ar Google pievienojam attēliem noturīgu starpplatformu SynthID ūdenszīmi, kā arī dalāmies ar rīka priekšskatījumu, ar kuru sabiedrība varēs pārbaudīt, vai attēlus ir ģenerējis OpenAI.
Visi šie atjauninājumi papildina mūsu iepriekšējo darbu atvērto standartu atbalstīšanā, lai padarītu OpenAI ģenerēto saturu vieglāk identificējamu un veicinātu sadarbību visā nozarē uzticamākas informācijas ekosistēmas izveidei.
OpenAI ir iesaistījies izcelsmes standartu izstrādē un ieviešanā kopš 2024. gada, kad sākām pievienot Content Credentials attēliem, ko ģenerējis DALL·E 3(atveras jaunā logā), un vēlāk arī ImageGen(atveras jaunā logā) un Sora(atveras jaunā logā). Mēs esam pievienojušies arī Coalition for Content Provenance and Authenticity (C2PA) vadības komitejai – starpnozaru grupai, kas izstrādā atvērto tehnisko standartu satura izcelsmei. C2PA tehniskā pieeja izmanto metadatus un kriptogrāfiskos parakstus, lai palīdzētu informācijai par medija vienību droši ceļot kopā ar pašu saturu. Šī informācija ietver kontekstu, kas palīdz žurnālistiem, kuri izvērtē avotu, platformām, kas pieņem integritātes lēmumus, un cilvēkiem, kuri cenšas saprast, ko viņi redz tiešsaistē.
Nesen mēs spērām soli, padarot OpenAI par standartiem C2PA atbilstošu ģeneratora produktu(atveras jaunā logā). Nodrošinot atbilstību C2PA, mēs sniedzam platformām uzticamu veidu, kā nolasīt, saglabāt un nodot tālāk izcelsmes informāciju, ko pievienojam savam saturam. Tas ir svarīgi, jo izcelsme darbojas tikai tad, ja tā saglabājas arī ārpus pirmās platformas, kurā saturs ir radīts, un atbilstība to padara iespējamu.
C2PA metadati ir būtisks pamats satura izcelsmes apliecināšanai Tie nodrošina, ka saturā saglabājas informācija par tā izcelsmi, izveidi vai rediģēšanu, kā arī par to, kas šos datus ir parakstījis. Taču metadati nav pilnībā aizsargāti pret manipulācijām. Tos var dzēst, tie var pazust augšupielādes un lejupielādes laikā, kā arī tikt sabojāti tādu izmaiņu dēļ, kā, laika formāta maiņa, mērogošana vai ekrānuzņēmumu veidošana.
Lai padarītu izcelsmi noturīgāku, mēs izmantojam daudzslāņainu pieeju un ieviešam ūdenszīmes ar Google DeepMind SynthID(atveras jaunā logā), sākot ar attēliem, kas ģenerēti ar ChatGPT, Codex vai OpenAI API. SynthID iestrādā neredzamu ūdenszīmes slāni, kas papildina uz C2PA metadatiem balstītās pieejas.
Mēs pie tā esam strādājuši jau kādu laiku. Mēs jau iepriekš esam izmantojuši redzamas ūdenszīmes Sora un audio ūdenszīmes risinājumā Voice Engine, kā arī laika gaitā turpinājuši testēt un pētīt precizitāti un uzticamību. ieviešanas procesā.
Šīs abas sistēmas viena otru papildina un stiprina. C2PA nodrošina, ka saturs ietver detalizētu kontekstu; savukārt SynthID palīdz saglabāt identifikācijas signālu pat tad, ja metadati tiek dzēsti. Ūdenszīmes var būt noturīgākas pret tādām izmaiņām kā ekrānuzņēmumu veidošana, savukārt metadati spēj sniegt plašāku informāciju nekā tikai viena pati ūdenszīme. Abas šīs tehnoloģijas kopā padara izcelsmes noteikšanu daudz drošāku, nekā spētu katrs slānis atsevišķi.
Uzticami metadati un pret lielāko daļu modifikāciju noturīgas ūdenszīmes, var padarīt izcelsmes signālus ievērojami ilgtspējīgākus. Taču cilvēkiem ir nepieciešams veids, kā šos signālus atklāt. Šobrīd mēs piedāvājam publiska verifikācijas rīka priekšskatījumu, kas palīdzēs cilvēkiem pārbaudīt, vai augšupielādēts attēls ir ģenerēts ar ChatGPT, OpenAI API vai Codex, analizējot, vai tas satur izcelsmes signālus, tostarp Content Credentials un SynthID.
Mēs uzskatām, ka izcelsmei vajadzētu būt vieglāk pārbaudāmai un interpretējamai un ka mūsu rīks, integrējot vairākus signālus, var palīdzēt sabiedrībai rast atbildi uz jautājumu: “Vai tas tika ģenerēts ar MI?” Tas balstās uz atziņām no mūsu attēlu noteikšanas klasifikatora sākotnējā pētniecības priekšskatījuma 2024. gadā un ļauj cilvēkiem ticami noteikt, vai mediju failā ir iestrādāta OpenAI SynthID ūdenszīme, kā arī uzrādīt atrastos C2PA metadatus.

Neviena noteikšanas metode nav pilnībā nevainojama, tāpēc gadījumos, kad identificēšana neizdodas, mēs ievērojam piesardzīgu pieeju. Piemēram, ja netiek atklāti ne metadati, ne ūdenszīme, rīks neizdarīs galīgu secinājumu par to, vai attēls tika ģenerēts ar OpenAI rīkiem, jo izcelsmes signāli dažos gadījumos var tikt dzēsti.
Palaišanas brīdī rīks spēj pārbaudīt tikai OpenAI ģenerēto saturu. Tuvāko mēnešu laikā mūsu mērķis ir atbalstīt starpnozaru centienus, lai nodrošinātu verifikācijas iespējas dažādās platformās. Laika gaitā mēs plānojam nodrošinat atbalstu vairākiem satura veidiem, ar kuriem cilvēki saskaras tiešsaistē.
Neviena atsevišķa izcelsmes noteikšanas metode pati par sevi nav pietiekama. Mēs uzskatām, ka spēcīga pieeja apvieno kopīgus standartus, noturīgus ūdenszīmju signālus un publisku verifikāciju. Balstoties uz mūsu ilgstošo atbalstu Content Credentials, nodrošinot atbalstu C2PA etandartiem, ieviešot SynthID un piedāvājot publiskās verifikācijas rīku priekšskatījumu, mēs ceram ilgtermiņā veicināt savietojamas izcelsmes ekosistēmu attīstību.


