Insaħħu l-provenjenza tal-kontenut għal ekosistema tal-IA aktar sigura u aktar trasparenti
Ngħinu lin-nies jifhmu l-oriġini tal-kontenut iġġenerat bl-IA permezz ta’ Content Credentials, SynthID, u għodda pubblika bikrija għall-verifika.
In-nies qed jużaw l-għodod ta' OpenAI kuljum biex joħolqu u jeditjaw immaġnijiet u awdjo b'modi li jagħmlu l-komunikazzjoni aktar espressiva, utli u aċċessibbli. Hekk kif dawn l-għodod isiru parti minn kif in-nies jibnu, jimmaġinaw u jaqsmu, huwa importanti li n-nies ikunu jistgħu jifhmu u jivverifikaw minn fejn ġejja l-midja sabiex ikunu jistgħu jinterpretawha b’aktar kunfidenza. Sinjali ta’ provenjenza jistgħu jgħinu billi jagħtu lin-nies kuntest dwar minn fejn ġie l-kontenut, kif inħoloq jew ġie editjat, u jekk hux dak li jgħid li hu.
Illum qed insaħħu l-approċċ tagħna għall-provenjenza tal-kontenut b’mudell b’diversi saffi, immexxi mill-ekosistema, biex nibnu fiduċja online. Qed nagħmlu s-sinjali ta’ provenjenza tagħna aktar faċli biex għodod u pjattaformi oħra jirrikonoxxuhom permezz tal-konformità ma’ C2PA, inżidu watermarking SynthID durabbli bejn il-pjattaformi mal-immaġnijiet permezz ta’ sħubija ma’ Google, u naqsmu ħarsa preliminari lejn għodda li l-pubbliku jista’ juża biex jivverifika jekk l-immaġnijiet ġewx minn OpenAI.
Flimkien, dawn l-aġġornamenti jibnu fuq ix- xogħol preċedenti tagħna biex nappoġġjaw standards miftuħa, nagħmlu l-kontenut iġġenerat minn OpenAI aktar faċli biex jiġi identifikat, u nikkollaboraw madwar l-industrija biex nappoġġjaw ekosistema tal-informazzjoni aktar affidabbli.
OpenAI ilha involuta fl-iżvilupp u l-adozzjoni tal-istandards tal-provenjenza mill-2024, meta bdejna nżidu l-Kredenzjali tal-Kontenut mal-immaġnijiet iġġenerati minn DALL·E 3(jinfetaħ f’tieqa ġdida) u aktar tard ma' ImageGen(jinfetaħ f’tieqa ġdida) u Sora(jinfetaħ f’tieqa ġdida). Ingħaqadna wkoll mal-Kumitat tat-Tmexxija tal-Coalition for Content Provenance and Authenticity (C2PA), il-grupp minn diversi industriji responsabbli għall-istandard tekniku miftuħ għall-provenjenza tal-kontenut. L-approċċ tekniku ta’ C2PA juża metadejta u firem kriptografiċi biex jgħin biex informazzjoni dwar biċċa midja tivvjaġġa b’mod sigur mal-kontenut innifsu. Din l-informazzjoni tinkludi kuntest li jgħin lill-ġurnalisti li jkunu qed jevalwaw sors, lill-pjattaformi li jkunu qed jieħdu deċiżjonijiet dwar l-integrità, u lin-nies li jkunu qed jippruvaw jifhmu dak li qed jaraw online.
Dan l-aħħar ħadna l-pass biex OpenAI jsir Prodott Ġeneratur Konformi ma’ C2PA(jinfetaħ f’tieqa ġdida). Billi nsiru konformi ma’ C2PA, qed nagħtu lill-pjattaformi mod affidabbli biex jaqraw, jippreservaw u jgħaddu ’l quddiem l-informazzjoni dwar il-provenjenza li nehmeż mal-kontenut tagħna. Dan huwa importanti għaliex il-provenjenza taħdem biss jekk tibqa’ tinżamm lil hinn mill-ewwel pjattaforma fejn jinħoloq il-kontenut, u l-konformità tagħmel dan possibbli.
Il-metadejta C2PA hija pedament importanti għall-provenjenza. Dan jgħin biex il-kontenut iġorr informazzjoni dwar minn fejn ġie, kif inħoloq jew ġie editjat, u min iffirma dik l-informazzjoni. Iżda l-metadata mhijiex infallibbli. Jista’ jitneħħa, jintilef waqt it-tlugħ u t-tniżżil, jew jitħassar minn trasformazzjonijiet bħal bidliet fil-format tal-fajl, tibdil fid-daqs, jew qbidiet tal-iskrin.
Biex nagħmlu l-provenjenza aktar reżiljenti, qed naddottaw approċċ b’diversi saffi u ninkorporaw il-watermarking permezz ta' SynthID ta' Google DeepMind(jinfetaħ f’tieqa ġdida), billi nibdew b’immaġnijiet iġġenerati permezz ta' ChatGPT, Codex, jew l-API ta' OpenAI. SynthID jinkorpora saff ta’ watermarking inviżibbli li jikkomplementa approċċi bbażati fuq il-metadati ta’ C2PA.
Ilna għal xi żmien naħdmu biex naslu għal dan. Użajna marki tal-ilma viżibbli f’Sora u marka tal-ilma tal-awdjo f’Voice Engine, u komplejna nittestjaw u nirriċerkaw il-preċiżjoni u l-affidabbiltà maż-żmien. permezz tal-iskjerament.
Dawn iż-żewġ sistemi jsaħħu lil xulxin. C2PA jgħin lill-kontenut iġorr kuntest dettaljat; SynthID jgħin biex jinżamm sinjal meta l-metadejta ma tibqax tinżamm. L-immarkar bil-watermark jista’ jkun aktar reżiljenti għal trasformazzjonijiet bħal screenshots, filwaqt li l-metadejta tista’ tipprovdi aktar informazzjoni minn watermark waħdu. Flimkien, jagħmlu l-provenjenza aktar reżiljenti milli jkun kull saff għalih waħdu.
Metadejta fdata u marki tal-ilma li jirreżistu l-biċċa l-kbira tal-modifiki jistgħu jagħmlu s-sinjali ta’ provenjenza aktar dejjiema. Iżda n-nies għandhom bżonn mod kif jidentifikaw dawn is-sinjali. Issa qed nipprevedu għodda pubblika ta’ verifika li se tgħin lin-nies jivverifikaw jekk immaġni mtella' ġietx iġġenerata fuq ChatGPT, l-API ta’ OpenAI, jew Codex, billi tiċċekkja jekk fihiex sinjali ta’ provenjenza, inklużi Content Credentials u SynthID.
Aħna nemmnu li l-provenjenza għandha tkun aktar faċli biex in-nies jivverifikawha u jinterpretawha, u li l-għodda tagħna tista’ tgħin lin-nies jaqdu rwol fit-tweġiba għall-mistoqsija, “Dan ġie ġġenerat bl-AI?” billi tintegra sinjali multipli. Dan jibni fuq it-tagħlimiet mill-preview inizjali tar-riċerka tal- klassifikatur tad-detezzjoni tal-immaġnijiet tagħna fl-2024 u jippermetti lin-nies jidentifikaw b’mod affidabbli jekk watermark SynthID li joriġina minn OpenAI huwiex preżenti fil-midja, kif ukoll juri l-metadejta C2PA meta tinstab.

L-ebda metodu ta’ detezzjoni mhu infallibbli, għalhekk nieħdu approċċ kawt f’każijiet meta d-detezzjoni tfalli. Jekk, pereżempju, ma tiġi skoperta l-ebda metadejta jew watermark, l-għodda mhux se tasal għal konklużjoni definittiva dwar jekk l-immaġni ġietx iġġenerata bl-għodod ta’ OpenAI, peress li s-sinjali ta’ provenjenza jistgħu, f’xi każijiet, jitneħħew.
Mat-tnedija, l-għodda hija limitata għal kontenut iġġenerat minn OpenAI. Fix-xhur li ġejjin, għandna l-għan li nappoġġaw sforzi bejn industriji differenti biex il-verifika tkun possibbli fuq pjattaformi differenti. Maż-żmien, nistennew ukoll li nappoġġaw aktar tipi ta’ kontenut li n-nies jistgħu jiltaqgħu magħhom online.
L-ebda teknika waħda ta’ provenjenza mhi biżżejjed waħedha. Aħna nemmnu li approċċ b’saħħtu jgħaqqad standards komuni, sinjali persistenti ta’ watermarking, u verifika pubblika. Billi nibnu fuq l-appoġġ fit-tul tagħna għal Content Credentials, insiru konformi ma’ C2PA, nadottaw SynthID, u noffru preview ta’ għodod pubbliċi ta’ verifika, nittamaw li fit-tul nikkontribwixxu għal ekosistema tal-provenjenza aktar interoperabbli.


