Përparimi i prejardhjes së përmbajtjes për një ekosistem IA-je më të sigurt dhe më transparent
Duke i ndihmuar njerëzit të kuptojnë origjinën e përmbajtjes së gjeneruar nga IA-ja përmes "Kredencialeve të përmbajtjes", SynthID dhe një mjeti të hershëm publik verifikimi.
Njerëzit po përdorin çdo ditë mjetet e OpenAI për të krijuar dhe redaktuar imazhe dhe audio në mënyra që e bëjnë komunikimin më shprehës, më të dobishëm dhe më të qasshëm. Ndërsa këto mjete bëhen pjesë e mënyrës se si njerëzit krijojnë, imagjinojnë dhe ndajnë, është e rëndësishme që ata të kuptojnë dhe verifikojnë nga vjen media, në mënyrë që ta interpretojnë me më shumë siguri. Sinjalet e prejardhjes mund të ndihmojnë duke u dhënë njerëzve kontekstin se nga erdhi përmbajtja, si u krijua ose u redaktua dhe nëse është ajo që pretendon të jetë.
Sot po e përforcojmë qasjen tonë ndaj prejardhjes së përmbajtjes për të ndërtuar besim në linjë nëpërmjet një modeli shumë-shtresor dhe të udhëhequr nga ekosistemi. Po i bëjmë sinjalet tona të prejardhjes më të lehta për t’u njohur nga mjete dhe platforma të tjera përmes përputhshmërisë me C2PA, duke i shtuar imazheve shenja sigurie të qëndrueshme dhe në shumë platforma të SynthID përmes një partneriteti me Google, dhe po ndajmë një pamje paraprake të një mjeti që publiku të mund ta përdorë për të verifikuar nëse imazhet vijnë nga OpenAI.
Së bashku, këto përditësime mbështeten te puna jonë e mëparshme për të mbështetur standarde të hapura, për ta bërë më të lehtë identifikimin e përmbajtjes së gjeneruar nga OpenAI dhe për të bashkëpunuar në të gjithë industrinë për mbështetjen e një ekosistemi informacioni më të besueshëm.
OpenAI është angazhuar në zhvillimin dhe adoptimin e standardeve të prejardhjes që nga viti 2024, kur filluam të shtonim "Kredencialet e përmbajtjes" tek imazhet e gjeneruara nga DALL-E 3(hapet në një dritare të re) dhe më vonë te ImageGen(hapet në një dritare të re) dhe Sora(hapet në një dritare të re). Ne iu bashkuam gjithashtu Komitetit Drejtues të Coalition for Content Provenance and Authenticity (C2PA), grupit në mbarë industrinë që qëndron pas standardit të hapur teknik për prejardhjen e përmbajtjes. Qasja teknike e C2PA përdor metadata dhe nënshkrime kriptografike për të ndihmuar që informacioni për një pjesë mediatike të udhëtojë në mënyrë të sigurt me vetë përmbajtjen. Ky informacion përfshin kontekstin që ndihmon gazetarët që vlerësojnë një burim, platformat që marrin vendime për integritetin dhe njerëzit që përpiqen të kuptojnë çfarë po shohin në linjë.
Së fundmi hodhëm hapin për ta bërë OpenAI një produkt gjenerues në përputhje me C2PA(hapet në një dritare të re). Duke u bërë në përputhje me C2PA, po u japim platformave një mënyrë të besueshme për të lexuar, ruajtur dhe përcjellë informacionin e prejardhjes që i bashkëngjisim përmbajtjes sonë. Kjo ka rëndësi sepse prejardhja funksionon vetëm nëse ajo mbetet e ruajtur përtej platformës së parë ku krijohet përmbajtja, dhe përputhshmëria e bën këtë të mundur.
Metadata e C2PA është një bazë e rëndësishme për prejardhjen. Ajo ndihmon që përmbajtja ta mbajë informacionin prej nga erdhi, si u krijua ose u redaktua dhe kush e nënshkroi atë informacion. Por metadata nuk është e pagabueshme. Ajo mund të hiqet, të humbasë gjatë ngarkimeve dhe shkarkimeve ose të prishet nga transformime si ndryshimet e formatit të skedarit, ndryshimi i madhësisë ose pamjet e ekranit.
Për ta bërë prejardhjen më rezistente, po ndjekim një qasje shumë-shtresore dhe po përfshijmë vendosjen e shenjave të sigurisë përmes SynthID të Google DeepMind(hapet në një dritare të re), duke filluar me imazhet e gjeneruara përmes ChatGPT, Codex ose OpenAI API. SynthID fut një shtresë të padukshme të shenjave të sigurisë që plotëson qasjet e bazuara në metadata të C2PA.
Kemi kohë që po punojmë drejt kësaj. Kemi përdorur shenja sigurie të dukshme në Sora dhe një shenjë sigurie audio në Voice Engine, si edhe kemi vazhduar të testojmë e studiojmë saktësinë dhe besueshmërinë me kalimin e kohës. përmes zbatimit.
Këto dy sisteme e përforcojnë njëri-tjetrin. C2PA ndihmon që përmbajtja të mbajë kontekst të detajuar; SynthID ndihmon të ruhet një sinjal kur metadata nuk mbijeton. Vendosja e shenjave të sigurisë mund të jetë më i qëndrueshëm ndaj transformimeve si pamjet e ekranit, ndërsa metadata mund të ofrojë më shumë informacion sesa vetëm një shenjë sigurie. Së bashku, ato e bëjnë prejardhjen më rezistente sesa do të ishte secila shtresë më vete.
Metadata e besueshme dhe shenjat e sigurisë që i rezistojnë shumicës së modifikimeve mund t’i bëjnë sinjalet e prejardhjes më të qëndrueshme. Por njerëzve u duhet një mënyrë për t’i zbuluar këto sinjale. Tani po prezantojmë një pamje paraprake të një mjeti publik verifikimi që do t’i ndihmojë njerëzit të verifikojnë nëse një imazh i ngarkuar është gjeneruar në ChatGPT, OpenAI API ose Codex, duke kontrolluar nëse përmban sinjale prejardhjeje, duke përfshirë kredencialet e përmbajtjes dhe SynthID.
Ne besojmë se prejardhja duhet të jetë më e lehtë për t’u verifikuar dhe interpretuar nga njerëzit dhe se mjeti ynë mund t’i ndihmojë ata të luajnë një rol në përgjigjen e pyetjes: “A është gjeneruar kjo me IA?” duke integruar sinjale të shumëfishta. Kjo bazohet në mësimet nga pamja paraprake fillestare kërkimore e klasifikuesit tonë për zbulimin e imazheve në vitin 2024 dhe u mundëson njerëzve të zbulojnë me besueshmëri nëse në media është i pranishëm një shenjë sigurie e SynthID me origjinë nga OpenAI, si edhe të shfaqin metadata C2PA kur ato gjenden.

Asnjë metodë zbulimi nuk është e pagabueshme, ndaj ndjekim një qasje të kujdesshme në rastet kur zbulimi dështon. Nëse nuk zbulohet metadata ose shenja e sigurisë, për shembull, mjeti nuk do të nxjerrë një konkluzion përfundimtar nëse imazhi është gjeneruar me mjetet e OpenAI, pasi sinjalet e prejardhjes në disa raste mund të hiqen.
Në lançim, mjeti kufizohet te përmbajtja e gjeneruar nga OpenAI. Në muajt në vijim, synojmë të mbështesim përpjekjet ndërindustriale për ta bërë verifikimin të mundur nëpër platforma. Me kalimin e kohës, presim gjithashtu të mbështesim më shumë lloje përmbajtjeje që njerëzit mund të hasin në linjë.
Asnjë teknikë e vetme prejardhjeje nuk mjafton e marrë më vete. Ne besojmë se një qasje e fortë kombinon standarde të përbashkëta, sinjale me shenja sigurie të qëndrueshme dhe verifikim publik. Duke u bazuar te mbështetja jonë afatgjate për "Kredencialet e përmbajtjes", duke qenë në përputhje me C2PA, duke adoptuar SynthID dhe duke prezantuar paraprakisht mjete publike verifikimi, ne shpresojmë të kontribuojmë në mënyrë afatgjate për një ekosistem prejardhjeje më të ndërveprueshëm.


