A tartalmak származáskövetésének fejlesztése egy biztonságosabb, átláthatóbb MI-ökoszisztémáért
Segítünk az embereknek megérteni a MI által generált tartalmak eredetét a Content Credentials, a SynthID és egy korai nyilvános ellenőrző eszköz révén.
Az emberek nap mint nap használják az OpenAI eszközeit képek és hanganyagok létrehozására és szerkesztésére, még kifejezőbbé, hasznosabbá és hozzáférhetőbbé téve a kommunikációt. Ahogy ezek az eszközök egyre inkább részévé válnak annak, ahogyan az emberek alkotnak, elképzelnek és megosztanak dolgokat, fontos, hogy megértsék és ellenőrizni tudják, honnan származik a média, hogy nagyobb bizalommal értelmezhessék azt. A származási jelzések ebben úgy segíthetnek, hogy kontextust adnak arról, honnan származik a tartalom, hogyan hozták létre vagy szerkesztették, és valóban az-e, aminek állítja magát.
Ma tovább erősítjük a tartalmak származására vonatkozó megközelítésünket egy többrétegű, ökoszisztéma-alapú modellel, amely az online bizalom építését szolgálja. A C2PA-megfelelőség révén megkönnyítjük, hogy más eszközök és platformok felismerjék származási jelzéseinket, a Google-lal való együttműködésben tartós, platformokon átívelő SynthID-vízjelezést adunk a képekhez, és bemutatjuk egy olyan eszköz előzetesét, amellyel a nyilvánosság ellenőrizheti, hogy a képek az OpenAI-tól származnak-e.
Ezek a frissítések együtt a nyílt szabványok támogatására, az OpenAI által létrehozott tartalmak könnyebb azonosíthatóságára és egy megbízhatóbb információs ökoszisztéma iparági együttműködésben történő támogatására irányuló korábbi munkánkra épülnek.
Az OpenAI 2024 óta vesz részt a származási szabványok fejlesztésében és bevezetésében, amikor elkezdtük a Content Credentials hozzáadását a DALL·E 3(új ablakban nyílik meg), majd később az ImageGen(új ablakban nyílik meg) és a Sora(új ablakban nyílik meg) által generált képekhez. Csatlakoztunk továbbá a Coalition for Content Provenance and Authenticity (C2PA) irányító bizottságához is, ahhoz az iparágakon átívelő csoporthoz, amely a tartalmak származására vonatkozó nyílt technikai szabvány mögött áll. A C2PA technikai megközelítése metaadatokat és kriptográfiai aláírásokat használ, hogy a médiatartalomra vonatkozó információk biztonságosan együtt mozoghassanak magával a tartalommal. Ezek az információk olyan kontextust tartalmaznak, amely segíti a forrást értékelő újságírókat, az integritási döntéseket hozó platformokat és azokat az embereket, akik meg akarják érteni, mit látnak online.
Nemrég megtettük azt a lépést, hogy az OpenAI C2PA Conforming Generator Product(új ablakban nyílik meg) lett. Azzal, hogy C2PA-megfelelővé váltunk, megbízható módot adunk a platformoknak arra, hogy elolvassák, megőrizzék és továbbadják a tartalmainkhoz csatolt származási információkat. Ez azért fontos, mert a származáskövetés csak akkor működik, ha túléli azt az első platformot, ahol a tartalom létrejön, és a megfelelőség ezt teszi lehetővé.
A C2PA-metaadatok a származáskövetés fontos alapját jelentik. Segítenek abban, hogy a tartalom információt hordozzon arról, honnan származik, hogyan hozták létre vagy szerkesztették, és ki írta alá ezeket az információkat. A metaadatok azonban nem tévedhetetlenek. Eltávolíthatók, elveszhetnek feltöltések és letöltések során, vagy sérülhetnek olyan átalakítások miatt, mint a fájlformátum-váltás, az átméretezés vagy a képernyőképek.
Hogy ellenállóbbá tegyük a származáskövetést, többrétegű megközelítést alkalmazunk, és vízjelezést építünk be a Google DeepMind SynthID-jén(új ablakban nyílik meg) keresztül, kezdve a ChatGPT, a Codex vagy az OpenAI API által generált képekkel. A SynthID egy láthatatlan vízjelezési réteget ágyaz be, amely kiegészíti a C2PA metaadat-alapú megközelítéseit.
Ezen már egy ideje dolgozunk. A Sorában látható vízjeleket, a Voice Engine-ben pedig hangvízjelet használtunk, és idővel tovább teszteltük és kutattuk ezek pontosságát és megbízhatóságát. az éles bevezetés során.
Ez a két rendszer erősíti egymást. A C2PA segít abban, hogy a tartalom részletes kontextust hordozzon; a SynthID pedig segít megőrizni egy jelzést, amikor a metaadatok nem maradnak fenn. A vízjelezés tartósabb lehet olyan átalakításokon keresztül, mint a képernyőképek, míg a metaadatok több információt adhatnak, mint önmagában egy vízjel. Együtt ellenállóbbá teszik a származáskövetést, mint bármelyik réteg önmagában.
A megbízható metaadatok és a legtöbb módosításnak ellenálló vízjelek tartósabbá tehetik a származási jelzéseket. Az embereknek azonban szükségük van egy módra e jelzések észleléséhez. Most bemutatjuk egy nyilvános ellenőrző eszköz előzetesét, amely segít az embereknek ellenőrizni, hogy egy feltöltött képet a ChatGPT‑ben, az OpenAI API-jal vagy a Codexszel hoztak-e létre, annak vizsgálatával, hogy tartalmaz-e származási jelzéseket, köztük Content Credentials-t és SynthID-t.
Úgy gondoljuk, hogy a származáskövetést az emberek számára könnyebben ellenőrizhetővé és értelmezhetővé kell tenni, és hogy eszközünk többféle jel integrálásával segíthet nekik szerepet vállalni a következő kérdés megválaszolásában: „Ezt a mesterséges intelligencia generálta?” Ez a 2024-es képfelismerő osztályozónk kezdeti kutatási előzeteséből származó tanulságokra épül, és lehetővé teszi, hogy az emberek megbízhatóan észleljék, jelen van-e a médiában egy OpenAI-tól származó SynthID-vízjel, valamint megjelenítsék a C2PA-metaadatokat, amikor azok megtalálhatók.

Egyetlen észlelési módszer sem tévedhetetlen, ezért óvatos megközelítést alkalmazunk azokban az esetekben, amikor az észlelés sikertelen. Ha például nem észlelhető sem metaadat, sem vízjel, az eszköz nem von le végleges következtetést arról, hogy a képet OpenAI-eszközökkel generálták-e, mivel a származási jelzések bizonyos esetekben eltávolíthatók.
Induláskor az eszköz az OpenAI által generált tartalmakra korlátozódik. A következő hónapokban célunk támogatni az iparágakon átívelő erőfeszítéseket, hogy a hitelesítés platformokon átívelően is lehetővé váljon. Idővel várhatóan többféle tartalomtípust is támogatunk majd, amelyekkel az emberek online találkozhatnak.
Önmagában egyetlen származáskövetési technika sem elegendő. Úgy gondoljuk, hogy az erős megközelítés a közös szabványokat, a tartós vízjelezési jelzéseket és a nyilvános ellenőrzést ötvözi. A Content Credentials melletti régóta fennálló támogatásunkra építve, a C2PA-megfelelőség elérésével, a SynthID bevezetésével és a nyilvános ellenőrzési eszközök előzetesének bemutatásával reméljük, hogy hosszú távon hozzájárulhatunk egy interoperábilisabb származáskövetési ökoszisztémához.


