Sisu päritolu edendamine turvalisema ja läbipaistvama tehisaruökosüsteemi nimel
Aitame inimestel mõista tehisaru loodud sisu päritolu Content Credentialsi, SynthID ja varajase avaliku kontrollitööriista abil.
Inimesed kasutavad OpenAI tööriistu iga päev, et luua ja töödelda pilte ning heli viisil, mis muudab suhtluse väljendusrikkamaks, kasulikumaks ja kättesaadavamaks. Kuna need tööriistad saavad osaks sellest, kuidas inimesed loovad, kujutlevad ja jagavad, on oluline, et inimesed saaksid aru, kust meedia pärineb, ja seda kontrollida, et nad saaksid seda kindlamalt tõlgendada. Päritolusignaalid võivad aidata, andes inimestele konteksti selle kohta, kust sisu pärineb, kuidas see loodi või seda muudeti ning kas see on see, milleks ta end esitab.
Täna tugevdame oma lähenemist sisu päritolule mitmekihilise, ökosüsteemist lähtuva mudeliga, et suurendada usaldust veebis. Muudame oma päritolusignaalid teistele tööriistadele ja platvormidele hõlpsamini äratuntavaks C2PA vastavuse kaudu, lisame piltidele koostöös Google’iga vastupidava platvormideülese SynthID vesimärgistuse ning jagame eelvaadet tööriistast, millega avalikkus saab kontrollida, kas pildid pärinevad OpenAI-lt.
Koos tuginevad need uuendused meie varasemale tööle, et toetada avatud standardeid, muuta OpenAI loodud sisu hõlpsamalt tuvastatavaks ja teha kogu valdkonnas koostööd usaldusväärsema teabeökosüsteemi nimel.
OpenAI on tegelenud päritolustandardite arendamise ja kasutuselevõtuga alates 2024. aastast, mil hakkasime lisama Content Credentialsi piltidele, mille lõi DALL·E 3(avaneb uues aknas), ning hiljem ka ImageGeni(avaneb uues aknas) ja Sorasse(avaneb uues aknas). Liitusime ka Coalition for Content Provenance and Authenticity (C2PA) juhtkomiteega — see on eri valdkondi ühendav rühm, mis seisab sisu päritolu avatud tehnilise standardi taga. C2PA tehniline lähenemine kasutab metaandmeid ja krüptograafilisi allkirju, et aidata meediat puudutaval teabel turvaliselt koos sisuga liikuda. See teave sisaldab konteksti, mis aitab allikat hindavaid ajakirjanikke, tervikluse kohta otsuseid tegevaid platvorme ja inimesi, kes püüavad mõista, mida nad veebis näevad.
Tegime hiljuti sammu, millega OpenAI-st sai C2PA-le vastav generaatoritoode(avaneb uues aknas). C2PA-le vastavaks saades anname platvormidele usaldusväärse viisi lugeda, säilitada ja edasi kanda päritoluteavet, mille oma sisule lisame. See on oluline, sest päritolu toimib ainult siis, kui see säilib ka pärast esimest platvormi, kus sisu luuakse, ning vastavus teeb selle võimalikuks.
C2PA metaandmed on päritolu jaoks oluline alus. Need aitavad sisul kanda teavet selle kohta, kust see pärineb, kuidas see loodi või seda muudeti ja kes sellele teabele alla kirjutas. Kuid metaandmed ei ole eksimatud. Need võidakse eemaldada, need võivad üles- ja allalaadimisel kaduma minna või puruneda teisenduste, näiteks failivormingu muutmise, suuruse muutmise või ekraanipiltide tõttu.
Et muuta päritolu vastupidavamaks, rakendame mitmekihilist lähenemist ja võtame kasutusele vesimärgistuse Google DeepMindi SynthID(avaneb uues aknas) kaudu, alustades piltidest, mis on loodud ChatGPT, Codexi või OpenAI API abil. SynthID lisab nähtamatu vesimärgikihi, mis täiendab C2PA metaandmetel põhinevaid lähenemisi.
Oleme selle suunas liikunud juba mõnda aega. Oleme kasutanud nähtavaid vesimärke Sora-s ja helivesimärki Voice Engine’is ning jätkanud aja jooksul täpsuse ja töökindluse testimist ja uurimist. kasutuselevõtu kaudu.
Need kaks süsteemi tugevdavad teineteist. C2PA aitab sisul kanda üksikasjalikku konteksti; SynthID aitab säilitada signaali siis, kui metaandmed ei püsi alles. Vesimärgistus võib olla vastupidavam teisendustele, näiteks ekraanipiltidele, samas kui metaandmed võivad anda rohkem teavet kui üksnes vesimärk. Koos muudavad need päritolu vastupidavamaks, kui kumbki kiht seda eraldi suudaks.
Usaldusväärsed metaandmed ja enamikele muudatustele vastu pidavad vesimärgid võivad muuta päritolusignaalid püsivamaks. Kuid inimesed vajavad viisi nende signaalide tuvastamiseks. Nüüd näitame eelvaates avalikku kontrollitööriista, mis aitab inimestel kontrollida, kas üles laaditud pilt loodi ChatGPT‑s, OpenAI API abil või Codexiga, kontrollides, kas see sisaldab päritolusignaale, sealhulgas Content Credentialsi ja SynthID-d.
Usume, et inimestel peaks olema päritolu lihtsam kontrollida ja tõlgendada ning et meie tööriist aitab inimestel mängida rolli küsimusele „Kas see on tehisintellektiga loodud?“ vastamisel, integreerides mitmeid signaale. See tugineb õppetundidele, mis saadi meie pildituvastuse klassifikaatori esmasest teaduseelvaatest 2024. aastal, ning võimaldab inimestel usaldusväärselt tuvastada, kas meedias leidub OpenAI-st pärinev SynthID vesimärk, ja tuua nähtavale ka C2PA metaandmed, kui need leitakse.

Ükski tuvastusmeetod ei ole eksimatu, seega läheneme ettevaatlikult juhtudele, kus tuvastamine ebaõnnestub. Kui näiteks metaandmeid ega vesimärki ei tuvastata, ei tee tööriist lõplikku järeldust selle kohta, kas pilt loodi OpenAI tööriistadega, sest päritolusignaalid võidakse mõnel juhul eemaldada.
Käivitamisel piirdub tööriist OpenAI loodud sisuga. Järgmiste kuude jooksul soovime toetada kogu valdkonna pingutusi, et muuta kontrollimine võimalikuks eri platvormidel. Aja jooksul loodame toetada ka rohkemat tüüpi sisu, millega inimesed võivad veebis kokku puutuda.
Ühestki päritolutehnikast üksi ei piisa. Usume, et tugev lähenemine ühendab ühised standardid, vastupidavad vesimärgisignaalid ja avaliku kontrolli. Tuginedes oma pikaajalisele toetusele Content Credentialsi suhtes, saavutades C2PA vastavuse, võttes kasutusele SynthID ja näidates avaliku kontrollitööriistast eelvaadet, loodame pikemas plaanis panustada paremini koostalitlusvõimelisse päritoluökosüsteemi.


