Жасанды интеллект экожүйесін қауіпсіз әрі ашық ету үшін контенттің шығу тегін анықтау мүмкіндігін дамыту
Content Credentials, SynthID және бастапқы ашық тексеру құралы арқылы адамдарға жасанды интеллект жасаған контенттің шығу тегін түсінуге көмектесу.
Адамдар OpenAI құралдарын күн сайын суреттер мен аудионы жасау және өңдеу үшін пайдаланып, қарым-қатынасты анағұрлым мәнерлі, пайдалы әрі қолжетімді етуде. Бұл құралдар адамдардың жасау, қиялдау және бөлісу тәсілдерінің бір бөлігіне айналған сайын, медианың қайдан шыққанын түсіну және тексеру маңызды бола түседі. Осылайша адамдар оны сенімдірек қабылдап, дұрыс түсіндіре алады. Контенттің шығу тегі туралы сигналдар адамдарға контенттің қайдан шыққанын, қалай жасалғанын немесе өңделгенін және оның мәлімделген сипатқа қаншалықты сай екенін түсінуге көмектеседі.
Бүгін біз онлайн ортада сенім қалыптастыру үшін көп деңгейлі, экожүйеге негізделген модель арқылы контенттің шығу тегін анықтауға қатысты тәсілімізді күшейтіп жатырмыз. Біз C2PA талаптарына сәйкестік арқылы шығу тегін көрсететін сигналдарымызды басқа құралдар мен платформалардың тануын жеңілдетіп жатырмыз, Google компаниясымен серіктестік арқылы кескіндерге ұзақ сақталатын, кросс-платформалық SynthID сутаңбасын қосып жатырмыз және жұртшылық кескіндердің OpenAI-дан шыққанын тексеру үшін пайдалана алатын құралдың алдын ала нұсқасымен бөлісіп жатырмыз.
Бұл жаңартулар жиынтығында ашық стандарттарды қолдауға, OpenAI жасаған контентті оңайырақ анықтауға және сенімдірек ақпараттық экожүйені қолдау үшін бүкіл сала бойынша ынтымақтастық жасауға бағытталған алдыңғы жұмысымызды дамытады.
OpenAI 2024 жылдан бері дереккөзді растау стандарттарын әзірлеу және енгізу жұмыстарымен айналысып келеді. Сол жылы біз DALL-E 3(жаңа терезеде ашылады) жасаған суреттерге, кейінірек ImageGen(жаңа терезеде ашылады) және Sora(жаңа терезеде ашылады) жасаған суреттерге Content Credentials қоса бастадық. Біз сондай-ақ контенттің шығу тегіне арналған ашық техникалық стандартты әзірлеген салааралық топ — Контенттің шығу тегі мен түпнұсқалығы коалициясының (C2PA) басқарушы комитетіне қосылдық. C2PA-ның техникалық тәсілі медиа материалы туралы ақпараттың контенттің өзімен бірге қауіпсіз түрде ілесіп жүруіне көмектесу үшін метадеректер мен криптографиялық қолтаңбаларды пайдаланады. Бұл ақпарат дереккөзді бағалайтын журналистерге, тұтастыққа қатысты шешімдер қабылдайтын платформаларға және онлайнда көріп отырғанын түсінуге тырысатын адамдарға көмектесетін мәнмәтінді қамтиды.
Жақында біз OpenAI-ды C2PA талаптарына сай генератор өнімі(жаңа терезеде ашылады) ету қадамын жасадық. C2PA талаптарына сай бола отырып, біз платформаларға контентімізге тіркейтін шығу тегі туралы ақпаратты оқудың, сақтаудың және әрі қарай жеткізудің сенімді тәсілін ұсынамыз. Бұл маңызды, өйткені контенттің шығу тегі туралы деректер контент жасалған алғашқы платформадан тыс жерде де сақталып қалса ғана жұмыс істейді, ал талаптарға сәйкестік соны мүмкін етеді.
C2PA метадеректері шығу тегін қадағалаудың маңызды негізі болып табылады. Ол контентке оның қайдан шыққаны, қалай жасалғаны немесе өңделгені және сол ақпаратқа кім қол қойғаны туралы ақпаратты қамтуға көмектеседі. Бірақ метадеректер қателіктен толық қорғай алмайды. Ол жойылып тасталуы, жүктеп салу және жүктеп алу кезінде жоғалуы немесе файл пішімін өзгерту, өлшемін өзгерту не скриншот жасау сияқты түрлендірулер салдарынан бұзылуы мүмкін.
Контенттің шығу тегі туралы ақпаратты анағұрлым сенімді ету үшін біз көпдеңгейлі тәсілді қолданып, Google DeepMind’s SynthID(жаңа терезеде ашылады) арқылы сутаңбасын енгіземіз. Бұл жұмыс ChatGPT, Codex немесе OpenAI API интерфейсі арқылы жасалған суреттерден басталады. SynthID C2PA метадеректеріне негізделген тәсілдерді толықтыратын көрінбейтін сутаңбалау қабатын ендіреді.
Біз бұл бағытта біраз уақыттан бері жұмыс істеп келеміз. Біз Sora-да көрінетін сутаңбаларды, ал Voice Engine-де аудио сутаңбаны қолдандық және уақыт өте келе олардың дәлдігі мен сенімділігін тексеріп, зерттеуді жалғастырып келеміз. енгізу арқылы.
Бұл екі жүйе бірін-бірі күшейтеді. C2PA контентте егжей-тегжейлі контекстті сақтауға көмектеседі, ал SynthID метадеректер сақталмаған жағдайда сигналдың сақталуына көмектеседі. Сутаңбалау скриншот жасау сияқты түрлендірулерден кейін де тұрақтырақ сақталуы мүмкін, ал метадеректер сутаңбаның өзіне қарағанда көбірек ақпарат бере алады. Бірге қолданылғанда, олар контенттің шығу тегін анықтау жүйесін әр қабат жеке жұмыс істегендегіге қарағанда әлдеқайда тұрақты етеді.
Сенімді метадеректер мен өзгертулердің көпшілігіне төзімді сутаңбалар шығу тегі туралы сигналдарды тұрақтырақ ете алады. Бірақ адамдарға бұл сигналдарды анықтау тәсілі қажет. Енді біз көпшілікке арналған тексеру құралының алдын ала нұсқасын ұсынып отырмыз. Ол жүктеп салынған суретте Content Credentials және SynthID сияқты шығу тегі туралы сигналдарды бар-жоғын тексеру арқылы оның ChatGPT, OpenAI API немесе Codex арқылы жасалған-жасалмағанын анықтауға көмектеседі.
Біздің ойымызша, адамдарға контенттің шығу тегін тексеру және түсіндіру оңай болуы керек. Ал біздің құрал бірнеше белгіні біріктіру арқылы «Бұл жасанды интеллект арқылы жасалды ма?» деген сұраққа жауап табуға көмектеседі. Бұл 2024 жылы біздің кескінді анықтау жіктеуішіміздің зерттеу мақсатындағы бастапқы алдын ала нұсқасынан алынған тәжірибеге сүйенеді және адамдарға OpenAI-дан шыққан SynthID сутаңбасының медиада бар-жоғын сенімді түрде анықтауға, сондай-ақ C2PA метадеректері табылған жағдайда оларды көрсетуге мүмкіндік береді.

Ешбір анықтау әдісі мінсіз емес, сондықтан анықтау сәтсіз болған жағдайларда біз сақтықпен әрекет етеміз. Мысалы, метадеректер немесе сутаңба анықталмаса, құрал суреттің OpenAI құралдары арқылы жасалған-жасалмағаны туралы нақты қорытынды шығармайды, себебі кейбір жағдайларда шығу тегі туралы сигналдары алынып тасталуы мүмкін.
Іске қосылған кезде құрал тек OpenAI жасаған контентпен ғана шектеледі. Алдағы айларда біз әртүрлі платформада тексеруді мүмкін етуге бағытталған салааралық бастамаларды қолдауды жоспарлап отырмыз. Уақыт өте келе біз адамдар онлайн ортада кездестіруі мүмкін контент түрлерін көбірек қолдауды да жоспарлап отырмыз.
Контенттің шығу тегін анықтаудың бір ғана әдісі өз алдына жеткіліксіз. Біздің ойымызша, сенімді тәсіл ортақ стандарттарды, тұрақты сутаңба сигналдарын және көпшілікке арналған тексеру мүмкіндігін біріктіруі керек. Content Credentials-ті ұзақ уақыт бойы қолдауымызды жалғастырып, C2PA талаптарына сай болып, SynthID-ді енгізіп және көпшілікке арналған тексеру құралдарының алдын ала нұсқасын ұсына отырып, біз ұзақ мерзімде өзара үйлесімді шығу тегін қадағалау экожүйесін дамытуға үлес қосуды көздейміз.


