Унапређење порекла садржаја за безбеднији и транспарентнији екосистем вештачке интелигенције
Помагање људима да разумеју порекло садржаја генерисаног вештачком интелигенцијом помоћу Content Credentials, SynthID и ране јавно доступне алатке за верификацију.
Људи свакодневно користе алате компаније OpenAI за креирање и уређивање слика и аудио-садржаја на начине који комуникацију чине изражајнијом, кориснијом и приступачнијом. Како ове алатке постају део начина на који људи стварају, замишљају и деле, важно је да људи могу да разумеју и провере одакле медијски садржај потиче како би могли да га тумаче са више сигурности. Сигнали о пореклу могу да помогну тако што људима пружају контекст о томе одакле садржај потиче, како је направљен или измењен и да ли је оно за шта се представља.
Данас оснажујемо свој приступ пореклу садржаја вишеслојним моделом заснованом на екосистему за изградњу поверења на интернету. Олакшавамо другим алаткама и платформама да препознају наше сигнале о пореклу кроз усаглашеност са C2PA стандардом, додајемо трајно SynthID обележавање слика воденим жигом на више платформи кроз партнерство са компанијом Google и делимо преглед алатке коју јавност може да користи да провери да ли слике потичу од компаније OpenAI.
Ова ажурирања се заједно надовезују на наш ранији рад како бисмо подржали отворене стандарде, олакшали препознавање садржаја који генерише OpenAI и сарађивали у целој индустрији на подршци поузданијем информационом екосистему.
Компанија OpenAI је од 2024. године ангажована на развоју и усвајању стандарда за утврђивање порекла, када смо почели да додајемо Content Credentials сликама које генерише DALL·E 3(отвара се у новом прозору), а касније и услугама ImageGen(отвара се у новом прозору) и Sora(отвара се у новом прозору). Такође смо се придружили Управном одбору Коалиције за порекло и аутентичност садржаја (C2PA) –међуиндустријска група која стоји иза отвореног техничког стандарда за порекло садржаја. Технички приступ C2PA користи метаподатке и криптографске потписе како би информације о медијском запису безбедно путовале заједно са самим садржајем. Ове информације обухватају контекст који помаже новинарима који процењују извор, платформама које доносе одлуке о интегритету и људима који покушавају да разумеју шта виде на интернету.
Недавно смо предузели корак да OpenAI постане производ за генерисање садржаја усклађен са C2PA стандардом(отвара се у новом прозору). Тиме што постајемо усаглашени са C2PA стандардом, платформама пружамо поуздан начин да читају, очувају и прослеђују информације о пореклу које придружујемо свом садржају. Ово је важно јер утврђивање порекла функционише само ако се очува изван прве платформе на којој је садржај креиран, а усаглашеност то омогућава.
C2PA метаподаци су важна основа за утврђивање порекла. Помаже садржају да садржи информације о томе одакле потиче, како је креиран или измењен и ко је потписао те информације. Међутим, метаподаци нису непогрешиви. Могу да се уклоне, изгубе током отпремања и преузимања или наруше приликом трансформација као што су промене формата датотеке, промена величине или снимци екрана.
Да бисмо ојачали отпорност утврђивања порекла, примењујемо вишеслојни приступ и укључујемо означавање воденим жиговима помоћу алатке SynthID компаније Google DeepMind(отвара се у новом прозору), почевши од слика генерисаних путем ChatGPT, алатке Codex или OpenAI API. SynthID уграђује невидљиви слој воденог жига који допуњује C2PA приступе засноване на метаподацима.
Већ неко време радимо на томе да дођемо до овога. Користили смо видљиве водене жигове у апликацији Sora и аудио водени жиг у систему Voice Engine, и наставили смо да током времена тестирамо и истражујемо тачност и поузданост. кроз примену.
Ова два система се међусобно појачавају. C2PA помаже садржају да носи детаљан контекст; SynthID помаже да се сачува сигнал када метаподаци не опстану. Означавање воденим жигом може бити отпорније на трансформације попут снимака екрана, док метаподаци могу да пруже више информација него сам водени жиг. Заједно, они чине утврђивање порекла отпорнијим него што би био било који од та два слоја сам за себе.
Поуздани метаподаци и водени жигови који су отпорни на већину измена могу учинити сигнале о пореклу постојанијим. Међутим, људима је потребан начин да открију ове сигнале. Сада представљамо пробну верзију јавно доступне алатке за верификацију која ће помоћи људима да провере да ли је отпремљена слика генерисана у услузи ChatGPT, путем OpenAI API или у алатки Codex, тако што ће проверити да ли садржи сигнале о пореклу, укључујући Content Credentials и SynthID.
Верујемо да би провера и тумачење порекла требало да буду лакши и да наша алатка може да помогне људима у одговарању на питање: „Да ли је ово генерисано помоћу вештачке интелигенције?” уз интегрисање више сигнала. Ово се надовезује на сазнања из почетног истраживачког прегледа нашег класификатора за детекцију слика из 2024. године и омогућава људима да поуздано утврде да ли је у медијском садржају присутан SynthID водени жиг који потиче од OpenAI-а, као и да прикажу C2PA метаподатке када се пронађу.

Ниједан метод детекције није потпуно поуздан, па примењујемо опрезан приступ у случајевима када детекција не успе. Ако, на пример, нису откривени метаподаци или водени жиг, алат неће донети коначан закључак о томе да ли је слика генерисана помоћу алата компаније OpenAI, јер се сигнали о пореклу у неким случајевима могу уклонити.
Приликом лансирања, алат је ограничен на садржај који генерише OpenAI. У предстојећим месецима настојаћемо да подржимо међусекторске напоре како би верификација била могућа на различитим платформама. Временом очекујемо да ћемо подржавати и више врста садржаја на које људи могу да наиђу на мрежи.
Ниједна појединачна техника за утврђивање порекла није довољна сама по себи. Сматрамо да робустан приступ обједињује заједничке стандарде, постојане сигнале воденог жига и јавну верификацију. Надовезујући се на нашу дугогодишњу подршку за Content Credentials, усклађивањем са C2PA, усвајањем SynthID-а и представљањем јавних алата за верификацију у прегледној верзији, надамо се да ћемо дугорочно допринети интероперабилнијем екосистему за утврђивање порекла.


