Розвиток системи визначення походження контенту для безпечнішої й прозорішої екосистеми ШІ
Допомагаємо людям розуміти походження контенту, згенерованого ШІ, за допомогою Content Credentials, SynthID і раннього публічного інструмента перевірки.
Люди щодня використовують інструменти OpenAI, щоб створювати й редагувати зображення та аудіо так, щоб спілкування ставало виразнішим, кориснішим і доступнішим. Оскільки ці інструменти стають частиною того, як люди створюють, уявляють і поширюють контент, важливо, щоб вони могли розуміти й перевіряти, звідки походить медіа, аби впевненіше його інтерпретувати. Допомогти в цьому можуть сигнали походження, надаючи людям контекст про те, звідки взявся контент, як його було створено чи відредаговано, і чи є він тим, за що себе видає.
Сьогодні ми посилюємо наш підхід до визначення походження контенту за допомогою багаторівневої, орієнтованої на екосистему моделі побудови довіри онлайн. Ми робимо наші сигнали походження простішими для розпізнавання іншими інструментами й платформами завдяки відповідності C2PA, додаємо стійкі міжплатформні водяні знаки SynthID до зображень у партнерстві з Google і ділимося попереднім переглядом інструмента, яким громадськість зможе перевіряти, чи походять зображення від OpenAI.
Разом ці оновлення розвивають нашу попередню роботу з підтримки відкритих стандартів, спрощення ідентифікації контенту, створеного OpenAI, і співпраці в усій галузі задля надійнішої інформаційної екосистеми.
OpenAI бере участь у розробці та впровадженні стандартів визначення походження з 2024 року, коли ми почали додавати Content Credentials до зображень, згенерованих DALL·E 3(відкривається у новому вікні), а згодом і до ImageGen(відкривається у новому вікні) та Sora(відкривається у новому вікні). Ми також увійшли до Керівного комітету Coalition for Content Provenance and Authenticity (C2PA) — міжгалузевої групи, що стоїть за відкритим технічним стандартом походження контенту. Технічний підхід C2PA використовує метадані та криптографічні підписи, щоб інформація про медіафайл могла безпечно передаватися разом із самим контентом. Ця інформація містить контекст, який допомагає журналістам оцінювати джерело, платформам — ухвалювати рішення щодо цілісності, а людям — розуміти, що саме вони бачать онлайн.
Нещодавно ми зробили ще один крок і надали OpenAI статус продукту-генератора, що відповідає C2PA(відкривається у новому вікні). Ставши сумісними з C2PA, ми даємо платформам надійний спосіб зчитувати, зберігати й передавати далі інформацію про походження, яку ми додаємо до нашого контенту. Це важливо, бо визначення походження працює лише тоді, коли зберігається за межами першої платформи, де було створено контент, і відповідність стандарту робить це можливим.
Метадані C2PA є важливою основою для визначення походження. Вони допомагають контенту нести інформацію про те, звідки він походить, як його було створено чи відредаговано і хто підписав цю інформацію. Але метадані не бездоганні. Їх можна видалити, втратити під час завантаження й вивантаження або пошкодити через перетворення, як-от зміну формату файлу, зміну розміру чи знімки екрана.
Щоб зробити визначення походження надійнішим, ми застосовуємо багаторівневий підхід і додаємо водяні знаки через SynthID від Google DeepMind(відкривається у новому вікні), починаючи із зображень, згенерованих через ChatGPT, Codex або OpenAI API. SynthID вбудовує невидимий шар водяного знака, який доповнює підходи на основі метаданих C2PA.
Ми йшли до цього вже певний час. Ми використовували видимі водяні знаки у Sora та аудіоводяний знак у Voice Engine, а також продовжували з часом тестувати й досліджувати точність і надійність. під час розгортання.
Ці дві системи підсилюють одна одну. C2PA допомагає контенту нести докладний контекст; SynthID допомагає зберегти сигнал, коли метадані не зберігаються. Водяні знаки можуть бути стійкішими до перетворень, як-от знімки екрана, тоді як метадані можуть надавати більше інформації, ніж сам лише водяний знак. Разом вони роблять визначення походження надійнішим, ніж будь-який із цих рівнів окремо.
Надійні метадані та водяні знаки, що витримують більшість змін, можуть зробити сигнали походження довговічнішими. Але людям потрібен спосіб виявляти ці сигнали. Ми представляємо ознайомчу версію публічного інструмента перевірки, який допоможе людям перевіряти, чи було завантажене зображення згенероване в ChatGPT, OpenAI API або Codex, перевіряючи наявність у ньому сигналів походження, зокрема Content Credentials і SynthID.
Ми вважаємо, що людям має бути простіше перевіряти й тлумачити походження, і що наш інструмент може допомогти їм відігравати роль у відповіді на запитання: «Чи було це згенеровано за допомогою ШІ?» — завдяки поєднанню кількох сигналів. Це спирається на висновки з початкового дослідницького попереднього перегляду нашого класифікатора виявлення зображень у 2024 році та дає людям змогу надійно виявляти, чи присутній у медіа водяний знак SynthID, що походить від OpenAI, а також показувати метадані C2PA, коли їх знайдено.

Жоден метод виявлення не є бездоганним, тому ми дотримуємося обережного підходу в тих випадках, коли виявлення не спрацьовує. Наприклад, якщо не виявлено ні метаданих, ні водяного знака, інструмент не робитиме остаточного висновку про те, чи було зображення згенероване інструментами OpenAI, оскільки сигнали походження в деяких випадках можуть бути видалені.
На момент запуску інструмент обмежений контентом, згенерованим OpenAI. У найближчі місяці ми прагнемо підтримати міжгалузеві зусилля, щоб зробити перевірку можливою на різних платформах. З часом ми також очікуємо підтримати більше типів контенту, з якими люди можуть стикатися онлайн.
Жодна окрема технологія визначення походження не є достатньою сама по собі. Ми вважаємо, що сильний підхід поєднує спільні стандарти, стійкі сигнали водяних знаків і публічну перевірку. Спираючись на нашу давню підтримку Content Credentials, досягнення відповідності C2PA, впровадження SynthID і попередній перегляд публічних інструментів перевірки, ми сподіваємося в довгостроковій перспективі зробити внесок у більш сумісну екосистему визначення походження.


