پیشبرد منشأ محتوا برای شکلدهی به اکوسیستم AI ایمنتر و شفافتر
کمک به مردم برای درک منشأ محتوای تولیدشده با AI از طریق Content Credentials، SynthID و یک ابزار عمومی اولیه برای تأیید.
مردم هر روز از ابزارهای OpenAI برای ساخت و ویرایش تصویر و صدا به شیوههایی استفاده میکنند که ارتباط را گویاتر، کاربردیتر و دسترسپذیرتر میکند. با تبدیل شدن این ابزارها به بخشی از شیوه ساختن، تصور کردن و بهاشتراکگذاری مردم، مهم است که افراد بتوانند بفهمند و تأیید کنند رسانه از کجا آمده است تا با اطمینان بیشتری آن را تفسیر کنند. سیگنالهای منشأ محتوا میتوانند با ارائه زمینهای درباره اینکه محتوا از کجا آمده، چگونه ایجاد یا ویرایش شده، و آیا همان چیزی هست که ادعا میکند، کمککننده باشند.
امروز رویکرد خود به منشأ محتوا را با یک مدل چندلایه و مبتنی بر اکوسیستم برای ایجاد اعتماد آنلاین تقویت میکنیم. ما از طریق انطباق با C2PA، تشخیص سیگنالهای منشأ خود را برای ابزارها و پلتفرمهای دیگر آسانتر میکنیم، با همکاری Google واترمارکگذاری پایدار و میانپلتفرمی SynthID را به تصاویر اضافه میکنیم، و پیشنمایشی از ابزاری را به اشتراک میگذاریم که عموم مردم میتوانند با آن بررسی کنند آیا تصاویر ساخته شده توسط OpenAI هستند یا خیر.
این بهروزرسانیها در کنار هم بر کارهای پیشین ما برای پشتیبانی از استانداردهای باز، آسانتر کردن شناسایی محتوای تولیدشده توسط OpenAI و همکاری در سراسر صنعت برای پشتیبانی از یک اکوسیستم اطلاعاتی قابلاعتمادتر بنا میشوند.
OpenAI از سال ۲۰۲۴ در توسعه و پذیرش استانداردهای منشأ مشارکت داشته است؛ زمانی که افزودن اعتبارنامههای محتوا را به تصاویر تولیدشده توسط DALL-E 3(در یک پنجره جدید باز میشود) آغاز کردیم و بعدها آن را به ImageGen(در یک پنجره جدید باز میشود) و Sora(در یک پنجره جدید باز میشود) نیز گسترش دادیم. همچنین به کمیته راهبری Coalition for Content Provenance and Authenticity (C2PA) پیوستیم؛ گروهی بینصنعتی که استاندارد فنی باز برای منشأ محتوا را پشتیبانی میکند. رویکرد فنی C2PA از فراداده و امضاهای رمزنگاریشده استفاده میکند تا اطلاعات مربوط به یک رسانه بتواند بهصورت امن همراه خود محتوا جابهجا شود. این اطلاعات شامل زمینهای است که به روزنامهنگارانی که در حال ارزیابی یک منبع هستند، پلتفرمهایی که درباره یکپارچگی تصمیم میگیرند، و افرادی که میخواهند بفهمند یه صورت آنلاین چه میبینند کمک میکند.
ما اخیراً این گام را برداشتیم که OpenAI به یک محصول تولیدکننده منطبق با C2PA(در یک پنجره جدید باز میشود) تبدیل شود. با منطبق شدن با C2PA، راهی قابلاعتماد در اختیار پلتفرمها میگذاریم تا اطلاعات منشأیی را که به محتوای خود پیوست میکنیم بخوانند، حفظ کنند و منتقل کنند. این موضوع مهم است، زیرا منشأ محتوا تنها زمانی کارآمد است که فراتر از نخستین پلتفرمی که محتوا در آن ایجاد شده باقی بماند و انطباق همین امکان را فراهم میکند.
فراداده C2PA پایهای مهم برای منشأ است. این رویکرد کمک میکند محتوا اطلاعاتی را همراه خود داشته باشد درباره اینکه از کجا آمده، چگونه ایجاد یا ویرایش شده، و چه کسی آن اطلاعات را تأیید کرده است. اما فراداده بینقص نیست. ممکن است حذف شود، در فرایند بارگذاری و دانلود از بین برود، یا بر اثر تغییراتی مانند عوض شدن فرمت فایل، تغییر اندازه یا اسکرینشات آسیب ببیند.
برای مقاومتر کردن منشأ محتوا، رویکردی چندلایه در پیش گرفتهایم و واترمارکگذاری را از طریق SynthID شرکت Google DeepMind(در یک پنجره جدید باز میشود) به کار میگیریم؛ این کار را با تصاویری آغاز میکنیم که از طریق ChatGPT، Codex یا OpenAI API تولید شدهاند. SynthID یک لایه واترمارک نامرئی تعبیه میکند که مکمل رویکردهای مبتنی بر فراداده C2PA است.
مدتی است که در حال حرکت به سوی این هدف بودهایم. ما از واترمارکهای قابلمشاهده در Sora و یک واترمارک صوتی در Voice Engine استفاده کردهایم و در طول زمان به آزمون و پژوهش درباره دقت و قابلیت اتکا ادامه دادهایم. از طریق استقرار.
این دو سامانه یکدیگر را تقویت میکنند. C2PA به محتوا کمک میکند زمینهای دقیق را با خود حمل کند؛ SynthID زمانی که فراداده باقی نمیماند به حفظ یک سیگنال کمک میکند. واترمارکگذاری میتواند در برابر تغییراتی مانند اسکرینشات پایدارتر باشد، در حالی که فراداده میتواند اطلاعات بیشتری نسبت به یک واترمارک بهتنهایی ارائه دهد. این دو در کنار هم منشأ محتوا را مقاومتر از حالتی میکنند که هر لایه بهتنهایی عمل کند.
فراداده قابلاعتماد و واترمارکهایی که در برابر بیشتر تغییرات مقاومت میکنند میتوانند سیگنالهای منشأ محتوا را پایدارتر کنند. اما مردم به راهی برای تشخیص این سیگنالها نیاز دارند. اکنون پیشنمایشی از یک ابزار عمومی تأیید ارائه میکنیم که با بررسی وجود سیگنالهای منشأ محتوا، از جمله Content Credentials و SynthID، به افراد کمک میکند تأیید کنند آیا یک تصویر بارگذاریشده توسط ChatGPT، OpenAI API یا Codex تولید شده است یا خیر.
ما باور داریم که تأیید و تفسیر منشأ محتوا باید برای مردم آسانتر باشد و ابزار ما میتواند با یکپارچهسازی چندین سیگنال، به افراد کمک کند در پاسخ به این پرسش نقش داشته باشند که «آیا این محتوا با AI تولید شده است؟». این کار بر پایه آموختههای حاصل از پیشنمایش پژوهشی اولیه دستهبند تشخیص تصویر ما در سال ۲۰۲۴ انجام میشود و به افراد امکان میدهد با اطمینان تشخیص دهند آیا واترمارک SynthID منشأگرفته از OpenAI در رسانه وجود دارد یا خیر، و در صورت شناسایی، فرادادههای C2PA را نیز نمایش دهند.

هیچ روش تشخیصی بینقص نیست، بنابراین در مواردی که تشخیص ناموفق است رویکردی محتاطانه در پیش میگیریم. برای مثال، اگر هیچ فراداده یا واترمارکی شناسایی نشود، ابزار درباره اینکه آیا تصویر با ابزارهای OpenAI تولید شده است یا خیر نتیجهگیری قطعی نخواهد کرد، زیرا سیگنالهای منشأ محتوا در برخی موارد ممکن است حذف شوند.
در زمان عرضه، این ابزار به محتوای تولیدشده توسط OpenAI محدود است. در ماههای آینده، هدف ما پشتیبانی از تلاشهای بینصنعتی برای امکان تأیید در سراسر پلتفرمها است. با گذشت زمان، انتظار داریم از انواع بیشتری از محتوا که مردم ممکن است آنلاین با آن روبهرو شوند نیز پشتیبانی کنیم.
هیچ تکنیک منشأ محتوایی بهتنهایی کافی نیست. ما باور داریم یک رویکرد قوی، استانداردهای مشترک، سیگنالهای واترمارک پایدار و تأیید عمومی را با هم ترکیب میکند. با تکیه بر حمایت دیرینهمان از Content Credentials، منطبق شدن با C2PA، پذیرش SynthID و ارائه پیشنمایش ابزارهای تأیید عمومی، امیدواریم در بلندمدت به اکوسیستم منشأ محتوایی تعاملپذیرتر کمک کنیم.


