۲۹ اردیبهشت ۱۴۰۵

پیشبرد منشأ محتوا برای شکل‌دهی به اکوسیستم AI ایمن‌تر و شفاف‌تر

کمک به مردم برای درک منشأ محتوای تولیدشده با AI از طریق Content Credentials، SynthID و یک ابزار عمومی اولیه برای تأیید.

در حال بارگذاری…

مردم هر روز از ابزارهای OpenAI برای ساخت و ویرایش تصویر و صدا به شیوه‌هایی استفاده می‌کنند که ارتباط را گویاتر، کاربردی‌تر و دسترس‌پذیرتر می‌کند. با تبدیل شدن این ابزارها به بخشی از شیوه ساختن، تصور کردن و به‌اشتراک‌گذاری مردم، مهم است که افراد بتوانند بفهمند و تأیید کنند رسانه از کجا آمده است تا با اطمینان بیشتری آن را تفسیر کنند. سیگنال‌های منشأ محتوا می‌توانند با ارائه زمینه‌ای درباره اینکه محتوا از کجا آمده، چگونه ایجاد یا ویرایش شده، و آیا همان چیزی هست که ادعا می‌کند، کمک‌کننده باشند.

امروز رویکرد خود به منشأ محتوا را با یک مدل چندلایه و مبتنی بر اکوسیستم برای ایجاد اعتماد آنلاین تقویت می‌کنیم. ما از طریق انطباق با C2PA، تشخیص سیگنال‌های منشأ خود را برای ابزارها و پلتفرم‌های دیگر آسان‌تر می‌کنیم، با همکاری Google واترمارک‌گذاری پایدار و میان‌پلتفرمی SynthID را به تصاویر اضافه می‌کنیم، و پیش‌نمایشی از ابزاری را به اشتراک می‌گذاریم که عموم مردم می‌توانند با آن بررسی کنند آیا تصاویر ساخته شده توسط OpenAI هستند یا خیر.

این به‌روزرسانی‌ها در کنار هم بر کارهای پیشین ما⁠ برای پشتیبانی از استانداردهای باز، آسان‌تر کردن شناسایی محتوای تولیدشده توسط OpenAI و همکاری در سراسر صنعت برای پشتیبانی از یک اکوسیستم اطلاعاتی قابل‌اعتمادتر بنا می‌شوند.

ایجاد اکوسیستم اعتماد از طریق انطباق با C2PA

OpenAI از سال ۲۰۲۴ در توسعه و پذیرش استانداردهای منشأ مشارکت داشته است؛ زمانی که افزودن اعتبارنامه‌های محتوا را به تصاویر تولیدشده توسط DALL-E 3⁠(در یک پنجره جدید باز می‌شود) آغاز کردیم و بعدها آن را به ImageGen⁠(در یک پنجره جدید باز می‌شود) و Sora⁠(در یک پنجره جدید باز می‌شود) نیز گسترش دادیم. همچنین به کمیته راهبری Coalition for Content Provenance and Authenticity (C2PA) پیوستیم؛ گروهی بین‌صنعتی که استاندارد فنی باز برای منشأ محتوا را پشتیبانی می‌کند. رویکرد فنی C2PA از فراداده و امضاهای رمزنگاری‌شده استفاده می‌کند تا اطلاعات مربوط به یک رسانه بتواند به‌صورت امن همراه خود محتوا جابه‌جا شود. این اطلاعات شامل زمینه‌ای است که به روزنامه‌نگارانی که در حال ارزیابی یک منبع هستند، پلتفرم‌هایی که درباره یکپارچگی تصمیم می‌گیرند، و افرادی که می‌خواهند بفهمند یه صورت آنلاین چه می‌بینند کمک می‌کند.

ما اخیراً این گام را برداشتیم که OpenAI به یک محصول تولیدکننده منطبق با C2PA⁠(در یک پنجره جدید باز می‌شود) تبدیل شود. با منطبق شدن با C2PA، راهی قابل‌اعتماد در اختیار پلتفرم‌ها می‌گذاریم تا اطلاعات منشأیی را که به محتوای خود پیوست می‌کنیم بخوانند، حفظ کنند و منتقل کنند. این موضوع مهم است، زیرا منشأ محتوا تنها زمانی کارآمد است که فراتر از نخستین پلتفرمی که محتوا در آن ایجاد شده باقی بماند و انطباق همین امکان را فراهم می‌کند.

رویکردی چندلایه برای منشأ محتوا با Google SynthID در تصاویر

فراداده C2PA پایه‌ای مهم برای منشأ است. این رویکرد کمک می‌کند محتوا اطلاعاتی را همراه خود داشته باشد درباره اینکه از کجا آمده، چگونه ایجاد یا ویرایش شده، و چه کسی آن اطلاعات را تأیید کرده است. اما فراداده بی‌نقص نیست. ممکن است حذف شود، در فرایند بارگذاری و دانلود از بین برود، یا بر اثر تغییراتی مانند عوض شدن فرمت فایل، تغییر اندازه یا اسکرین‌شات آسیب ببیند.

برای مقاوم‌تر کردن منشأ محتوا، رویکردی چندلایه در پیش گرفته‌ایم و واترمارک‌گذاری را از طریق SynthID شرکت Google DeepMind⁠(در یک پنجره جدید باز می‌شود) به کار می‌گیریم؛ این کار را با تصاویری آغاز می‌کنیم که از طریق ChatGPT⁠، Codex یا OpenAI API تولید شده‌اند. SynthID یک لایه واترمارک نامرئی تعبیه می‌کند که مکمل رویکردهای مبتنی بر فراداده C2PA است.

مدتی است که در حال حرکت به سوی این هدف بوده‌ایم. ما از واترمارک‌های قابل‌مشاهده⁠ در Sora و یک واترمارک صوتی⁠ در Voice Engine استفاده کرده‌ایم و در طول زمان به آزمون و پژوهش درباره دقت و قابلیت اتکا ادامه داده‌ایم. از طریق استقرار.

این دو سامانه یکدیگر را تقویت می‌کنند. C2PA به محتوا کمک می‌کند زمینه‌ای دقیق را با خود حمل کند؛ SynthID زمانی که فراداده باقی نمی‌ماند به حفظ یک سیگنال کمک می‌کند. واترمارک‌گذاری می‌تواند در برابر تغییراتی مانند اسکرین‌شات پایدارتر باشد، در حالی که فراداده می‌تواند اطلاعات بیشتری نسبت به یک واترمارک به‌تنهایی ارائه دهد. این دو در کنار هم منشأ محتوا را مقاوم‌تر از حالتی می‌کنند که هر لایه به‌تنهایی عمل کند.

نموداری که دو سیگنال منشأ تصویر را مقایسه می‌کند: C2PA فرادادهٔ امضاشده‌ای اضافه می‌کند که می‌توان آن را برای تأیید یک صادرکنندهٔ مورد اعتماد OpenAI اعتبارسنجی کرد در حالی که SynthID یک سیگنال در سطح پیکسل تعبیه می‌کند که می‌توان آن را شناسایی کرد تا مشخص شود آیا تصویری توسط OpenAI کدگذاری شده است یا نه.

تشخیص و پیش‌نمایشی از ابزار عمومی تأیید ما

فراداده قابل‌اعتماد و واترمارک‌هایی که در برابر بیشتر تغییرات مقاومت می‌کنند می‌توانند سیگنال‌های منشأ محتوا را پایدارتر کنند. اما مردم به راهی برای تشخیص این سیگنال‌ها نیاز دارند. اکنون پیش‌نمایشی از یک ابزار عمومی تأیید⁠ ارائه می‌کنیم که با بررسی وجود سیگنال‌های منشأ محتوا، از جمله Content Credentials و SynthID، به افراد کمک می‌کند تأیید کنند آیا یک تصویر بارگذاری‌شده توسط ChatGPT، OpenAI API یا Codex تولید شده است یا خیر.

ما باور داریم که تأیید و تفسیر منشأ محتوا باید برای مردم آسان‌تر باشد و ابزار ما می‌تواند با یکپارچه‌سازی چندین سیگنال، به افراد کمک کند در پاسخ به این پرسش نقش داشته باشند که «آیا این محتوا با AI تولید شده است؟». این کار بر پایه آموخته‌های حاصل از پیش‌نمایش پژوهشی اولیه دسته‌بند تشخیص تصویر⁠ ما در سال ۲۰۲۴ انجام می‌شود و به افراد امکان می‌دهد با اطمینان تشخیص دهند آیا واترمارک SynthID منشأگرفته از OpenAI در رسانه وجود دارد یا خیر، و در صورت شناسایی، فراداده‌های C2PA را نیز نمایش دهند.

صفحه وب OpenAI که نتیجه راستی‌آزمایی یک تصویر آپلودشده را نشان می‌دهد و تأیید می‌کند که این تصویر، بر اساس سیگنال‌های شناسایی‌شده SynthID و اعتبارنامه‌های محتوا، با ابزارهای OpenAI تولید شده است.

هیچ روش تشخیصی بی‌نقص نیست، بنابراین در مواردی که تشخیص ناموفق است رویکردی محتاطانه در پیش می‌گیریم. برای مثال، اگر هیچ فراداده یا واترمارکی شناسایی نشود، ابزار درباره اینکه آیا تصویر با ابزارهای OpenAI تولید شده است یا خیر نتیجه‌گیری قطعی نخواهد کرد، زیرا سیگنال‌های منشأ محتوا در برخی موارد ممکن است حذف شوند.

در زمان عرضه، این ابزار به محتوای تولیدشده توسط OpenAI محدود است. در ماه‌های آینده، هدف ما پشتیبانی از تلاش‌های بین‌صنعتی برای امکان تأیید در سراسر پلتفرم‌ها است. با گذشت زمان، انتظار داریم از انواع بیشتری از محتوا که مردم ممکن است آنلاین با آن روبه‌رو شوند نیز پشتیبانی کنیم.

با نگاهی به آینده

هیچ تکنیک منشأ محتوایی به‌تنهایی کافی نیست. ما باور داریم یک رویکرد قوی، استانداردهای مشترک، سیگنال‌های واترمارک پایدار و تأیید عمومی را با هم ترکیب می‌کند. با تکیه بر حمایت دیرینه‌مان از Content Credentials، منطبق شدن با C2PA، پذیرش SynthID و ارائه پیش‌نمایش ابزارهای تأیید عمومی، امیدواریم در بلندمدت به اکوسیستم منشأ محتوایی تعامل‌پذیرتر کمک کنیم.