अधिक सुरक्षित, अधिक पारदर्शक AI परिसंस्थेसाठी सामग्री प्रोव्हनन्समध्ये प्रगती
Content Credentials, SynthID आणि एका प्राथमिक सार्वजनिक पडताळणी साधनाच्या माध्यमातून, AI-निर्मित मजकुराचा उगम समजून घेण्यास लोकांना मदत करणे.
OpenAI ची टूल्स लोक दररोज प्रतिमा आणि ऑडिओ तयार व संपादित करण्यासाठी वापरत आहेत, ज्यामुळे संवाद अधिक प्रभावी, उपयोगी आणि सहज उपलब्ध होत आहे. लोक ज्या प्रकारे निर्माण करतात, कल्पना करतात आणि सामग्री शेअर करतात त्यामध्ये ही टूल्स अधिक वापरली जात असताना, माध्यमाचा स्रोत समजणे आणि त्याची पडताळणी करणे महत्त्वाचे आहे, जेणेकरून लोक त्याचा अधिक विश्वासाने अर्थ लावू शकतील. Provenance signals मुळे लोकांना कंटेंटचा उगम, त्याची निर्मिती किंवा संपादन कसे झाले आणि तो खरोखर दावा केल्याप्रमाणे आहे का याबद्दल अधिक संदर्भ मिळू शकतो.
आज आम्ही ऑनलाइन विश्वास निर्माण करण्याच्या उद्देशाने, एका बहुस्तरीय आणि परिसंस्था-आधारित मॉडेलद्वारे, मजकुराच्या उगमाशी संबंधित आमचा दृष्टिकोन अधिक बळकट करत आहोत. आम्ही C2PA अनुरूपतेद्वारे इतर साधने आणि प्लॅटफॉर्मसाठी आमचे मूळ ओळखचिन्हे अधिक सुलभ करत आहोत, Google सोबतच्या भागीदारीतून प्रतिमांवर टिकाऊ क्रॉस-प्लॅटफॉर्म SynthID वॉटरमार्किंग जोडत आहोत, आणि प्रतिमा OpenAI कडून आल्या आहेत की नाही हे तपासण्यासाठी जनता वापरू शकेल अशा एका साधनाचे पूर्वावलोकन सादर करत आहोत.
हे सर्व अद्यतने एकत्रितपणे, मुक्त मानकांना (open standards) पाठिंबा देण्यासाठी, OpenAI द्वारे निर्मित मजकूर अधिक सहजपणे ओळखता यावा यासाठी आणि अधिक विश्वासार्ह माहिती परिसंस्थेला बळ देण्यासाठी संपूर्ण उद्योगामध्ये सहकार्य करण्याच्या आमच्या मागील कार्याचीच पुढची पायरी ठरतात.
OpenAI 2024 पासून प्रोव्हनन्स मानकांच्या विकास आणि स्वीकारात सहभागी आहे, जेव्हा आम्ही DALL-E 3(नवीन विंडोमध्ये उघडेल) द्वारे तयार झालेल्या प्रतिमांमध्ये कंटेंट क्रीडेंशियल्स जोडण्यास सुरुवात केली आणि नंतर ImageGen(नवीन विंडोमध्ये उघडेल) आणि Sora(नवीन विंडोमध्ये उघडेल) मध्येही जोडले. आम्ही 'Coalition for Content Provenance and Authenticity' (C2PA) च्या सुकाणू समितीमध्येही सामील झालो; हा गट मजकुराच्या उगमाशी संबंधित खुल्या तांत्रिक मानकाचा आधार असलेला एक आंतर-उद्योग समूह आहे. C2PA चा तांत्रिक दृष्टिकोन मेटाडेटा आणि क्रिप्टोग्राफिक स्वाक्षऱ्यांचा वापर करतो, ज्यामुळे एखाद्या माध्यमाविषयीची माहिती त्या मजकुरासोबतच सुरक्षितपणे प्रवास करण्यास मदत मिळते. या माहितीमध्ये असा संदर्भ समाविष्ट आहे, जो पत्रकारांना स्रोताचे मूल्यमापन करण्यास, प्लॅटफॉर्म्सना विश्वासार्हतेबाबत निर्णय घेण्यास आणि लोकांना तुम्ही ऑनलाइन काय पाहत आहोत हे समजून घेण्यास मदत करतो.
अलीकडेच आम्ही OpenAI ला C2PA अनुरूप Generator Product(नवीन विंडोमध्ये उघडेल) बनवण्याचे पाऊल उचलले. C2PA-सुसंगत बनून, आम्ही प्लॅटफॉर्म्सना आमच्या आशयाशी जोडलेली 'उगम-माहिती' (provenance information) वाचण्यासाठी, जतन करण्यासाठी आणि पुढे प्रसारित करण्यासाठी एक विश्वासार्ह मार्ग उपलब्ध करून देत आहोत. हे महत्त्वाचे आहे कारण सामग्री ज्या पहिल्या प्लॅटफॉर्मवर तयार केली जाते, त्यापलीकडेही तिचा उगम टिकून राहिला तरच ती प्रभावी ठरते, आणि अनुरूपतेमुळे ते शक्य होते.
C2PA मेटाडेटा हा प्रोव्हनन्ससाठी एक महत्त्वाचा पाया आहे. यामुळे मजकुराला तो कोठून आला, त्याची निर्मिती किंवा संपादन कसे केले गेले आणि त्या माहितीवर कोणी स्वाक्षरी केली, याविषयीची माहिती सोबत वाहून नेण्यास मदत होते. परंतु मेटाडेटा निर्दोष नाही. ते काढून टाकले जाऊ शकते, अपलोड आणि डाउनलोडमुळे गमावले जाऊ शकते, किंवा फाइल फॉरमॅट बदलणे, आकार बदलणे किंवा स्क्रीनशॉट घेणे यांसारख्या बदलांमुळे खराब होऊ शकते.
प्रोव्हनन्स अधिक लवचिक करण्यासाठी, आम्ही बहुस्तरीय दृष्टिकोन स्वीकारत आहोत आणि Google DeepMindच्या SynthID(नवीन विंडोमध्ये उघडेल) द्वारे वॉटरमार्किंग समाविष्ट करत आहोत, सुरुवात ChatGPT, Codex, किंवा OpenAI API द्वारे तयार झालेल्या प्रतिमांपासून. SynthID एक अदृश्य वॉटरमार्किंग थर अंतर्भूत करते, जे C2PA च्या मेटाडेटा-आधारित दृष्टिकोनांना पूरक ठरते.
आम्ही काही काळापासून याच दिशेने काम करत आहोत. आम्ही Sora मध्ये दृश्यमान वॉटरमार्क आणि Voice Engine मध्ये ऑडिओ वॉटरमार्क वापरले आहेत, आणि कालांतराने अचूकता व विश्वासार्हतेची चाचणी आणि संशोधन सुरू ठेवले आहे. अंमलबजावणीद्वारे.
ही दोन्ही प्रणाली एकमेकांना बळकटी देतात. C2PA मजकुरासोबत सविस्तर संदर्भ वाहून नेण्यास मदत करते; तर, जेव्हा मेटाडेटा टिकून राहत नाही, तेव्हा SynthID एखादा संकेत जतन करण्यास मदत करते. स्क्रीनशॉट्ससारख्या रूपांतरांमधूनही वॉटरमार्किंग अधिक टिकून राहू शकते, तर केवळ वॉटरमार्कपेक्षा मेटाडेटा अधिक माहिती प्रदान करू शकतो. एकत्रितपणे, हे दोन्ही स्तर स्वतंत्रपणे जितके सक्षम असतील त्यापेक्षा प्रोव्हनन्स अधिक लवचिक बनवतात.
विश्वासार्ह मेटाडेटा आणि बहुतेक बदलांना प्रतिकार करणारे वॉटरमार्क प्रोव्हनन्स संकेत अधिक टिकाऊ बनवू शकतात. पण लोकांना हे संकेत शोधण्याचा मार्ग हवा. आम्ही आता सार्वजनिक पडताळणी साधनाची झलक देत आहोत, जे अपलोड केलेली प्रतिमा ChatGPT, OpenAI API, किंवा Codex वर तयार झाली आहे का हे लोकांना पडताळण्यास मदत करेल, त्यात कंटेंट क्रीडेंशियल्स आणि SynthIDसह प्रोव्हनन्स संकेत आहेत का हे तपासून.
आमचा विश्वास आहे की लोकांना स्रोताची पडताळणी करणे आणि त्याचा अर्थ लावणे अधिक सोपे असावे, आणि अनेक संकेत एकत्रित करून आमचे साधन लोकांना “हे AI द्वारे तयार केले आहे का?” या प्रश्नाचे उत्तर देण्यात भूमिका बजावण्यास मदत करू शकते. हे 2024 मधील आमच्या प्रतिमा शोध वर्गीकरणकर्त्याच्या प्रारंभिक संशोधन झलकमधील शिकवणींवर आधारित आहे आणि OpenAI कडून आलेला SynthID वॉटरमार्क माध्यमात आहे का हे लोकांना विश्वासार्हपणे शोधता येते, तसेच C2PA मेटाडेटा आढळल्यास तेही दाखवते.

कोणतीही शोध पद्धत पूर्णपणे अचूक नसते, त्यामुळे शोध अयशस्वी झाल्यास आम्ही सावध दृष्टिकोन स्वीकारतो. उदाहरणार्थ, जर कोणतेही मेटाडेटा किंवा वॉटरमार्क आढळले नाहीत, तर हे साधन—ती प्रतिमा OpenAI च्या साधनांद्वारे तयार केली गेली आहे की नाही याविषयी—कोणताही निश्चित निष्कर्ष काढणार नाही; कारण काही प्रकरणांमध्ये, प्रतिमेच्या मूळ स्रोताशी संबंधित संकेत काढून टाकले जाण्याची शक्यता असते.
लॉन्चच्या वेळी, हे साधन OpenAI ने तयार केलेल्या सामग्रीपुरते मर्यादित आहे. पुढील काही महिन्यांत, प्लॅटफॉर्मदरम्यान पडताळणी शक्य करण्यासाठी आम्ही बहु-उद्योगीय प्रयत्नांना समर्थन देण्याचे उद्दिष्ट ठेवतो. कालांतराने, लोकांना ऑनलाइन भेटू शकणाऱ्या अधिक प्रकारच्या सामग्रीला समर्थन देण्याचीही आम्ही अपेक्षा करतो.
एकही प्रोव्हनन्स तंत्र स्वतःपुरते पुरेसे नाही. आमचा विश्वास आहे की मजबूत दृष्टिकोनात सामायिक मानके, टिकाऊ वॉटरमार्किंग संकेत, आणि सार्वजनिक पडताळणी यांचा समावेश असतो. Content Credentialsला आमच्या दीर्घकालीन समर्थनावर आधार घेत, C2PAशी अनुरूप होत, SynthID स्वीकारत, आणि सार्वजनिक पडताळणी साधनांची झलक देत, आम्ही दीर्घकाळात अधिक परस्पर-सुसंगत प्रोव्हनन्स परिसंस्थेत योगदान देण्याची आशा करतो.


