मुख्य मजकूराकडे जा
OpenAI

१९ मे, २०२६

सुरक्षितता

अधिक सुरक्षित, अधिक पारदर्शक AI परिसंस्थेसाठी सामग्री प्रोव्हनन्समध्ये प्रगती

Content Credentials, SynthID आणि एका प्राथमिक सार्वजनिक पडताळणी साधनाच्या माध्यमातून, AI-निर्मित मजकुराचा उगम समजून घेण्यास लोकांना मदत करणे.

लोड होत आहे...

OpenAI ची टूल्स लोक दररोज प्रतिमा आणि ऑडिओ तयार व संपादित करण्यासाठी वापरत आहेत, ज्यामुळे संवाद अधिक प्रभावी, उपयोगी आणि सहज उपलब्ध होत आहे. लोक ज्या प्रकारे निर्माण करतात, कल्पना करतात आणि सामग्री शेअर करतात त्यामध्ये ही टूल्स अधिक वापरली जात असताना, माध्यमाचा स्रोत समजणे आणि त्याची पडताळणी करणे महत्त्वाचे आहे, जेणेकरून लोक त्याचा अधिक विश्वासाने अर्थ लावू शकतील. Provenance signals मुळे लोकांना कंटेंटचा उगम, त्याची निर्मिती किंवा संपादन कसे झाले आणि तो खरोखर दावा केल्याप्रमाणे आहे का याबद्दल अधिक संदर्भ मिळू शकतो.

आज आम्ही ऑनलाइन विश्वास निर्माण करण्याच्या उद्देशाने, एका बहुस्तरीय आणि परिसंस्था-आधारित मॉडेलद्वारे, मजकुराच्या उगमाशी संबंधित आमचा दृष्टिकोन अधिक बळकट करत आहोत. आम्ही C2PA अनुरूपतेद्वारे इतर साधने आणि प्लॅटफॉर्मसाठी आमचे मूळ ओळखचिन्हे अधिक सुलभ करत आहोत, Google सोबतच्या भागीदारीतून प्रतिमांवर टिकाऊ क्रॉस-प्लॅटफॉर्म SynthID वॉटरमार्किंग जोडत आहोत, आणि प्रतिमा OpenAI कडून आल्या आहेत की नाही हे तपासण्यासाठी जनता वापरू शकेल अशा एका साधनाचे पूर्वावलोकन सादर करत आहोत.

हे सर्व अद्यतने एकत्रितपणे, मुक्त मानकांना (open standards) पाठिंबा देण्यासाठी, OpenAI द्वारे निर्मित मजकूर अधिक सहजपणे ओळखता यावा यासाठी आणि अधिक विश्वासार्ह माहिती परिसंस्थेला बळ देण्यासाठी संपूर्ण उद्योगामध्ये सहकार्य करण्याच्या आमच्या मागील कार्याचीच पुढची पायरी ठरतात.

C2PA अनुरूपतेद्वारे विश्वास परिसंस्था उभारणे

OpenAI 2024 पासून प्रोव्हनन्स मानकांच्या विकास आणि स्वीकारात सहभागी आहे, जेव्हा आम्ही DALL-E 3(नवीन विंडोमध्ये उघडेल) द्वारे तयार झालेल्या प्रतिमांमध्ये कंटेंट क्रीडेंशियल्स जोडण्यास सुरुवात केली आणि नंतर ImageGen(नवीन विंडोमध्ये उघडेल) आणि Sora(नवीन विंडोमध्ये उघडेल) मध्येही जोडले. आम्ही 'Coalition for Content Provenance and Authenticity' (C2PA) च्या सुकाणू समितीमध्येही सामील झालो; हा गट मजकुराच्या उगमाशी संबंधित खुल्या तांत्रिक मानकाचा आधार असलेला एक आंतर-उद्योग समूह आहे. C2PA चा तांत्रिक दृष्टिकोन मेटाडेटा आणि क्रिप्टोग्राफिक स्वाक्षऱ्यांचा वापर करतो, ज्यामुळे एखाद्या माध्यमाविषयीची माहिती त्या मजकुरासोबतच सुरक्षितपणे प्रवास करण्यास मदत मिळते. या माहितीमध्ये असा संदर्भ समाविष्ट आहे, जो पत्रकारांना स्रोताचे मूल्यमापन करण्यास, प्लॅटफॉर्म्सना विश्वासार्हतेबाबत निर्णय घेण्यास आणि लोकांना तुम्ही ऑनलाइन काय पाहत आहोत हे समजून घेण्यास मदत करतो.

अलीकडेच आम्ही OpenAI ला C2PA अनुरूप Generator Product(नवीन विंडोमध्ये उघडेल) बनवण्याचे पाऊल उचलले. C2PA-सुसंगत बनून, आम्ही प्लॅटफॉर्म्सना आमच्या आशयाशी जोडलेली 'उगम-माहिती' (provenance information) वाचण्यासाठी, जतन करण्यासाठी आणि पुढे प्रसारित करण्यासाठी एक विश्वासार्ह मार्ग उपलब्ध करून देत आहोत. हे महत्त्वाचे आहे कारण सामग्री ज्या पहिल्या प्लॅटफॉर्मवर तयार केली जाते, त्यापलीकडेही तिचा उगम टिकून राहिला तरच ती प्रभावी ठरते, आणि अनुरूपतेमुळे ते शक्य होते.

प्रतिमांसाठी Google SynthID सह प्रोव्हनन्सकडे बहुस्तरीय दृष्टिकोन

C2PA मेटाडेटा हा प्रोव्हनन्ससाठी एक महत्त्वाचा पाया आहे. यामुळे मजकुराला तो कोठून आला, त्याची निर्मिती किंवा संपादन कसे केले गेले आणि त्या माहितीवर कोणी स्वाक्षरी केली, याविषयीची माहिती सोबत वाहून नेण्यास मदत होते. परंतु मेटाडेटा निर्दोष नाही. ते काढून टाकले जाऊ शकते, अपलोड आणि डाउनलोडमुळे गमावले जाऊ शकते, किंवा फाइल फॉरमॅट बदलणे, आकार बदलणे किंवा स्क्रीनशॉट घेणे यांसारख्या बदलांमुळे खराब होऊ शकते.

प्रोव्हनन्स अधिक लवचिक करण्यासाठी, आम्ही बहुस्तरीय दृष्टिकोन स्वीकारत आहोत आणि Google DeepMindच्या SynthID(नवीन विंडोमध्ये उघडेल) द्वारे वॉटरमार्किंग समाविष्ट करत आहोत, सुरुवात ChatGPT, Codex, किंवा OpenAI API द्वारे तयार झालेल्या प्रतिमांपासून. SynthID एक अदृश्य वॉटरमार्किंग थर अंतर्भूत करते, जे C2PA च्या मेटाडेटा-आधारित दृष्टिकोनांना पूरक ठरते.

आम्ही काही काळापासून याच दिशेने काम करत आहोत. आम्ही Sora मध्ये दृश्यमान वॉटरमार्क आणि Voice Engine मध्ये ऑडिओ वॉटरमार्क वापरले आहेत, आणि कालांतराने अचूकता व विश्वासार्हतेची चाचणी आणि संशोधन सुरू ठेवले आहे. अंमलबजावणीद्वारे.

ही दोन्ही प्रणाली एकमेकांना बळकटी देतात. C2PA मजकुरासोबत सविस्तर संदर्भ वाहून नेण्यास मदत करते; तर, जेव्हा मेटाडेटा टिकून राहत नाही, तेव्हा SynthID एखादा संकेत जतन करण्यास मदत करते. स्क्रीनशॉट्ससारख्या रूपांतरांमधूनही वॉटरमार्किंग अधिक टिकून राहू शकते, तर केवळ वॉटरमार्कपेक्षा मेटाडेटा अधिक माहिती प्रदान करू शकतो. एकत्रितपणे, हे दोन्ही स्तर स्वतंत्रपणे जितके सक्षम असतील त्यापेक्षा प्रोव्हनन्स अधिक लवचिक बनवतात.

दोन प्रतिमा-उत्पत्ती संकेतांची तुलना करणारी आकृती: C2PA विश्वासार्ह OpenAI जारीकर्त्याची पुष्टी करण्यासाठी पडताळता येणारा स्वाक्षरी केलेला मेटाडेटा जोडते, तर SynthID पिक्सेल-स्तरीय संकेत एम्बेड करते, जो प्रतिमा OpenAI द्वारे एन्कोड केली होती की नाही हे दर्शवण्यासाठी शोधता येतो.

शोध आणि आमच्या सार्वजनिक पडताळणी साधनाची झलक

विश्वासार्ह मेटाडेटा आणि बहुतेक बदलांना प्रतिकार करणारे वॉटरमार्क प्रोव्हनन्स संकेत अधिक टिकाऊ बनवू शकतात. पण लोकांना हे संकेत शोधण्याचा मार्ग हवा. आम्ही आता सार्वजनिक पडताळणी साधनाची झलक देत आहोत, जे अपलोड केलेली प्रतिमा ChatGPT, OpenAI API, किंवा Codex वर तयार झाली आहे का हे लोकांना पडताळण्यास मदत करेल, त्यात कंटेंट क्रीडेंशियल्स आणि SynthIDसह प्रोव्हनन्स संकेत आहेत का हे तपासून.

आमचा विश्वास आहे की लोकांना स्रोताची पडताळणी करणे आणि त्याचा अर्थ लावणे अधिक सोपे असावे, आणि अनेक संकेत एकत्रित करून आमचे साधन लोकांना “हे AI द्वारे तयार केले आहे का?” या प्रश्नाचे उत्तर देण्यात भूमिका बजावण्यास मदत करू शकते. हे 2024 मधील आमच्या प्रतिमा शोध वर्गीकरणकर्त्याच्या प्रारंभिक संशोधन झलकमधील शिकवणींवर आधारित आहे आणि OpenAI कडून आलेला SynthID वॉटरमार्क माध्यमात आहे का हे लोकांना विश्वासार्हपणे शोधता येते, तसेच C2PA मेटाडेटा आढळल्यास तेही दाखवते.

अपलोड केलेल्या प्रतिमेसाठी पडताळणीचा निकाल दाखवणारे OpenAI वेबपेज, ज्यामध्ये आढळलेल्या SynthID आणि कंटेंट क्रीडेंशियल्स संकेतांवर आधारित ती OpenAI साधनांचा वापर करून तयार केली गेल्याची पुष्टी केली आहे.

कोणतीही शोध पद्धत पूर्णपणे अचूक नसते, त्यामुळे शोध अयशस्वी झाल्यास आम्ही सावध दृष्टिकोन स्वीकारतो. उदाहरणार्थ, जर कोणतेही मेटाडेटा किंवा वॉटरमार्क आढळले नाहीत, तर हे साधन—ती प्रतिमा OpenAI च्या साधनांद्वारे तयार केली गेली आहे की नाही याविषयी—कोणताही निश्चित निष्कर्ष काढणार नाही; कारण काही प्रकरणांमध्ये, प्रतिमेच्या मूळ स्रोताशी संबंधित संकेत काढून टाकले जाण्याची शक्यता असते.

लॉन्चच्या वेळी, हे साधन OpenAI ने तयार केलेल्या सामग्रीपुरते मर्यादित आहे. पुढील काही महिन्यांत, प्लॅटफॉर्मदरम्यान पडताळणी शक्य करण्यासाठी आम्ही बहु-उद्योगीय प्रयत्नांना समर्थन देण्याचे उद्दिष्ट ठेवतो. कालांतराने, लोकांना ऑनलाइन भेटू शकणाऱ्या अधिक प्रकारच्या सामग्रीला समर्थन देण्याचीही आम्ही अपेक्षा करतो.

भविष्यातील दृष्टीकोन

एकही प्रोव्हनन्स तंत्र स्वतःपुरते पुरेसे नाही. आमचा विश्वास आहे की मजबूत दृष्टिकोनात सामायिक मानके, टिकाऊ वॉटरमार्किंग संकेत, आणि सार्वजनिक पडताळणी यांचा समावेश असतो. Content Credentialsला आमच्या दीर्घकालीन समर्थनावर आधार घेत, C2PAशी अनुरूप होत, SynthID स्वीकारत, आणि सार्वजनिक पडताळणी साधनांची झलक देत, आम्ही दीर्घकाळात अधिक परस्पर-सुसंगत प्रोव्हनन्स परिसंस्थेत योगदान देण्याची आशा करतो.

लेखक

OpenAI