১৯ মে, ২০২৬

আরও নিরাপদ ও স্বচ্ছ AI ইকোসিস্টেমের জন্য কনটেন্ট প্রোভেন্যান্সকে এগিয়ে নেওয়া

Content Credentials, SynthID এবং একটি প্রাথমিক জনসাধারণের যাচাইকরণ টুলের মাধ্যমে মানুষকে AI-উৎপাদিত কনটেন্টের উৎস বুঝতে সহায়তা করা.

আমাদের টুলটি ব্যবহার করে দেখুন

লোডিং…

মানুষ প্রতিদিন OpenAI-এর টুল ব্যবহার করে এমনভাবে ছবি ও অডিও তৈরি ও সম্পাদনা করছে, যা যোগাযোগকে আরও প্রকাশক্ষম, উপযোগী এবং সহজপ্রাপ্য করে তোলে. এই টুলগুলো মানুষ কীভাবে তৈরি করে, কল্পনা করে এবং শেয়ার করে তার অংশ হয়ে উঠছে, তাই মিডিয়া কোথা থেকে এসেছে তা মানুষ বুঝতে ও যাচাই করতে পারা গুরুত্বপূর্ণ, যাতে তারা আরও আত্মবিশ্বাসের সঙ্গে তা ব্যাখ্যা করতে পারে. প্রোভেন্যান্স সংকেত মানুষকে এই প্রেক্ষাপট দিয়ে সহায়তা করতে পারে যে কনটেন্ট কোথা থেকে এসেছে, কীভাবে এটি তৈরি বা সম্পাদনা করা হয়েছে, এবং এটি যা দাবি করছে তা-ই কি না.

আজ আমরা অনলাইনে আস্থা গড়ে তুলতে কনটেন্ট প্রোভেন্যান্সে আমাদের পদ্ধতিকে আরও শক্তিশালী করছি, একটি বহুস্তরীয়, ইকোসিস্টেম-চালিত মডেলের মাধ্যমে. আমরা C2PA conformance-এর মাধ্যমে আমাদের প্রোভেন্যান্স সংকেতকে অন্য টুল ও প্ল্যাটফর্মের জন্য আরও সহজে শনাক্তযোগ্য করছি, Google-এর সঙ্গে অংশীদারিত্বের মাধ্যমে ছবিতে টেকসই cross-platform SynthID watermarking যোগ করছি, এবং OpenAI থেকে ছবি এসেছে কি না তা যাচাই করতে জনসাধারণ ব্যবহার করতে পারবে এমন একটি টুলের প্রিভিউ শেয়ার করছি.

একসঙ্গে, এই আপডেটগুলো উন্মুক্ত মানদণ্ডকে সমর্থন করা, OpenAI-উৎপাদিত কনটেন্টকে আরও সহজে শনাক্তযোগ্য করা এবং আরও নির্ভরযোগ্য তথ্য ইকোসিস্টেমকে সমর্থন করতে শিল্পখাত জুড়ে সহযোগিতা করার ক্ষেত্রে আমাদের পূর্ববর্তী কাজের⁠ উপর ভিত্তি করে তৈরি হয়েছে.

C2PA conformance-এর মাধ্যমে আস্থার ইকোসিস্টেম গড়ে তোলা

2024 সাল থেকে OpenAI প্রোভেন্যান্স মানদণ্ডের উন্নয়ন ও গ্রহণে যুক্ত রয়েছে, যখন আমরা DALL·E 3⁠(একটি নতুন উইন্ডোতে খোলে) দ্বারা তৈরি ছবিতে এবং পরে ImageGen⁠(একটি নতুন উইন্ডোতে খোলে) ও Sora⁠(একটি নতুন উইন্ডোতে খোলে)-তে Content Credentials যোগ করা শুরু করি. আমরাও কন্টেন্ট প্রোভেনেন্সের জন্য উন্মুক্ত প্রযুক্তিগত মানের নেপথ্যে থাকা বিভিন্ন শিল্পের সমন্বয়ে গঠিত কোয়ালিশন ফর কন্টেন্ট প্রোভেনেন্স অ্যান্ড অথেন্টিসিটি (C2PA)-এর স্টিয়ারিং কমিটিতে যোগদান করেছি. C2PA-এর প্রযুক্তিগত পদ্ধতি মেটাডেটা এবং ক্রিপ্টোগ্রাফিক স্বাক্ষর ব্যবহার করে কোনো মিডিয়া সম্পর্কিত তথ্যকে কন্টেন্টটির সাথেই নিরাপদে স্থানান্তর করতে সাহায্য করে. এই তথ্যের মধ্যে এমন প্রেক্ষাপট থাকে যা কোনো উৎস মূল্যায়নকারী সাংবাদিক, অখণ্ডতা-সংক্রান্ত সিদ্ধান্ত নেওয়া প্ল্যাটফর্ম এবং অনলাইনে তারা কী দেখছে তা বোঝার চেষ্টা করা মানুষকে সহায়তা করে.

সম্প্রতি আমরা OpenAI-কে একটি C2PA Conforming Generator Product⁠(একটি নতুন উইন্ডোতে খোলে) করার পদক্ষেপ নিয়েছি. C2PA-সম্মত হওয়ার মাধ্যমে, আমরা প্ল্যাটফর্মগুলোকে আমাদের কন্টেন্টের সাথে সংযুক্ত উৎস-সংক্রান্ত তথ্য পড়া, সংরক্ষণ করা এবং হস্তান্তর করার একটি নির্ভরযোগ্য উপায় দিচ্ছি. এটি গুরুত্বপূর্ণ, কারণ উৎসের সত্যতা তখনই কার্যকর হয় যখন তা কন্টেন্ট তৈরির প্রথম প্ল্যাটফর্মের পরেও টিকে থাকে এবং সঙ্গতিই তা সম্ভব করে তোলে.

ছবির জন্য Google SynthID সহ প্রোভেন্যান্সে একটি বহুস্তরীয় পদ্ধতি

C2PA metadata প্রোভেন্যান্সের জন্য একটি গুরুত্বপূর্ণ ভিত্তি. এটি কনটেন্টকে কোথা থেকে এসেছে, কীভাবে তৈরি বা সম্পাদনা করা হয়েছে, এবং কে সেই তথ্য স্বাক্ষর করেছে—এসব তথ্য বহন করতে সহায়তা করে. কিন্তু metadata নির্ভুলতার নিশ্চয়তা দেয় না. এটি মুছে ফেলা যেতে পারে, আপলোড ও ডাউনলোডের সময় হারিয়ে যেতে পারে, অথবা file format পরিবর্তন, resizing, বা screenshot-এর মতো রূপান্তরে নষ্ট হয়ে যেতে পারে.

উৎসের নির্ভরযোগ্যতা আরও বাড়াতে, আমরা একটি বহুস্তরীয় পদ্ধতি গ্রহণ করছি এবং ChatGPT⁠(একটি নতুন উইন্ডোতে খোলে), Codex বা OpenAI API-এর মাধ্যমে তৈরি করা ছবিগুলো থেকে শুরু করে Google DeepMind-এর SynthID⁠ ব্যবহার করে ওয়াটারমার্কিং যুক্ত করছি. SynthID একটি অদৃশ্য ওয়াটারমার্কিং স্তর অন্তর্ভুক্ত করে যা C2PA মেটাডেটা-ভিত্তিক পদ্ধতিগুলোর পরিপূরক হিসেবে কাজ করে.

আমরা কিছু সময় ধরেই এটির দিকে এগোচ্ছিলাম. আমরা Sora-তে দৃশ্যমান ওয়াটারমার্ক⁠ এবং Voice Engine-এ একটি অডিও ওয়াটারমার্ক⁠ ব্যবহার করেছি এবং সময়ের সঙ্গে নির্ভুলতা ও নির্ভরযোগ্যতা পরীক্ষা ও গবেষণা চালিয়ে গেছি. মোতায়েনের মাধ্যমে.

এই দুটি সিস্টেম একে অপরকে শক্তিশালী করে. C2PA কনটেন্টকে বিস্তারিত প্রেক্ষাপট বহন করতে সহায়তা করে; metadata টিকে না থাকলে SynthID একটি সংকেত সংরক্ষণে সহায়তা করে. screenshot-এর মতো রূপান্তরের মধ্যেও watermarking বেশি টেকসই হতে পারে, আর metadata একা একটি watermark-এর চেয়ে বেশি তথ্য দিতে পারে. একসঙ্গে, তারা প্রোভেন্যান্সকে এমনভাবে আরও স্থিতিস্থাপক করে তোলে, যা এককভাবে কোনো স্তরই পারত না.

দুটি ছবির উৎস-প্রমাণ সংকেত তুলনা করা ডায়াগ্রাম: C2PA স্বাক্ষরিত মেটাডেটা যোগ করে, যা একটি বিশ্বস্ত OpenAI ইস্যুয়ার নিশ্চিত করতে যাচাই করা যায়, আর SynthID পিক্সেল-স্তরের একটি সংকেত এমবেড করে, যা কোনো ছবি OpenAI দ্বারা এনকোড করা হয়েছে কিনা তা নির্দেশ করতে শনাক্ত করা যায়.

শনাক্তকরণ এবং আমাদের জনসাধারণের যাচাইকরণ টুলের একটি প্রিভিউ

নির্ভরযোগ্য মেটাডেটা এবং ওয়াটারমার্ক, যা বেশিরভাগ পরিবর্তন প্রতিরোধ করতে পারে, তা উৎসের সংকেতকে আরও টেকসই করে তুলতে পারে. কিন্তু মানুষের এসব সংকেত শনাক্ত করার একটি উপায় দরকার. আমরা এখন একটি জনসাধারণের যাচাইকরণ টুলের⁠ প্রিভিউ দিচ্ছি, যা আপলোড করা কোনো ছবি ChatGPT, OpenAI API বা Codex-এ তৈরি হয়েছে কি না তা মানুষকে যাচাই করতে সহায়তা করবে, এটি Content Credentials এবং SynthID-সহ প্রোভেন্যান্স সংকেত ধারণ করে কি না তা পরীক্ষা করে.

আমরা বিশ্বাস করি প্রোভেন্যান্স মানুষের জন্য যাচাই ও ব্যাখ্যা করা আরও সহজ হওয়া উচিত, এবং আমাদের টুল একাধিক সংকেত একত্র করে মানুষকে এই প্রশ্নের উত্তর খুঁজতে ভূমিকা রাখতে সহায়তা করতে পারে, “এটি কি AI দিয়ে তৈরি করা হয়েছে?” এটি 2024 সালে আমাদের ইমেজ ডিটেকশন ক্লাসিফায়ারের⁠ প্রাথমিক গবেষণা প্রিভিউ থেকে প্রাপ্ত শিক্ষার উপর ভিত্তি করে তৈরি এবং এটি মানুষকে মিডিয়াতে OpenAI থেকে উদ্ভূত কোনো SynthID ওয়াটারমার্ক আছে কিনা তা নির্ভরযোগ্যভাবে শনাক্ত করতে সক্ষম করে এবং এটি পাওয়া গেলে C2PA মেটাডেটাও প্রদর্শন করে.

OpenAI ওয়েবপেজে একটি আপলোড করা ছবির যাচাইকরণের ফলাফল দেখানো হচ্ছে, যেখানে শনাক্ত করা SynthID এবং Content Credentials সংকেতের ভিত্তিতে নিশ্চিত করা হচ্ছে যে এটি OpenAI টুল দিয়ে তৈরি করা হয়েছে.

কোনো শনাক্তকরণ পদ্ধতিই নির্ভুলতার নিশ্চয়তা দেয় না, তাই শনাক্তকরণ ব্যর্থ হলে আমরা সতর্ক পদ্ধতি গ্রহণ করি. উদাহরণস্বরূপ, যদি কোনো metadata বা watermark শনাক্ত না হয়, তাহলে টুলটি ছবিটি OpenAI-এর টুল দিয়ে তৈরি হয়েছে কি না সে বিষয়ে চূড়ান্ত সিদ্ধান্ত দেবে না, কারণ কিছু ক্ষেত্রে প্রোভেন্যান্স সংকেত মুছে ফেলা যেতে পারে.

উদ্বোধনের সময় টুলটি OpenAI-উৎপাদিত কনটেন্টেই সীমিত. আগামী মাসগুলোতে আমরা প্ল্যাটফর্মজুড়ে যাচাইকরণ সম্ভব করতে আন্তঃশিল্প প্রচেষ্টাকে সমর্থন করার লক্ষ্য রাখি. সময়ের সঙ্গে আমরা অনলাইনে মানুষ যে আরও বেশি ধরনের কনটেন্টের মুখোমুখি হতে পারে, সেগুলোকেও সমর্থন করার আশা করি.

ভবিষ্যতের কথা বিবেচনা করে

একটি মাত্র প্রোভেন্যান্স কৌশল নিজে নিজে যথেষ্ট নয়. আমরা বিশ্বাস করি একটি শক্তিশালী পদ্ধতিতে যৌথ মানদণ্ড, টেকসই watermarking সংকেত, এবং জনসাধারণের যাচাইকরণ একত্রিত থাকে. Content Credentials-এর প্রতি আমাদের দীর্ঘদিনের সমর্থনের ওপর ভিত্তি করে, C2PA-এর সঙ্গে conformant হওয়া, SynthID গ্রহণ করা, এবং জনসাধারণের যাচাইকরণ টুলিংয়ের প্রিভিউ দেওয়ার মাধ্যমে আমরা আশা করি দীর্ঘমেয়াদে আরও আন্তঃকার্যক্ষম প্রোভেন্যান্স ইকোসিস্টেমে অবদান রাখতে পারব.