გადადით მთავარ შინაარსზე
OpenAI

19 მაისი, 2026

უსაფრთხოება

შიგთავსის წარმომავლობის მიკვლევადობის გაუმჯობესება ხელოვნური ინტელექტის უფრო უსაფრთხო და გამჭვირვალე ეკოსისტემისთვის

ადამიანებს ვეხმარებით, გაერკვიონ ხელოვნური ინტელექტის მიერ გენერირებული შიგთავსის წარმომავლობაში ისეთი ტექნოლოგიების მეშვეობით, როგორიცაა Content Credentials, SynthID და ადრეული საჯარო შემოწმების ხელსაწყო.

იტვირთება…

ადამიანები ყოველდღიურად იყენებენ OpenAI-ს ხელსაწყოებს სურათებისა და აუდიომასალების შესაქმნელად და დასარედაქტირებლად. ისინი იყენებენ ისეთი გზებს, რომლებიც კომუნიკაციას უფრო გამომხატველს, სასარგებლოსა და ხელმისაწვდომს ხდის. აღნიშნული ხელსაწყოები ხდება იმის ნაწილი, თუ როგორ ქმნიან, წარმოიდგენენ და აზიარებენ ადამიანები შიგთავსს, ამიტომ მნიშვნელოვანია, რომ მათ შეეძლოთ მედიამასალის წარმომავლობის გაგება და გადამოწმება, რათა მეტი თავდაჯერებით მოახდინონ მისი ინტერპრეტირება. ამას შეიძლება ხელი შეუწყოს წარმომავლობის სიგნალებმა. ისინი ადამიანებს აწვდის კონტექსტს, თუ საიდან გაჩნდა, როგორ შეიქმნა ან დარედაქტირდა შიგთავსი და ნამდვილად ის არის თუ არა, რადაც თავს ასაღებს.

დღეს ჩვენ ვაძლიერებთ შიგთავსის წარმომავლობისადმი მიდგომას მრავალშრიანი, ეკოსისტემაზე დაფუძნებული მოდელით, რომელიც ინტერნეტში ნდობის ჩამოყალიბებას ისახავს მიზნად. ჩვენს წარმომავლობის სიგნალებს ვამარტივებთ, რომ სხვა ხელსაწყოებმა და პლატფორმებმა იოლად ამოიცნოს ისინი C2PA-სთან შესაბამისობის მეშვეობით; Google-თან თანამშრომლობით სურათებს ვამატებთ გამძლე, პლატფორმათაშორის SynthID წყლის ნიშნებს; და ვაზიარებთ იმ ხელსაწყოს წინასწარ ვერსიას, რომლის გამოყენებითაც საზოგადოებას შეუძლია, შეამოწმოს OpenAI არის თუ არა სურათების წარმომავლობის წყარო.

ერთად აღებული, ეს განახლებები ეყრდნობა ჩვენს ადრინდელ სამუშაოს, რომელიც მიზნად ისახავს, მხარი დაუჭიროს ღია სტანდარტებს, გაამარტივოს OpenAI-ს მიერ გენერირებული შიგთავსის ამოცნობა და ხელი შეუწყოს მთელი დარგის მასშტაბით თანამშრომლობას უფრო სანდო საინფორმაციო ეკოსისტემის ჩამოსაყალიბებლად.

ნდობის ეკოსისტემის ჩამოყალიბება C2PA-სთან შესაბამისობის მეშვეობით

OpenAI წარმომავლობის სტანდარტების შემუშავებასა და დანერგვაში ჩართულია 2024 წლიდან, როცა დავიწყეთ Content Credentials ტექნოლოგიის დამატება DALL·E 3(იხსნება ახალ ფანჯარაში)-ის მიერ გენერირებულ სურათებზე, მოგვიანებით კი იგივე ტექნოლოგია გამოვიყენეთ ImageGen(იხსნება ახალ ფანჯარაში)-ისა და Sora(იხსნება ახალ ფანჯარაში)-ს მიერ გენერირებული სურათების შემთხვევაშიც. ჩვენ შევუერთდით ორგანიზაციის Coalition for Content Provenance and Authenticity (C2PA) მართვის კომიტეტს. ესაა სხვადასხვა დარგის წარმომადგენლებისგან შემდგარი ჯგუფი, რომელიც შიგთავსის წარმომავლობის ღია ტექნიკური სტანდარტის უკან დგას. C2PA-ს ტექნიკური მიდგომა იყენებს მეტამონაცემებსა და კრიპტოგრაფიულ ხელმოწერებს, რომ მედიაფაილის შესახებ ინფორმაცია დაცულად გაჰყვეს თვითონ შიგთავსს. ამ ინფორმაციაში შედის კონტექსტი, რომლის მეშვეობითაც ჟურნალისტები აფასებენ წყაროს, პლატფორმები იღებენ გადაწყვეტილებებს მთლიანობასთან დაკავშირებით, ხოლო ადამიანები ერკვევიან იმაში, რასაც ონლაინ ხედავენ.

ახლახან კიდევ ერთი ნაბიჯი გადავდგით და OpenAI-მ მიიღო C2PA-ს მოთხოვნებთან თავსებადი გენერატორის(იხსნება ახალ ფანჯარაში) სტატუსი. ჩვენ გავხდით C2PA-სთან თავსებადი და პლატფორმებს ვაძლევთ სანდო გზას, რომ წაიკითხონ, შეინახონ და გადასცენ წარმომავლობის შესახებ ინფორმაცია, რომელსაც თან ვურთავთ შიგთავსს. ეს მნიშვნელოვანია, რადგან წარმომავლობის განსაზღვრა მხოლოდ მაშინ მუშაობს, თუ ის ინახება იმ პლატფორმის მიღმაც, სადაც შიგთავსი შეიქმნა. სტანდარტთან შესაბამისობა სწორედ ამის საშუალებას იძლევა.

მრავალშრიანი მიდგომა სურათების წარმომავლობის დასადგენად Google-ის SynthID ტექნოლოგიის გამოყენებით

C2PA-ს მეტამონაცემები მნიშვნელოვანი საფუძველია წარმომავლობის განსასაზღვრად. ისინი შიგთავსს საშუალებას აძლევს, თან ჰქონდეს ინფორმაცია იმის შესახებ, თუ საიდან მოდის, როგორ შეიქმნა თუ დარედაქტირდა და ვინ მოაწერა ხელი აღნიშნულ ინფორმაციას. მაგრამ მეტამონაცემები მთლად საიმედო არ არის. შესაძლებელია მათი მოცილება, დაკარგვა ატვირთვისას და ჩამოტვირთვისას და დაზიანება ისეთი გარდაქმნების შედეგად, როგორიცაა ფაილის ფორმატის ცვლილება, ზომის შეცვლა და ეკრანის ანაბეჭდები.

წარმომავლობის უფრო მეტად დასაცავად ჩვენ ვიყენებთ მრავალშრიან მიდგომას და წყლის ნიშნებს ვამატებთ Google DeepMind-ის SynthID(იხსნება ახალ ფანჯარაში) ტექნოლოგიის გამოყენებით, დაწყებული ChatGPT-ს, Codex-ისა და OpenAI API-ს მეშვეობით გენერირებული სურათებით. SynthID შიგთავსში სვამს წყლის ნიშნის უხილავ ფენას, რომელიც ავსებს C2PA-ს მეტამონაცემებზე დაფუძნებულ მიდგომებს.

დიდი ხანია, ამისთვის ვემზადებით. Sora-ში გამოვიყენეთ ხილული წყლის ნიშნები, ხოლო Voice Engine მოდელში — ხმოვანი წყლის ნიშანი, ხოლო შემდგომ გავაგრძელეთ მათი სიზუსტისა და საიმედოობის ტესტირება და კვლევა. დანერგვის ჩათვლით.

ეს ორი სისტემა ერთმანეთს აძლიერებს. C2PA შიგთავსს ეხმარება დეტალური კონტექსტის შენარჩუნებაში; SynthID ხელს უწყობს სიგნალის შენარჩუნებას, როცა მეტამონაცემები იკარგება. წყლის ნიშნებმა შეიძლება უფრო გაუძლოს ისეთ გარდაქმნებს, როგორიცაა ეკრანის ანაბეჭდები, ხოლო მეტამონაცემებს უფრო მეტი ინფორმაციის მიწოდება შეუძლია, ვიდრე მხოლოდ წყლის ნიშანს. ერთობლივად ისინი წარმომავლობას განსაზღვრას უფრო მედეგს ხდის, ვიდრე ცალკე აღებული რომელიმე მათგანი.

დიაგრამა, რომელიც ერთმანეთს ადარებს სურათის წარმომავლობის ორ სიგნალს: C2PA ამატებს ხელმოწერილ მეტამონაცემებს, რომელთა შემოწმებაც შესაძლებელია OpenAI-ს სანდო გამომცემლის დასადასტურებლად, ხოლო SynthID სურათში სვამს სიგნალს პიქსელების დონეზე. ამ სიგნალის აღმოჩენით შეიძლება განისაზღვროს, იყო თუ არა სურათი კოდირებული OpenAI-ს მიერ.

აღმოჩენა და შემოწმების საჯარო ხელსაწყოს გადახედვა

სანდო მეტამონაცემებმა და წყლის ნიშნებმა, რომლებიც ცვლილებების უმეტესობას უძლებს, წარმომავლობის სიგნალები უფრო გამძლე შეიძლება გახადოს. მაგრამ ადამიანებს სჭირდებათ ამ სიგნალების აღმოჩენის საშუალება. ახლა წარმოგიდგენთ შემოწმების საჯარო ხელსაწყოს წინასწარ ვერსიას, რომელიც ადამიანებს დაეხმარება, შეამოწმონ, შეიქმნა თუ არა ატვირთული სურათი ChatGPT‑ში, OpenAI API-ში ან Codex-ში. კერძოდ, ხელსაწყო ამოწმებს, შეიცავს თუ არა სურათი წარმომავლობის სიგნალებს, მათ შორის, Content Credentials და SynthID ტექნოლოგიებს.

გვჯერა, რომ ადამიანებისთვის წარმომავლობის შემოწმება და ინტერპრეტაცია უფრო მარტივი უნდა იყოს. ჩვენი ხელსაწყო მათ დაეხმარება, თავიანთი წვლილი შეიტანონ და პასუხი გასცენ შეკითხვას „ეს ხელოვნური ინტელექტის მეშვეობით შეიქმნა?“. ამისთვის ხელსაწყოში მრავალი სიგნალია ინტეგრირებული. ეს ეფუძნება 2024 წელს სურათების ამოცნობის კლასიფიკატორის საწყისი კვლევითი წინასწარი ვერსიიდან მიღებულ ცოდნას და ადამიანებს საშუალებას აძლევს, საიმედოდ დაადგინონ, არის თუ არა მედიაფაილში OpenAI-დან მომავალი SynthID-ს წყლის ნიშანი, ხოლო აღმოჩენის შემთხვევაში ნახონ C2PA-ს მეტამონაცემები.

OpenAI-ს ვებგვერდი, რომელზეც ნაჩვენებია ატვირთული სურათის შემოწმების შედეგი და დასტურდება, რომ ის OpenAI-ს ხელსაწყოებით შეიქმნა, რადგან აღმოჩენილია SynthID და Content Credentials სიგნალებ.

აღმოჩენის არცერთი მეთოდი არ არის მთლიანად უშეცდომო, ამიტომ იმ შემთხვევებში, თუ აღმოჩენა ვერ ხერხდება, ფრთხილ მიდგომას ვიყენებთ. მაგალითად, თუ მეტამონაცემები ან წყლის ნიშანი არ არის აღმოჩენილი, ხელსაწყო კატეგორიულ დასკვნას არ გააკეთებს იმის შესახებ, შეიქმნა თუ არა სურათი OpenAI-ს ხელსაწყოების მეშვეობით, რადგან წარმომავლობის სიგნალები ზოგიერთ შემთხვევაში შეიძლება წაიშალოს.

გამოშვების მომენტში ხელსაწყო შემოიფარგლება OpenAI-ს მიერ გენერირებული შიგთავსით. მომდევნო თვეებში ვგეგმავთ, მხარი დავუჭიროთ დარგთაშორის ძალისხმევას, რომ შემოწმება შესაძლებელი გახდეს სხვადასხვა პლატფორმაზე. ამასთანავე, ვგეგმავთ, რომ დროთა განმავლობაში მხარდაჭერა მიიღოს უფრო მეტი სახის შიგთავსმა, რომელსაც ადამიანები ინტერნეტში შეიძლება წააწყდნენ.

მომავლის ხედვები

წარმომავლობის დადგენის არცერთი ცალკე აღებული მეთოდი არ არის საკმარისი. მიგვაჩნია, რომ ძლიერი მიდგომა აერთიანებს საერთო სტანდარტებს, წყლის ნიშნით მარკირების გამძლე სიგნალებსა და საჯარო შემოწმებას. ვიმედოვნებთ, რომ გრძელვადიან პერსპექტივაში წვლილს შევიტანთ წარმომავლობის დადგენის უფრო ურთიერთთავსებად ეკოსისტემაში. ამის თქმის საფუძველს გვაძლევს ჩვენი მხრიდან Content Credentials ტექნოლოგიის ხანგრძლივი მხარდაჭერა, C2PA-სთან შესაბამისობის მიღწევა, SynthID ტექნოლოგიის დანერგვა და შემოწმების საჯარო ხელსაწყოს წინასწარი ვერსიის წარდგენა.

ავტორი

OpenAI