მიკერძოების შემცირება და უსაფრთხოების გაუმჯობესება DALL·E 2-ში
დღეს ვნერგავთ ახალ ტექნიკას, რათა DALL·E-მ შექმნას ადამიანების გამოსახულებები, რომლებიც უფრო ზუსტად ასახავს მსოფლიოს მოსახლეობის მრავალფეროვნებას.

დღეს ვნერგავთ ახალ ტექნიკას, რათა DALL·E-მ შექმნას ადამიანების გამოსახულებები, რომლებიც უფრო ზუსტად ასახავს მსოფლიოს მოსახლეობის მრავალფეროვნებას. ეს ტექნიკა გამოიყენება სისტემურ დონეზე, როდესაც DALL·E იღებს მოთხოვნას, რომელიც აღწერს ადამიანს, მაგრამ არ აკონკრეტებს რასას ან სქესს, მაგალითად, „მეხანძრე“.
ჩვენი შიდა შეფასების საფუძველზე, მომხმარებლები 12-ჯერ უფრო ხშირად ამბობდნენ, რომ ამ ტექნიკის გამოყენების შემდეგ DALL·E-ის გამოსახულებებში სხვადასხვა წარმომავლობის ადამიანები იყვნენ წარმოდგენილი. ვგეგმავთ ამ ტექნიკის გაუმჯობესებას დროთა განმავლობაში, რადგან უფრო მეტ მონაცემსა და გამოხმაურებას ვაგროვებთ.
აპრილში დავიწყეთ DALL·E 2-ის კვლევის წინასწარი გაცნობა ადამიანების შეზღუდული რაოდენობისთვის, რამაც საშუალება მოგვცა უკეთ გაგვეგო სისტემის შესაძლებლობები და შეზღუდვები და გაგვეუმჯობესებინა ჩვენი უსაფრთხოების სისტემები.
წინასწარი გაცნობის ამ ეტაპზე ადრეულმა მომხმარებლებმა მონიშნეს მგრძნობიარე და მიკერძოებული გამოსახულებები, რაც დაგვეხმარა ამ ახალი შემამსუბუქებელი ზომის ჩამოყალიბებასა და შეფასებაში.
ვაგრძელებთ კვლევას იმის შესახებ, თუ როგორ შეიძლება DALL·E-ის მსგავსმა AI სისტემებმა ასახონ მიკერძოებები თავიანთ სასწავლო მონაცემებში და რა სხვადასხვა გზებით შეგვიძლია მათთან გამკლავება.
კვლევითი წინასწარი გაცნობის პერიოდში ასევე გადავდგით სხვა ნაბიჯები ჩვენი უსაფრთხოების სისტემების გასაუმჯობესებლად, მათ შორის:
- DALL·E-ის მოტყუებითი შინაარსის შესაქმნელად ბოროტად გამოყენების რისკის შემცირება, რეალისტური სახეების შემცველი ატვირთული გამოსახულებებისა და საჯარო პირების, მათ შორის ცნობილებისა და გამორჩეული პოლიტიკური ფიგურების, მსგავსი გამოსახულებების შექმნის მცდელობების უარყოფით.
- ჩვენი შინაარსის ფილტრების უფრო ზუსტად მუშაობის უზრუნველყოფა, რათა ისინი უფრო ეფექტურად ბლოკავდნენ მოთხოვნებსა და ატვირთულ გამოსახულებებს, რომლებიც არღვევს ჩვენს შინაარსის პოლიტიკას(იხსნება ახალ ფანჯარაში), და ამავე დროს კვლავ იძლეოდეს შემოქმედებითი გამოხატვის საშუალებას.
- ავტომატური და ადამიანური მონიტორინგის სისტემების დახვეწა ბოროტად გამოყენებისგან დასაცავად.
ეს გაუმჯობესებები დაგვეხმარა უფრო მეტად დარწმუნებულიყავით იმაში, რომ შეგვიძლია DALL·E-ის გამოსაცდელად მეტი მომხმარებლის მოწვევა.
წვდომის გაფართოება ჩვენი AI სისტემების პასუხისმგებლობით დანერგვის მნიშვნელოვანი ნაწილია, რადგან ეს გვაძლევს საშუალებას მეტი ვისწავლოთ რეალურ სამყაროში გამოყენების შესახებ და გავაგრძელოთ ჩვენი უსაფრთხოების სისტემების გაუმჯობესება.














