კონსისტენტურობის მოდელების გაწვრთნის გაუმჯობესებული მეთოდები

კონსისტენტურობის მოდელები გენერაციული მოდელების ახალი ოჯახია, რომელსაც შეუძლია მაღალი ხარისხის მონაცემების ერთ ნაბიჯში გენერირება მოწინააღმდეგური გაწვრთნის გარეშე. ამჟამინდელი კონსისტენტურობის მოდელები ნიმუშების ოპტიმალურ ხარისხს აღწევს წინასწარ გაწვრთნილი დიფუზიური მოდელებიდან დისტილაციით და ისეთი ნასწავლი მეტრიკების გამოყენებით, როგორიცაა LPIPS. თუმცა, დისტილაცია კონსისტენტურობის მოდელების ხარისხს წინასწარ გაწვრთნილი დიფუზიური მოდელის ხარისხით ზღუდავს, ხოლო LPIPS შეფასებაში არასასურველ მიკერძოებას იწვევს. ამ გამოწვევების გადასაჭრელად წარმოგიდგენთ კონსისტენტური გაწვრთნის გაუმჯობესებულ ტექნიკებს, სადაც კონსისტენტურობის მოდელები დისტილაციის გარეშე უშუალოდ მონაცემებიდან სწავლობენ. ჩვენ განვიხილავთ კონსისტენტური გაწვრთნის თეორიას და ვადგენთ მანამდე შეუმჩნეველ ხარვეზს, რომელსაც ვასწორებთ მასწავლებელი კონსისტენტურობის მოდელიდან Exponential Moving Average-ის ამოღებით. LPIPS-ის მსგავსი ნასწავლი მეტრიკების ჩასანაცვლებლად ვიყენებთ Pseudo-Huber დანაკარგებს მდგრადი სტატისტიკიდან. დამატებით, კონსისტენტური გაწვრთნის მიზნისთვის შემოგვაქვს lognormal ხმაურის განრიგი და ვთავაზობთ, რომ გაწვრთნის იტერაციების განსაზღვრული რაოდენობის შემდეგ დისკრეტიზაციის ნაბიჯების საერთო რაოდენობა გაორმაგდეს. უკეთეს ჰიპერპარამეტრების მორგებასთან ერთად, ეს ცვლილებები კონსისტენტურობის მოდელებს საშუალებას აძლევს, ერთჯერადი სემპლირების ნაბიჯში CIFAR-10-სა და ImageNet 64×64-ზე შესაბამისად მიაღწიონ FID ქულებს 2.51 და 3.25. ეს ქულები 3.5×-იან და 4×-იან გაუმჯობესებას აღნიშნავს კონსისტენტური გაწვრთნის წინა მიდგომებთან შედარებით. ორნაბიჯიანი სემპლირებით ჩვენ ამ ორ მონაცემთა ნაკრებზე FID ქულებს კიდევ უფრო ვამცირებთ 2.24-მდე და 2.77-მდე, რითაც ვაჭარბებთ დისტილაციით მიღებულ შედეგებს როგორც ერთნაბიჯიან, ისე ორნაბიჯიან რეჟიმებში, და თან ვამცირებთ სხვაობას კონსისტენტურობის მოდელებსა და სხვა უახლესი დონის გენერაციულ მოდელებს შორის.

კონსისტენტურობის მოდელების გაწვრთნის გაუმჯობესებული მეთოდები

ავტორები