Consistency မော်ဒယ်များ

Diffusion မော်ဒယ်များသည် ပုံရိပ်၊ အသံနှင့် ဗီဒီယို ထုတ်လုပ်ခြင်း နယ်ပယ်များကို သိသိသာသာ တိုးတက်စေခဲ့သော်လည်း၊ ၎င်းတို့သည် ထုတ်လုပ်မှုနှေးကွေးစေသော iterative sampling process တစ်ခုအပေါ် မူတည်နေသည်။ ဤကန့်သတ်ချက်ကို ကျော်လွှားရန်၊ noise ကို data သို့ တိုက်ရိုက် mapping လုပ်ခြင်းဖြင့် အရည်အသွေးမြင့် sample များကို ထုတ်ပေးနိုင်သော မော်ဒယ်အမျိုးအစားသစ်တစ်ရပ်ဖြစ်သည့် consistency မော်ဒယ်များကို ကျွန်ုပ်တို့ အဆိုပြုထားသည်။ ၎င်းတို့သည် ဒီဇိုင်းအရ မြန်ဆန်သော one-step generation ကို ပံ့ပိုးပေးသကဲ့သို့၊ sample quality အတွက် compute ကို အလဲအလှယ်လုပ်နိုင်သော multistep sampling ကိုလည်း ခွင့်ပြုပေးသည်။ ထို့အပြင် image inpainting, colorization နှင့် super-resolution ကဲ့သို့သော zero-shot data editing ကိုလည်း ဤလုပ်ငန်းများအတွက် explicit training မလိုဘဲ ပံ့ပိုးပေးနိုင်သည်။ Consistency မော်ဒယ်များကို pre-trained diffusion မော်ဒယ်များကို distill လုပ်၍ဖြစ်စေ၊ သီးခြားလွတ်လပ်သော ထုတ်လုပ်ပေးနိုင်သော မော်ဒယ်များအဖြစ်ဖြစ်စေ လေ့ကျင့်နိုင်သည်။ ကျယ်ပြန့်သော စမ်းသပ်မှုများမှတစ်ဆင့် one- နှင့် few-step sampling တွင် diffusion မော်ဒယ်များအတွက် ရှိပြီးသား distillation technique များထက် ၎င်းတို့က ပိုမိုကောင်းမွန်ကြောင်းကို ကျွန်ုပ်တို့ ပြသခဲ့ပြီး၊ one-step generation အတွက် CIFAR-10 တွင် 3.55 နှင့် ImageNet 64x64 တွင် 6.20 ဆိုသည့် state-of-the-art FID အသစ်ကို ရရှိခဲ့သည်။ သီးခြားစွာ လေ့ကျင့်ထားသောအခါ consistency မော်ဒယ်များသည် CIFAR-10, ImageNet 64x64 နှင့် LSUN 256x256 ကဲ့သို့သော စံ benchmark များပေါ်တွင် ရှိပြီးသား one-step, non-adversarial ထုတ်လုပ်ပေးနိုင်သော မော်ဒယ်များထက် ပိုမိုကောင်းမွန်နိုင်သော ထုတ်လုပ်ပေးနိုင်သော မော်ဒယ်များ၏ မိသားစုသစ်တစ်ရပ် ဖြစ်လာသည်။

Consistency မော်ဒယ်များ

စာရေးသူများ