Aqbeż għall-kontenut prinċipali
OpenAI

20 ta’ Ġunju 2024

Pubblikazzjoni

Tekniki mtejba għat-taħriġ ta’ mudelli ta’ konsistenza

Qed jillowdja…

Il-mudelli ta’ konsistenza huma familja emerġenti ta’ mudelli ġenerattivi li jistgħu jikkampjunaw data ta’ kwalità għolja f’pass wieħed mingħajr il-ħtieġa ta’ taħriġ avversarju. Il-mudelli ta’ konsistenza attwali jilħqu kwalità ottimali tal-kampjuni billi jwettqu distillazzjoni minn mudelli ta’ diffużjoni mħarrġa minn qabel u jużaw metriċi mgħallma bħal LPIPS. Madankollu, id-distillazzjoni tillimita l-kwalità tal-mudelli ta’ konsistenza għal dik tal-mudell ta’ diffużjoni mħarreġ minn qabel, u LPIPS jikkawża preġudizzju mhux mixtieq fl-evalwazzjoni. Biex nindirizzaw dawn l-isfidi, nippreżentaw tekniki mtejba għat-taħriġ tal-konsistenza, fejn il-mudelli ta’ konsistenza jitgħallmu direttament mid-data mingħajr distillazzjoni. Nidħlu fil-fond fit-teorija wara t-taħriġ tal-konsistenza u nidentifikaw difett li qabel kien injorat, li nindirizzawh billi neliminaw Exponential Moving Average mill-mudell ta’ konsistenza tal-għalliem. Biex nissostitwixxu metriċi mgħallma bħal LPIPS, nadottaw it-telfiet Pseudo-Huber mill-istatistika robusta. Barra minn hekk, nintroduċu skeda ta’ storbju lognormali għall-objettiv tat-taħriġ tal-konsistenza, u nipproponu li nirdoppjaw il-passi totali ta’ diskretizzazzjoni kull numru stabbilit ta’ iterazzjonijiet tat-taħriġ. Flimkien ma’ aġġustament aħjar tal-iperparametri, dawn il-modifiki jippermettu lill-mudelli ta’ konsistenza jilħqu punteġġi FID ta’ 2.51 u 3.25 fuq CIFAR-10 u ImageNet 64×64 rispettivament f’pass wieħed ta’ kampjunar. Dawn il-punteġġi jfissru titjib ta’ 3.5× u 4× meta mqabbla ma’ approċċi preċedenti għat-taħriġ tal-konsistenza. Permezz ta’ kampjunar f’żewġ passi, innaqqsu aktar il-punteġġi FID għal 2.24 u 2.77 fuq dawn iż-żewġ datasets, u naqbżu dawk miksuba permezz tad-distillazzjoni kemm f’ambjenti b’pass wieħed kif ukoll f’dawk b’żewġ passi, filwaqt li nnaqqsu d-distakk bejn il-mudelli ta’ konsistenza u mudelli ġenerattivi oħra tal-ogħla livell.

Awturi

Yang Song u Prafulla Dhariwal