Үндсэн агуулга руу алгасах
OpenAI

2024 оны зургаадугаар сарын 20

Нийтлэл

Consistency models

Ачаалж байна…

Диффуз загварууд нь зураг, дуу, видео үүсгэх салбарт ихээхэн ахиц авчирсан ч давталтат дээжлэх үйл явцад тулгуурладаг тул үүсгэлт удаан байдаг. Энэ хязгаарлалтыг даван туулахын тулд бид noise-оос өгөгдөл рүү шууд зураглал хийж, өндөр чанартай дээж үүсгэдэг шинэ загварын бүлэг болох consistency models-ийг санал болгож байна. Эдгээр нь бүтэцийнхээ хувьд нэг алхамтай хурдан үүсгэлтийг дэмжихийн зэрэгцээ, тооцооллыг дээжийн чанартай солилцох олон алхамт дээжлэлт хийх боломжийг хадгалдаг. Мөн эдгээр нь зураг нөхөн бөглөх, өнгө оруулах, супер нягтаршил зэрэг өгөгдөл засварлах тэг оролдлого чадварыг, эдгээр даалгаварт тусгайлан сургах шаардлагагүйгээр, дэмждэг. Consistency models-ийг урьдчилан сургагдсан диффуз загваруудаас нэрж сургаж болохоос гадна, бие даасан үүсмэл загвар хэлбэрээр ч сургаж болно. Өргөн хүрээний туршилтуудаар бид эдгээр нь нэг болон цөөн алхамт дээжлэлт дээр диффуз загварын одоогийн нэрэх аргуудыг давж, нэг алхамтай үүсгэлтэд CIFAR-10 дээр 3.55, ImageNet 64x64 дээр 6.20 гэсэн шинэ state-of-the-art FID үзүүлэлтэд хүрснийг харуулсан. Тусгаарлан сургах үед consistency models нь CIFAR-10, ImageNet 64x64, LSUN 256x256 зэрэг стандарт шалгуур дээр одоогийн нэг алхамт, adversarial бус үүсмэл загваруудаас илүү гүйцэтгэлтэй шинэ үүсмэл загварын бүлэг болдог.

Зохиогчид

Yang Song, Prafulla Dhariwal, Mark Chen, Ilya Sutskever