DALL·E፦ ከጽሑፍ ምስሎችን መፍጠር
በተፈጥሮ ቋንቋ ለሚገለጽ ሰፊ ፅንሰ-ሀሳብ ከጽሑፍ መግለጫ ምስሎችን የሚፈጥር DALL·E የሚባል የነርቭ አውታረ መረብ አሰልጥነናል።

ምሳሌ፦ Justin Jay Wang
DALL·E የ12 ቢሊዮን ፓራሜተር ያለው የGPT‑3(በአዲስ መስኮት ውስጥ ይክፈታል) እትም ነው፣ ከጽሑፍ መግለጫዎች ምስሎችን ለመፍጠር የተማረ፣ እንዲሁም ከጽሑፍ–ምስል ጥምረት የተዘጋጀ ውሂብ ስብስብ በመጠቀም ያመነጫል። እኛ እንደምናገኘው ይህ በተለያዩ ክህሎቶች የተሞላ ነው፣ እነዚህም የእንስሳትና ዕቃዎችን የሰው ሠራሽ እትም ቅርጽ ፍጠር፣ የማይዛመዱ ሀሳቦችን በምንም እንኳን አስተማማኝ መንገድ ማዋሃድ፣ ጽሑፍ ማቅረብ እና ነባሪ ምስሎችን መቀየር ያካትታሉ።
እንዲሁም ይመልከቱ፦ DALL·E 2፣ ከ4 እጥፍ የተሻለ ጥራት ጋር ይበልጥ እውነተኛና ትክክለኛ ምስሎችን ያመነጫል።
GPT‑3 አስመለከተው ቋንቋ በተለያዩ የጽሑፍ ተግባሮች ላይ ለማስተማር ትልቅ የነርቭ አውታረ መረብ ማምረት እንደሚቻል አሳየ። Image GPT እንደዚሁ ዓይነት የነርቭ አውታረ መረብ ከፍተኛ ጥራት ያላቸው ምስሎችን ለመያመነጫት ሊጠቀም እንደሚችል አሳየ። የዕይታ ፅንሰ-ሀሳቦችን በቋንቋ መጠቀም አሁን ሊደረስበት የሚችል መሆኑን ለማሳየት እነዚህን ግኝቶች እናራዝማለን።
እንደ GPT‑3፣ DALL·E ተለዋዋጭ የቋንቋ ሞዴል ነው። ጽሑፉንም ሆነ ምስሉን እስከ 1280 ቶከኖችን፣ የያዘ እንደ አንድ ዥረት ይቀበላል እና ሁሉንም ቶከኖች ለማመንጨት ከፍተኛ እድልን በመጠቀም የሰለጠኑ ናቸው። A
ይህ የስልጠና ሂደት DALL·E ከመጀመሪያ እንደ መሰረት ምስል ያመነጫል ብቻ ሳይሆን፣ ነባሪ ምስል ውስጥ ወደ ታችኛው-ቀኝ ማዕዘን የሚዘርጋ ማንኛውንም አራት ማዕዘን ክልል ከጽሑፍ እርምጃ ጋር ተመሳሳይ በሆነ መንገድ ማስተካከል ይችላል።
እኛ የጅምላ ሞዴሎችን የሚያካትቱ ሥራዎች ለማህበረሰብ ከፍተኛ እና ሰፊ ተፅእኖ ሊኖራቸው እንደሚችሉ እናውቃለን። ለወደፊቱ፣ እንደ DALL·E ያሉ ሞዴሎች ከህብረተሰቡ ጋር እንዴት እንደሚዛመዱ እንደ ኢኮኖሚያዊ ተፅእኖ በተወሰኑ የሥራ ሂደቶች እና ሙያዎች ላይ፣ በአምሳያው ውጤቶች ላይ ያለውን አድልዎ እና በዚህ ቴክኖሎጂ የረጅም ጊዜ የስነምግባር ፈተናዎችን ለመተንተን አቅደናል።
እኛ እንደምናገኘው DALL·E ለተለያዩ ዓይነት ዐረፍተ ነገሮች እውነተኛ የሚመስሉ ምስሎችን ማፍጠር እንደሚችል እና የቋንቋ ቅንብር መዋቅርን ማሰስ እንደሚችል ነው። ይህንን በሚቀጥለው ክፍል ተከታታይ በይነተገናኝ ምስሎችን በመጠቀም እናሳያለን። በእያንዳንዱ ምስል ላይ የተቀመጡ ምሳሌዎች በCLIP ከተመረጡ 512 ውስጥ ከላይ 32 በመውሰድ ይገኛሉ፣ ነገር ግን ከተነጣጠሉ እና ከተለያዩ ምስሎች ውጭ ማንኛውም የእጅ መረጣ አንጠቀምም፣ ከተነጣጠሉ እና ከተለያዩ ምስሎች ውጭ የተለያዩ ምስሎች ይቀርባሉ።B
DALL·E የአንድ ነገር ባህሪዎችን እንዲሁም የተመለከተው ጊዜ ብዛት ለማሻሻል ችሎታውን እንፈትሻለን።
በተመሳሳይ ጊዜ ብዙ ነገሮችን፣ ባህሪያቸውን እና የቦታ ግንኙነታቸውን መቆጣጠር አዲስ ፈታኝ ሁነታ ያስከትላል። ለምሳሌ «ቀይ ኮፍያ፣ ቢጫ ጓንት፣ ሰማያዊ ሸሚዝ እና አረንጓዴ ሱሪ የለበሰ ጃርት» የሚለውን ሐረግ ተመልከት። ይህንን ዓረፍተ ነገር በትክክል ለመተርጎም፣ DALL·E እያንዳንዱን ልብስ ከእንስሳው ጋር በትክክል ማቀናበር ብቻ ሳይሆን ማኅበራትን (ኮፍያ፣ ቀይ)፣ (ጓንት፣ ቢጫ) (ሸሚዝ፣ ሰማያዊ) እና (ሱሪ፣ አረንጓዴ) ሳይቀላቀሉ ማኅበራት መፍጠር አለበት C
እኛ አንፃራዊ ቦታ ለማስቀመጥ፣ ነገሮችን ለመደርደር እና በርካታ ባህሪያትን ለመቆጣጠር የDALL·Eን ችሎታ እንፈትሻለን።
ምንም እንኳን DALL·E በትንሽ ዕቃዎች ላይ ያሉ ባህሪያትን እና አቀማመጦችን ለመቆጣጠር ደረጃ ያለውን ተቆጣጠር ቢሰጥም፣ የስኬት መጠኑ ግን እንዴት እንደተጻፈ ከሚሰጥ ጽሑፍ ጋር ይተያያዣል። ሌሎች ነገሮች ሲጨመሩ፣ DALL·E በነገሮች እና ቀለሞቻቸው መካከል ግንኙነት ማስታረቅ ይችላል፣ እና የስኬት ተመን በፍጥነት ይቀንሳል። እንዲሁም በእነዚህ ሁኔታዎች ውስጥ ለመግለጫ ጽሑፍ መሸጋገብ በተመለከተ የDALL·E ድንጋጤን እንመለከታለን፤ ተዋሳኝ እና በስምምነት ተመሳሳይ የሆኑ መግለጫ ጽሑፎች ብዙ ጊዜ ትክክለኛ ትርጉሞችን አያመነጩም።
በተጨማሪም DALL·E አንድን ትዕይንት ከየትኛው አቅጣጫ ማየት እንደሚቻል እንዲሁም አንድ ትዕይንት የሚቀርጸው በ3D ስታይል እንደሆነ እንገነዘባለን።
ይህንን የበለጠ ለመግፋት የDALL·E ችሎታን እንፈትሻለን የአንድ ታዋቂ ሰው ጭንቅላትን በእያንዳንዱ ማዕዘን ላይ በእኩል ከተቀመጡ ማዕዘኖች በተከታታይ መሳል እና የሚሽከረከር ጭንቅላት ለስላሳ አኒሜሽን ማግኘት እንደምንችል እንገነዘባለን።
«የአሳ አይን ሌንስ እይታ» እና «ሉላዊ ፓኖራማ» በሚሉት አማራጮች እንደምንመለከተው DALL·E አንዳንድ የኦፕቲካል መዛባትን ወደ ትዕይንቶች መተግበር የሚችል ይመስላል። ይህ ነጸብራቅ የማመንጨት ችሎታውን እንድናስስ አነሳስቶናል።
«እጅግ በጣም ቅርብ ዕይታ» እና «ኤክስሬይ» ቅጥ የተወሰዱ ናሙናቶች የDALL·E የውስጥ መዋቅርን በክፍተት እንዲያሳይ እና የውጭ መዋቅርን በማክሮ ፎቶግራፍ እንዲያቀርብ የሚችል እንደሆነ ማሰስ እንደምንችል አድርጎናል።
ጽሑፍን ወደ ምስሎች የመተርጎም ተግባር በዝርዝር ተገልጿል፦ ነጠላ መግለጫ ጽሑፍ በአጠቃላይ ከአሳማኝ ምስሎች ወሰን የለሽነት ጋር ይዛመዳል፣ ስለዚህ ምስሉ በልዩ ሁኔታ አልተወሰነም። ምሳሌ እንደ ምሳሌ ይወስዱ፣ «በፀሐይ መውጣት ላይ በሜዳ ላይ የተቀመጠ ካፒባራ ሥዕል» የሚለውን መግለጫ ይመልከቱ። በካፒቢባው አቅጣጫ ላይ በመመስረት፣ ይህ ዝርዝር በግልፅ ያልተጠቀሰ ቢሆንም፣ ጥላን መሳል አስፈላጊ ሊሆን ይችላል። እኛ የDALL·E ችሎታን በሦስት ጉዳዮች ውስጥ ያለውን የማልቀስ ችግር ማስተካከል ማሰስ፦ ቅጥ መቀየር፣ ማቋቋም እና ጊዜ፤ ተመሳሳይ ነገርን በተለያዩ ሁኔታዎች ማሳየት፤ እና በምስል ላይ የተገለጸ የተወሰነ ጽሑፍ ያለው ነገር ያመነጫል።
በተለያዩ ደረጃዎች የተረጋጋነት ጋር፣ DALL·E በተፈጥሮ ቋንቋ የ3D ምስል ማቀነባበር ማህደር አካል የሆነ አንድ ክፍል መዳረሻ ይሰጣል። ራሱን የቻለ አነስተኛ ቁጥር ያላቸውን ነገሮች ባህሪያት፣ እና በተወሰነ መጠን፣ ስንት እንዳሉ እና እርስ በርስ እንዴት እንደሚደረደሩ መቆጣጠር ይችላል። እንዲሁም አንድ ትዕይንት የተሠራበትን ቦታ እና ማዕዘኑን ይቆጣጠራል፣ የማዕዘን እና የብርሃን ሁኔታዎችን ትክክለኛነት በማክበር የታወቁ ነገሮችን ማመንጨት ይችላል።
እንደ 3D ተርጓሚ ሞተር ሳይሆን ግብዓቶቹ በማያሻማ እና በተሟላ መልኩ መገለፅ አለባቸው፣ DALL·E ብዙውን ጊዜ «ባዶ መሙላት» ይችላል መግለጫ ጽሑፉ ምስሉ በግልፅ ያልተገለፀ የተወሰነ ዝርዝር መያዝ አለበት ሲል ያሳያል።
ቀጣይ፣ የቀደመውን ችሎታ ለፋሽን እና የውስጥ ንድፍ ማሰስ እንዴት እንደሚጠቀሙበት እንመለከታለን።
የቋንቋ ስብጥር ተፈጥሮ እውነተኛ እና ምናባዊ ነገሮችን ለመግለጽ ፅንሰ-ሀሳቦችን አንድ ላይ እንድናስቀምጥ ያስችለናል። DALL·E የተለያዩ ሐሳቦችን በማጣመር ዕቃዎችን የማዋሃድ ችሎታ እንዳለው አግኝተናል፣ አንዳንዶቹ በገሃዱ ዓለም ውስጥ ሊኖሩ የማይችሉ ናቸው። ይህንን ችሎታ በሁለት አጋጣሚዎች እናስሳለን፦ ከተለያዩ ፅንሰ-ሀሳቦች ወደ እንስሳት ዝውውር እና ከማይዛመዱ ፅንሰ-ሀሳቦች መነሳሻን በመውሰድ ምርቶችን መንደፍ።
በቀደም ብሎ በተዘረዘረው ክፍል ውስጥ፣ DALL·E የእውነተኛ ዓለም ንብረቶች ምስሎችን ሲያመነጫ ያልተያያዙ ፅንሰ-ሀሳቦችን የማሰስ ችሎታውን እንመለከታለን። እዚህ በአርት አውድ ውስጥ ይህን ችሎታ ለሶስት አይነት ስዕላት ማሰስ እንደምንሠራ እንመልከታለን፦ የሰው ባህሪ ያላቸው የእንስሳት እና ዕቃዎች እትም፣ የእንስሳት ተዋሕዶች እና ኢሞጂዎች።
GPT‑3 በማንኛውም ተጨማሪ ስልጠና ሳይፈልግ በመግለጫ እና በእርምጃ የተሰጠውን መልስ ለማያመነጫል ብቻ ብዙ አይነት ተግባሮችን ለማከናወን ሊመራ ይችላል። ለምሳሌ፣ ከ«እርምጃ» ቃል ጋር ሲሰጥ የሚለውን «እዚህ ያለው የሰነኝ ሰው ውሻውን በፓርክ ሲያሳድግ በፈረንሳይኛ ውስጥ የተተረጎመ ነው።» GPT‑3 እንደ «un homme qui promène son chien dans le parc» ይመልሳል። ይህ ችሎታ ዜሮ-ሾት ማመዛዘን ይባላል።እኛ እንደምናገኘው DALL·E እነዚህን ችሎታዎች ወደ እይታ ጎራ ያስፋፋ እና በትክክለኛ እርምጃ ሲሰጠው ምስል ወደ ምስል ተርጎም ተግባሮችን ማከናወን ይችላል።
እኛ ይህን አቅም እንደሚቀርብ አልጠበቅንም፣ እና የነርቭ አውታረ መረብ ወይም ስልጠና ሂደትን ለማበረታታት ምንም አይነት ለውጥ አላደረግንም። ከእነዚህ ውጤቶች ተነስተን፣ በ20ኛው ክፍለ ዘመን በስፋት የተጠቀመ የዕይታ IQ ፈተና የሆነውን የRaven ተራማጅ ማትሪክስ በመሞከር የDALL·E የአናሎግ ማመዛዘን ችሎታን እንመለካለን።
DALL·E ስለ ጂኦግራፊያዊ እውነታዎች፣ ምልክቶች እና ሰፈሮች ተምሯል። እውቀቱ በእነዚህ ፅንሰ-ሀሳቦች ላይ በአንዳንድ መንገዶች ትክክለኛ እና በሌሎች ላይ ጉድለት ያለበት ነው።
በቦታ ላይ የሚለዋወጡ ፅንሰ-ሀሳቦች ላይ የDALL·E እውቀትን ያስሳል፣ በተጨማሪ በጊዜ ላይ የሚለዋወጡ ፅንሰ-ሀሳቦች እውቀትን እናስሳለን።
DALL·E ቀላል የዲኮድ ብቻ ተለዋዋጭ ተሞላላ ሲሆን ጽሑፉን እና ምስሉን እንደ አንድ ዝርዝር የ1280 token ይቀበላል—256 ለጽሑፍ እና 1024 ለምስል—እና ሁሉንም በራስ-ሰር የሚቀረፅ። በእያንዳንዱ የ64ቱ የራስ ትኩረት ንብርብቶች ላይ ያለው የትኩረት ጭንብል እያንዳንዱ የምስል ማስመሰያ በሁሉም የጽሑፍ ቶከኖች ላይ እንዲገኝ ያስችለዋል። DALL·E ለጽሑፍ ቶከኖች ደረጃውን የጠበቀ የምክንያት ጭንብል ይጠቀማል፣ እና ለምስሉ ቶከኖች በረድፍ፣ አምድ፣ ወይም ኮንቮሉሽን ትኩረት ጥለት ያለው ትንሽ ትኩረት፣ እንደ ንብርብሩ ይለያያል። ስለ አርክቴክቸር እና ስልጠና ሂደት ተጨማሪ ዝርዝር መረጃ በ ወረቀታችን(በአዲስ መስኮት ውስጥ ይክፈታል) እንሰጣለን።
የጽሁፍ-ወደ-ምስል አምጪ ከReed et እና ተባባሪዎቹ የመጀመሪያ አስቀድሞ ሥራ ጀምሮ እንደ ንቁ የምርምር አካል ነበር። al፣1 የሚጠቀምበት አቀራረብ በጽሑፍ መዋቅር ላይ የተመረኮዘ የGAN ነው። መክተቻዎቹ የሚዘጋጁት ከCLIP በተለየ በተቃራኒ መጥፋት በመጠቀም አስቀድሞ በሰለጠነ ኢንኮደር ነው። StackGAN3 እና StackGAN++4 በተደጋጋሚ መጠን ያላቸው የGAN ቴክኖሎጂዎችን በመጠቀም የምስል መጠንን ለማሳደግ እና የእይታ ታማኝነትን ለማሻሻል ይጠቀማሉ። AttnGAN5 በጽሑፍ እና ምስል ባህሪዎች መካከል ትኩረት ያካትታል፣ እና እንደ ተጨማሪ ዕላማ የተቃራኒ ጽሑፍ-ምስል ባህሪ መስማማት ኪሳራን ያቀርባል። ይህ ከመስመር ውጭ ከሚሠራው CLIP ጋር ካለን የደረጃ አሰጣጥ ጋር ማነጻጸር አስደሳች ነው። ሌላ ሥራ2፣ 6 እና 7 በስልጠና ጊዜ ተጨማሪ የእንቅስቃሴ ምንጮችን በመደመር የምስል ጥራትን ለማሻሻል ይጠቀማል። በመጨረሻም፣ ሥራ በNguyen et። al8 እና Cho et። al9 በተጠናቀቀ ባለብዙ ሞዴሎች የማለዳ ሞዴሎችን በመጠቀም የምስል ፈጠራ ዘዴዎችን ማሰስ ይሻላል።
ከVQVAE-2(በአዲስ መስኮት ውስጥ ይክፈታል) ውስጥ የተጠቀሰውን የመቅረዝ ምርመራ ተመሳሳይ በመሆን፣ በሁሉም የተጫዋቾች ምስሎች ውስጥ ለእያንዳንዱ መግለጫ ከ512 ናሙናዎች ላይ ከፍተኛውን 32 ለመመልስ CLIP እንጠቀማለን። ይህ አሠራር እንደ ቋንቋ የሚመራ ፍለጋ16 አይነት ሆኖ ሊታይ ይችላል፣ እና በናሙና ጥራት ላይ ከፍተኛ ተጽዕኖ ሊያሳድር ይችላል።
የግርጌ ማስታወሻዎች
- A
ቶከን ማለት ከተወሰነ መዝገበ ቃላት ውስጥ ያለ ምልክት ነው፤ ለሰው ልጆች እያንዳንዱ የእንግሊዝኛ ፊደል ከ26 ፊደላት ፊደል ውስጥ ያለ ቶከን ነው። የDALL·E ቃላት ለጽሑፍ እና ምስል ፅንሰ-ሀሳቦች ቶከንዎችን ይዟል። በተለይም እያንዳንዱ የምስል መግለጫ በከፍተኛው 256 የBPE ኮድ የተያያዘ ቶከኖች እና በ16384 የመዝገበ-ቃላት መጠን ይወክላል፣ ምስሉም በ1024 ማስመሰያ እና በ8192 የመዝገበ-ቃላት መጠን ይወክላል።
ምስሎች በስልጠና ወቅት ወደ 256x256 መጠን በቅድመ አዘጋጅት ይደረጋሉ። ከVQVAE ጋር ተመሳሳይ፣ እያንዳንዱ ምስል ወደ 32x32 ክፍል የተወሰነ የምስል ኮዶች በመጨመር ይጨመራል፣ ይህም በቀጣይ ማማረር የተማረ የተወሰነ የVAE በመጠቀም ነው። እኛ እንደምንገኝ ስልጠና በማረፍ ሂደት ሲከናወን የተወሰነ ኮድ መጽሐፍ ወይም የEMA ኪሳራ ወይም እንደ ሞተ ኮድ መልሶ ማስነሣት ያሉ ሥልቶች እንደማያስፈልጉ እና እስከ ትልቅ መዝገበ ቃላት መጠን ድረስ ማሳደግ እንደሚችል ነው።
- B
ተጨማሪ ዝርዝሮች በኋላ ክፍል ውስጥ ይሰጣሉ።
- 17
ይህ ተግባር ተለዋዋጭ ማሰሪያ ተብሎ ይጠራል፣ እና በሥነ-ጽሑፍ ውስጥ በሰፊው ተጠንቷል።
ማጣቀሻዎች
- 1
Reed፣ S.፣ Akata፣ Z.፣ Yan፣ X.፣ Logeswaran፣ L.፣ Schiele፣ B.፣ Lee፣ H. እ.ኤ.አ (2016)። «የመነጨ ተዋጊ ጽሑፍ ወደ ምስል ፈጠራ(በአዲስ መስኮት ውስጥ ይክፈታል)»። በICML እ.ኤ.አ 2016 ውስጥ።
- 2
Reed፣ S.፣ Akata፣ Z.፣ Mohan፣ S.፣ Tenka፣ S.፣ Schiele፣ B.፣ Lee፣ H. እ.ኤ.አ (2016)። «ምን እና የት እንደሚሳል መማር(በአዲስ መስኮት ውስጥ ይክፈታል)»። በNIPS እ.ኤ.አ 2016 ውስጥ።
- 3
Zhang፣ H.፣ Xu፣ T.፣ Li፣ H.፣ Zhang፣ S.፣ Wang፣ X.፣ Huang X.፣ Metaxas፣ D. እ.ኤ.አ (2016)። «StackGAN፦በተደባለቀ የመነሻ ግንባታ አውታረ መረቦች ጽሑፍን ወደ እውነተኛ ምስል ማመንጨት(በአዲስ መስኮት ውስጥ ይክፈታል)»። በICCY እ.ኤ.አ 2017 ውስጥ።
- 4
Zhang፣ H.፣ Xu፣ T.፣ Li፣ H.፣ Zhang፣ S.፣ Wang፣ X.፣ Huang፣ X.፣ Metaxas፣ D. እ.ኤ.አ (2017)። «StackGAN++፦ ከተደባለቀ የምስል ማመንጨት አውታረ መረቦች ጋር እውነተኛ ምስል ማቀነባበር(በአዲስ መስኮት ውስጥ ይክፈታል)»። በIEEE TPAMI እ.ኤ.አ 2018 ውስጥ።
- 5
Xu፣ T.፣ Zhang፣ P.፣ Huang፣ Q.፣ Zhang፣ H.፣ Gan፣ Z.፣ Huang፣ X.፣ He፣ X. እ.ኤ.አ (2017)። ‹፣AttnGAN፦ በትኩረት የሚሠራ የመነሻ ጠላት አውራ መረብ በመጠቀም ዝርዝር ያለ ጽሑፍ ወደ ምስል ፈጠራ(በአዲስ መስኮት ውስጥ ይክፈታል)።
- 6
Li፣ W.፣ Zhang፣ P.፣ Zhang፣ L.፣ Huang፣ Q.፣ He፣ X.፣ Lyu፣ S.፣ Gao፣ J. እ.ኤ.አ (2019)። «በነገር የሚመራ የጽሑፍ-ወደ-ምስል ውህደት በተቃዋሚ ስልጠና(በአዲስ መስኮት ውስጥ ይክፈታል)»። በCVPR እ.ኤ.አ 2019 ውስጥ።
- 7
Koh፣ J. Y.፣ Baldridge፣ J.፣ Lee፣ H.፣ Yang፣ Y. እ.ኤ.አ (2020)። «ከጽሑፍ ወደ ምስል ማመንጨት በጥሩ ጥራት ባለው የተጠቃሚ ትኩረት ላይ የተመሠረተ(በአዲስ መስኮት ውስጥ ይክፈታል)።» በWACV እ.ኤ.አ 2021 ውስጥ።
- 8
Nguyen፣ A.፣ Clune፣ J.፣ Bengio፣ Y.፣ Dosovitskiy፣ A.፣ Yosinski፣ J. እ.ኤ.አ (2016)። «አመንጪ አውታረ መረቦችን ይሰኩ እና ያጫውቱ፦ ሁኔታዊ ተደጋጋሚ ምስሎችን በድብቅ ቦታ ማመንጨት(በአዲስ መስኮት ውስጥ ይክፈታል)።
- 9
Cho፣ J.፣ Lu፣ J.፣ Schwen፣ D.፣ Hajishirzi፣ H.፣ Kembhavi፣ A. እ.ኤ.አ (2020)። «X-LXMERT፦ ባለብዙ ሞዳል ትራንስፎርመር ማህበረሰብ ማስተካከል፣ መግለጫ ማድረግ እና ጥያቄዎችን መልስ(በአዲስ መስኮት ውስጥ ይክፈታል)»። EMNLP እ.ኤ.አ 2020።
- 10
Kingma፣ Diederik P.፣ እና Max Welling። «ተለዋዋጮችን በራስ-መቀየሪያ(በአዲስ መስኮት ውስጥ ይክፈታል)።» arXiv preprint እ.ኤ.አ (2013)።
- 11
Rezende፣ Danilo Jimenez፣ Shakir Mohamed፣ and Daan Wierstra። «በጥልቅ አመንጪ ሞዴሎች ውስጥ ስቶካስቲክ የጀርባ ስርጭት እና ግምታዊ ግምት(በአዲስ መስኮት ውስጥ ይክፈታል)።» arXiv preprint እ.ኤ.አ (2014)።
- 12
Jang፣ E.፣ Gu፣ S.፣ Poole፣ B. እ.ኤ.አ (2016) «ከምድብ ከGumbel-softmax ጋር ዳግም ማቀናበር(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 13
Maddison፣ C.፣ Mnih፣ A.፣ Teh፣ Y. W. እ.ኤ.አ (2016) «የኮንክሪት ስርጭቱ፦ የተለዩ የዘፈቀደ ተለዋዋጮች ቀጣይነት ያለው መዝናናት(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 14
van den Oord፣ A.፣ Vinyals፣ O.፣ Kavukcuoglu፣ K. እ.ኤ.አ (2017)። «የነርቭ ውክልና ትምህርት(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 15
Razavi፣ A.፣ van der Oord፣ A.፣ Vinyals፣ O. እ.ኤ.አ (2019)። « በVQ-VAE-2 የተለያዩ ከፍተኛ ታማኝነት ያላቸውን ምስሎች በማመንጨት ላይ(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 16
Andreas፣ J.፣ Klein፣ D.፣ Levine፣ S. እ.ኤ.አ (2017)። «በምስላዊ ቋንቋ መማር(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 17
Smolensky፣ P. እ.ኤ.አ (1990)። «የTensor ምርት ተለዋዋጭ መስማማት እና በግንኙነት ሥርዓቶች ውስጥ የምልክታዊ መዋቅር ተወካይነት(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 18
Plate፣ T. እ.ኤ.አ (1995)። «ሆሎግራፊክ የተቀነሱ ውክልናዎች፦ convolution algebra ለተቀነባበረ የተከፋፈሉ ውክልናዎች(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 19
Gayler፣ R. እ.ኤ.አ (1998)። «የማባዛት ትስስር፣ የአሠሪዎች ውክልና እና ተመሳሳይነት(በአዲስ መስኮት ውስጥ ይክፈታል)»።
- 20
Kanerva፣ P. እ.ኤ.አ (1997)። «ሙሉ በሙሉ የተከፋፈሉ ውክልናዎች(በአዲስ መስኮት ውስጥ ይክፈታል)»።


