ወደ ዋና ይዘት እለፍ
OpenAI

በዚህ ገጽ ላይ ያሉ ሁሉም ቪዲዮዎች ሳይለወጡ በቀጥታ በSora ያመነጫሉ።

በመጫን ላይ…

ሰው ሰራሽ አስተውሎት (AI) ተጨባጭ የሆነው ዓለም በእንቅስቃሴ እንዲረዳ እና እንዲያስመስል እያስተማርን ሲሆን የዚህም አላማ ሰዎች በእውነተኛ ዓለም መስተጋብር የሚያስፈልጋቸውን ችግሮች እንዲፈቱ የሚያግዙ ሞዴሎችን ማሰልጠን ነው።

Sora,፣ የእኛ ከጽሑፍ-ወደ-ቪዲዮ ሞዴል እያስተዋወቅን ነው። Sora የእይታ ጥራትን እና የተጠቃሚውን ጥያቄ በመጠበቅ እስከ አንድ ደቂቃ የሚረዝም ቪዲዮዎችን መፍጠር ይችላል።

ዛሬ Sora ለቀይ ቡድኖች ወሳኝ ቦታዎችን ለጉዳት ወይም አደጋ ለመገምገም ይገኛል። እንዲሁም ለፈጠራ ባለሙያዎች በጣም ጠቃሚ እንዲሆን ሞዴሉን እንዴት ማሻሻል እንደሚቻል ግብረ መልስ ለማግኘት ለብዙ የእይታ አርቲስቶች፣ ዲዛይነሮች እና የፊልም ሰሪዎች መዳረሻ እንሰጣለን።

ከOpenAI ውጭ ሰዎች ጋር መስራት ለመጀመር እና ግብረ መልስ ለማግኘት እና ለህዝቡ የሰው ሠራሽ አስተውሎት (AI) ችሎታዎች አድማስ ላይ ምን እንደሆኑ ስሜት ለመስጠት የምርምር እድገታችንን ቀደም ብለን እናጋራለን።

Sora በብዙ ገጸ ባሕርዮች፣ በተወሰኑ የእንቅስቃሴ ዓይነቶች እና በርዕሱ እና የጀርባ ትክክለኛ ዝርዝሮች ውስብስብ ትዕይንቶችን ያመነጫል። ሞዴሉ ተጠቃሚው በእርምጃ ውስጥ ምን እንደጠየቀ ብቻ ሳይሆን እነዚያ ነገሮች በአካላዊ ዓለም ውስጥ እንዴት እንደሚኖሩና እንዴት እንደሚሰሩ ይረዳል።

ሞዴሉ ስለ ቋንቋ ጥልቅ ግንዛቤ አለው፣ ይህም ጥያቄዎችን በትክክል ለመተርጎም እና ንቁ ስሜቶችን የሚገልጹ አሳሳቢ ገጸ-ባህሪያትን ለማመንጨት ይችላል። Sora በአንድ ያመነጨ ቪዲዮ ውስጥ ገጸ ባሕርዮችን እና ምስላዊ ዘይቤን በትክክል የሚጸኑ ብዙ ፎቶዎችን ፍጠር ይችላል።

የአሁኑ ሞዴል አሁንም ቢሆን መሻሻል የሚችልባቸው ስፍራዎች አሉት። የአንድ ውስብስብ የሆነ ትዕይንትን ፊዚክስ ለማስመሰል ሊቸገር ይችላል፣ እና የተወሰኑ የምክንያት እና ውጤት ምሳሌዎችን ላይረዳ ይችላል (ለምሳሌ፦ ኩኪስ አንድ ገፀ ባህሪ ከነከሰው በኋላ ምልክት ላያሳይ ይችላል)። ሞዴሉ እንደ ግራ ከቀኝ መለየት ያሉ በጥያቄ ውስጥ የተካተቱትን የቦታ ዝርዝር መረጃዎችን ሊያደናግር ወይም እንደ የተወሰኑ የካሜራ አቅጣጫዎች ያሉ በጊዜ ሂደት የሚከሰቱ ክስተቶችን የሚገልጹ ትክክለኛ መግለጫዎችን መረዳት ሊከብደው ይችላል።

ደህንነት

Sora በOpenAI ምርቶች ውስጥ እንዲገኝ ከመሆኑ በፊት በርካታ አስፈላጊ የደህንነት እርምጃዎችን እንወስዳለን። ከቀይ ቡድኖች ጋር እንደ የተሳሳተ መረጃ፣ የጥላቻ ይዘት እና አድራጎት ባሉ አካባቢዎች ውስጥ የሚሰሩ የጎራ ባለሙያዎች ሞዴሉን በተቃዋሚ ለማምረም እንሠራለን።

እንዲሁም በSora የመነጨ ቪዲዮ መሆኑን ሊያስታውቅ የሚችል የመለየት መሳሪያ ያሉ አሳሳቢ ይዘቶችን ለመለየት መሳሪያዎችን እንገነባለን። ሞዴሉን በOpenAI ምርት ውስጥ ካሰማርን ለወደፊቱ የC2PA ሜታዳታን(በአዲስ መስኮት ውስጥ ይክፈታል) ለማካተት እቅድ አደርገናል።

እኛ ለማሰማራት ለመዘጋጀት አዳዲስ ቴክኒኮችን እየሳበን ሳለን፣ በDALL·E 3 ላይ የተመሠረተ የምርቶቻችንን ነባር የደህንነት ዘዴዎች(በአዲስ መስኮት ውስጥ ይክፈታል) እንጠቀማለን፣ እነሱም ለSora ተግባራዊ ናቸው።

ለምሳሌ፣ አንዴ በOpenAI ምርት ውስጥ፣ የጽሑፍ ምደባ የእኛ የአጠቃቀም ፖሊሲዎቻችንን የሚጣሱ የጽሑፍ እርምጃ ግቤት ያረጋግጣል፣ እንደ ከፍተኛ ጥቃት፣ የወሲብ ይዘት፣ የጥላቻ ምስሎች፣ የታዋቂ ተመሳሳይ ወይም የሌሎችን IP የሚጠይቁ ያሉ። በተጨማሪም ለተጠቃሚው ከመታየቱ በፊት የአጠቃቀም ፖሊሲዎቻችንን ማክበሩን ለማረጋገጥ ለማገዝ የተፈጠሩትን እያንዳንዱን ቪዲዮ ፍሬሞች ለመገምገም የሚያገለግሉ ጠንካራ የምስል ምደባዎችን አዳብረናል።

በዓለም ዙሪያ ያሉ ፖሊሲ አውጪዎች፣ አስተማሪዎች እና አርቲስቶች ስጋታቸውን ለመረዳት እና ለዚህ አዲስ ቴክኖሎጂ አወንታዊ አጠቃቀም ምሳሌዎችን ለማስታወቅ እንሠራለን። ሰፊ ምርምር እና ሙከራ ቢኖርም፣ ሰዎች ቴክኖሎጂያችንን በሚጠቀሙባቸው ጠቃሚ መንገዶች ሁሉ እንዲሁም ሊያጥሩባት የሚችሉትን መንገዶች ሁሉ መተንበይ አንችልም። ለዚህ ምክንያት ከእውነተኛው ዓለም አጠቃቀም መማር ከጊዜ ወደ ጊዜ ደህንነታቸው የተጠበቀ የሰው ሠራሽ አስተውሎት (AI) ስርዓቶችን ለመፍጠር እና ለመልቀቅ አስፈላጊ አካል ነው ብለን እናምናለን።

Research techniques

Sora የስርጭት ሞዴል ነው፣ ይህም እንደ ቋሚ ጫጫታ ከሚመስለው ጋር በመጀመር ቪዲዮ ያመነጫል እና በብዙ ደረጃዎች ላይ ጫጫታውን በማስወገድ ቀስ በቀስ ያስወግዳል።

Sora በአንድ ጊዜ ሙሉ ቪዲዮዎችን ያመነጫል ወይም የተመነጩ ቪዲዮዎችን ረዘም ለማድረግ ይችላል። በአንድ ጊዜ ለብዙ ክፍሎች ሞዴል አስቀድሞ ማስተዋል በማበረታታት አንድ ርዕስ ለጊዜው ከእይታ ሲወጣ እንኳን ተመሳሳይ እንዲቆይ ለማረጋገጥ ከባድ ችግርን ፈታተናል።

ከGPT ሞዴሎች ጋር ተመሳሳይነት ያለው Sora የላቀ የመለኪያ አፈፃፀም በመክፈት የትራንስፎርመር ሥነ-ሕንፃን ይጠቀማል።

ቪዲዮዎችን እና ምስሎችን እንደ ፓች የሚባሉ አነስተኛ የውሂብ አሃዶች ስብስቦች እንወክለዋለን፣ እያንዳንዳቸው በGPT ውስጥ ከሚለው token ጋር ተመሳሳይ ነው። ውሂብን እንዴት እንደምንወክል በማዋሃድ፣ የተለያዩ ጊዜዎችን፣ ጥራቶችን እና የገጽታ መጠኖችን በማሰራጨት ከዚህ በፊት ከተቻለውን በሰፊ የእይታ ውሂብ ላይ የስርጭት አሰልጥን ትራንስፎርመሮችን እንቀማለን።

Sora በDALL·E እና GPT ሞዴሎች ያለፈው ምርምር ላይ ይገነባል። ለምስላዊ ስልጠና መረጃ በጣም መግለጫ ጽሑፎችን ያመነጫል ከDALL·E 3 የዳግም የመሸጋገብ ቴክኒክን ይጠቀማል። በዚህ ምክንያት ሞዴሉ በያመነጫሉ ቪዲዮዎች ውስጥ የተጠቃሚውን የጽሑፍ መመሪያዎች በታማኝነት መከተል ይችላል።

ከጽሑፍ መመሪያዎች ብቻ ቪዲዮ ማያመነጫል ከመቻል በተጨማሪ ሞዴሉ ነባር ምስል መውሰድ እና ከእሱ ቪዲዮ ማያመነጫል ይችላል፣ የምስሉን ይዘት በትክክለኛነት እና ለትንሽ ዝርዝሮች ትኩረት በማድረግ ይችላል። ሞዴሉ እንዲሁም ነባር ቪዲዮ መውሰድ እና ማራዘም ወይም የጎደሉ እቃዎችን መሙላት ይችላል። በእኛ የቴክኒክ ሪፖርት የበለጠ ይማሩ

Sora እውነተኛውን ዓለም ለመረዳት እና ለመምሰል የሚችሉ ሞዴሎች መሠረት ሆኖ ያገለግላል፣ እኛም ይህን ችሎታ ለAGI ማሳካት አስፈላጊ ወቅት እንደሚሆን እናምናለን።

በመጫን ላይ...