പ്രധാന ഉള്ളടക്കത്തിലേക്ക് നീങ്ങുക
OpenAI

വാചകത്തിൽ നിന്ന് വീഡിയോ സൃഷ്ടിക്കുന്നു

ഈ പേജിലെ എല്ലാ വീഡിയോകളും മാറ്റം വരുത്താതെ Sora നേരിട്ട് സൃഷ്ടിച്ചവയാണ്.

ലോഡിംഗ്…

യഥാർത്ഥ ലോക ഇടപെടൽ ആവശ്യമുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ആളുകളെ സഹായിക്കുന്ന മോഡലുകൾ പരിശീലനം എന്ന ലക്ഷ്യത്തോടെ, ചലനത്തിലെ ഭൗതിക ലോകത്തെ മനസിലാക്കാനും അനുകരിക്കാനും ഞങ്ങൾ AI യെ പഠിപ്പിക്കുന്നു.

Sora, ഞങ്ങളുടെ ടെക്സ്റ്റ്-ടു-വീഡിയോ മോഡലിനെ പരിചയപ്പെടുത്തുന്നു. വിഷ്വൽ ക്വാളിറ്റി നിലനിർത്തുകയും ഉപയോക്താവിന്റെ പ്രോംപ്റ്റ് അനുസരിക്കുകയും ചെയ്യുമ്പോൾ Sora ഒരു മിനിറ്റ് വരെ ദൈർഘ്യമുള്ള വീഡിയോകൾ സൃഷ്ടിക്കാൻ കഴിയും.

ഇന്ന്, Sora ചുവന്ന ടീമർമാർക്ക് ഹാനികൾ അല്ലെങ്കിൽ അപകടസാധ്യതകൾ വിലയിരുത്തുന്നതിനായി നിർണായക മേഖലകളിൽ ലഭ്യമാകുന്നു. സൃഷ്ടിപരമായ പ്രൊഫഷണലുകൾക്ക് ഏറ്റവും സഹായകരമാകാൻ മോഡൽ എങ്ങനെ മെച്ചപ്പെടുത്താമെന്നതിനെക്കുറിച്ചുള്ള ഫീഡ്ബാക്ക് നേടുന്നതിന് നിരവധി ദൃശ്യകലാകാരന്മാർ, ഡിസൈനർമാർ, ചലച്ചിത്ര നിർമ്മാതാക്കൾ എന്നിവർക്കും ഞങ്ങൾ ആക്സസ് അനുവദിക്കുന്നു.

OpenAI-യ്ക്ക് പുറത്തുള്ള ആളുകളുമായി പ്രവർത്തിക്കാനും ഫീഡ്ബാക്ക് നേടാനും ചക്രവാളത്തിൽ AI കഴിവുകൾ എന്താണെന്ന് പൊതുജനങ്ങൾക്ക് ബോധം നൽകാനും ഞങ്ങൾ ഞങ്ങളുടെ ഗവേഷണ പുരോഗതി നേരത്തേ പങ്കിടുന്നു.

Soraയ്ക്ക് നിരവധി അക്ഷരങ്ങളുള്ള, പ്രത്യേക ചലനങ്ങളുള്ള, വിഷയത്തിന്റെയും പശ്ചാത്തലത്തിന്റെയും കൃത്യമായ വിശദാംശങ്ങളുള്ള സങ്കീർണ്ണമായ രംഗങ്ങൾ സൃഷ്ടിക്കാൻ കഴിയും. മോഡൽ പ്രോംപ്റ്റിൽ ഉപയോക്താവ് എന്താണ് ആവശ്യപ്പെട്ടതെന്ന് മാത്രമല്ല, ആ കാര്യങ്ങൾ ഭൗതിക ലോകത്ത് എങ്ങനെയാണ് നിലനിൽക്കുന്നതെന്നും മനസ്സിലാക്കുന്നു.

മോഡലിന് ഭാഷയെക്കുറിച്ച് ആഴത്തിലുള്ള ധാരണയുണ്ട്, ഇത് പ്രോംപ്റ്റുകളെ കൃത്യമായി വ്യാഖ്യാനിക്കാനും ഉജ്ജ്വലമായ വികാരങ്ങൾ പ്രകടിപ്പിക്കുന്ന ആകർഷകമായ അക്ഷരങ്ങളെ സൃഷ്ടിക്കാനും പ്രാപ്തമാക്കുന്നു. അക്ഷരങ്ങളും വിഷ്വൽ ശൈലിയും കൃത്യമായി നിലനിൽക്കുന്ന ഒരൊറ്റ സൃഷ്ടിച്ച വീഡിയോയ്ക്കുള്ളിൽ ഒന്നിലധികം ഷോട്ടുകൾ സൃഷ്ടിക്കാനും Soraക്ക് കഴിയും.

നിലവിലെ മോഡലിന് ഇപ്പോഴും മെച്ചപ്പെടുത്താനുള്ള സാധ്യതയുണ്ട്. ഒരു സങ്കീർണ്ണമായ രംഗത്തിന്റെ ഭൗതികശാസ്ത്രത്തെ അനുകരിക്കാൻ ഇതിന് ബുദ്ധിമുട്ടുണ്ടാകാം, കൂടാതെ കാരണ-ഫല ബന്ധത്തിന്റെ പ്രത്യേക സാഹചര്യങ്ങൾ മനസ്സിലാക്കാൻ കഴിയില്ല (ഉദാഹരണത്തിന്: ഒരു അക്ഷരം കടിച്ചതിന് ശേഷം ഒരു കുക്കിയിൽ ഒരു അടയാളം കാണിച്ചേക്കില്ല). വലത്തുനിന്ന് ഇടത് വിവേചനം നടത്തുക, അല്ലെങ്കിൽ നിർദ്ദിഷ്ട ക്യാമറ പഥങ്ങൾ പോലെ കാലക്രമേണ ചുരുളഴിയുന്ന സംഭവങ്ങളുടെ കൃത്യമായ വിവരണങ്ങളുമായി പൊരുതുന്നത് പോലുള്ള ഒരു പ്രോംപ്റ്റിൽ ഉൾപ്പെടുത്തിയിരിക്കുന്ന സ്പേഷ്യൽ വിശദാംശങ്ങളും മോഡൽ ആശയക്കുഴപ്പത്തിലാക്കിയേക്കാം.

സുരക്ഷാ

OpenAIയുടെ ഉൽപ്പന്നങ്ങളിൽ Sora-യെ ലഭ്യമാക്കുന്നതിന് മുമ്പ്, ഞങ്ങൾ നിരവധി സുപ്രധാന സുരക്ഷാ നടപടികൾ സ്വീകരിക്കും. ഞങ്ങൾ റെഡ് ടീം അംഗങ്ങളായ ഡൊമെയ്ൻ വിദഗ്ധരുമായി പ്രവർത്തിക്കുന്നു - തെറ്റായ വിവരങ്ങൾ, വിദ്വേഷകരമായ ഉള്ളടക്കം, പക്ഷപാതം തുടങ്ങിയ മേഖലകളിൽ - അവർ മോഡലിനെ വൈരുദ്ധ്യപരമായി പരീക്ഷിക്കും.

ഒരു വീഡിയോ Sora സൃഷ്ടിച്ചത് എപ്പോൾ എന്ന് പറയാൻ കഴിയുന്ന ഒരു ഡിറ്റക്ഷൻ ക്ലാസിഫയർ പോലുള്ള തെറ്റിദ്ധരിപ്പിക്കുന്ന ഉള്ളടക്കം കണ്ടെത്താൻ സഹായിക്കുന്ന ഉപകരണങ്ങളും ഞങ്ങൾ നിർമ്മിക്കുന്നു. ഞങ്ങൾ ഒരു OpenAI ഉൽപ്പന്നത്തിൽ മോഡൽ വിന്യസിക്കുകയാണെങ്കിൽ ഭാവിയിൽ C2PA മെറ്റാഡാറ്റ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) ഉൾപ്പെടുത്താൻ പദ്ധതി വയ്ക്കുന്നു.

വിന്യാസത്തിനായി തയ്യാറാക്കാൻ പുതിയ സാങ്കേതിക വിദ്യകൾ വികസിപ്പിക്കുന്നതിനൊപ്പം, DALL·E 3 ഉപയോഗിക്കുന്ന ഞങ്ങളുടെ ഉൽപ്പന്നങ്ങൾക്കായി ഞങ്ങൾ നിർമ്മിച്ച നിലവിലുള്ള സുരക്ഷാ രീതികൾ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) ഞങ്ങൾ പ്രയോജനപ്പെടുത്തുന്നു, അവ Sora-യ്ക്കും ബാധകമാണ്.

ഉദാഹരണത്തിന്, OpenAI ഉൽപ്പന്നത്തിൽ ഒരിക്കൽ, ഞങ്ങളുടെ ടെക്സ്റ്റ് ക്ലാസിഫയർ, ഞങ്ങളുടെ ഉപയോഗ നയങ്ങളുടെ ലംഘനമായ, ഉദാഹരണത്തിന്, തീവ്രമായ അക്രമം, ലൈംഗിക ഉള്ളടക്കം, വിദ്വേഷകരമായ ഇമേജറി, സെലിബ്രിറ്റി സാദൃശ്യം അല്ലെങ്കിൽ മറ്റുള്ളവരുടെ IP അഭ്യർത്ഥിക്കുന്ന ടെക്സ്റ്റ് ഇൻപുട്ട് പ്രോംപ്റ്റുകൾ പരിശോധിച്ച് നിരസിക്കും. ഉപയോക്താവിന് കാണിക്കുന്നതിനുമുമ്പ് അത് ഞങ്ങളുടെ ഉപയോഗ നയങ്ങൾ പാലിക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നതിന് സഹായിക്കുന്നതിന് സൃഷ്ടിച്ച ഓരോ വീഡിയോയുടെയും ഫ്രെയിമുകൾ അവലോകനം ചെയ്യാൻ ഉപയോഗിക്കുന്ന ശക്തമായ ചിത്രം ക്ലാസിഫയറുകളും ഞങ്ങൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്.

ലോകമെമ്പാടുമുള്ള നയരൂപകർത്താക്കൾ, അധ്യാപകർ, കലാകാരന്മാർ എന്നിവരുടെ ആശങ്കകൾ മനസ്സിലാക്കുന്നതിനും ഈ പുതിയ സാങ്കേതികവിദ്യയുടെ പോസിറ്റീവ് ഉപയോഗ കേസുകൾ തിരിച്ചറിയുന്നതിനും ഞങ്ങൾ അവരെ ഉൾപ്പെടുത്തും. വിപുലമായ ഗവേഷണവും പരിശോധനയും നടത്തിയിട്ടും, ആളുകൾ ഞങ്ങളുടെ സാങ്കേതികവിദ്യയെ പ്രയോജനകരമായി ഉപയോഗിക്കുന്ന എല്ലാ വഴികളും അതിനെ ദുരുപയോഗം ചെയ്യുന്ന എല്ലാ വഴികളും പ്രവചിക്കാൻ ഞങ്ങൾക്ക് കഴിയില്ല. അതുകൊണ്ടാണ് യഥാർത്ഥ ലോക ഉപയോഗത്തിൽ നിന്ന് പഠിക്കുന്നത് കാലക്രമേണ കൂടുതൽ സുരക്ഷിതമായ AI സിസ്റ്റങ്ങൾ സൃഷ്ടിക്കുന്നതിനും പുറത്തിറക്കുന്നതിനുമുള്ള ഒരു നിർണായക ഘടകമാണെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു.

Research techniques

Sora ഒരു ഡിഫ്യൂഷൻ മോഡലാണ്, ഇത് സ്റ്റാറ്റിക് ശബ്ദം പോലെയുള്ള ഒരു വീഡിയോ ഉപയോഗിച്ച് ആരംഭിച്ച്, ശബ്ദം പല ഘട്ടങ്ങളിലായി നീക്കംചെയ്തുകൊണ്ട് ക്രമേണ അത് സൃഷ്ടിക്കുന്നു.

മുഴുവൻ വീഡിയോകളും ഒറ്റയടിക്ക് സൃഷ്ടിക്കുന്നതിനോ അല്ലെങ്കിൽ ജനറേറ്റുചെയ്ത വീഡിയോകൾ ദീർഘിപ്പിക്കുന്നതിനോ Soraയ്ക്ക് കഴിവുണ്ട്. ഒരു സമയത്ത് നിരവധി ഫ്രെയിമുകളുടെ ദീർഘവീക്ഷണം മോഡലിന് നൽകുന്നതിലൂടെ, ഒരു വിഷയം താൽക്കാലികമായി കാഴ്ചയിൽ നിന്ന് മറഞ്ഞുപോയാലും അതേപടി തുടരുന്നുവെന്ന് ഉറപ്പാക്കാനുള്ള വെല്ലുവിളി നിറഞ്ഞ പ്രശ്നം ഞങ്ങൾ പരിഹരിച്ചു.

GPT മോഡലുകൾ പോലെ, Sora ഒരു ട്രാൻസ്ഫോർമർ ആർക്കിടെക്ചർ ഉപയോഗിക്കുന്നു, മികച്ച സ്കെയിലിംഗ് പ്രകടനം പ്രാപ്തമാക്കുന്നു.

വീഡിയോകളെയും ചിത്രങ്ങളെയും പാച്ചുകൾ എന്ന് വിളിക്കുന്ന ഡാറ്റയുടെ ചെറിയ യൂണിറ്റുകളുടെ ശേഖരങ്ങളായി ഞങ്ങൾ പ്രതിനിധീകരിക്കുന്നു, അവയിൽ ഓരോന്നും GPTയിലെ tokenന് സമാനമാണ്. ഡാറ്റയെ എങ്ങനെ പ്രതിനിധീകരിക്കുന്നു എന്നതിനെ ഏകീകരിക്കുന്നതിലൂടെ, വ്യത്യസ്ത കാലയളവുകൾ, റെസലൂഷനുകൾ, വീക്ഷണ അനുപാതങ്ങൾ എന്നിവ ഉൾക്കൊള്ളുന്ന, മുമ്പ് സാധ്യമായതിനേക്കാൾ വിശാലമായ ദൃശ്യ ഡാറ്റയിൽ ഡിഫ്യൂഷൻ ട്രാൻസ്ഫോർമറുകളെ ട്രെയിൻ ചെയ്യാൻ ഞങ്ങൾക്ക് കഴിയും.

Sora DALL·E, GPT മോഡലുകളിലെ മുൻകാല ഗവേഷണങ്ങളെ അടിസ്ഥാനമാക്കി നിർമ്മിച്ചിരിക്കുന്നു. ഇത് DALL·E 3 ൽ നിന്നുള്ള പുനർക്യാപ്ഷന സാങ്കേതികത ഉപയോഗിക്കുന്നു, അതിൽ ദൃശ്യ പരിശീലനം ഡാറ്റയ്ക്കായി വളരെ വിവരണാത്മകമായ അടിക്കുറിപ്പുകൾ സൃഷ്ടിക്കുന്നു. ഫലമായി, സൃഷ്ടിച്ച വീഡിയോയിൽ ഉപയോക്താവിന്റെ ടെക്സ്റ്റ് നിർദ്ദേശങ്ങൾ കൂടുതൽ വിശ്വസ്തമായി പിന്തുടരാൻ മോഡലിന് കഴിയും.

ടെക്സ്റ്റ് നിർദ്ദേശങ്ങളിൽ നിന്ന് മാത്രം ഒരു വീഡിയോ സൃഷ്ടിക്കാൻ കഴിയുന്നതിനൊപ്പം, നിലവിലുള്ള ഒരു സ്റ്റിൽ ചിത്രം എടുത്ത് അതിൽ നിന്ന് ഒരു വീഡിയോ സൃഷ്ടിക്കാൻ മോഡലിന് കഴിയും, ചിത്രത്തിന്റെ ഉള്ളടക്കങ്ങൾ കൃത്യതയോടും ചെറിയ വിശദാംശങ്ങളോടും ശ്രദ്ധയോടും കൂടി ആനിമേറ്റ് ചെയ്യുന്നു. മോഡലിന് നിലവിലുള്ള ഒരു വീഡിയോ എടുത്ത് അതിനെ വിപുലീകരിക്കുകയോ കാണാതായ ഫ്രെയിമുകൾ പൂരിപ്പിക്കുകയോ ചെയ്യാൻ കഴിയും. ഞങ്ങളുടെ സാങ്കേതിക റിപ്പോർട്ടിൽ കൂടുതൽ അറിയുക.

യഥാർത്ഥ ലോകത്തെ മനസിലാക്കുകയും അനുകരിക്കുകയും ചെയ്യുന്ന മോഡലുകൾക്ക് ഒരു അടിത്തറയായി Sora പ്രവർത്തിക്കുന്നു, AGI നേടുന്നതിന് ഒരു പ്രധാന നാഴികക്കല്ലായിരിക്കുമെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്ന കഴിവ്.

ലോഡിംഗ്...