முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

இந்தப் பக்கத்தில் உள்ள அனைத்து வீடியோக்களும் மாற்றமின்றி நேரடியாக Sora மூலம் உருவாக்கப்பட்டவை.

ஏற்றுகிறது…

நாங்கள் AI-ஐ நிஜ உலக இயக்கங்களைப் புரிந்து அவற்றை உருவகப்படுத்த பயிற்றுவித்து வருகிறோம், இதன் நோக்கம் நிஜ உலகத் தொடர்பு தேவைப்படும் சிக்கல்களைத் தீர்க்க மக்களுக்கு உதவும் மாடல்களை உருவாக்குவதாகும்.

எங்கள் டெக்ஸ்ட்-டு-வீடியோ மாடல் Sora-வை அறிமுகப்படுத்துகிறோம். Sora ஒரு நிமிட நீளமுள்ள வீடியோக்களை உருவாக்க முடியும், அதேசமயம் காட்சித் தரத்தையும் பயனர் பிராம்ப்ட்டிற்கான துல்லியத்தையும் காக்கிறது.

இன்றுமுதல், சாத்தியமான தீங்குகள் மற்றும் அபாயங்களை மதிப்பிட ரெட் டீமர்களுக்கு Sora கிடைக்கிறது. மேலும், மாடலை சிருஷ்டிப்புத் துறையில் ஈடுபட்டவர்களுக்கு மிகப் பயனுள்ளதாக மாற்றுவதற்கான கருத்துக்களை பெற, பல்வேறு விஷுவல் ஆர்டிஸ்ட்கள், டிசைனர்கள் மற்றும் திரைப்பட இயக்குநர்களுக்கும் அணுகலை வழங்குகிறோம்.

OpenAI-க்கு வெளியே உள்ளவர்களுடன் இணைந்து பணியாற்றவும், அவர்களிடமிருந்து கருத்துக்களைப் பெறவும், மேலும் எதிர்கால AI திறன்களின் ஒரு பார்வையை பொதுமக்களுக்கு வழங்கவும், எங்கள் ஆராய்ச்சி முன்னேற்றத்தை முன்னதாகப் பகிர்ந்து கொள்கிறோம்.

Sora பல கதாபாத்திரங்களுடன் கூடிய சிக்கலான காட்சிகளையும், குறிப்பிட்ட இயக்க வடிவங்களையும், பொருள் மற்றும் பின்னணியின் துல்லியமான விவரங்களையும் உருவாக்கும் திறன் கொண்டது. இந்த மாடல், பயனர் பிராம்ப்டில் கேட்டதையே அல்லாமல், அந்த விஷயங்கள் நிஜ உலகில் எவ்வாறு இருப்பதையும் புரிந்து கொள்ளும்.

இந்த மாடல், மொழியை ஆழமாகப் புரிந்துகொள்ளும் திறன் கொண்டது. இதனால் அது தூண்டிகளைத் துல்லியமாகப் புரிந்து, உயிர்ப்புடன் கூடிய, உணர்ச்சிகரமான கதாபாத்திரங்களை உருவாக்க முடிகிறது. Sora ஒரு உருவாக்கப்பட்ட வீடியோவின் பல ஷாட்களில் கதாபாத்திரங்களையும் காட்சித் தோற்றத்தையும் துல்லியமாக ஒரே மாதிரியாகக் காட்ட முடியும்.

தற்போதைய மாடலில் இன்னும் மேம்பாட்டுக்கான வாய்ப்பு உள்ளது. சிக்கலான காட்சியின் பௌதீக இயக்கங்களை உருவகப்படுத்துவதில் சிரமப்படலாம், மேலும் காரண–விளைவு நிகழ்வுகளைச் சரியாகப் புரிந்துகொள்ளாமல் இருக்கலாம் (உதாரணமாக: ஒரு கதாபாத்திரம் பிஸ்கட்டைக் கடித்த பிறகும் அதில் கடித்த குறியீடு தெரியாமல் இருக்கலாம்). இந்த மாடல், ஒரு குறிப்பில் சேர்க்கப்பட்டுள்ள இடஞ்சார்ந்த விவரங்களான இடது அல்லது வலதைக் கண்டறிதல் போன்றவற்றில் குழப்பமடையலாம் அல்லது குறிப்பிட்ட கேமராப் பயணப்பாதை போன்ற காலப்போக்கில் நிகழும் நிகழ்வுகளைத் துல்லியமாக விவரிக்கவும் திணறலாம்.

பாதுகாப்பு

Sora-வை OpenAI தயாரிப்புகளில் வழங்குவதற்கு முன், பல முக்கியமான பாதுகாப்பு நடவடிக்கைகளை எடுக்கிறோம். தவறான தகவல், வெறுப்பு உள்ளடக்கம், மற்றும் பாகுபாடு போன்ற துறைகளில் நிபுணர்களான ரெட் டீமர்களுடன் இணைந்து பணிபுரிகிறோம்; அவர்கள் மாடலை எதிர்மறை சோதனைகளின் மூலம் மதிப்பீடு செய்வார்கள்.

தவறான தகவல்களைக் கண்டறிய உதவும் கருவிகளையும் உருவாக்கி வருகிறோம். அதில் Sora மூலம் உருவாக்கப்பட்ட வீடியோவாக இருப்பதை அடையாளம் காணக்கூடிய கண்டறிதல் வகைப்படுத்தி ஒன்று உள்ளது. நாங்கள் எதிர்காலத்தில் ஒரு OpenAI தயாரிப்பில் மாதிரியைப் பயன்படுத்தினால், C2PA மெட்டாடேட்டாவை(புதிய சாளரத்தில் திறக்கும்) சேர்க்க திட்டமிட்டுள்ளோம்.

நாங்கள் பயன்படுத்தலுக்குத் தயாராக புதிய நுட்பங்களை உருவாக்குவதோடு, DALL·E 3 ஐப் பயன்படுத்தும் எங்கள் தயாரிப்புகளுக்காக உருவாக்கிய தற்போதைய பாதுகாப்பு முறைகளை(புதிய சாளரத்தில் திறக்கும்) Sora வுக்கும் பொருந்தும் வகையில் பயன்படுத்துகிறோம்.

உதாரணமாக, OpenAI தயாரிப்பில் இணைக்கப்பட்ட பிறகு, எங்கள் உரை வகைப்படுத்தி எங்கள் பயன்பாட்டுக் கொள்கைகளை மீறும் உரை உள்ளீட்டு துண்டிகளைச் சரிபார்த்து நிராகரிக்கும் — அதாவது, அதீத வன்முறை, பாலியல் உள்ளடக்கம், வெறுப்பு தூண்டும் காட்சிகள், பிரபலங்களின் ஒற்றுமை அல்லது பிறரின் அறிவுசார் சொத்துக்கள் போன்றவற்றைக் கோரும் தூண்டிகள். மேலும், பயனருக்கு வீடியோ காட்டப்படுவதற்கு முன், அது எங்கள் பயன்பாட்டு கொள்கைகளுக்கு இணங்குகிறதா என்பதை உறுதி செய்ய, ஒவ்வொரு உருவாக்கப்பட்ட வீடியோவின் ஃப்ரேம்களையும் பரிசோதிக்கும் வலுவான இமேஜ் கிளாசிபையர்களையும் உருவாக்கியுள்ளோம்.

உலகம் முழுவதும் உள்ள கொள்கை உருவாக்குநர்கள், கல்வியாளர்கள் மற்றும் கலைஞர்களுடன் இணைந்து, அவர்களின் கவலைகளைப் புரிந்து கொண்டு, இந்தப் புதிய தொழில்நுட்பத்திற்கான நேர்மையான பயன்பாட்டு வழிகளைக் கண்டறிவோம். பரந்த அளவிலான ஆராய்ச்சியும் சோதனைகளும் நடத்தியிருந்தாலும், மக்கள் எங்கள் தொழில்நுட்பத்தை எவ்வாறு பயனுள்ளதாகப் பயன்படுத்துவார்கள் என்பதையும், எவ்வாறு தவறாகப் பயன்படுத்துவார்கள் என்பதையும் முழுமையாக முன்னறிவிக்க முடியாது. அதனால் தான், நிஜ உலகப் பயன்பாட்டிலிருந்து கற்றுக்கொள்வது, காலத்தோடு மேலும் பாதுகாப்பான AI அமைப்புகளை உருவாக்குவதற்கும் வெளியிடுவதற்கும் அத்தியாவசியமான கூறாகும் என்று நாங்கள் நம்புகிறோம்.

ஆராய்ச்சி நுட்பங்கள்

Sora ஒரு பரவல் மாடல் ஆகும்; இது முதலில் நிலையான இரைச்சல் போலத் தோன்றும் வீடியோவுடன் தொடங்கி, பல கட்டங்களில் அந்த இரைச்சலை அகற்றி படிப்படியாக ஒரு வீடியோவாக மாற்றுகிறது.

Sora முழு வீடியோக்களையும் ஒரே நேரத்தில் உருவாக்கவோ அல்லது ஏற்கெனவே உருவாக்கப்பட்ட வீடியோக்களை நீட்டித்து நீளமானதாக மாற்றவோ முடியும். மாடலுக்கு ஒரே நேரத்தில் பல ஃப்ரேம்களைக் கற்பனை செய்யும் திறனை வழங்குவதன் மூலம், ஒரு பொருள் சில நேரம் காட்சியில் இருந்து மறைந்தாலும் அது அதேபோலவே தொடரும் என்பதை உறுதிப்படுத்தும் சவாலான பிரச்சனையை நாங்கள் தீர்த்துள்ளோம்.

GPT மாடல்களைப் போலவே, Sora டிரான்ஸ்ஃபார்மர் ஆர்கிடெக்சரைப் பயன்படுத்துகிறது. இது மேம்பட்ட ஸ்கேலிங் திறனை வெளிப்படுத்துகிறது.

வீடியோக்களையும் படங்களையும், “patches” எனப்படும் சிறிய தரவு கூறுகளின் தொகுப்புகளாக நாம் எடுத்தாள்கிறோம்; ஒவ்வொரு “patch”உம் GPT இல் உள்ள ஒரு “டோக்கன்” போலச் செயல்படுகிறது. தரவை பிரதிநிதித்துவப்படுத்தும் முறையை ஒரே மாதிரியாக்குவதன் மூலம், முந்தையதை விட பல்வேறு காலநீளம், தீர்மானம் மற்றும் அஸ்பெக்ட் ரேஷியோ கொண்ட பரந்த அளவிலான காட்சித் தரவுகளில் டிஃப்யூஷன் டிரான்ஸ்ஃபார்மர்களை பயிற்றுவிக்க முடிகிறது.

DALL·E மற்றும் GPT மாடல்களில் மேற்கொள்ளப்பட்ட முந்தைய ஆராய்ச்சிகளை அடிப்படையாகக் கொண்டு Sora உருவாக்கப்பட்டுள்ளது. இது DALL·E 3 இல் பயன்படுத்தப்படும் “recaptioning” நுட்பத்தைப் பயன்படுத்துகிறது, இது காட்சிப் பயிற்சி தரவிற்காக மிகவும் விளக்கமான விளக்கங்களை உருவாக்குவதை உள்ளடக்குகிறது. அதன் விளைவாக, மாடல் பயனரின் டெக்ஸ்ட் வழிமுறைகளை உருவாக்கப்பட்ட வீடியோவில் மிகத் துல்லியமாகப் பின்பற்ற முடிகிறது.

உரை அறிவுறுத்தல்களிலிருந்து வீடியோ உருவாக்குவதுடன், மாடல் ஏற்கனவே உள்ள நிலையான படத்தைப் பெற்று அதிலிருந்து ஒரு வீடியோவையும் உருவாக்க முடியும்; அதில் உள்ள கூறுகளை மிகத் துல்லியமாகவும் நுணுக்கமாகவும் உயிர்ப்பூட்டுகிறது. ஏற்கெனவே உள்ள ஒரு வீடியோவை நீட்டிக்கவோ அல்லது அதில் காணாமல் போன ஃப்ரேம்களை நிரப்பவோ மாடலால் முடியும். எங்கள் தொழில்நுட்ப அறிக்கையில் மேலும் அறிந்துகொள்ளுங்கள்.

நிஜ உலகத்தைப் புரிந்து அதைப் பிரதிபலிக்கக் கூடிய மாடல்களுக்கான அடித்தளமாக Sora செயல்படுகிறது; இது AGI-யை அடைவதற்கான ஒரு முக்கிய மைல்கல் என நாங்கள் நம்புகிறோம்.

ஏற்றுகிறது...