ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

ਇਸ ਪੰਨੇ ਦੀਆਂ ਸਾਰੀਆਂ ਵੀਡੀਓਜ਼ ਬਿਨਾਂ ਕਿਸੇ ਸੋਧ ਦੇ ਸਿੱਧੇ Sora ਦੁਆਰਾ ਬਣਾਈਆਂ ਗਈਆਂ ਸਨ.

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਅਸੀਂ AI ਨੂੰ ਗਤੀਸ਼ੀਲ ਭੌਤਿਕ ਸੰਸਾਰ ਨੂੰ ਸਮਝਣ ਅਤੇ ਉਸ ਦੀ ਨਕਲ ਕਰਨ ਦੀ ਸਿੱਖਿਆ ਦੇ ਰਹੇ ਹਾਂ, ਇਸ ਲਕਸ਼ ਨਾਲ ਕਿ ਅਜੇਹੇ ਮਾਡਲ ਤਿਆਰ ਕੀਤੇ ਜਾਣ ਜੋ ਲੋਕਾਂ ਨੂੰ ਉਹ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਜਿਨ੍ਹਾਂ ਲਈ ਅਸਲ ਦੁਨੀਆ ਨਾਲ ਅੰਤਰਕਿਰਿਆ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ.

Sora ਪੇਸ਼ ਹੈ, ਸਾਡਾ ਟੈਕਸਟ-ਤੋਂ-ਵੀਡੀਓ ਮਾਡਲ. Sora ਯੂਜ਼ਰ ਦੇ ਪ੍ਰੌੰਪਟ ਦੀ ਪਾਲਣਾ ਅਤੇ ਵਿਜ਼ੂਅਲ ਗੁਣਵੱਤਾ ਕਾਇਮ ਰੱਖਦਿਆਂ ਇੱਕ ਮਿੰਟ ਤੱਕ ਦੀਆਂ ਵੀਡੀਓਜ਼ ਬਣਾ ਸਕਦਾ ਹੈ.

ਅੱਜ, Sora ਨੁਕਸਾਨ ਜਾਂ ਖਤਰਿਆਂ ਦੇ ਮਹੱਤਵਪੂਰਨ ਖੇਤਰਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਰੈੱਡ ਟੀਮਰਾਂ ਲਈ ਉਪਲਬਧ ਹੋਣਾ ਸ਼ੁਰੂ ਹੋ ਰਿਹਾ ਹੈ. ਅਸੀਂ ਕਈ ਵਿਜ਼ੂਅਲ ਕਲਾਕਾਰਾਂ, ਡਿਜ਼ਾਈਨਰਾਂ ਅਤੇ ਫਿਲਮ ਨਿਰਮਾਤਾਵਾਂ ਨੂੰ ਵੀ ਪਹੁੰਚ ਦੇ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਇਹ ਜਾਣਨ ਲਈ ਫੀਡਬੈਕ ਮਿਲ ਸਕੇ ਕਿ ਮਾਡਲ ਨੂੰ ਰਚਨਾਤਮਕ ਪੇਸ਼ੇਵਰਾਂ ਲਈ ਸਭ ਤੋਂ ਜ਼ਿਆਦਾ ਮਦਦਗਾਰ ਬਣਾਉਣ ਵਾਸਤੇ ਕਿਵੇਂ ਅੱਗੇ ਵਧਾਇਆ ਜਾਵੇ.

ਅਸੀਂ ਆਪਣੀ ਖੋਜ ਵਿੱਚ ਹੋ ਰਹੀ ਤਰੱਕੀ ਜਲਦੀ ਸਾਂਝੀ ਕਰ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ OpenAI ਤੋਂ ਬਾਹਰ ਦੇ ਲੋਕਾਂ ਨਾਲ ਕੰਮ ਕਰਨਾ ਅਤੇ ਉਨ੍ਹਾਂ ਤੋਂ ਫੀਡਬੈਕ ਲੈਣਾ ਸ਼ੁਰੂ ਕਰ ਸਕੀਏ ਅਤੇ ਜਨਤਾ ਨੂੰ ਇਹ ਅਹਿਸਾਸ ਕਰਵਾ ਸਕੀਏ ਕਿ AI ਸਮਰੱਥਾਵਾਂ ਦੀਆਂ ਅਗਲੀਆਂ ਹੱਦਾਂ ਕੀ ਹਨ.

Sora ਕਈ ਕਿਰਦਾਰਾਂ, ਖਾਸ ਕਿਸਮ ਦੀ ਗਤੀ, ਅਤੇ ਵਿਸ਼ੇ ਅਤੇ ਪਿਛੋਕੜ ਦੇ ਸਹੀ ਵੇਰਵਿਆਂ ਵਾਲੇ ਜਟਿਲ ਦ੍ਰਿਸ਼ ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੈ. ਮਾਡਲ ਸਿਰਫ਼ ਇਹ ਨਹੀਂ ਸਮਝਦਾ ਕਿ ਯੂਜ਼ਰ ਨੇ ਪ੍ਰੌੰਪਟ ਵਿੱਚ ਕੀ ਮੰਗਿਆ ਹੈ, ਸਗੋਂ ਇਹ ਵੀ ਸਮਝਦਾ ਹੈ ਕਿ ਉਹ ਚੀਜ਼ਾਂ ਭੌਤਿਕ ਸੰਸਾਰ ਵਿੱਚ ਕਿਵੇਂ ਮੌਜੂਦ ਹਨ.

ਮਾਡਲ ਨੂੰ ਭਾਸ਼ਾ ਦੀ ਡੂੰਘੀ ਸਮਝ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਪ੍ਰੌੰਪਟਾਂ ਦੀ ਸਹੀ ਵਿਆਖਿਆ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਅਜਿਹੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਕਿਰਦਾਰ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਜੀਵੰਤ ਭਾਵਨਾਵਾਂ ਪ੍ਰਗਟ ਕਰਦੇ ਹਨ. Sora ਇੱਕੋ ਬਣੀ ਹੋਈ ਵੀਡੀਓ ਵਿੱਚ ਕਈ ਸ਼ਾਟ ਵੀ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਕਿਰਦਾਰਾਂ ਅਤੇ ਵਿਜ਼ੂਅਲ ਸ਼ੈਲੀ ਨੂੰ ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਕਾਇਮ ਰੱਖਦੇ ਹਨ.

ਮੌਜੂਦਾ ਮਾਡਲ ਵਿੱਚ ਹਾਲੇ ਵੀ ਸੁਧਾਰ ਦੀ ਗੁੰਜਾਇਸ਼ ਹੈ. ਇਹ ਕਿਸੇ ਜਟਿਲ ਦ੍ਰਿਸ਼ ਦੀ ਭੌਤਿਕੀ ਦੀ ਨਕਲ ਕਰਨ ਵਿੱਚ ਮੁਸ਼ਕਲ ਮਹਿਸੂਸ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਕਾਰਨ ਤੇ ਪ੍ਰਭਾਵ ਦੇ ਖਾਸ ਮਾਮਲਿਆਂ ਨੂੰ ਸਮਝ ਨਾ ਸਕੇਗਾ (ਉਦਾਹਰਨ ਲਈ: ਕੋਈ ਕਿਰਦਾਰ ਕੁਕੀ ਨੂੰ ਕਟੇ ਤਾਂ ਉਸ 'ਤੇ ਨਿਸ਼ਾਨ ਨਾ ਦਿਖੇ). ਮਾਡਲ ਪ੍ਰੌੰਪਟ ਵਿੱਚ ਦਿੱਤੇ ਗਏ ਸਥਾਨਕ ਵੇਰਵਿਆਂ ਨੂੰ ਵੀ ਗੁੰਝਲ ਵਿੱਚ ਪਾ ਸਕਦਾ ਹੈ, ਜਿਵੇਂ ਖੱਬੇ ਅਤੇ ਸੱਜੇ ਵਿੱਚ ਫ਼ਰਕ ਕਰਨਾ, ਜਾਂ ਸਮੇਂ ਦੇ ਨਾਲ ਘਟਣ ਵਾਲੀਆਂ ਘਟਨਾਵਾਂ ਦੇ ਸਟੀਕ ਵਰਣਨ ਨਾਲ ਸੰਘਰਸ਼ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਵੇਂ ਖਾਸ ਕੈਮਰਾ ਟ੍ਰੈਜੈਕਟਰੀਆਂ.

ਸੁਰੱਖਿਆ

OpenAI ਦੇ ਉਤਪਾਦਾਂ ਵਿੱਚ Sora ਉਪਲਬਧ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਅਸੀਂ ਸੁਰੱਖਿਆ ਦੇ ਕਈ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਚੁੱਕਾਂਗੇ. ਅਸੀਂ ਰੈੱਡ ਟੀਮਰਾਂ — ਗਲਤ ਜਾਣਕਾਰੀ, ਘ੍ਰਿਣਾਪੂਰਣ ਸਮੱਗਰੀ ਅਤੇ ਪੱਖਪਾਤ ਵਰਗੇ ਖੇਤਰਾਂ ਦੇ ਮਾਹਿਰਾਂ — ਨਾਲ ਕੰਮ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਮਾਡਲ ਦੀ ਵਿਰੋਧੀ ਢੰਗ ਨਾਲ ਜਾਂਚ ਕਰਨਗੇ.

ਅਸੀਂ ਭ੍ਰਮਿਤ ਕਰਨ ਵਾਲੀ ਸਮੱਗਰੀ ਦੀ ਪਛਾਣ ਵਿੱਚ ਮਦਦ ਲਈ ਟੂਲ ਵੀ ਬਣਾ ਰਹੇ ਹਾਂ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਡਿਟੈਕਸ਼ਨ ਕਲਾਸੀਫਾਇਰ ਜੋ ਦੱਸ ਸਕੇ ਕਿ ਕੋਈ ਵੀਡੀਓ Sora ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਸੀ ਜਾਂ ਨਹੀਂ. ਜੇ ਅਸੀਂ ਮਾਡਲ ਨੂੰ ਕਿਸੇ OpenAI ਉਤਪਾਦ ਵਿੱਚ ਤੈਨਾਤ ਕਰਦੇ ਹਾਂ, ਤਾਂ ਭਵਿੱਖ ਵਿੱਚ C2PA metadata(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਸ਼ਾਮਲ ਕਰਨ ਦੀ ਯੋਜਨਾ ਹੈ.

ਤੈਨਾਤੀ ਦੀ ਤਿਆਰੀ ਲਈ ਨਵੀਆਂ ਤਕਨੀਕਾਂ ਵਿਕਸਿਤ ਕਰਨ ਦੇ ਨਾਲ ਨਾਲ, ਅਸੀਂ ਆਪਣੇ ਉਹ ਮੌਜੂਦਾ ਸੁਰੱਖਿਆ ਤਰੀਕੇ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵੀ ਵਰਤ ਰਹੇ ਹਾਂ ਜੋ ਅਸੀਂ DALL·E 3 ਵਰਤਣ ਵਾਲੇ ਉਤਪਾਦਾਂ ਲਈ ਬਣਾਏ ਸਨ, ਅਤੇ ਜੋ Sora 'ਤੇ ਵੀ ਲਾਗੂ ਹੁੰਦੇ ਹਨ.

ਉਦਾਹਰਨ ਵਜੋਂ, ਕਿਸੇ OpenAI ਉਤਪਾਦ ਵਿੱਚ ਆਉਣ ਤੋਂ ਬਾਅਦ, ਸਾਡਾ ਟੈਕਸਟ ਕਲਾਸੀਫਾਇਰ ਅਜਿਹੇ ਟੈਕਸਟ ਇਨਪੁਟ ਪ੍ਰੌੰਪਟਾਂ ਦੀ ਜਾਂਚ ਕਰੇਗਾ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਰੱਦ ਕਰੇਗਾ ਜੋ ਸਾਡੀਆਂ ਵਰਤੋਂ ਨੀਤੀਆਂ ਦੀ ਉਲੰਘਣਾ ਕਰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਉਹ ਜੋ ਅਤਿ ਹਿੰਸਾ, ਯੌਨ ਸਮੱਗਰੀ, ਘ੍ਰਿਣਾਪੂਰਣ ਚਿੱਤਰਾਂ, ਮਸ਼ਹੂਰ ਹਸਤੀਆਂ ਦੀ ਸਮਾਨਤਾ ਜਾਂ ਦੂਜਿਆਂ ਦੀ IP ਦੀ ਮੰਗ ਕਰਦੇ ਹਨ. ਅਸੀਂ ਮਜ਼ਬੂਤ ਚਿੱਤਰ ਕਲਾਸੀਫਾਇਰ ਵੀ ਵਿਕਸਿਤ ਕੀਤੇ ਹਨ ਜੋ ਬਣਾਈ ਗਈ ਹਰ ਵੀਡੀਓ ਦੇ ਫ੍ਰੇਮਾਂ ਦੀ ਸਮੀਖਿਆ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ, ਤਾਂ ਜੋ ਇਹ ਯਕੀਨੀ ਬਣਾਇਆ ਜਾ ਸਕੇ ਕਿ ਉਹ ਯੂਜ਼ਰ ਨੂੰ ਦਿਖਾਏ ਜਾਣ ਤੋਂ ਪਹਿਲਾਂ ਸਾਡੀਆਂ ਵਰਤੋਂ ਨੀਤੀਆਂ ਦਾ ਪਾਲਣ ਕਰਦੀ ਹੈ.

ਅਸੀਂ ਦੁਨੀਆ ਭਰ ਦੇ ਨੀਤੀ-ਨਿਰਧਾਰਕਾਂ, ਸਿੱਖਿਆਵਿਦਾਂ ਅਤੇ ਕਲਾਕਾਰਾਂ ਨਾਲ ਸੰਪਰਕ ਕਰਾਂਗੇ ਤਾਂ ਜੋ ਉਨ੍ਹਾਂ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਨੂੰ ਸਮਝ ਸਕੀਏ ਅਤੇ ਇਸ ਨਵੀਂ ਤਕਨਾਲੋਜੀ ਲਈ ਸਕਾਰਾਤਮਕ ਵਰਤੋਂ ਦੇ ਕੇਸਾਂ ਦੀ ਪਛਾਣ ਕਰ ਸਕੀਏ. ਵਿਸਤ੍ਰਿਤ ਖੋਜ ਅਤੇ ਜਾਂਚ ਦੇ ਬਾਵਜੂਦ, ਅਸੀਂ ਉਹਨਾਂ ਸਭ ਲਾਭਦਾਇਕ ਤਰੀਕਿਆਂ ਦੀ ਪੇਸ਼ਗੋਈ ਨਹੀਂ ਕਰ ਸਕਦੇ ਜਿਨ੍ਹਾਂ ਨਾਲ ਲੋਕ ਸਾਡੀ ਤਕਨਾਲੋਜੀ ਵਰਤਣਗੇ, ਨਾ ਹੀ ਉਹਨਾਂ ਸਭ ਤਰੀਕਿਆਂ ਦੀ ਜਿਨ੍ਹਾਂ ਨਾਲ ਲੋਕ ਇਸ ਦਾ ਦੁਰੁਪਯੋਗ ਕਰਨਗੇ. ਇਸ ਲਈ ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਅਸਲ ਦੁਨੀਆ ਦੀ ਵਰਤੋਂ ਤੋਂ ਸਿੱਖਣਾ ਸਮੇਂ ਦੇ ਨਾਲ ਹੋਰ ਸੁਰੱਖਿਅਤ AI ਸਿਸਟਮ ਬਣਾਉਣ ਅਤੇ ਜਾਰੀ ਕਰਨ ਦਾ ਇੱਕ ਅਤਿਅੰਤ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹੈ.

Research techniques

Sora ਇੱਕ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਹੈ, ਜੋ ਸਟੈਟਿਕ ਸ਼ੋਰ ਵਰਗੀ ਦਿਖਾਈ ਦੇਣ ਵਾਲੀ ਵੀਡੀਓ ਨਾਲ ਸ਼ੁਰੂ ਕਰਕੇ ਅਤੇ ਕਈ ਕਦਮਾਂ ਵਿੱਚ ਸ਼ੋਰ ਹਟਾ ਕੇ ਉਸ ਨੂੰ ਹੌਲੇ-ਹੌਲੇ ਬਦਲਦਿਆਂ ਵੀਡੀਓ ਤਿਆਰ ਕਰਦਾ ਹੈ.

Sora ਪੂਰੀਆਂ ਵੀਡੀਓਜ਼ ਇੱਕੋ ਵਾਰ ਬਣਾਉਣ ਜਾਂ ਬਣੀਆਂ ਹੋਈਆਂ ਵੀਡੀਓਜ਼ ਨੂੰ ਲੰਬਾ ਕਰਨ ਲਈ ਵਧਾਉਣ ਦੇ ਯੋਗ ਹੈ. ਮਾਡਲ ਨੂੰ ਇੱਕ ਸਮੇਂ ਕਈ ਫ੍ਰੇਮਾਂ ਦੀ ਪੂਰਵ-ਝਲਕ ਦੇ ਕੇ, ਅਸੀਂ ਇਹ ਮੁਸ਼ਕਲ ਸਮੱਸਿਆ ਹੱਲ ਕੀਤੀ ਹੈ ਕਿ ਜਦੋਂ ਕੋਈ ਵਿਸ਼ਾ ਕੁਝ ਸਮੇਂ ਲਈ ਨਜ਼ਰੋਂ ਓਝਲ ਹੋ ਜਾਵੇ, ਤਦ ਵੀ ਉਹ ਇੱਕੋ ਜਿਹਾ ਰਹੇ.

GPT ਮਾਡਲਾਂ ਦੀ ਤਰ੍ਹਾਂ, Sora ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਵਰਤਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵਧੀਆ ਸਕੇਲਿੰਗ ਪ੍ਰਦਰਸ਼ਨ ਮਿਲਦਾ ਹੈ.

ਅਸੀਂ ਵੀਡੀਓਜ਼ ਅਤੇ ਚਿੱਤਰਾਂ ਨੂੰ ਡਾਟਾ ਦੀਆਂ ਛੋਟੀਆਂ ਇਕਾਈਆਂ ਦੇ ਸੰਗ੍ਰਹਿ ਵਜੋਂ ਦਰਸਾਉਂਦੇ ਹਾਂ ਜਿਨ੍ਹਾਂ ਨੂੰ ਪੈਚ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਹਰ ਇੱਕ GPT ਦੇ ਟੋਕਨ ਵਰਗੀ ਹੁੰਦੀ ਹੈ. ਡਾਟਾ ਨੂੰ ਦਰਸਾਉਣ ਦੇ ਇਸ ਇਕਰੂਪ ਤਰੀਕੇ ਨਾਲ, ਅਸੀਂ ਡਿਫਿਊਜ਼ਨ ਟ੍ਰਾਂਸਫ਼ਾਰਮਰ ਨੂੰ ਪਹਿਲਾਂ ਨਾਲੋਂ ਵੱਡੀ ਰੇਂਜ ਦੇ ਵਿਜ਼ੂਅਲ ਡਾਟਾ 'ਤੇ ਟ੍ਰੇਨ ਕਰ ਸਕਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਮਿਆਦਾਂ, ਰੈਜ਼ੋਲੂਸ਼ਨਾਂ ਅਤੇ ਆਸਪੈਕਟ ਰੇਸ਼ੋ ਸ਼ਾਮਲ ਹਨ.

Sora DALL·E ਅਤੇ GPT ਮਾਡਲਾਂ ਵਿੱਚ ਹੋਈ ਪਿਛਲੀ ਖੋਜ 'ਤੇ ਅਧਾਰਿਤ ਹੈ. ਇਹ DALL·E 3 ਦੀ ਰੀਕੈਪਸ਼ਨਿੰਗ ਤਕਨੀਕ ਵਰਤਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਵਿਜ਼ੂਅਲ ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਲਈ ਬਹੁਤ ਵਰਣਨਾਤਮਕ ਕੈਪਸ਼ਨ ਤਿਆਰ ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ. ਇਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ, ਮਾਡਲ ਬਣੀ ਹੋਈ ਵੀਡੀਓ ਵਿੱਚ ਯੂਜ਼ਰ ਦੇ ਟੈਕਸਟ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਹੋਰ ਨਿਸ਼ਠਾ ਨਾਲ ਪਾਲਣਾ ਕਰ ਸਕਦਾ ਹੈ.

ਸਿਰਫ਼ ਟੈਕਸਟ ਨਿਰਦੇਸ਼ਾਂ ਤੋਂ ਵੀਡੀਓ ਬਣਾਉਣ ਦੇ ਨਾਲ ਨਾਲ, ਮਾਡਲ ਮੌਜੂਦਾ ਸਥਿਰ ਚਿੱਤਰ ਲੈ ਕੇ ਉਸ ਤੋਂ ਵੀਡੀਓ ਵੀ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ, ਚਿੱਤਰ ਦੇ ਅੰਦਰਲੇ ਤੱਤਾਂ ਨੂੰ ਸਹੀਪਣ ਅਤੇ ਬਾਰੀਕੀ ਨਾਲ ਐਨੀਮੇਟ ਕਰਦਾ ਹੋਇਆ. ਮਾਡਲ ਮੌਜੂਦਾ ਵੀਡੀਓ ਲੈ ਕੇ ਉਸ ਨੂੰ ਵਧਾ ਸਕਦਾ ਹੈ ਜਾਂ ਗੁੰਮ ਫ੍ਰੇਮ ਭਰ ਸਕਦਾ ਹੈ.

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ...