ಮುಖ್ಯ ವಿಷಯಕ್ಕೆ ನೇರವಾಗಿ ಹೋಗಿ
OpenAI

ಪಠ್ಯದಿಂದ ವೀಡಿಯೊವನ್ನು ರಚಿಸಿ

ಈ ಪುಟದಲ್ಲಿನ ಎಲ್ಲಾ ವೀಡಿಯೋಗಳನ್ನು ಯಾವುದೇ ಬದಲಾವಣೆಗಳಿಲ್ಲದೆ ನೇರವಾಗಿ Sora ರಚಿಸಿದೆ.

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

ನೈಜ ಜಗತ್ತಿನ ಸಂವಹನ ಅಗತ್ಯವಿರುವ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಸಹಾಯ ಮಾಡುವ ಮಾಡೆಲ್‌ಗಳನ್ನು ಟ್ರೈನ್ ಮಾಡುವ ಉದ್ದೇಶದಿಂದ ನಾವು AI ಯನ್ನು ನೈಜ ಜಗತ್ತಿನ ಚಲನೆಯ ಭೌತಿಕ ಪರಿಸರವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮತ್ತು ಅನುಕರಿಸಲು ಟ್ರೈನಿಂಗ್ ನೀಡುತ್ತಿದ್ದೇವೆ.

ನಮ್ಮ ಪಠ್ಯದಿಂದ ವೀಡಿಯೋ ಮಾಡೆಲ್ ಆದ Sora ಅನ್ನು ಪರಿಚಯಿಸುತ್ತಿದ್ದೇವೆ. Sora ದೃಶ್ಯ ಗುಣಮಟ್ಟವನ್ನು ಉಳಿಸಿಕೊಂಡು, ಬಳಕೆದಾರರ ಪ್ರಾಂಪ್ಟ್‌ಗೆ ನಿಷ್ಠೆಯಿಂದ, ಒಂದು ನಿಮಿಷದವರೆಗಿನ ವೀಡಿಯೋಗಳನ್ನು ರಚಿಸಬಹುದು.

ಇಂದು, ಅಪಾಯಗಳು ಅಥವಾ ಹಾನಿಯ ಪ್ರಮುಖ ಕ್ಷೇತ್ರಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು Sora ಅನ್ನು ರೆಡ್ ಟೀಮ್ ಸದಸ್ಯರಿಗೆ ಲಭ್ಯವಾಗುತ್ತಿದೆ. ಸೃಜನಶೀಲ ವೃತ್ತಿಪರರಿಗೆ ಅತ್ಯಂತ ಸಹಾಯಕವಾಗುವಂತೆ ಮಾಡೆಲ್ ಅನ್ನು ಹೇಗೆ ಅಭಿವೃದ್ಧಿಪಡಿಸಬಹುದು ಎಂಬ ಕುರಿತು ಪ್ರತಿಕ್ರಿಯೆ ಪಡೆಯಲು ನಾವು ಹಲವು ದೃಶ್ಯ ಕಲಾವಿದರು, ವಿನ್ಯಾಸಕರರು ಮತ್ತು ಚಲನಚಿತ್ರ ನಿರ್ಮಾಪಕರಿಗೂ ಪ್ರವೇಶವನ್ನು ನೀಡುತ್ತಿದ್ದೇವೆ.

ನಾವು ನಮ್ಮ ಸಂಶೋಧನಾ ಪ್ರಗತಿಯನ್ನು ಮುಂಚಿತವಾಗಿ ಹಂಚಿಕೊಳ್ಳುತ್ತಿರುವುದು, OpenAI ಹೊರಗಿನ ಜನರೊಂದಿಗೆ ಸಹಕರಿಸಲು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆ ಪಡೆಯಲು ಪ್ರಾರಂಭಿಸುವ ಜೊತೆಗೆ, ಭವಿಷ್ಯದಲ್ಲಿ ಬರಲಿರುವ AI ಸಾಮರ್ಥ್ಯಗಳ ಬಗ್ಗೆ ಸಾರ್ವಜನಿಕರಿಗೆ ತಿಳಿಸುವ ಉದ್ದೇಶದಿಂದವಾಗಿದೆ.

Sora ಅನೇಕ ಪಾತ್ರಗಳೊಂದಿಗೆ, ನಿರ್ದಿಷ್ಟ ಚಲನೆಯ ವಿಧಗಳೊಂದಿಗೆ ಮತ್ತು ವಿಷಯ ಮತ್ತು ಹಿನ್ನೆಲೆಯ ನಿಖರವಾದ ವಿವರಗಳೊಂದಿಗೆ ಸಂಕೀರ್ಣ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸಲು ಸಾಮರ್ಥ್ಯ ಹೊಂದಿದೆ. ಈ ಮಾಡೆಲ್ ಬಳಕೆದಾರನು ಪ್ರಾಂಪ್ಟ್‌ನಲ್ಲಿ ಕೇಳಿರುವುದನ್ನೇ ಅಲ್ಲ, ಆ ಅಂಶಗಳು ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಹೇಗೆ ಅಸ್ತಿತ್ವದಲ್ಲಿವೆ ಎಂಬುದನ್ನೂ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತದೆ.

ಮಾಡೆಲ್ ಭಾಷೆಯ ಆಳವಾದ ಅರ್ಥವನ್ನು ತಿಳಿದಿದ್ದು, ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ನಿಖರವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮತ್ತು ಜೀವಂತ ಭಾವನೆಗಳನ್ನು ವ್ಯಕ್ತಪಡಿಸುವ ಆಕರ್ಷಕ ಪಾತ್ರಗಳನ್ನು ರಚಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. Sora ಒಂದು ವೀಡಿಯೋದಲ್ಲಿಯೇ ಅನೇಕ ಶಾಟ್‌ಗಳನ್ನು ರಚಿಸಿ, ಪಾತ್ರಗಳು ಮತ್ತು ದೃಶ್ಯ ಶೈಲಿಯನ್ನು ನಿಖರವಾಗಿ ನಿರಂತರವಾಗಿ ಕಾಪಾಡುತ್ತದೆ.

ಪ್ರಸ್ತುತ ಮಾಡೆಲ್‌ನಲ್ಲಿ ಇನ್ನೂ ಸುಧಾರಣೆಗೆ ಅವಕಾಶವಿದೆ. ಇದು ಸಂಕೀರ್ಣ ದೃಶ್ಯದ ಭೌತಿಕಶಾಸ್ತ್ರವನ್ನು ನಿಖರವಾಗಿ ಅನುಕರಿಸಲು ಕಷ್ಟಪಡಬಹುದು ಮತ್ತು ಕೆಲವು ಕಾರಣ-ಪರಿಣಾಮ ಸಂಬಂಧಿತ ಘಟನೆಗಳನ್ನು ಸರಿಯಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳದಿರಬಹುದು (ಉದಾಹರಣೆಗೆ: ಪಾತ್ರವೊಂದು ಬಿಸ್ಕತ್ ಕಚ್ಚಿದ ನಂತರ ಅದರ ಮೇಲೆ ಗುರುತು ಕಾಣದಿರಬಹುದು). ಮಾಡೆಲ್ ಪ್ರಾಂಪ್ಟ್‌ನಲ್ಲಿ ನೀಡಲಾದ ಸ್ಥಳ ಸಂಬಂಧಿತ ವಿವರಗಳನ್ನು, ಉದಾಹರಣೆಗೆ ಎಡ ಮತ್ತು ಬಲವನ್ನು ಭೇದಿಸುವುದರಲ್ಲಿ ಗೊಂದಲಪಡಬಹುದು ಅಥವಾ ಸಮಯದೊಂದಿಗೆ ಬೆಳೆಯುವ ಘಟನೆಗಳ ನಿಖರ ವಿವರಣೆಯಲ್ಲಿ, ಉದಾಹರಣೆಗೆ ನಿರ್ದಿಷ್ಟ ಕ್ಯಾಮೆರಾ ಚಲನೆಗಳಲ್ಲಿ, ಕಷ್ಟಪಡುವುದು ಸಾಧ್ಯ.

ಸುರಕ್ಷತೆ

OpenAI ಉತ್ಪನ್ನಗಳಲ್ಲಿ Sora ಅನ್ನು ಲಭ್ಯಗೊಳಿಸುವ ಮೊದಲು ನಾವು ಹಲವು ಪ್ರಮುಖ ಸುರಕ್ಷತಾ ಕ್ರಮಗಳನ್ನು ಕೈಗೊಳ್ಳುತ್ತೇವೆ. ತಪ್ಪುಮಾಹಿತಿ, ದ್ವೇಷಪೂರಿತ ವಿಷಯ ಮತ್ತು ಪಕ್ಷಪಾತದಂತಹ ಕ್ಷೇತ್ರಗಳ ತಜ್ಞರಾದ ರೆಡ್ ಟೀಮರ್‌ಗಳೊಂದಿಗೆ ನಾವು ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇವೆ — ಅವರು ಮಾಡೆಲ್ ಅನ್ನು ಸವಾಲುಮಯವಾಗಿ ಪರೀಕ್ಷಿಸುತ್ತಾರೆ.

ತಪ್ಪುಮಾಹಿತಿಯನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಹಾಯ ಮಾಡುವ ಸಾಧನಗಳನ್ನು ಕೂಡ ನಾವು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇವೆ — ಉದಾಹರಣೆಗೆ, Sora ಮೂಲಕ ವೀಡಿಯೋ ರಚಿಸಲ್ಪಟ್ಟಿದೆಯೇ ಎಂದು ತಿಳಿಯುವ ಡಿಟೆಕ್ಷನ್ ಕ್ಲಾಸಿಫೈಯರ್. ನಾವು ಭವಿಷ್ಯದಲ್ಲಿ OpenAI ಉತ್ಪನ್ನದಲ್ಲಿ ಮಾಡೆಲ್ ಅನ್ನು ನಿಯೋಜಿಸಿದರೆ C2PA ಮೆಟಾಡೇಟಾವನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಸೇರಿಸಲು ಯೋಜಿಸುತ್ತೇವೆ.

ನಿಯೋಜನೆಗೆ ಸಿದ್ಧತೆಗಾಗಿ ನಾವು ಹೊಸ ತಂತ್ರಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಿರುವುದರ ಜೊತೆಗೆ, DALL·E 3 ಬಳಸುವ ನಮ್ಮ ಉತ್ಪನ್ನಗಳಿಗೆ ನಿರ್ಮಿಸಿದ existing safety methods ಗಳನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) Sora ಗಾಗಿ ಕೂಡ ಬಳಸುತ್ತಿದ್ದೇವೆ.

ಉದಾಹರಣೆಗೆ, OpenAI ಉತ್ಪನ್ನದಲ್ಲಿ ಸೇರಿಸಿದ ನಂತರ, ನಮ್ಮ ಪಠ್ಯ ವರ್ಗೀಕರಣ ವ್ಯವಸ್ಥೆ ಬಳಕೆ ನೀತಿಗಳನ್ನು ಉಲ್ಲಂಘಿಸುವ ಪಠ್ಯ ಇನ್‌ಪುಟ್ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಪರಿಶೀಲಿಸಿ ತಿರಸ್ಕರಿಸುತ್ತದೆ, ಉದಾಹರಣೆಗೆ ಅತಿದೊಡ್ಡ ಹಿಂಸಾಚಾರ, ಲೈಂಗಿಕ ವಿಷಯ, ದ್ವೇಷಪೂರಿತ ಚಿತ್ರಗಳು, ಪ್ರಸಿದ್ಧರ ಹೋಲಿಕೆಗಳು ಅಥವಾ ಇತರರ ಬೌದ್ಧಿಕ ಸ್ವತ್ತು (IP) ಸೇರಿದಂತೆ. ಬಳಕೆದಾರರಿಗೆ ತೋರಿಸುವ ಮೊದಲು ಪ್ರತಿಯೊಂದು ರಚಿಸಲಾದ ವೀಡಿಯೋದ ಫ್ರೇಮ್‌ಗಳನ್ನು ಪರಿಶೀಲಿಸಲು ಮತ್ತು ನಮ್ಮ ಬಳಕೆ ನೀತಿಗಳನ್ನು ಪಾಲಿಸುವುದನ್ನು ಖಚಿತಪಡಿಸಲು ನಾವು ಬಲವಾದ ಚಿತ್ರ ಕ್ಲಾಸಿಫೈಯರ್‌ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ.

ಈ ಹೊಸ ತಂತ್ರಜ್ಞಾನಕ್ಕಾಗಿ ಸಕಾರಾತ್ಮಕ ಬಳಕೆ ಪ್ರಕರಣಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ಅವರ ಆತಂಕಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನಾವು ಜಾಗತಿಕವಾಗಿ ನೀತಿ ರೂಪಕರು, ಶಿಕ್ಷಣತಜ್ಞರು ಮತ್ತು ಕಲಾವಿದರೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಲಿದ್ದೇವೆ. ವ್ಯಾಪಕ ಸಂಶೋಧನೆ ಮತ್ತು ಪರೀಕ್ಷೆಗಳ ಬಳಿಕವೂ, ಜನರು ನಮ್ಮ ತಂತ್ರಜ್ಞಾನವನ್ನು ಹೇಗೆ ಉಪಯೋಗಿಸಲಿದ್ದಾರೆ ಎಂಬುದನ್ನೂ ಅಥವಾ ಹೇಗೆ ದುರುಪಯೋಗ ಮಾಡಬಹುದು ಎಂಬುದನ್ನೂ ನಾವು ಸಂಪೂರ್ಣವಾಗಿ ಊಹಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಆದ್ದರಿಂದ, ನಿಜ ಜಗತ್ತಿನ ಬಳಕೆಯಿಂದ ಕಲಿಯುವುದು ಕಾಲಕ್ರಮೇಣ ಹೆಚ್ಚು ಸುರಕ್ಷಿತ AI ವ್ಯವಸ್ಥೆಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ಬಿಡುಗಡೆ ಮಾಡಲು ಅತಿ ಪ್ರಮುಖ ಅಂಶವೆಂದು ನಾವು ನಂಬುತ್ತೇವೆ.

ಸಂಶೋಧನಾ ತಂತ್ರಗಳು

Sora ಒಂದು ಡಿಫ್ಯೂಷನ್ ಮಾಡೆಲ್ ಆಗಿದ್ದು, ಸ್ಥಿರ ಶಬ್ದದಂತೆ ಕಾಣುವ ಚಿತ್ರದಿಂದ ಆರಂಭಿಸಿ, ಶಬ್ದವನ್ನು ಕ್ರಮೇಣ ತೆಗೆದುಹಾಕುವ ಮೂಲಕ ಅನೇಕ ಹಂತಗಳಲ್ಲಿ ವೀಡಿಯೋವನ್ನು ರಚಿಸುತ್ತದೆ.

Sora ಸಂಪೂರ್ಣ ವೀಡಿಯೋಗಳನ್ನು ಒಂದೇ ಬಾರಿ ರಚಿಸುವ ಸಾಮರ್ಥ್ಯ ಹೊಂದಿದೆ ಅಥವಾ ರಚಿಸಲಾದ ವೀಡಿಯೋಗಳನ್ನು ವಿಸ್ತರಿಸಿ ಅವುಗಳನ್ನು ಉದ್ದಗೊಳಿಸಬಹುದು. ಮಾದರಿಗೆ ಒಂದೇ ಬಾರಿ ಅನೇಕ ಫ್ರೇಮ್‌ಗಳ ಮುಂಚಿತ ನೋಟ ನೀಡುವುದರ ಮೂಲಕ, ವಿಷಯವು ತಾತ್ಕಾಲಿಕವಾಗಿ ದೃಶ್ಯದಿಂದ ಹೊರಗೆ ಹೋದರೂ ಅದೇ ರೀತಿಯಾಗಿ ಉಳಿಯುವಂತೆ ಮಾಡುವುದು ಎಂಬ ಸವಾಲಿನ ಸಮಸ್ಯೆಯನ್ನು ನಾವು ಪರಿಹರಿಸಿದ್ದೇವೆ.

GPT ಮಾಡೆಲ್‌ಗಳಂತೆ, Sora ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು ಬಳಸುತ್ತದೆ, ಇದು ಅತ್ಯುತ್ತಮ ಸ್ಕೇಲಿಂಗ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ.

ನಾವು ವೀಡಿಯೊಗಳು ಮತ್ತು ಚಿತ್ರಗಳನ್ನು “ಪ್ಯಾಚ್‌ಗಳು” ಎಂದು ಕರೆಯುವ ಸಣ್ಣ ಡೇಟಾ ಘಟಕಗಳ ಸಂಗ್ರಹವಾಗಿ ಪ್ರತಿನಿಧಿಸುತ್ತೇವೆ — ಪ್ರತಿಯೊಂದು ಪ್ಯಾಚ್ GPT ಯಲ್ಲಿನ token‌ನಂತೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಡೇಟಾವನ್ನು ಪ್ರತಿನಿಧಿಸುವ ವಿಧಾನವನ್ನು ಏಕೀಕರಿಸುವ ಮೂಲಕ, ನಾವು ಡಿಫ್ಯೂಷನ್ ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್‌ಗಳನ್ನು ಹಿಂದಿನಿಗಿಂತ ಹೆಚ್ಚು ವ್ಯಾಪಕವಾದ ದೃಶ್ಯ ಡೇಟಾದ ಮೇಲೆ ಟ್ರೈನ್‌ ಮಾಡಬಹುದು — ವಿಭಿನ್ನ ಅವಧಿ, ರೆಸಲ್ಯೂಷನ್ ಮತ್ತು ಆಸ್ಪೆಕ್ಟ್ ಅನುಪಾತಗಳನ್ನು ಒಳಗೊಂಡಂತೆ.

Sora, DALL·E ಮತ್ತು GPT ಮಾಡೆಲ್‌ಗಳ ಹಿಂದಿನ ಸಂಶೋಧನೆಯ ಮೇಲೆ ಆಧಾರಿತವಾಗಿದೆ. ಇದು DALL·E 3 ನ ರಿಕ್ಯಾಪ್ಷನಿಂಗ್ ತಂತ್ರವನ್ನು ಬಳಸುತ್ತದೆ, ಇದು ದೃಶ್ಯ ಟ್ರೈನಿಂಗ್ ಡೇಟಾಗಾಗಿ ಅತ್ಯಂತ ವಿವರವಾದ ಕ್ಯಾಪ್ಷನ್‌ಗಳನ್ನು ರಚಿಸುವುದನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದರ ಫಲವಾಗಿ, ಮಾಡೆಲ್ ಬಳಕೆದಾರರ ಪಠ್ಯ ಸೂಚನೆಗಳನ್ನು ರಚಿಸಲಾದ ವೀಡಿಯೋದಲ್ಲಿ ಹೆಚ್ಚು ನಿಖರವಾಗಿ ಅನುಸರಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.

ಪಠ್ಯ ಸೂಚನೆಗಳಿಂದ ಮಾತ್ರ ವೀಡಿಯೋ ರಚಿಸುವ ಸಾಮರ್ಥ್ಯಕ್ಕಿಂತಲೂ ಹೆಚ್ಚಾಗಿ, ಈ ಮಾಡೆಲ್ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಸ್ಥಿರ ಚಿತ್ರವನ್ನು ತೆಗೆದುಕೊಂಡು ಅದರಿಂದ ವೀಡಿಯೋ ರಚಿಸಲು, ಅದರ ಅಂಶಗಳನ್ನು ನಿಖರವಾಗಿ ಮತ್ತು ಸೂಕ್ಷ್ಮ ವಿವರಗಳೊಂದಿಗೆ ಅನಿಮೇಟ್ ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಮಾಡೆಲ್ ಈಗಾಗಲೇ ಇರುವ ವೀಡಿಯೋವನ್ನು ವಿಸ್ತರಿಸಲು ಅಥವಾ ಕಳೆದುಹೋದ ಫ್ರೇಮ್‌ಗಳನ್ನು ತುಂಬಲು ಸಹ ಸಾಧ್ಯವಾಗುತ್ತದೆ. ನಮ್ಮ ತಾಂತ್ರಿಕ ವರದಿಯಲ್ಲಿ ಇನ್ನಷ್ಟು ತಿಳಿಯಿರಿ.

Sora ನೈಜ ಜಗತ್ತನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮತ್ತು ಅನುಕರಿಸಲು ಸಾಧ್ಯವಾಗುವ ಮಾಡೆಲ್‌ಗಳ ಅಡಿಪಾಯವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಮತ್ತು AGI ಸಾಧನೆಗೆ ಇದು ಪ್ರಮುಖ ಮೈಲಿಗಲ್ಲಾಗುತ್ತದೆ ಎಂದು ನಾವು ನಂಬುತ್ತೇವೆ.

ಲೋಡ್ ಆಗುತ್ತಿದೆ...